浮点数在计算机内存中是如何存储的？

转自：http://blog.csdn.net/boatalways/article/details/17121205

对于一个整数，我们可以很方便的在十进制与二进制中转换，但是对于一个浮点数来说不是这么容易——因为小数点的存在。对于浮点数来说，小数点的位置不是固定的（小数点后面的数的个数不定），所以如何存储小数点是一个挑战。后来人们想出用科学计数法通常如这般：3.12*10^5来表示浮点数，这样的好处是：小数点的位置固定下来了。因为计算机只能用01表示，所以我们用2来表示上面提到的那个10.

公式如下：
X = a * 2^e

a为浮点数的二进制表示，范围为[1,2) ;

e为小数点移动的位数;

如:27.0表示成二进制为：11011.0,用科学计数法表示为1.10110*2^4.

那么如何存储1.10110*2^4这个数呢？

对于float型数据，其长度是4个字节，右边23位用来表示小数点后面的数字，中间8位用来表示e，左边一位用来表示正负。

对于double型数据，其长度是8个字节，右边52位用来表示小数点后面的数字.中间11位表示e，左边一位用来表示正负。如下图：

指数偏移量=2^（k-1），k为指数位个数。

因为e可以为正，可以为负数。比如1.10110*2^4 这个e为正数，如果是0.101那么用指数表示就是1.01*2^-1，那么e为-1。同时要求先把e+指数偏移量，得到的结果再化成二进制，就是我们的指数位。

小数部分：把小数点后面的数字。如上面的10110，位数不够就补零。

符号位：1表示负数，0表示正数

举例子：

27.5的二进制为11011.1

1.10111*2^4

尾数（小数点后的数）10111，补够23位 1011 1000 0000 0000 0000 000

指数：4，加上127，就是131，二进制1000 0011

用二进制表示就是 (符号数位1位)0 （指数位8位）1000 0011 （尾数位23位）1011 1000 0000 0000 0000 000

写成二进制标准形式：0100 0001 1101 1100 0000 0000 0000 0000

写成16进制就是41 DC 00 00

那么如何从二进制形式求出相应的十进制数呢？
先可以找出小数部分，指数位，以及符号位
1.通过符号位判断正负
2.算出指数位代表的十进制，把这个十进制减去指数偏移量2^（k-1），结果为正表明小数点往右边便宜e位，负则左边。
3小数部分有1，因为都有，可以不需要在计算机中存储，在这要表示出来结果是1.小数部分，如果e为正数，则把小数点往右边移动e位，负则是左边

举例子:
0x3fc00000
符号位：0 //说明是正数。
指数位：011 1111 1 //偏移0
小数位：100 0000 0000 0000 0000 0000，-->1.10000000000000000000000为1.5
而按照规定，小数点前还隐含包括1，而这个1是不储存的，所以小数位实际是1.5，当偏移大于0时，小数点向右偏移相应的值，反之向左偏移相应的值。

0x40c00000
符号位：0 //说明是正数。
指数位：100 0000 1 //偏移2

小数位：100 0000 0000 0000 0000 0000，
由于偏移为2，1.100 0000 0000 0000 0000 0000变成了110.0 0000 0000 0000 0000 0000 所以0x40c00000值为6
我们可以明白double变量的内存布局了。由于小数位的计算方式比如11.11111...在计算时为 1*2^1+1*2^0+1*2^(-1)+1*2^(-2)....可以看出在表示小数时，flaot的值不是连续的，事实上浮点数，以IEEE标准所能精确表示的仅仅是其中的一部分。

—————————————————————————————————————————————————————————————————————————————

转：

浮点数的二进制表示

前几天，我在读一本C语言教材，有一道例题：

　　#include <stdio.h>

　　void main(void){

　　　　int num=9; /* num是整型变量，设为9 */

　　　　float* pFloat=&num; /* pFloat表示num的内存地址，但是设为浮点数 */

　　　　printf("num的值为：%d\n",num); /* 显示num的整型值 */

　　　　printf("*pFloat的值为：%f\n",*pFloat); /* 显示num的浮点值 */

　　　　*pFloat=9.0; /* 将num的值改为浮点数 */

　　　　printf("num的值为：%d\n",num); /* 显示num的整型值 */

　　　　printf("*pFloat的值为：%f\n",*pFloat); /* 显示num的浮点值 */

　　}

运行结果如下：

　　num的值为：9
　　*pFloat的值为：0.000000
　　num的值为：1091567616
　　*pFloat的值为：9.000000

我很惊讶，num和*pFloat在内存中明明是同一个数，为什么浮点数和整数的解读结果会差别这么大？

要理解这个结果，一定要搞懂浮点数在计算机内部的表示方法。我读了一些资料，下面就是我的笔记。

在讨论浮点数之前，先看一下整数在计算机内部是怎样表示的。

　　int num=9;

上面这条命令，声明了一个整数变量，类型为int，值为9（二进制写法为1001）。普通的32位计算机，用4个字节表示int变量，所以9就被保存为00000000 00000000 00000000 00001001，写成16进制就是0x00000009。

那么，我们的问题就简化成：为什么0x00000009还原成浮点数，就成了0.000000？

根据国际标准IEEE 754，任意一个二进制浮点数V可以表示成下面的形式：

　　 $V = (-1)^s\times M\times 2^E$

　　（1）(-1)^s表示符号位，当s=0，V为正数；当s=1，V为负数。

　　（2）M表示有效数字，大于等于1，小于2。

　　（3）2^E表示指数位。

举例来说，十进制的5.0，写成二进制是101.0，相当于1.01×2^2。那么，按照上面V的格式，可以得出s=0，M=1.01，E=2。

十进制的-5.0，写成二进制是-101.0，相当于-1.01×2^2。那么，s=1，M=1.01，E=2。

IEEE 754规定，对于32位的浮点数，最高的1位是符号位s，接着的8位是指数E，剩下的23位为有效数字M。

对于64位的浮点数，最高的1位是符号位S，接着的11位是指数E，剩下的52位为有效数字M。

IEEE 754对有效数字M和指数E，还有一些特别规定。

前面说过，1≤M<2，也就是说，M可以写成1.xxxxxx的形式，其中xxxxxx表示小数部分。IEEE 754规定，在计算机内部保存M时，默认这个数的第一位总是1，因此可以被舍去，只保存后面的xxxxxx部分。比如保存1.01的时候，只保存01，等到读取的时候，再把第一位的1加上去。这样做的目的，是节省1位有效数字。以32位浮点数为例，留给M只有23位，将第一位的1舍去以后，等于可以保存24位有效数字。

至于指数E，情况就比较复杂。

首先，E为一个无符号整数（unsigned int）。这意味着，如果E为8位，它的取值范围为0~255；如果E为11位，它的取值范围为0~2047。但是，我们知道，科学计数法中的E是可以出现负数的，所以IEEE 754规定，E的真实值必须再减去一个中间数，对于8位的E，这个中间数是127；对于11位的E，这个中间数是1023。

比如，2^10的E是10，所以保存成32位浮点数时，必须保存成10+127=137，即10001001。

然后，指数E还可以再分成三种情况：

（1）E不全为0或不全为1。这时，浮点数就采用上面的规则表示，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第一位的1。

（2）E全为0。这时，浮点数的指数E等于1-127（或者1-1023），有效数字M不再加上第一位的1，而是还原为0.xxxxxx的小数。这样做是为了表示±0，以及接近于0的很小的数字。

（3）E全为1。这时，如果有效数字M全为0，表示±无穷大（正负取决于符号位s）；如果有效数字M不全为0，表示这个数不是一个数（NaN）。

好了，关于浮点数的表示规则，就说到这里。

下面，让我们回到一开始的问题：为什么0x00000009还原成浮点数，就成了0.000000？

首先，将0x00000009拆分，得到第一位符号位s=0，后面8位的指数E=00000000，最后23位的有效数字M=000 0000 0000 0000 0000 1001。

由于指数E全为0，所以符合上一节的第二种情况。因此，浮点数V就写成：

　　V=(-1)^0×0.00000000000000000001001×2^(-126)=1.001×2^(-146)

显然，V是一个很小的接近于0的正数，所以用十进制小数表示就是0.000000。

再看例题的第二部分。

请问浮点数9.0，如何用二进制表示？还原成十进制又是多少？

首先，浮点数9.0等于二进制的1001.0，即1.001×2^3。

那么，第一位的符号位s=0，有效数字M等于001后面再加20个0，凑满23位，指数E等于3+127=130，即10000010。

所以，写成二进制形式，应该是s+E+M，即0 10000010 001 0000 0000 0000 0000 0000。这个32位的二进制数，还原成十进制，正是1091567616。