C/C++浮點數在內存中的存儲方式
任何數據在內存中都是以二進制的形式存儲的,例如一個short型數據1156,其二進制表示形式為00000100 10000100。則在Intel CPU架構的系統中,存放方式為 10000100(低地址單元) 00000100(高地址單元),因為Intel CPU的架構是小端模式。但是對於浮點數在內存是如何存儲的?目前所有的C/C++編譯器都是采用IEEE所制定的標准浮點格式,即二進制科學表示法。
在二進制科學表示法中,S=M*2^N 主要由三部分構成:符號位+階碼(N)+尾數(M)。對於float型數據,其二進制有32位,其中符號位1位,階碼8位,尾數23位;對於double型數據,其二進制為64位,符號位1位,階碼11位,尾數52位。
31 30-23 22-0
float 符號位 階碼 尾數
63 62-52 51-0
double 符號位 階碼 尾數
符號位:0表示正,1表示負
階碼:這裡階碼采用移碼表示,對於float型數據其規定偏置量為127,階碼有正有負,對於8位二進制,則其表示范圍為-128-127,double型規定為1023,其表示范圍為-1024-1023。比如對於float型數據,若階碼的真實值為2,則加上127後為129,其階碼表示形式為10000010
尾數:有效數字位,即部分二進制位(小數點後面的二進制位),因為規定M的整數部分恆為1,所以這個1就不進行存儲了。
下面舉例說明:
float型數據125.5轉換為標准浮點格式
125二進制表示形式為1111101,小數部分表示為二進制為 1,則125.5二進制表示為1111101.1,由於規定尾數的整數部分恆為1,則表示為1.1111011*2^6,階碼為6,加上127為133,則表示為10000101,而對於尾數將整數部分1去掉,為1111011,在其後面補0使其位數達到23位,則為11110110000000000000000
則其二進制表示形式為
0 10000101 11110110000000000000000,則在內存中存放方式為:
00000000 低地址
00000000
11111011
01000010 高地址
而反過來若要根據二進制形式求算浮點數如0 10000101 11110110000000000000000
由於符號為為0,則為正數。階碼為133-127=6,尾數為11110110000000000000000,則其真實尾數為1.1111011。所以其大小為
1.1111011*2^6,將小數點右移6位,得到1111101.1,而1111101的十進制為125,0.1的十進制為1*2^(-1)=0.5,所以其大小為125.5。
同理若將float型數據0.5轉換為二進制形式
0.5的二進制形式為0.1,由於規定正數部分必須為1,將小數點右移1位,則為1.0*2^(-1),其階碼為-1+127=126,表示為01111110,而尾數1.0去掉整數部分為0,補齊0到23位00000000000000000000000,則其二進制表示形式為
0 01111110 00000000000000000000000
由上分析可知float型數據最大表示范圍為1.11111111111111111111111*2^127=3.4*10^38
對於double型數據情況類似,只不過其階碼為11位,偏置量為1023,尾數為52位。
測試程序:
/*測試浮點型數據在內存中存放方式 2011.10.2*/ #include <iostream>using namespace std;int main(int argc, char *argv[]){ float a=125.5; char *p=(char *)&a; printf("%d\n",*p); printf("%d\n",*(p+1)); printf("%d\n",*(p+2)); printf("%d\n",*(p+3)); return 0;}
輸出結果為:
0
0
-5
66
在上面已經知道float型125.5在內存中存放方式為:
00000000 低地址
00000000
11111011
01000010 高地址
因此對於p和p+1指向的單元,其中存儲的二進制數表示的十進制整數為0;
而對於p+2指向的單元,由於為char型指針,為帶符號的數據類型,因此11111011,符號位為1,則為負數,由於在內存中二進制是以補碼存儲的,所以其真值為-5.
對於p+3指向的單元,01000010,為正數,則其大小為66。上面程序輸出結果驗證了其正確性。
摘自:海子的blog