程式師世界 >> 編程語言 >> C語言 >> C++ >> C++入門知識 >> C++ sizeof 使用規則及陷阱分析

C++ sizeof 使用規則及陷阱分析

編輯：C++入門知識

1、什麼是sizeof
　　
　　首先看一下sizeof在msdn上的定義：
　　
　　The sizeof keyWord gives the amount of storage, in bytes, associated with a variable or a type (including aggregate types). This keyword returns a value of type size_t.
　　
　　看到return這個字眼，是不是想到了函數？錯了，sizeof不是一個函數，你見過給一個函數傳參數，而不加括號的嗎？sizeof可以，所以sizeof不是函數。網上有人說sizeof是一元操作符，但是我並不這麼認為，因為sizeof更像一個非凡的宏，它是在編譯階段求值的。舉個例子：
　　
　　 cout<<sizeof(int)<<endl; // 32位機上int長度為4
　　cout<<sizeof(1==2)<<endl; // == 操作符返回bool類型，相當於 cout<<sizeof(bool)<<endl;
　　在編譯階段已經被翻譯為：
　　
　　 cout<<4<<endl;
　　cout<<1<<endl;
　　這裡有個陷阱，看下面的程序：
　　
　　 int a = 0;
　　cout<<sizeof(a=3)<<endl;
　　cout<<a<<endl;
　　輸出為什麼是4，0而不是期望中的4，3？？？就在於sizeof在編譯階段處理的特性。由於sizeof不能被編譯成機器碼，所以sizeof作用范圍內，也就是()裡面的內容也不能被編譯，而是被替換成類型。=操作符返回左操作數的類型，所以a=3相當於int，而代碼也被替換為：
　　
　　 int a = 0;
　　cout<<4<<endl;
　　cout<<a<<endl;
　　所以，sizeof是不可能支持鏈式表達式的，這也是和一元操作符不一樣的地方。
　　
　　結論：不要把sizeof當成函數，也不要看作一元操作符，把他當成一個非凡的編譯預處理。
　　
　　2、sizeof的用法
　　
　　sizeof有兩種用法：
　　
　　（1）sizeof(object)
　　
　　也就是對對象使用sizeof，也可以寫成sizeof object 的形式。
　　
　　（2）sizeof(typename)
　　
　　也就是對類型使用sizeof，注重這種情況下寫成sizeof typename是非法的。下面舉幾個例子說明一下：
　　
　　 int i = 2;
　　cout<<sizeof(i)<<endl; // sizeof(object)的用法，合理
　　cout<<sizeof i<<endl; // sizeof object的用法，合理
　　cout<<sizeof 2<<endl; // 2被解析成int類型的object, sizeof object的用法，合理
　　cout<<sizeof(2)<<endl; // 2被解析成int類型的object, sizeof(object)的用法，合理
　　cout<<sizeof(int)<<endl;// sizeof(typename)的用法，合理
　　cout<<sizeof int<<endl; // 錯誤！對於操作符，一定要加()
　　可以看出，加()是永遠正確的選擇。
　　
　　結論：不論sizeof要對誰取值，最好都加上()。
　　
　　3、數據類型的sizeof
　　
　　（1）C++固有數據類型
　　
　　32位C++中的基本數據類型，也就char,short int(short),int,long int(long),float,double, long double
　　
　　大小分別是：1，2，4，4，4，8, 10。
　　
　　考慮下面的代碼：
　　
　　 cout<<sizeof(unsigned int) == sizeof(int)<<endl; // 相等，輸出 1
　　unsigned影響的只是最高位bit的意義，數據長度不會被改變的。
　　
　　結論：unsigned不能影響sizeof的取值。
　　
　　（2）自定義數據類型
　　
　　typedef可以用來定義C++自定義類型。考慮下面的問題：
　　
　　 typedef short WORD;
　　typedef long DWORD;
　　cout<<(sizeof(short) == sizeof(WORD))<<endl; // 相等，輸出1
　　cout<<(sizeof(long) == sizeof(DWORD))<<endl; // 相等，輸出1
　　結論：自定義類型的sizeof取值等同於它的類型原形。
　　
　　（3）函數類型
　　
　　考慮下面的問題：
　　
　　 int f1(){return 0;};
　　double f2(){return 0.0;}
　　void f3(){}
　　
　　cout<<sizeof(f1())<<endl; // f1()返回值為int，因此被認為是int
　　cout<<sizeof(f2())<<endl; // f2()返回值為double，因此被認為是double
　　cout<<sizeof(f3())<<endl; // 錯誤！無法對void類型使用sizeof
　　cout<<sizeof(f1)<<endl; // 錯誤！無法對函數指針使用sizeof
　　cout<<sizeof*f2<<endl; // *f2，和f2()等價，因為可以看作object，所以括號不是必要的。被認為是double
　　結論：對函數使用sizeof，在編譯階段會被函數返回值的類型取代，
　　
　　4、指針問題
　　
　　考慮下面問題：
　　
　　
　　 cout<<sizeof(string*)<<endl; // 4
　　cout<<sizeof(int*)<<endl; // 4
　　cout<<sizof(char****)<<endl; // 4
　　可以看到，不管是什麼類型的指針，大小都是4的，因為指針就是32位的物理地址。
　　
　　結論：只要是指針，大小就是4。（64位機上要變成8也不一定）。
　　
　　順便唧唧歪歪幾句，C++中的指針表示實際內存的地址。和C不一樣的是，C++中取消了模式之分，也就是不再有small,middle,big,取而代之的是統一的flat。flat模式采用32位實地址尋址，而不再是c中的 segment:offset模式。舉個例子，假如有一個指向地址 f000:8888的指針，假如是C類型則是8888(16位, 只存儲位移，省略段)，far類型的C指針是f0008888(32位，高位保留段地址，地位保留位移),C++類型的指針是f8888(32位，相當於段地址*16 + 位移，但尋址范圍要更大)。
　　
　　5、數組問題
　　
　　考慮下面問題：
　　
　　 char a[] = "abcdef";
　　int b[20] = {3, 4};
　　char c[2][3] = {"aa", "bb"};
　　
　　cout<<sizeof(a)<<endl; // 7
　　cout<<sizeof(b)<<endl; // 20*4
　　cout<<sizeof(c)<<endl; // 6
　　數組a的大小在定義時未指定，編譯時給它分配的空間是按照初始化的值確定的，也就是7。c是多維數組，占用的空間大小是各維數的乘積，也就是6。可以看出，數組的大小就是他在編譯時被分配的空間，也就是各維數的乘積*數組元素的大小。
　　
　　結論：數組的大小是各維數的乘積*數組元素的大小。
　　
　　這裡有一個陷阱：
　　
　　 int *d = new int[10];
　　cout<<sizeof(d)<<endl; // 4
　　d是我們常說的動態數組，但是他實質上還是一個指針，所以sizeof(d)的值是4。
　　
　　再考慮下面的問題：
　　
　　 double* (*a)[3][6];
　　cout<<sizeof(a)<<endl; // 4
　　cout<<sizeof(*a)<<endl; // 72
　　cout<<sizeof(**a)<<endl; // 24
　　cout<<sizeof(***a)<<endl; // 4
　　cout<<sizeof(****a)<<endl; // 8
　　a是一個很希奇的定義，他表示一個指向 double*[3][6]類型數組的指針。既然是指針，所以sizeof(a)就是4。
　　
　　既然a是執行double*[3][6]類型的指針，*a就表示一個double*[3][6]的多維數組類型，因此sizeof(*a)=3*6*sizeof(double*)=72。同樣的，**a表示一個double*[6]類型的數組，所以sizeof(**a)=6*sizeof(double*)=24。***a就表示其中的一個元素，也就是double*了，所以sizeof(***a)=4。至於****a，就是一個double了，所以sizeof(****a)=sizeof(double)=8。 6、向函數傳遞數組的問題
　　
　　考慮下面的問題：
　　
　　 #include <iostream>
　　using namespace std;
　　
　　int Sum(int i[])
　　{
　　　int sumofi = 0;
　　　for (int j = 0; j < sizeof(i)/sizeof(int); j++) //實際上，sizeof(i) = 4
　　　{
　　sumofi += i[j];
　　　}
　　　return sumofi;
　　}
　　
　　int main()
　　{
　　　int allAges[6] = {21, 22, 22, 19, 34, 12};
　　　cout<<Sum(allAges)<<endl;
　　　system("pause");
　　　return 0;
　　}
　　Sum的本意是用sizeof得到數組的大小，然後求和。但是實際上，傳入自函數Sum的，只是一個int 類型的指針，所以sizeof(i)=4，而不是24，所以會產生錯誤的結果。解決這個問題的方法使是用指針或者引用。
　　
　　使用指針的情況：
　　
　　 int Sum(int (*i)[6])
　　{
　　　int sumofi = 0;
　　　for (int j = 0; j < sizeof(*i)/sizeof(int); j++) //sizeof(*i) = 24
　　　{
　　sumofi += (*i)[j];
　　　}
　　　return sumofi;
　　}
　　
　　int main()
　　{
　　　int allAges[] = {21, 22, 22, 19, 34, 12};
　　　cout<<Sum(&allAges)<<endl;
　　　system("pause");
　　　return 0;
　　}
　　在這個Sum裡，i是一個指向i[6]類型的指針，注重，這裡不能用int Sum(int (*i)[])聲明函數，而是必須指明要傳入的數組的大小，不然sizeof(*i)無法計算。但是在這種情況下，再通過sizeof來計算數組大小已經沒有意義了，因為此時大小是指定為6的。
　　
　　使用引用的情況和指針相似：
　　
　　
　　 int Sum(int (&i)[6])
　　{
　　　int sumofi = 0;
　　　for (int j = 0; j < sizeof(i)/sizeof(int); j++)
　　　{
　　sumofi += i[j];
　　　}
　　　return sumofi;
　　}
　　
　　int main()
　　{
　　　int allAges[] = {21, 22, 22, 19, 34, 12};
　　　cout<<Sum(allAges)<<endl;
　　　system("pause");
　　　return 0;
　　}
　　這種情況下sizeof的計算同樣無意義，所以用數組做參數，而且需要遍歷的時候，函數應該有一個參數來說明數組的大小，而數組的大小在數組定義的作用域內通過sizeof求值。因此上面的函數正確形式應該是：
　　
　　 #include <iostream>
　　using namespace std;
　　
　　int Sum(int *i, unsigned int n)
　　{
　　　int sumofi = 0;
　　　for (int j = 0; j < n; j++)
　　　{
　　sumofi += i[j];
　　　}
　　　return sumofi;
　　}
　　
　　int main()
　　{
　　　int allAges[] = {21, 22, 22, 19, 34, 12};
　　　cout<<Sum(i, sizeof(allAges)/sizeof(int))<<endl;
　　　system("pause");
　　　return 0;
　　}
　　7、字符串的sizeof和strlen
　　
　　考慮下面的問題：
　　
　　 char a[] = "abcdef";
　　char b[20] = "abcdef";
　　string s = "abcdef";
　　
　　cout<<strlen(a)<<endl; // 6，字符串長度
　　cout<<sizeof(a)<<endl; // 7，字符串容量
　　cout<<strlen(b)<<endl; // 6，字符串長度
　　cout<<strlen(b)<<endl; // 20，字符串容量
　　cout<<sizeof(s)<<endl; // 12, 這裡不代表字符串的長度，而是string類的大小
　　cout<<strlen(s)<<endl; // 錯誤！s不是一個字符指針。
　　
　　a[1] = '

C++入門知識