C/C++ sizeof函數解析——解決sizeof求結構體大小的問題
C/C++中不同數據類型所占用的內存大小
32位 64位
char 1 1
int 4 大多數4,少數8
short 2 2
long 4 8
float 4 4
double 8 8
指針 4 8
(單位都為字節)
結構體(struct):比較復雜,對齊問題。
聯合(union):所有成員中最長的。
枚舉(enum):根據數據類型。
sizeof計算單層結構體大小
運算符sizeof可以計算出給定類型的大小,對於32位系統來說,sizeof(char) = 1; sizeof(int) = 4。基本數據類型的大小很好計算,我們來看一下如何計算構造數據類型的大小。
C語言中的構造數據類型有三種:數組、結構體和共用體。
數組是相同類型的元素的集合,只要會計算單個元素的大小,整個數組所占空間等於基礎元素大小乘上元素的個數。
結構體中的成員可以是不同的數據類型,成員按照定義時的順序依次存儲在連續的內存空間。和數組不一樣的是,結構體的大小不是所有成員大小簡單的相加,需要考慮到系統在存儲結構體變量時的地址對齊問題。看下面這樣的一個結構體:
struct stu1
{
int i;
char c;
int j;
};
用sizeof求該結構體的大小,發現值為12。int占4個字節,char占1個字節,結果應該是9個字節才對啊,為什麼呢?
先介紹一個相關的概念——偏移量。偏移量指的是結構體變量中成員的地址和結構體變量地址的差。結構體大小等於最後一個成員的偏移量加上最後一個成員的大小。顯然,結構體變量中第一個成員的地址就是結構體變量的首地址。因此,第一個成員i的偏移量為0。第二個成員c的偏移量是第一個成員的偏移量加上第一個成員的大小(0+4),其值為4;第三個成員j的偏移量是第二個成員的偏移量加上第二個成員的大小(4+1),其值為5。
然而,在實際中,存儲變量時地址要求對齊,編譯器在編譯程序時會遵循兩條原則:
(1)結構體變量中成員的偏移量必須是成員大小的整數倍(0被認為是任何數的整數倍)
(2)結構體大小必須是所有成員大小的整數倍,也即所有成員大小的公倍數。
上面的例子中前兩個成員的偏移量都滿足要求,但第三個成員的偏移量為5,並不是自身(int)大小的整數倍。編譯器在處理時會在第二個成員後面補上3個空字節,使得第三個成員的偏移量變成8。結構體大小等於最後一個成員的偏移量加上其大小,上面的例子中計算出來的大小為12,滿足要求。
再來看另外一個例子:
struct stu2
{
int k;
short t;
};
成員k的偏移量為0;成員t的偏移量為4,都不需要調整。但計算出來的大小為6,顯然不是成員k大小的整數倍。因此,編譯器會在成員t後面補上2個字節,使得結構體的大小變成8從而滿足第二個要求。
由此可見,結構體類型需要考慮到字節對齊的情況,不同的順序會影響結構體的大小。
對比下面兩種定義順序:
struct stu3
{
char c1;
int i;
char c2;
}
struct stu4
{
char c1;
char c2;
int i;
}
雖然結構體stu3和stu4中成員都一樣,但sizeof(struct stu3)的值為12而sizeof(struct stu4)的值為8。
sizeof計算嵌套的結構體大小
對於嵌套的結構體,需要將其展開。對結構體求sizeof時,上述兩種原則變為:
(1)展開後的結構體的第一個成員的偏移量應當是被展開的結構體中最大的成員的整數倍。
(2)結構體大小必須是所有成員大小的整數倍,這裡所有成員計算的是展開後的成員,而不是將嵌套的結構體當做一個整體。
看下面的例子:
struct stu5
{
short i;
struct
{
char c;
int j;
} ss;
int k;
}
結構體stu5的成員ss.c的偏移量應該是4,而不是2。整個結構體大小應該是16。
下述代碼測試原則2:
struct stu5
{
char i;
struct
{
char c;
int j;
} ss;
char a;
char b;
char d;
char e;
char f;
}
結構體ss單獨計算占用空間為8,而stu5的sizeof則是20,不是8的整數倍,這說明在計算sizeof(stu5)時,將嵌套的結構體ss展開了,這樣stu5中最大的成員為ss.j,占用4個字節,20為4的整數倍。如果將ss當做一個整體,結果應該是24了。
另一個特殊的例子是結構體中包含數組,其sizeof應當和處理嵌套結構體一樣,將其展開,如下例子:
struct ss
{
float f;
char p;
int adf[3];
};
其值為20。float占4個字節,到char p時偏移量為4,p占一個字節,到int adf[3]時偏移量為5,擴展為int的整數倍,而非int adf[3]的整數倍,這樣偏移量變為8,而不是12。結果是8+12=20,是最大成員float或int的大小的整數倍。
如何給結構體變量分配空間由編譯器決定,以上情況針對的是Linux下的GCC。在Windows下的VC平台也是這樣,至於其他平台,可能會有不同的處理。