我們經常看到求 sizeof(A) 的值的問題,其中A是一個結構體,類,或者聯合體。
為了優化CPU訪問和優化內存,減少內存碎片,編譯器對內存對齊制定了一些規則。但是,不同的編譯器可能有不同的實現,本文只針對VC++編譯器,這裡使用的IDE是VS2012。
#pragma pack()是一個預處理,表示內存對齊。布局控制#pragma,為編譯程序提供非常規的控制流信息。
/**********結構體的大小的規則*************/
結構體大小是處理器位數和結構體內最長數據元素所占字節數二者中較小的那一個的整數倍。
比如說,假設處理器位數為n,結構體內最大數據元素所占字節數為m。
處理器為32位,n = 4;結構體內最大數據類型為short,m = 2; n > m;結構體大小為m的整數倍,反之亦然。
注意:有些雖然是64位的操作系統,但是編譯器卻是32位的,此時位數為32.
1 class A{ 2 int a; 3 char b; 4 short c; 5 };
sizeof(A)為8,為4的整數倍。
1 struct B{ 2 short a; 3 short b; 4 short c; 5 };
sizeof(B)為6,為2(sizeof(short))的整數倍。
注意:C++中的結構體與類只有一個區別,就是結構體成員默認是public,而類默認是private。
class X{ public: double a; float b; int c; char d; };
sizeof(X)為20,為4(處理器位數)的整數倍。
/********* #pragma pack(n) *************/
#pragma pack(n)中的n默認是4,即處理器位數32,但我們可以自己定義它的大小。
#pragma pack(1) class A{ public: int a; char b; short c; };
此時sizeof(A)為7,為1(#pragma pack(1))的整數倍。
#pragma pack(1) class X{ public: double a; int b; short c; char d; };
sizeof(X)為15,為1(#pragma pack(1))的整數倍。
#pragma pack(4) class X{ public: double a; int b; short c; char d; };
sizeof(X)為16,為4(#pragma pack(4))的整數倍。
#pragma pack(8) class X{ public: double a; int b; short c; char d; };
sizeof(X)為16,為8(#pragma pack(8) 或者 sizeof(double))的整數倍。
/***************內存對齊**************/
結構體中數據元素所在內存地址由兩個因素決定。
一是#pragma pack(n) 中的n,二是元素類型所占字節數,sizeof(type),兩者中取較小的一個,元素內存地址到結構體或類的起始地址的偏移量為較小數的整數倍。
比如#pragma pack(n)默認為4,有以下結構體
struct A{ int a; char b; short c; };
a的起始地址距離結構體起始地址的偏移量為0,是sizeof(int)的整數倍。
b的起始地址距離結構體起始地址的偏移量為4,是sizeof(char)的整數倍。
c的起始地址距離結構體起始地址的偏移量為5,不是sizeof(short)的整數倍,所以它的起始地址偏移量將會是6,而不是5。
輸出a, b, c 的地址為
0043FD68
0043FD6C
0043FD6E
可以看到c的起始地址比b的起始地址大了2個字節,b占了2個字節的大小,這是因為c的類型是short型,大小為2,而n默認是4,sizeof(short) < n,所以偏移量應該是2的整數倍,這裡是6.
准確地說是結構體內部內存對齊。完整的方法是:
#pragma pack(push) //保存對齊狀態
#pragma pack(4)//設定為4字節對齊
struct test
{
char m1;
double m4;
int m3;
};
#pragma pack(pop)//恢復對齊狀態
GCC可能不支持 progma!但是C++編譯器,比如g++是支持的,你可以試試。
……
結果是對的。
因為不涉及到指針的問題,所以不考慮32位和64位的問題,認為是32位的,在C++中int為4字節。
結構體的內存對齊在編譯時會對齊到該結構體中最大的類型,既最大類型字節數的整數倍,如果一個成員類型占用內存小於最大的類型,將嘗試加上下一個(或下幾個)成員占用的內存一起來對齊,該內存和一定小於等於最大類型占用的內存,如果小於則擴展對齊到結構體中的最大類型;
但是如果下一個成員的類型本身已經對齊了結構體中的最大類型,那麼他前面的成員占用的內存(和)將被擴展到與結構體中的最大類型對齊。
涉及到位域(如前2個結構體)的結構體在對齊時比較麻煩,涉及到不同的編譯器問題,不同的編譯器處理方式不一樣,如C++相鄰的如果是不同類型不壓縮保存,Dev-C++壓縮保存。
下面分別分析上面三個例子:
1.
struct Date
{
int year:20; // 20bits
int month:6; // 6bits
char day:6; // 1字節8bits
};// the sizeof(Date) is 8
前2個成員一共大小是26bits,小於int類型的4字節32bits,雖然第三個成員也是6bits,加起來等於32bits,但是因為類型不同,在VC中會分別保存,所以前2個成員占用的內存擴展到對齊到該結構體最大的類型int,占用4字節;
第三個成員為char型6bits,也需要對應到該結構體最大的類型int,也占用4字節內存;
一共為8字節;
注意:8字節這是VC中的情況,如果是用Dev-C++的話,該結構體只占用4字節。
2.
struct Date
{
int year:20;// 20bits
int month:6;// 6bits
int day:6;// 6bits
};// the sizeof(Date) is4
該例子中3個成員的大小加起來為32bits,正好是4字節,且類型相同,編譯器會進行壓縮保存,對齊了結構體中的最大類型int,不會再擴展,只是占用了4字節內存;
即使再後面再增加一個只有1bit的成員,那麼結構體占用的內存也將被擴展為8字節,與int型對齊。
3.
struct Date
{
int year; // 4Byte
int month; // 4Byte
int day; // 4Byte
};// the sizeof(Date) is 12
3個成員都為int型,本身也對齊了int類型的4字節,所以相加即可,一共占用12字節內存。