1.引子
在結構中,編譯器為結構的每個成員按其自身的自然對界(alignment)條件分配空間。各個成員按照它們被聲明的順序在內存中順序存儲,第一個成員的地址和整個結構的地址相同。
例如,下面的結構各成員空間分配情況(假設對齊方式大於2字節,即#pragma pack(n), n = 2,4,8...下文將討論#pragmapack()):
代碼如下:
struct test
{
char x1;
short x2;
float x3;
char x4;
};
結構的第一個成員x1,其偏移地址為0,占據了第1個字節。第二個成員x2為short類型,其起始地址必須2字節對界,即偏移地址是2的倍數。因此,編譯器在x2和x1之間填充了一個空字節,將x2放在了偏移地址為2的位置。結構的第三個成員x3和第四個成員x4恰好落在其自然對界地址上,在它們前面不需要額外的填充字節。在test結構中,成員x3要求4字節對界,是該結構所有成員中要求的最大對界單元,因而test結構的自然對界條件為4字節,整個結構體的大小是最大對界單元大小的整數倍(結構體內部有結構體時也遵循這個規則,下文將提到),編譯器在成員x4後面填充了3個空字節。整個結構所占據空間為12字節。
關於為什麼要內存對齊,參考<解析內存對齊 Data alignment: Straighten up and fly right的詳解>。看了這篇文章便可以更輕松的理解下面的內容。
好了,下面說說#pragma pack:
2.#pragma pack()
該預處理指令用來改變對齊參數。在缺省情況下,C編譯器為每一個變量或數據單元按其自然對界條件分配空間。一般地,可以通過下面的方法來改變缺省的對齊參數:
· 使用偽指令#pragma pack (n),C編譯器將按照n字節對齊。
· 使用偽指令#pragma pack (),取消自定義字節對齊方式。
也可以寫成:
#pragma pack(push,n)
#pragma pack(pop)
#pragma pack (n)表示每個成員的對齊單元不大於n(n為2的整數次冪)。這裡規定的是上界,只影響對齊單元大於n的成員,對於對齊字節不大於n的成員沒有影響。其實從字面意思,pack是“包裹,打包”的意思,#pragma pack(n)規定n個字節是一個“包裹”,個人認為實在不理解的話可以認為處理器一次性可以從內存中讀/寫n個字節,這樣好理解。對於大小小於n的成員,當然是按照自己的對齊條件對齊,因為不論怎麼放都可以一次性取出。對於對齊條件大於n個字節的成員,成員按照自身的對齊條件對齊和按照n字節對齊需要相同的讀取次數,但按照n字節對齊節省空間,何樂而不為呢。可以參考我上面提到的<解析內存對齊 Data alignment: Straighten up and fly right的詳解>。下面是一位大牛的觀點,和我說的是一個意思:
All it means is that each member of it will require alignment no greater than n.It doesn't mean that each member will have alignment requirement n.Notice, after all, it's called pack and not align for a reason-- precisely because it controls packing, not alignment.
另外,GNU C還有如下的一種方式:
· __attribute__((aligned (n))),讓所作用的結構成員對齊在n字節自然邊界上。如果結構中有成員的長度大於n,則按照最大成員的長度來對齊。
· __attribute__ ((packed)),取消結構在編譯過程中的優化對齊,按照實際占用字節數進行對齊。
以上的n = 1, 2, 4, 8, 16... 第一種方式較為常見。
3.結構體內成員如何找出自己的位置
首先遵循以下規則:
1. 每個成員分別取自己的對齊方式和#pragma pack指定的對齊參數二者的較小值作為自己的對齊方式。
2. 復雜類型(如結構)的對齊方式是該類型聲明時所使用的對齊方式,或者說是聲明時它的所有成員使用的對齊參數的最大值,最後和此時的#pragma pack指定的對齊參數二者取極小值。大牛是這麼說的:
The documentation for #pragma pack(n) says that "The alignment of a member will be on a boundary that is either a multiple of n or a multiple of the size of the member,whichever is smaller". However I think this is incorrect; the docs should say that the alignment of a member will be on a boundary that is either a multiple of n or the alignment requirement of the member, whichever is smaller.
3. 對齊後的長度必須是成員中最大的對齊參數(不是成員的大小)的整數倍,這樣在處理數組時可以保證每一項都邊界對齊。
4. 對於數組,比如:char a[3];這種,它的對齊方式和分別寫3個char是一樣的。也就是說它還是按1個字節對齊.
如果寫: typedef char Array3[3];
Array3這種類型的對齊方式還是按1個字節對齊,而不是按它的長度。
5. 不論類型是什麼,對齊的邊界一定是1,2,4,8,16,32,64....中的一個。
看一個簡單的例子:
代碼如下:
#pragma pack(8)
struct s1
{
short a;
long b;
};
struct s2
{
char c;
s1 d;
long long e;
};
#pragma pack()
成員對齊有一個重要的條件:每個成員分別對齊。即每個成員按自己的方式對齊.
也就是說上面雖然指定了按8字節對齊,但並不是所有的成員都是以8字節對齊。其對齊的規則是,每個成員按其類型的對齊參數(通常是這個類型的大小)和指定對齊參數(這裡是8字節)中較小的一個對齊。並且結構的長度必須為所用過的所有對齊參數的整數倍(只要是最大的對齊參數的整數倍即可),不夠就補空字節(視編譯器而定)。
S1中,成員a是2字節默認按2字節對齊,指定對齊參數為8,這兩個值中取2,a按2字節對齊;成員b是4個字節,默認是按4字節對齊,這時就按4字節對齊,a後補2個字節後存放b,所以sizeof(S1)應該為8。8是4的倍數,滿足上述的第3條規則。
S2中,c和S1中的a一樣,按2字節對齊,而d是個結構,它是8個字節,它按什麼對齊呢?對於結構來說,它的默認對齊方式就是該結構定義(聲明)時它的所有成員使用的對齊參數中最大的一個,S1的是4,小於指定的8。所以成員d就是按4字節對齊,c後補2個字節,後面是8個字節的結構體d。成員e是8個字節,它是默認按8字節對齊,和指定的一樣,所以它對到8字節的邊界上,這時,已經使用了12個字節了,所以d後又補上4個字節,從第16個字節開始放置成員e。這時,長度為24,已經可以被最大對齊參數8(成員e按8字節對齊)整除。這樣,一共使用了24個字節。
上面的不夠復雜?再來一個:
代碼如下:
#pragma pack(4)
struct s1
{
char a;
double b;
};
#pragma pack()
#pragma pack(2)
struct s2
{
char c;
struct s1 st1;
};
#pragma pack()
#pragma pack(2)
struct s3
{
char a;
long b;
};
#pragma pack()
#pragma pack(4)
struct s4
{
char c;
struct s3 st3;
};
#pragma pack()
先看s1,a放在偏移地址為0的位置(第一個字節)。b默認8字節對齊,但指定對齊參數是4字節,所以b按4字節對齊,放在偏移地址為4的位置,a後補3個字節。所以sizeof(s1)是12。結構體s1的對齊參數是4,下面會用到。
再看s2,c放在第一個字節。st1自己的對齊參數是4,但此時指定的對齊參數是2,所以st1按照2字節對齊,c後補一個字節後存放st1。注意,st1內部是不會變的,聲明s1時是什麼樣就是什麼樣,因為我們要保證sizeof(s2.st1) == sizeof(s1),如果不這樣就亂套了。這樣sizeof(s2)是14。結構體s2的對齊參數是2,14是2的整數倍。
再看s3,a放在第一個字節。b默認4字節對齊,但指定的對齊參數是2,所以b按2字節對齊,放在偏移地址為2的位置,a後補一個字節。sizeof(s3)是6。結構體s3的對齊參數是2(後面會用到),6是2的整數倍。
最後看s4,c放在第一個字節。st3自己的對齊參數是2,指定的對齊參數是4,所以st3取極小值,按2字節對齊,放在偏移地址為2的位置,c後補一個字節。sizeof(s4)是8,結構體的對齊參數是2,8是2的整數倍。