C結構體之位域(位段)
有些信息在存儲時,並不需要占用一個完整的字節, 而只需占幾個或一個二進制位。例如在存放一個開關量時,只有0和1 兩種狀態, 用一位二進位即可。為了節省存儲空間,並使處理簡便,C語言又提供了一種數據結構,稱為“位域”或“位段”。所謂“位域”是把一個字節中的二進位劃分為幾個不同的區域, 並說明每個區域的位數。每個域有一個域名,允許在程序中按域名進行操作。 這樣就可以把幾個不同的對象用一個字節的二進制位域來表示。
一、位域的定義和位域變量的說明位域定義與結構定義相仿,其形式為:
struct 位域結構名
{
位域列表
};其中位域列表的形式為:
類型說明符 位域名:位域長度
位域變量的說明與結構變量說明的方式相同。 可采用先定義後說明,同時定義說明或者直接說明這三種方式。例如:
代碼如下:
struct bs
{
int a:8;
int b:2;
int c:6;
}data;
說明data為bs變量,共占兩個字節。其中位域a占8位,位域b占2位,位域c占6位。對於位域的定義尚有以下幾點說明:
1. 一個位域必須存儲在同一個字節中,不能跨兩個字節。如一個字節所剩空間不夠存放另一位域時,應從下一單元起存放該位域。也可以有意使某位域從下一單元開始。例如:
代碼如下:
struct bs
{
unsigned a:4
unsigned b:5 /*從下一單元開始存放*/
unsigned c:4
}
2. 由於位域不允許跨兩個字節,因此位域的長度不能大於一個字節的長度。
3. 位域可以無位域名,這時它只用來作填充或調整位置。無名的位域是不能使用的。例如:
代碼如下:
struct k
{
int a:1
int :2 /*無位域名,該2位不能使用*/
int b:3
int c:2
};
二、位域的使用
下面例子是參加一個公司(白領科技-青島)的筆試遇到的,當時做錯了,為了怕忘了,趕緊寫下來。
代碼如下:
#include <iostream>
#include <memory.h>
using namespace std;
struct A
{
int a:5;
int b:3;
};
int main(void)
{
char str[100] = "0134324324afsadfsdlfjlsdjfl";
struct A d;
memcpy(&d, str, sizeof(A));
cout << d.a << endl;
cout << d.b << endl;
return 0;
}
在32位x86機器上輸出:
代碼如下:
?
$ ./langxun.exe
-16
1
解析:在默認情況下,為了方便對結構體內元素的訪問和管理,當結構體內的元素長度都小於處理器的位數的時候,便以結構體裡面最長的元素為對其單位,即結構體的長度一定是最長的數據元素的整數倍;如果有結構體內存長度大於處理器位數的元素,那麼就以處理器的位數為對齊單元。由於是32位處理器,而且結構體中a和b元素類型均為int(也是4個字節),所以結構體的A占用內存為4個字節。
上例程序中定義了位域結構A,兩個個位域為a(占用5位),b(占用3位),所以a和b總共占用了結構A一個字節(低位的一個字節)。
當程序運行到14行時,d內存分配情況:
代碼如下:
高位 00110100 00110011 00110001 00110000 低位
'4' '3' '1' '0'
其中d.a和d.b占用d低位一個字節(00110000),d.a : 10000, d.b : 001
d.a內存中二進制表示為10000,由於d.a為有符號的整型變量,輸出時要對符號位進行擴展,所以結果為-16(二進制為11111111111111111111111111110000)
d.b內存中二進制表示為001,由於d.b為有符號的整型變量,輸出時要對符號位進行擴展,所以結果為1(二進制為00000000000000000000000000000001)
三、位域的對齊
如果結構體中含有位域(bit-field),那麼VC中准則是:
1) 如果相鄰位域字段的類型相同,且其位寬之和小於類型的sizeof大小,則後面的字段將緊鄰前一個字段存儲,直到不能容納為止;
2) 如果相鄰位域字段的類型相同,但其位寬之和大於類型的sizeof大小,則後面的字段將從新的存儲單元開始,其偏移量為其類型大小的整數倍;
3) 如果相鄰的位域字段的類型不同,則各編譯器的具體實現有差異,VC6采取不壓縮方式(不同位域字段存放在不同的位域類型字節中),Dev-C++和GCC都采取壓縮方式;
系統會先為結構體成員按照對齊方式分配空間和填塞(padding),然後對變量進行位域操作。