C語言常常讓人覺得它所能表達的東西非常有限。它不具有類似第一級函數和模式匹配這樣的高級功能。但是C非常簡單,並且仍然有一些非常有用的語法技巧和功能,只是沒有多少人知道罷了。
指定的初始化
很多人都知道像這樣來靜態地初始化數組:
intfibs[] = {1, 1, 2, 3, 5};
C99標准實際上支持一種更為直觀簡單的方式來初始化各種不同的集合類數據(如:結構體,聯合體和數組)。
數組
我們可以指定數組的元素來進行初始化。這非常有用,特別是當我們需要根據一組#define來保持某種映射關系的同步更新時。來看看一組錯誤碼的定義,如:
/* Entries may not correspond to actual numbers. Some entries omitted. */
#define EINVAL 1
#define ENOMEM 2
#define EFAULT 3
/* ... */
#define E2BIG 7
#define EBUSY 8
/* ... */
#define ECHILD 12
/* ... */
現在,假設我們想為每個錯誤碼提供一個錯誤描述的字符串。為了確保數組保持了最新的定義,無論頭文件做了任何修改或增補,我們都可以用這個數組指定的語法。
char*err_strings[] = {
[0] ="Success",
[EINVAL] ="Invalid argument",
[ENOMEM] ="Not enough memory",
[EFAULT] ="Bad address",
/* ... */
[E2BIG ] ="Argument list too long",
[EBUSY ] ="Device or resource busy",
/* ... */
[ECHILD] ="No child processes"
/* ... */
};
這樣就可以靜態分配足夠的空間,且保證最大的索引是合法的,同時將特殊的索引初始化為指定的值,並將剩下的索引初始化為0。
結構體與聯合體
用結構體與聯合體的字段名稱來初始化數據是非常有用的。假設我們定義:
structpoint {
intx;
inty;
intz;
}
然後我們這樣初始化structpoint:
1
structpoint p = {.x = 3, .y = 4, .z = 5};
當我們不想將所有字段都初始化為0時,這種作法可以很容易的在編譯時就生成結構體,而不需要專門調用一個初始化函數。 www.2cto.com
對聯合體來說,我們可以使用相同的辦法,只是我們只用初始化一個字段。
宏列表
C中的一個慣用方法,是說有一個已命名的實體列表,需要為它們中的每一個建立函數,將它們中的每一個初始化,並在不同的代碼模塊中擴展它們的名字。這在Mozilla的源碼中經常用到,我就是在那時學到這個技巧的。例如,在我去年夏天工作的那個項目中,我們有一個針對每個命令進行標記的宏列表。其工作方式如下:
#define FLAG_LIST(_) \
_(InWorklist) \
_(EmittedAtUses) \
_(LoopInvariant) \
_(Commutative) \
_(Movable) \
_(Lowered) \
_(Guard)
它定義了一個FLAG_LIST宏,這個宏有一個參數稱之為 _ ,這個參數本身是一個宏,它能夠調用列表中的每個參數。舉一個實際使用的例子可能更能直觀地說明問題。假設我們定義了一個宏DEFINE_FLAG,如:
#define DEFINE_FLAG(flag) flag,
enumFlag {
None = 0,
FLAG_LIST(DEFINE_FLAG)
Total
};
#undef DEFINE_FLAG
對FLAG_LIST(DEFINE_FLAG)做擴展能夠得到如下代碼:
enumFlag {
None = 0,
DEFINE_FLAG(InWorklist)
DEFINE_FLAG(EmittedAtUses)
DEFINE_FLAG(LoopInvariant)
DEFINE_FLAG(Commutative)
DEFINE_FLAG(Movable)
DEFINE_FLAG(Lowered)
DEFINE_FLAG(Guard)
Total
};
接著,對每個參數都擴展DEFINE_FLAG宏,這樣我們就得到了enum如下:
enumFlag {
None = 0,
InWorklist,
EmittedAtUses,
LoopInvariant,
Commutative,
Movable,
Lowered,
Guard,
Total
};
接著,我們可能要定義一些訪問函數,這樣才能更好的使用flag列表:
#define FLAG_ACCESSOR(flag) \
boolis##flag()const{\
returnhasFlags(1 << flag);\
}\
voidset##flag() {\
JS_ASSERT(!hasFlags(1 << flag));\
setFlags(1 << flag);\
}\
voidsetNot##flag() {\
JS_ASSERT(hasFlags(1 << flag));\
removeFlags(1 << flag);\
}
FLAG_LIST(FLAG_ACCESSOR)
#undef FLAG_ACCESSOR
一步步的展示其過程是非常有啟發性的,如果對它的使用還有不解,可以花一些時間在gcc –E上。
編譯時斷言
這其實是使用C語言的宏來實現的非常有“創意”的一個功能。有些時候,特別是在進行內核編程時,在編譯時就能夠進行條件檢查的斷言,而不是在運行時進行,這非常有用。不幸的是,C99標准還不支持任何編譯時的斷言。
但是,我們可以利用預處理來生成代碼,這些代碼只有在某些條件成立時才會通過編譯(最好是那種不做實際功能的命令)。有各種各樣不同的方式都可以做到這一點,通常都是建立一個大小為負的數組或結構體。最常用的方式如下:
/* Force a compilation error if condition is false, but also produce a result
* (of value 0 and type size_t), so it can be used e.g. in a structure
* initializer (or wherever else comma expressions aren't permitted). */
/* Linux calls these BUILD_BUG_ON_ZERO/_NULL, which is rather misleading. */
#define STATIC_ZERO_ASSERT(condition) (sizeof(struct { int:-!(condition); }) )
#define STATIC_NULL_ASSERT(condition) ((void *)STATIC_ZERO_ASSERT(condition) )
/* Force a compilation error if condition is false */
#define STATIC_ASSERT(condition) ((void)STATIC_ZERO_ASSERT(condition))
如果(condition)計算結果為一個非零值(即C中的真值),即! (condition)為零值,那麼代碼將能順利地編譯,並生成一個大小為零的結構體。如果(condition)結果為0(在C真為假),那麼在試圖生成一個負大小的結構體時,就會產生編譯錯誤。
它的使用非常簡單,如果任何某假設條件能夠靜態地檢查,那麼它就可以在編譯時斷言。例如,在上面提到的標志列表中,標志集合的類型為uint32_t,所以,我們可以做以下斷言:
STATIC_ASSERT(Total <= 32)
它擴展為:
(void)sizeof(struct{int:-!(Total <= 32) })
現在,假設Total<=32。那麼-!(Total <= 32)等於0,所以這行代碼相當於:
(void)sizeof(struct{int: 0 })
這是一個合法的C代碼。現在假設標志不止32個,那麼-!(Total <= 32)等於-1,所以這時代碼就相當於:
(void)sizeof(struct{int: -1 } )
因為位寬為負,所以可以確定,如果標志的數量超過了我們指派的空間,那麼編譯將會失敗。