C語言預處理器執行宏替換、條件編譯和文件包含。通常采用以“#”為行首的提示。下面是C語言預處理的應用場合:
1.三字母詞(Trigraph Sequences)
C源程序的字符集被包含在7位的ASCII字符集中,但是它是ISO 646-1983 Invariant Code Set的超集。為了讓程序可以在縮減集(reduced set)中呈現出來,下面的三字母詞會被替換成相應的單字符.
三字母詞 單字符 ??= # ??/ \ ??' ^ ??( [ ??) ] ??! | ??< { ??> } ??- ~替換發生在任何其他處理之前。
例如:如果你嘗試打印字符串"what??!"
代碼如下:
printf("what??!\n");
會得到字符串"what|"。
如果你這樣注釋代碼,結果會讓你意外:
代碼如下:
// Will the next line be executed?????????????/
a++;
a++並不會執行。前提是你知道\的作用。
注意:由於編譯器對ANSI C的支持不一樣,有些編譯器會把三字母詞當普通字符處理,你需要給編譯選項加上“-trigraphs”
2.行拼接
以反斜槓"\"結尾的行會把該行和下一行拼接成一行(預處理器做的工作就是把該反斜槓'"\"和接著的換行字符'\n'刪除)。['\'稱為續行符]
例如你可以這樣寫
代碼如下:
/\
* is a legal comment. *\
/
3.宏定義和展開
a)簡單宏替換
簡單宏替換使程序中能用一個標識符來表示一個單詞串,指令形式為:
代碼如下:
#define 標識符 單詞串
標識符(稱為宏名)被定義為後面的單詞串;單詞串(簡稱串)是任意以換行結束的用於替換程序中該標識符的正文。如果串太長需要寫成多行,則除了最後一行外每一行末尾都要有一個續行符(即添加一個“\”後回車)。
注意:字符串常數中出現的與宏名相同的字符串不在替換之列。例如:
代碼如下:
#define YES 1
printf("YES"); // 輸出 YES,而不是1
b)帶參數的宏替換
預處理指令的形式為:
代碼如下:
#define 標識符(標識符,標識符,...,標識符) 單詞串
“標識符(標識符,標識符,...,標識符)”是被定義的宏,()外面的標識符稱為宏名,()中的標識符是宏的形式參數;宏名與其後的()之間不能有空白符。
例如:
代碼如下:
#define max(a,b) ((a)>(b)? (a): (b))
♦操作符#和##
操作符#把其後的串變成雙引號包圍的串;
操作符##把兩個標志符拼在一起,形成一個新的標識符
代碼如下:
#define str(expr) #expr
#define cat(x,y) x ## y
int ab=12;
printf(str(hello world!)); // 會被替換成 printf("hello world!");
printf("ab=%d\n", cat(a,b)); // 會被替換成 printf("ab=%d\n", ab); 輸出 ab=12
♦宏替換時的順序
代碼如下:
#include <stdio.h>
#define f(a,b) a##b
#define g(a) #a
#define h(a) g(a)
int main()
{
printf("%s\n", h(f(1,2)));
printf("%s\n", g(f(1,2)));
return 0;
}
輸出結果是12和f(1,2)。為什麼會這樣呢,宏的解開不像函數,由裡到外。
(1)在""內的宏名或宏參數名不被替換
(2)宏替換順序:一個帶參數的宏內部調用另一個宏,參數也是一個宏,則先替換外層的宏,再替換外層宏的參數,最後替換內層宏。
知道這些規則對於出現上面的結果就不難理解了。
溫馨提示:在寫帶參數的宏替換指令時,推薦的做法時將單詞串中的每一個參數都用()括起來,整個表達式也要用()括起來;否則,替換結果可能不是你想要的,例如:
代碼如下:
#define sqr(x) x * x
// 如果程序中的宏的引用形式為
sqr(3.0+1.0); // 經預處理後會被替換為 3.0 + 1.0 * 3.0 + 1.0
結果與你的原意(3.0+1.0)*(3.0+1.0)不等價
c)取消宏定義
代碼如下:
#undef 標識符
會使宏名標識符失去定義。如果#undef 一個沒有定義過的標識符 也不會引發錯誤。
4.文件包含
代碼如下:
#include <filename> // 引用標准庫的頭文件(編譯器將從標准庫目錄開始搜索)
#include "filename" // 引用非標准庫的頭文件(編譯器將從用戶的工作目錄開始搜索)
#include 標識符 // 標識符是由#define 定義的<filename>或"filename"的宏名
5.條件編譯
條件編譯指令格式如下:
代碼如下:
if-line 正文
[#elif 常量表達式 正文]
...
[#else 正文]
#endif
if-line為下面中的任意一種形式:
(1)#if 常量表達式
(2)#ifdef 標識符
(3)#ifndef 標識符
♦defined操作符用來判斷標識符是否定義過。形式如下:
defined identifier
或
defined (identifier)
下面的
#ifdef identifier
#ifndef identifier
等價於
#if defined identifier
#if ! defined identifier
6.行控制
行控制指令有下列兩種形式
(1)#line n "filename"
(2)#line n
行控制預處理功能為其他產生C源程序的預處理程序(例如數據庫系統中的宿主C預編譯程序)在跟蹤被處理程序(例如被宿主C預編譯程序處理的擴展名為.pc的預編譯源程序)的行號時提供方便,便於最終用戶的源程序查錯和該錯。它會使編譯器相信n(十進制正整數)為下一個源程序行的行號,“filename”會被當作當前文件名。
7.生成錯誤
#error error_messageopt
讓編譯器輸出錯誤信息error_message
8.Pragmas
#pragma token-sequenceopt
#pragma是編譯程序實現時定義的指令,它允許由此向編譯程序傳入各種指令。例如,一個編譯程序可能具有支持跟蹤程序執行的選項,此時可以用#pragma語句選擇該功能。編譯程序忽略其不支持的#pragma選項。#pragma提高C源程序對編譯程序的可移植性。
9.空指令
形如
#
沒有任何作用
10.預定義宏
C語言規范了5個固有的預定義宏,他們分別是
__LINE__ 當前源程序的行號
__FILE__ 正在編譯的程序的文件名
__DATE__ 編譯的日期字符串,形如"Mmm dd yyyy"
__TIME__ 編譯的時間字符串,形如"hh:mm:ss"
__STDC__ 如果__STDC__的內容是十進制常數1,則表示編譯程序的實現符合標准C