程式師世界 >> 編程語言 >> C語言 >> C >> 關於C >> C語言初學者入門第十五講預處理

C語言初學者入門第十五講預處理

編輯：關於C

概述

　　在前面各章中，已多次使用過以“#”號開頭的預處理命令。如包含命令# include，宏定義命令# define等。在源程序中這些命令都放在函數之外，而且一般都放在源文件的前面，它們稱為預處理部分。

　　所謂預處理是指在進行編譯的第一遍掃描(詞法掃描和語法分析)之前所作的工作。預處理是C語言的一個重要功能，它由預處理程序負責完成。當對一個源文件進行編譯時，系統將自動引用預處理程序對源程序中的預處理部分作處理，處理完畢自動進入對源程序的編譯。

　　C語言提供了多種預處理功能，如宏定義、文件包含、條件編譯等。合理地使用預處理功能編寫的程序便於閱讀、修改、移植和調試，也有利於模塊化程序設計。本章介紹常用的幾種預處理功能。

　　宏定義

　　在C語言源程序中允許用一個標識符來表示一個字符串，稱為“宏”。被定義為“宏”的標識符稱為“宏名”。在編譯預處理時，對程序中所有出現的“宏名”，都用宏定義中的字符串去代換，這稱為“宏代換”或“宏展開”。

　　宏定義是由源程序中的宏定義命令完成的。宏代換是由預處理程序自動完成的。在C語言中，“宏”分為有參數和無參數兩種。下面分別討論這兩種“宏”的定義和調用。

　　無參宏定義

　　無參宏的宏名後不帶參數。其定義的一般形式為： #define 標識符字符串其中的“#”表示這是一條預處理命令。凡是以“#”開頭的均為預處理命令。“define”為宏定義命令。 “標識符”為所定義的宏名。“字符串”可以是常數、表達式、格式串等。在前面介紹過的符號常量的定義就是一種無參宏定義。此外，常對程序中反復使用的表達式進行宏定義。例如： # define M (y*y+3*y) 定義M表達式(y*y+3*y)。在編寫源程序時，所有的(y*y+3*y)都可由M代替，而對源程序作編譯時，將先由預處理程序進行宏代換，即用(y*y+3*y)表達式去置換所有的宏名M，然後再進行編譯。

#define M (y*y+3*y)
main(){
　int s,y;
　printf("input a number: ");
　scanf("%d",&y);
　s=3*M+4*M+5*M;
　printf("s=%d\n",s);
}

　　上例程序中首先進行宏定義，定義M表達式(y*y+3*y),在s= 3*M+4*M+5* M中作了宏調用。在預處理時經宏展開後該語句變為：s=3*(y*y+3*y)+4(y*y+3*y)+5(y*y+3*y);但要注意的是，在宏定義中表達式(y*y+3*y)兩邊的括號不能少。否則會發生錯誤。

　　當作以下定義後： #difine M y*y+3*y在宏展開時將得到下述語句： s=3*y*y+3*y+4*y*y+3*y+5*y*y+3*y；這相當於； 3y2+3y+4y2+3y+5y2+3y；顯然與原題意要求不符。計算結果當然是錯誤的。因此在作宏定義時必須十分注意。應保證在宏代換之後不發生錯誤。對於宏定義還要說明以下幾點：

　　1. 宏定義是用宏名來表示一個字符串，在宏展開時又以該字符串取代宏名，這只是一種簡單的代換，字符串中可以含任何字符，可以是常數，也可以是表達式，預處理程序對它不作任何檢查。如有錯誤，只能在編譯已被宏展開後的源程序時發現。

　　2. 宏定義不是說明或語句，在行末不必加分號，如加上分號則連分號也一起置換。

　　3. 宏定義必須寫在函數之外，其作用域為宏定義命令起到源程序結束。如要終止其作用域可使用# undef命令，例如：

# define PI 3.14159
main()
{
……
}

　　# undef PIPI的作用域

　　f1()

　　....表示PI只在main函數中有效，在f1中無效。

　　4. 宏名在源程序中若用引號括起來，則預處理程序不對其作宏代換。

#define OK 100
main()
{
　printf("OK");
　printf("\n");
}

　　上例中定義宏名OK表示100，但在printf語句中OK被引號括起來，因此不作宏代換。程序的運行結果為：OK這表示把“OK”當字符串處理。

　　5. 宏定義允許嵌套，在宏定義的字符串中可以使用已經定義的宏名。在宏展開時由預處理程序層層代換。例如：

#define PI 3.1415926
#define S PI*y*y /* PI是已定義的宏名*/對語句： printf("%f",s);

　　在宏代換後變為： printf("%f",3.1415926*y*y);

　　6. 習慣上宏名用大寫字母表示，以便於與變量區別。但也允許用小寫字母。

　　7. 可用宏定義表示數據類型，使書寫方便。例如： #define STU struct stu在程序中可用STU作變量說明：

STU body[5],*p;#define INTEGER int
　　
　　在程序中即可用INTEGER作整型變量說明： INTEGER a,b; 應注意用宏定義表示數據類型和用typedef定義數據說明符的區別。宏定義只是簡單的字符串代換，是在預處理完成的，而typedef是在編譯時處理的，它不是作簡單的代換，而是對類型說明符重新命名。被命名的標識符具有類型定義說明的功能。請看下面的例子： #define PIN1 int*　typedef (int*) PIN2;從形式上看這兩者相似，但在實際使用中卻不相同。下面用PIN1，PIN2說明變量時就可以看出它們的區別： PIN1 a,b;在宏代換後變成 int *a,b;表示a是指向整型的指針變量，而b是整型變量。然而：PIN2 a,b;表示a,b都是指向整型的指針變量。因為PIN2是一個類型說明符。由這個例子可見，宏定義雖然也可表示數據類型，但畢竟是作字符代換。在使用時要分外小心，以避出錯。

　　8. 對“輸出格式”作宏定義，可以減少書寫麻煩。例9.3 中就采用了這種方法。

#define P printf
#define D "%d\n"
#define F "%f\n"
main(){
int a=5, c=8, e=11;
float b=3.8, d=9.7, f=21.08;
P(D F,a,b);
P(D F,c,d);
P(D F,e,f);
}
　　帶參宏定義

　　C語言允許宏帶有參數。在宏定義中的參數稱為形式參數，在宏調用中的參數稱為實際參數。對帶參數的宏，在調用中，不僅要宏展開，而且要用實參去代換形參。

　　帶參宏定義的一般形式為： #define 宏名(形參表) 字符串在字符串中含有各個形參。帶參宏調用的一般形式為：宏名(實參表)；
例如：

#define M(y) y*y+3*y /*宏定義*/
:
k=M(5); /*宏調用*/
: 在宏調用時，用實參5去代替形參y，經預處理宏展開後的語句
為： k=5*5+3*5
#define MAX(a,b) (a>b)?a:b
main(){
int x,y,max;
printf("input two numbers: ");
scanf("%d%d",&x,&y);
max=MAX(x,y);
printf("max=%d\n",max);
}

　　上例程序的第一行進行帶參宏定義，用宏名MAX表示條件表達式(a>b)?a:b，形參a,b均出現在條件表達式中。程序第七行max=MAX(x,
y)為宏調用，實參x,y，將代換形參a,b。宏展開後該語句為： max=(x>y)?x:y;用於計算x,y中的大數。對於帶參的宏定義有以下問題需要說明：

　　1. 帶參宏定義中，宏名和形參表之間不能有空格出現。

　　例如把： #define MAX(a,b) (a>b)?a:b寫為： #define MAX (a,b) (a>b)?a:b 將被認為是無參宏定義，宏名MAX代表字符串 (a,b)(a>b)?a:b。

　　宏展開時，宏調用語句： max=MAX(x,y);將變為： max=(a,b)(a>b)?a:b(x,y);這顯然是錯誤的。

　　2. 在帶參宏定義中，形式參數不分配內存單元，因此不必作類型定義。而宏調用中的實參有具體的值。要用它們去代換形參，因此必須作類型說明。這是與函數中的情況不同的。在函數中，形參和實參是兩個不同的量，各有自己的作用域，調用時要把實參值賦予形參，進行“值傳遞”。而在帶參宏中，只是符號代換，不存在值傳遞的問題。

　　3. 在宏定義中的形參是標識符，而宏調用中的實參可以是表達式。

#define SQ(y) (y)*(y)
main(){
int a,sq;
printf("input a number: ");
scanf("%d",&a);
sq=SQ(a+1);
printf("sq=%d\n",sq);
}

　　上例中第一行為宏定義，形參為y。程序第七行宏調用中實參為a+1，是一個表達式，在宏展開時，用a+1代換y，再用(y)*(y) 代換SQ，得到如下語句： sq=(a+1)*(a+1); 這與函數的調用是不同的，函數調用時要把實參表達式的值求出來再賦予形參。而宏代換中對實參表達式不作計算直接地照原樣代換。

　　4. 在宏定義中，字符串內的形參通常要用括號括起來以避免出錯。在上例中的宏定義中(y)*(y)表達式的y都用括號括起來，因此結果是正確的。如果去掉括號，把程序改為以下形式：

#define SQ(y) y*y
main(){
int a,sq;
printf("input a number: ");
scanf("%d",&a);
sq=SQ(a+1);
printf("sq=%d\n",sq);
}

　　運行結果為：input a number:3

　　sq=7 同樣輸入3，但結果卻是不一樣的。問題在哪裡呢? 這是由於代換只作符號代換而不作其它處理而造成的。宏代換後將得到以下語句： sq=a+1*a+1; 由於a為3故sq的值為7。這顯然與題意相違，因此參數兩邊的括號是不能少的。即使在參數兩邊加括號還是不夠的，請看下面程序：

#define SQ(y) (y)*(y)
main(){
int a,sq;
printf("input a number: ");
scanf("%d",&a);
sq=160/SQ(a+1);
printf("sq=%d\n",sq);
}

　　本程序與前例相比，只把宏調用語句改為： sq=160/SQ(a+1); 運行本程序如輸入值仍為3時，希望結果為10。但實際運行的結果如下：input a number:3　sq=160為什麼會得這樣的結果呢?分析宏調用語句，在宏代換之後變為： sq=160/(a+1)*(a+1);a為3時，由於“/”和“*”運算符優先級和結合性相同，則先作160/(3+1)得40，再作40*(3+1)最後得160。為了得到正確答案應在宏定義中的整個字符串外加括號，程序修改如下

#define SQ(y) ((y)*(y))
main(){
　int a,sq;
　printf("input a number: ");
　scanf("%d",&a);
　sq=160/SQ(a+1);
　printf("sq=%d\n",sq);
}

　　以上討論說明，對於宏定義不僅應在參數兩側加括號，也應在整個字符串外加括號。

　　5. 帶參的宏和帶參函數很相似，但有本質上的不同，除上面已談到的各點外，把同一表達式用函數處理與用宏處理兩者的結果有可能是不同的。

main(){
int i=1;
while(i<=5)
printf("%d\n",SQ(i++));
}
SQ(int y)
{
　return((y)*(y));
}#define SQ(y) ((y)*(y))
main(){
　int i=1;
　while(i<=5)
　　printf("%d\n",SQ(i++));
}

　　在上例中函數名為SQ，形參為Y，函數體表達式為((y)*(y))。在例9.6中宏名為SQ，形參也為y，字符串表達式為(y)*(y))。兩例是相同的。例9.6的函數調用為SQ(i++)，例9.7的宏調用為SQ(i++)，實參也是相同的。從輸出結果來看，卻大不相同。分析如下：在例9.6中，函數調用是把實參i值傳給形參y後自增1。然後輸出函數值。因而要循環5次。輸出1～5的平方值。而在例9.7中宏調用時，只作代換。SQ(i++)被代換為((i++)*(i++))。在第一次循環時，由於i等於1，其計算過程為：表達式中前一個i初值為1，然後i自增1變為2，因此表達式中第2個i初值為2，兩相乘的結果也為2，然後i值再自增1，得3。在第二次循環時，i值已有初值為3，因此表達式中前一個i為3，後一個i為4，乘積為12，然後i再自增1變為5。進入第三次循環，由於i 值已為5，所以這將是最後一次循環。計算表達式的值為5*6等於30。i值再自增1變為6，不再滿足循環條件，停止循環。從以上分析可以看出函數調用和宏調用二者在形式上相似，在本質上是完全不同的。

　　6. 宏定義也可用來定義多個語句，在宏調用時，把這些語句又代換到源程序內。看下面的例子。

#define SSSV(s1,s2,s3,v) s1=l*w;s2=l*h;s3=w*h;v=w*l*h;
main(){
　int l=3,w=4,h=5,sa,sb,sc,vv;
　SSSV(sa,sb,sc,vv);
　printf("sa=%d\nsb=%d\nsc=%d\nvv=%d\n",sa,sb,sc,vv);
}

　　程序第一行為宏定義，用宏名SSSV表示4個賦值語句，4 個形參分別為4個賦值符左部的變量。在宏調用時，把4 個語句展開並用實參代替形參。使計算結果送入實參之中。

　　文件包含

　　文件包含是C預處理程序的另一個重要功能。文件包含命令行的一般形式為： #include"文件名" 在前面我們已多次用此命令包含過庫函數的頭文件。例如：

#include"stdio.h"
#include"math.h"

　　文件包含命令的功能是把指定的文件插入該命令行位置取代該命令行，從而把指定的文件和當前的源程序文件連成一個源文件。在程序設計中，文件包含是很有用的。一個大的程序可以分為多個模塊，由多個程序員分別編程。有些公用的符號常量或宏定義等可單獨組成一個文件，在其它文件的開頭用包含命令包含該文件即可使用。這樣，可避免在每個文件開頭都去書寫那些公用量，從而節省時間，並減少出錯。

　　對文件包含命令還要說明以下幾點：

　　1. 包含命令中的文件名可以用雙引號括起來，也可以用尖括號括起來。例如以下寫法都是允許的： #include"stdio.h"　#include<math.h> 但是這兩種形式是有區別的：使用尖括號表示在包含文件目錄中去查找(包含目錄是由用戶在設置環境時設置的)，而不在源文件目錄去查找；使用雙引號則表示首先在當前的源文件目錄中查找，若未找到才到包含目錄中去查找。用戶編程時可根據自己文件所在的目錄來選擇某一種命令形式。

　　2. 一個include命令只能指定一個被包含文件，若有多個文件要包含，則需用多個include命令。3. 文件包含允許嵌套，即在一個被包含的文件中又可以包含另一個文件。

　　條件編譯

　　預處理程序提供了條件編譯的功能。可以按不同的條件去編譯不同的程序部分，因而產生不同的目標代碼文件。這對於程序的移植和調試是很有用的。條件編譯有三種形式，下面分別介紹：

　　1. 第一種形式：

#ifdef 標識符
程序段1
#else
程序段2
#endif

　　它的功能是，如果標識符已被 #define命令定義過則對程序段1進行編譯；否則對程序段2進行編譯。如果沒有程序段2(它為空)，本格式中的#else可以沒有，即可以寫為：

#ifdef 標識符
程序段 #endif
#define NUM ok
main(){
　struct stu
　{
　　int num;
　　char *name;
　　char sex;
　　float score;
　} *ps;
　ps=(struct stu*)malloc(sizeof(struct stu));
　ps->num=102;
　ps->name="Zhang ping";
　ps->sex='M';
　ps->score=62.5;
　#ifdef NUM
　　printf("Number=%d\nScore=%f\n",ps->num,ps->score);
　#else
　　printf("Name=%s\nSex=%c\n",ps->name,ps->sex);
　#endif
　free(ps);
}

　　由於在程序的第16行插入了條件編譯預處理命令，因此要根據NUM是否被定義過來決定編譯那一個printf語句。而在程序的第一行已對NUM作過宏定義，因此應對第一個printf語句作編譯故運行結果是輸出了學號和成績。在程序的第一行宏定義中，定義NUM表示字符串OK，其實也可以為任何字符串，甚至不給出任何字符串，寫為： #define NUM 也具有同樣的意義。只有取消程序的第一行才會去編譯第二個printf語句。讀者可上機試作。

　　2. 第二種形式：

#ifndef 標識符
程序段1
#else
程序段2
#endif

　　與第一種形式的區別是將“ifdef”改為“ifndef”。它的功能是，如果標識符未被#define命令定義過則對程序段1進行編譯，否則對程序段2進行編譯。這與第一種形式的功能正相反。

　　3. 第三種形式：

#if 常量表達式
程序段1
#else
程序段2
#endif

　　它的功能是，如常量表達式的值為真(非0)，則對程序段1 進行編譯，否則對程序段2進行編譯。因此可以使程序在不同條件下，完成不同的功能

#define R 1
main(){
　float c,r,s;
　printf ("input a number: ");
　scanf("%f",&c);
　#if R
　　r=3.14159*c*c;
　　printf("area of round is: %f\n",r);
　#else
　　s=c*c;
　　printf("area of square is: %f\n",s);
　#endif
}

　　本例中采用了第三種形式的條件編譯。在程序第一行宏定義中，定義R為1，因此在條件編譯時，常量表達式的值為真，故計算並輸出圓面積。上面介紹的條件編譯當然也可以用條件語句來實現。但是用條件語句將會對整個源程序進行編譯，生成的目標代碼程序很長，而采用條件編譯，則根據條件只編譯其中的程序段1或程序段2，生成的目標程序較短。如果條件選擇的程序段很長，采用條件編譯的方法是十分必要的。