基本解釋
本節主要探討C編譯器下面兩方面的特點所引發的一系列常見的編程問題。
對C文件進行分別編譯:
C程序通常由幾個小程序(.c文件)組成,編譯器將這幾個小程序分別編譯,然後通過鏈接程序將它們組合在一起形成一個目標代碼。由於編譯器每次只能編譯一個文件,因此它不能立即檢查需要幾個源文件配合才能發現的錯誤。
對函數的參數和返回值建立臨時變量 C編譯器會對函數的參數建立臨時參數,也可能會對函數的返回值隱含傳遞一個指針。因為這些臨時變量的隱含性存在,使得在某些情況下,特別是有指針存在的時候,會引發一系列的問題。
C文件中所包含的頭文件會和C語言一同編譯 C語言中被包含的頭文件是和.c文件一起編譯的,頭文件中的問題會反映到.c文件的編譯中。
問題:C文件的分別編譯
我有一個數組a定義在f1.c中,但是我想在f2.c中計算它的元素個數,用sizeof可以達到這個目的嗎?
答案與分析:
答案是否定的,你沒有辦法達到目的,本質原因是sizeof操作符只是在“編譯時(compile time)”起作用,而C語言的編譯單位是每次單個.c文件進行編譯(其它語言也都如此)。因此,sizeof可以確定同一個源文件中某個數組的大小,但是對於定義在另一個源文件中的數組它無能為力了,因為那已經是“運行時(run time)”才能確定的事情了。
一件事情要想做,總會有辦法的,下面提供有三種可選的辦法來解決這個問題:
1)、定義一個全局變量,讓它記住數組的大小,在另外一個.c文件中我們通過訪問這個全局變量來得到數組的大小信息(好像有點小題大做得不償失^_^)。
2)、在某個.h文件中用宏定義數組的大小,例如#define ARRAY_SIZE 50,然後在兩個源文件中都包含這個.h文件,通過直接訪問ARRAY_SIZE來得到定義在不同.c文件中的數組的大小。
3)、設置數組的最後一個元素為特殊值,例如0,-1,NULL等,然後我們通過遍歷數組來尋找這個特殊的結尾元素,從而判斷數組的長度(這個辦法效率低,也是笨笨的)。
問題:函數返回值隱含傳遞指針
下面的代碼可以正常工作,但是在程序結束時會有一個致命錯誤產生。究竟是什麼原因呢?
struct list
{
char *item;
struct list *next;
}
main (argc, argv)
{
...
}
答案與分析:
原因很簡單,稍微注意一點不難發現,在定義結構list的右花括弧後面加一個分號就可以解決這個問題:
struct list
{
char *item;
struct list *next;
};//缺了這個分號可不行!
好了,問題是解決了,但,你知道這個錯誤究竟導致了什麼致命問題嗎?問題不是表面上那麼簡單的,OK,讓我們來看看事情背後的真相。
首先看一看下面這段代碼:
VOID Func ( struct my_struct stX)
{
.......
}
struct my_struct stY = {...};
Func (stY);
當調用函數Func的時候,是把結構變量stY的值拷貝一份到調用棧中,從而作為參數傳遞給函數FUNC的,這個叫做C語言的參數值傳遞。我相信這個你一定很清楚,那麼,你應該知道:如果函數的返回值是結構變量的話,函數應該如何將值返回給調用者呢?且看下面這段代碼:
struct my_structFunc (VOID)
{
.......
}
struct my_struct stY = Func();
此時函數Func的返回值是一個結構類型的值,這個返回值被放在內存中一個陰暗恐怖的地方,同時安排了一個指針指向這個地方(暫時稱為“神秘指針”),而這個指針會由C語言的編譯器作為一個隱藏參數傳遞給函數Func。當函數Func返回時,編譯器生成的代碼將這個由隱藏指針指向的內存區的值拷貝到返回結構stY中,從而完成將結構變量值返回給調用者。
你明白了上述所講的東東,那麼今天問題的真正原因也就呼之欲出了:
因為struct list {...}的定義後面沒有加分號,導致主函數main (argc, argv)被編譯器理解為是一個返回值為結構變量的函數,從而期望得到除了argc和argv以外的第三個參數,也就是我們上面提到的那個隱含傳入的“神秘指針”。可是,大家知道,這裡函數是main函數,main函數的參數是由程序中的啟動代碼(startup code)提供的。而啟動代碼當然認為main()天生就應該只得到兩個參數,要“神秘指針”,當然沒有,如此一來, main()在返回時自作主張地去調用棧中訪問它的那個並不存在的第三個參數(即神秘指針),這樣導致非法訪問,產生致命問題。這才是這個問題的真正根源。
建議:
1)、盡量將結構變量的指針而不是結構本身作為函數參數,否則函數調用時內存拷貝的開銷可不小,尤其是對那些調用頻繁、結構體大的情況。
2)、結構定義的後面一定要加分號,經過上面我的大段講述,我相信你不會犯相同的錯誤
問題:編譯器會給函數的參數隱含制造臨時副本
請問運行下面的Test函數會有什麼樣的結果?
void GetMemory2(char **p, int num)
{
*p = (char *)malloc(num);
}
void Test(void)
{
char *str = NULL;
GetMemory(&str, 100);
strcpy(str, "hello");
printf(str);
}
答案與分析:
這是林銳的《C/C++高質量編程指南》上面的例子,拿來用一下。
這樣調用會產生如下兩個後果:
1)、能夠輸出hello
2)、內存洩漏
另一個相關問題:
請問運行Test函數會有什麼樣的結果?
void GetMemory(char *p)
{
p = (char *)malloc(100);
}
void Test(void)
{
char *str = NULL;
GetMemory(str);
strcpy(str, "hello world");
printf(str);
}
答案與分析:
後果嚴重,運行的結果是程序崩潰,通過運行調試我們可以看到,經過GetMemory後,Test函數中的 str仍舊是NULL。可想而知,一調用
strcpy(str, "hello world");
程序必然崩潰了事。
原因分析:
C編譯器總是會為函數的每個參數制作臨時副本,指針參數p的副本是 _p,編譯器使 _p = p。如果函數體內的程序修改了_p的內容,就導致參數p的內容作相應的修改。這就是指針可以用作輸出參數的原因。在本例中,_p申請了新的內存,只是把_p所指的內存地址改變了,但是p絲毫未變。所以函數GetMemory並不能輸出任何東西,如果想要輸出動態內存,請使用指向指針的指針,或者,使用指向引用的指針。
問題:頭文件和包含它的.c文件一同編譯問題
下面的代碼非常短小,看起來毫無問題,但編譯器會報告一個錯誤,請問問題可能出現在什麼地方?
#include "someheader.h"
int myint = 0;
答案與分析:
不用盯著int myint = 0;看,這一句賦值應該是C語言中最簡單的語句,問題肯定不會出在它身上,那麼問題只可能出現在someheader.h中,最常見的就是該頭文件的最後一行的聲明(函數也好,變量也好)沒有用分號";"結尾,那麼編譯器會將它和myint變量結合起來考慮,自然就會出錯了。
這個問題主要是提醒你,在定位問題時思路要拓寬一點,可能要考慮一下所包含的頭文件是否有問題。
結論:被包含的頭文件是和.c文件一起編譯的,頭文件中的問題會反映到.c文件編譯中去的,切記。