聲明:下面的實例全部在linux下嘗試,window下未嘗試。有興趣者可以試一下。文章針c初學者。
c語言的強符號和弱符號是c初學者經常容易犯錯的地方。而且很多時候,特別是多人配合開發的程序,它引起的問題往往非常行為怪異而且難以定位。
什麼是強符號和弱符號?
在c語言中,函數和初始化的全局變量是強符號,未初始化的全局變量時弱符號。強符號和弱符號的定義是連接器用來處理多重定義符號的,它的規則是:
不允許多個強符號;
如果一個強符號和一個弱符號,這選擇強符號;
如果多個弱符號,則任意選一個。
它的陷阱:
上代碼:
代碼如下:
//main.c
#include <stdio.h>
int fun();
int x;
int main()
{
printf("in main.c:x=%p\n", &x);
fun();
return 0;
}
//test.c
#include <stdio.h>
int x;
int fun()
{
printf("in test.c:x=%p\n", &x);
return 0;
}
編譯:gcc main.c test.c,運行,結果:
in main.c:x=0x80496a8
in test.c:x=0x80496a8
兩個x是一個變量。這也許可以說的過去,可能一個忘記加extern了。
再看:
代碼如下:
//main.c
#include <stdio.h>
int fun();
int x;
int main()
{
printf("in main.c:&x=%p\n", &x);
fun();
return 0;
}
代碼如下:
//test.c
#include <stdio.h>
struct
{
<span > </span>char a;
<span > </span>char b;
<span > </span>char c;
<span > </span>char d;<span > </span>
代碼如下:
<span > </span>int t;
代碼如下:
} x;
int fun()
{
printf("in test.c:&x=%p\n", &x);
return 0;
}
運行結果:
in main.c:&x=0x80496e0
in test.c:&x=0x80496e0
連接器還認為他們是一個變量,這個時候程序員非常可能認為他們是兩個變量(或者說優秀的程序員會)。而事實卻相反,同一塊內存,在不同的文件中會有不同的類型和含義。這兩個文件對這塊內存讀寫的過程中,都會影響到對方,引發非常詭異的問題。
設想一下,如果是一個程序同時又多個人員來開發,如果他們只有有一個全局變量重名,且沒有初始化,那麼就會引發問題了。
在一個程序中出現問題還算好,畢竟代碼都在一起。如果你使用的動態庫或者靜態庫中有未初始化的全局變量,並且恰好也和你定義的重名,結果如何?我嘗試過,和上面一樣,沖突的兩個變量地址也相同。而這個時候你如果沒有庫的源碼,當發生了問題,變量被修改,你估計要走很多彎路才能想到是庫改了你的變量。這是我曾經解決過的一個問題。從那之後,我要求我們公司所有庫的源碼中不可以出現非static全局變量。
如何避免?
1、上策:想辦法消除全局變量。全局變量會增加程序的耦合性,對他要控制使用。如果能用其他的方法代替最好。
2、中策:實在沒有辦法,那就把全局變量定義為static,它是沒有強弱之分的。而且不會和其他的全局符號產生沖突。至於其他文件可能對他的訪問,可以封裝成函數。把一個模塊的數據封裝起來是一個好的實踐。
3、下策:把所有的符號全部都變成強符號。所有的全局變量都初始化,記住,是所有的。如果一個沒有初始化,就可能會和其他人產生沖突,盡管別人初始化了。(自己寫代碼測試一下)。
4、必備之策:GCC提供了一個選項,可以檢查這類錯誤:-fno-common。
c語言為什麼設計它?
容易引發問題,怎麼回事C的一個特性?可能是歷史的原因,沒有深究。但我認為也可能是部分語言設計哲學的原因:c語言的設計哲學有一點就是充分的相信程序員,給他們最大的權利和靈活性。這個特性在某些特殊的情況下也許可能發揮作用。
語言中的君子和小人:
古人說要近君子,遠小人。像今天說的這個特性(共同體也可以算一個),應該是c語言中的“小人”(輕拍,可能說的比較重)。我們還是敬而遠之的比較好。康熙好像說過,(特殊時期)治國不但要用君子,還要會用小人,但要能夠駕馭得當。否則會引火燒身。