概述
Joel Spolsky認為,對指針的理解是一種aptitude,不是通過訓練就可以達到的。雖然如此,我還是想談一談這個C/C++語言中最強勁也是最容易出錯的要素。
鑒於指針和目前計算機內存結構的關聯,很多C語言比較本質的特點都孕育在其中,因此,本篇和第六、第七兩篇我都將以指針為主線,結合在實際編程中遇到的問題,來詳細談談關於指針的幾個重要方面。
指針類型的本質分析
1、指針的本質
指針的本質:一種復合的數據類型。下面我將以下面幾個作為例子進行展開分析:
a)、int *p;
b)、int **p;
c)、int (*parValue)[3];
d)、int (*pFun)();
分析:
所謂的數據類型就是具有某種數據特征的東東,比如數據類型char,它的數據特征就是它所占據的內存為1個字節, 指針也很類似,指針所指向的值也占據著內存中的一塊地址,地址的長度與指針的類型有關,比如對於char型指針,這個指針占據的內存就是1個字節,因此指針也是一種數據類型,但我們知道指針本身也占據了一個內存空間地址,地址的長度和機器的字長有關,比如在32位機器中,這個長度就是4個字節,因此指針本身也同樣是一種數據類型,因此,我們說,指針其實是一種復合的數據類型,
好了,現在我們可以分析上面的幾個例子了。
假設有如下定義:
int nValue;
那麼,nValue的類型就是int,也就是把nValue這個具體變量去掉後剩余的部分,因此,上面的4個聲明可以類比進行分析:
a)、int *
*代表變量(指針本身)的值是一個地址,int代表這個地址裡面存放的是一個整數,這兩個結合起來,int *定義了一個指向整數的指針,類推如下:
b)、int **
指向一個指向整數的指針的指針。
c)、int (*)[3]
指向一個擁有三個整數的數組的指針。
d)、int (*)()
指向一個函數的指針,這個函數參數為空,返回值為整數。
分析結束,從上面可以看出,指針包括兩個方面,一個是它本身的值,是一個內存中的地址;另一個是指針所指向的物,是這個地址中所存放著具有各種各樣意義的數據。
2、對指針本身值的分析
下面例子考察指針本身的值(環境為32位的計算機):
void *p = malloc( 100 );
請計算sizeof ( p ) = ?
char str[] = “Hello” ;
char *p = str ;
請計算sizeof ( p ) = ?
void Func ( char str[100])
{
請計算 sizeof( str ) = ? //注意,此時,str已經退化為一個指針,詳情見
//下一篇指針與數組
}
分析:上面的例子,答案都是4,因為從上面的討論可以知道,指針本身的值對應著內存中的一個地址,它的size只與機器的字長有關(即它是由系統的內存模型決定的),在32位機器中,這個長度是4個字節。
3、對指針所指向物的分析
現在再對指針這個復合類型的第二部分,指針所指向物的意義進行分析。
上面我們已經得到了指針本身的類型,那麼將指針本身的類型去掉 “*”號就可得到指針所指向物的類型,分別如下:
a)、int
所指向物是一個整數。
b)、int*
所指向物是一個指向整數的指針。
c)、int ()[3]
()為空,可以去掉,變為int [3],所指向物是一個擁有三個整數的數組。
d)、int ()()
第一個()為空,可以去掉,變為int (),所指向物是一個函數,這個函數的參數為空,返回值為整數。
4、附加分析
另外,關於指針本身大小的問題,在C++中與C有所不同,這裡我也順帶談一下。
在C++中,對於指向對象成員的指針,它的大小不一定是4個字節,這主要是因為在引入多重虛擬繼承以及虛擬函數的時候,有些附加的信息也需要通過這個指針進行傳遞,因此指向對象成員的指針會增大,不論是指向成員數據,還是成員函數都是如此,具體與編譯器的實現有關,你可以編寫個很小的C++程序去驗證一下。另外,對一個類的靜態成員(static member,可以是靜態成員變量或者靜態成員函數)來說,指向它的指針只是普通的函數指針,而不是一個指向類成員的指針,所以它的大小不會增加,仍舊是4個字節。
指針運算符&和*
“&和*”,它們是一對相反的操作,’&’取得一個物的地址(也就是指針本身),’*’得到一個地址裡放的物(指針所指向的物)。這個東西可以是值(對象)、函數、數組、類成員(class member)等等。
參照上面的分析我們可以很好地理解&與*。
使用指針的好處?
關於指針的本質和基本的運算符我們討論過了,在這裡,我想再籠總地談一談使用指針的必要性和好處,為我們今後的使用和對後面篇章的理解做好鋪墊。簡而言之,指針有以下好處:
1)、方便使用動態分配的數組。
這個解釋我放在本系列第六篇中進行講解。
2)、對於相同類型(甚至是相似類型)的多個變量進行通用訪問。
就是用一個指針變量不斷在多個變量之間指來指去,從而使得非常應用起來非常靈活,不過,這招也比較危險,需要小心使用:因為出現錯誤的指針是編程中非常忌諱的事情。
3)、變相改變一個函數的值傳遞特性。
說白了,就是指針的傳地址作用,將一個變量的地址作為參數傳給函數,這樣函數就可以修改那個變量了。
4)、節省函數調用代價。
我們可以將參數,尤其是大個的參數(例如結構,對象等),將他們地址作為參數傳給函數,這樣可以省去編譯器為它們制作副本所帶來的空間和時間上的開銷。
5)、動態擴展數據結構。
因為指針可以動態地使用malloc/new生成堆上的內存,所以在需要動態擴展數據結構的時候,非常有用;比如對於樹、鏈表、Hash表等,這幾乎是必不可少的特性。
6)、與目前計算機的內存模型相對應,可按照內存地址進行直接存取,這使得C非常適合於一些較底層的應用。
這也是C/C++指針一個強大的優點,我會在後面講述C語言的底層操作時,較詳細地介紹這個優點的應用。
7)、遍歷數組。
據個例子來說吧,當你需要對字符串數組進行操作時,想一想,你當然要用字符串指針在字符串上掃來掃去。
…實在太多了,你可以慢慢來補充^_^。
指針本身的相關問題
1、問題:空指針的定義
曾經看過有的.h文件將NULL定義為0L,為什麼?
答案與分析:
這是一個關於空指針宏定義的問題。指針在C語言中是經常使用的,有時需要將一個指針置為空指針,例如在指針變量初始化的時候。
C語言中的空指針和Pascal或者Lisp語言中的NIL具有相同的地位。那如何定義空指針呢?下面的語句是正確的:
char *p1 = 0;
int *p2;
if (p != 0)
{
...
}
p2 = 0;
也就是說,在指針變量的初始化、賦值、比較操作中,0會被編譯器理解為要將指針置為空指針。至於空指針的內部表示是否是0,則隨不同的機器類型而定,不過通常都是0。但是在另外一些場合下,例如函數的參數原型是指針類型,函數調用時如果將0作為參數傳入,編譯器則不能將其理解為空指針。此時需要明確的類型轉換,例如:
void func (char *p);
func ((char *)0);
一般情況下,0是可以放在代碼中和指針關聯使用的,但是有些程序員(數量還不少呦!也許就包括你在內)不喜歡0的直白,認為其不能表示作為指針的特殊含義,於是要定義一個宏NULL,來明確表示空指針常量。這也是對的,人家C語言標准就明確說:“ NULL應該被定義為與實現相關的空指針常量”。但是將NULL定義成什麼樣的值呢?我想你一定見過好幾種定義NULL的方法:
#define NULL 0
#define NULL (char *)0
#define NULL (void *)0
在我們使用的絕大多數計算系統上,例如PC,上述定義是能夠工作的。然而,世界上還有很多其它種類的計算機,其CPU也不是Intel的。在某些系統上,指針和整數的大小和內部表示並不一致,甚至不同類型的指針的大小都不一致。為了避免這種可移植性問題,0L是一種最為安全的、最妥帖的定義方式。0L的含義是: “值為0的整數常量表達式”。這與C語言給出的空指針定義完全一致。因此,建議采用0L作為空指針常量NULL的值。
其實 NULL定義值,和操作系統的的平台有關, 將一個指針定義為 NULL, 其用意是為了保護操作系統,因為通過指針可以訪問任何一塊地址, 但是,有些數據是不許一般用戶訪問的,比如操作系統的核心數據。 當我們通過一個空(NULL)的指針去方位數據時,系統會提示非法, 那麼系統又是如何知道的呢??
以windows2000系統為例, 該系統規定系統中每個進程的起始地址(0x00000000)開始的某個地址范圍內是存放系統數據的,用戶進程無法訪問, 所以當用戶用空指針(0)訪問時,其實訪問的就是0x00000000地址的系統數據,由於該地址數據是受系統保護的,所以系統會提示錯誤(指針訪問非法)。
這也就是說NULL值不一定要定義成0,起始只要定義在系統的保護范圍的地址空間內,比如定義成(0x00000001, 0x00000002)都會起到相同的作用,但是為了考慮到移植性,普遍定義為0 。
2、問題:與指針相關的編程規則&規則分析
指針既然這麼重要,而且容易出錯,那麼有沒有方法可以很好地減少這些指針相關問題的出現呢?
答案與分析:
減少出錯的根本是徹底理解指針。
在方法上,遵循一定的編碼規則可能是最立竿見影的方法了,下面我來闡述一下與指針相關的編程規則:
1) 未使用的指針初始化為NULL 。
2) 在給指針分配空間前、分配後均應作判斷。
3) 指針所指向的內容刪除後也要清除指針本身。
要牢記指針是一個復合的數據結構這個本質,所以我們不論初始化和清除都要同時兼顧指針本身(上述規則1,3)和指針所指向的內容(上述規則2,3)這兩個方面。
遵循這些規則可以有效地減少指針出錯,我們來看下面的例子:
void Test(void)
{
char *str = (char *) malloc(100);
strcpy(str, “hello”);
free(str);
if(str != NULL)
{
strcpy(str, “world”);
printf(str);
}
}
請問運行Test函數會有什麼樣的結果?
答:
篡改動態內存區的內容,後果難以預料,非常危險。因為free(str);之後,str成為野指針,if(str != NULL)語句不起作用。
如果我們牢記規則3,在free(str)後增加語句:
str = NULL;
那麼,就可以防止這樣的錯誤發生。