了解引用reference與指針pointer到底有什麼不同可以幫助你決定什麼時候該用reference,什麼時候該用pointer。
在C++ 中,reference在很多方面與指針(pointer)具有同樣的能力。雖然多數C++程序員對於何時使用reference何時使用pointer 都會有一些直覺,但總還是會有些時候搞不清楚。如果你想要建立一個關於使用reference使用的清晰有理的概念, 又有必要了解到底reference和pointer有什麼不同。
深層含義
與pointer 類似,一個reference是一個對象(object),可以用來間接指向另一個對象。一個reference的聲明與pointer的聲明的實質語法結構是相同的。不同的是,聲明pointer的時候使用星號操作符 * , 而聲明reference的時候使用地址操作符 & 。 例如,我們有:
int i = 3;
則有:
int *pi = &i;
聲明 pi 為一個指針類型的對象,並且是一個”指向int整型的指針”,它的初始值為對象i的地址。而另一方面:
int &ri = i;
聲明 ri為一個reference類型的對象,並且也是一個指向整型的reference,它指向的是i。 我們可以看到pointer和reference的聲明有顯著的不同,但這並不是決定何時使用哪一個的根據。決定的真正依據是當它們被用在表達式中時其顯 示的不同決定了使用哪一個合適
Pointer 和reference的最大不同是:pointer必須使用一個星號操作符 * 來去掉reference (英文叫做dereference,我不知道這裡怎樣翻譯這個詞合適,姑且就叫“去參考”吧)而reference不需要任何操作符來去參考。 例如, 有了上面例子中的定義, 間接表達式 *pi 將 pi 去參考為指向i。相反, 表達式ri-不需要任何操作符-自動將ri去參考為指向i。因此, 使用指針p,我們需要用賦值語句:
*p = 4;
將i的值變為4; 而使用reference ri,我們只需要直接寫:
ri = 4;
就可以同樣將i的值變為4 。
這個顯示的不同在當你為函數的參數類型和返回值類型選擇是使用pointer還是reference的時候就會顯著起來,尤其是對於重載操作符的函數。
下面使用一個針對列舉類型(enumeration)的++操作符例子來說明上面這點。在C++中, 內置的++操作符對列舉類型無效,例如, 對下面定義:
enum day{
Sunday, Monday, …
};
day x;
表達式 ++x 不能編譯。如果想讓它通過編譯,必須要定義一個名為operator++的函數,接受day為參數,並且調用 ++x 必須改變x的值。因此, 僅聲明一個函數 operator++ , 以類型day為參數, 如下:
day operator++(day d);
並不能夠得到想要得效果。 這個函數通過值傳遞參數(pass by value),這就意味著函數內看到的是參數的一個拷貝,而不是參數本身。為了使函數能夠改變其操作數(operand)的值,它必須通過指針或reference來傳遞其操作數。
通過指針傳遞參數(passing by pointer),函數定義如下:
day *operator++(day *d);
它通過將增加後的值存儲到*d裡面來使函數改變日期(day)的值。但是,這樣你就必須使用像表達式++&x這樣來調用這個操作符,這看起來不太對勁兒。
正確的方法是定義operator++以reference為參數類型,如下:
day &operator++(day &d)
{
d = (day)(d + 1);
return d;
}
使用這個函數, 表達式 ++x 才有正確的顯示以及正確的操作。
Passing by reference不僅僅是寫operator++較好的方法,而是唯一的方法。 C++在這裡並沒有給我們選擇的余地。 像下面的聲明:
day *operator++(day *d);
是不能 通過編譯的。每個重載的操作符函數必須或者是一個類的成員, 或者使用類型T、 T & 或 T const & 為參數類型,這裡T是一個類(class)或列舉(enumeration)類型。 也就是說,每一個重載操作符必須以類或列舉類型為參數類型。指針,即使是指向一個類或列舉類型對象的指針,也不可以用。C++ 不允許在重載操作符時重新定義內置操作符的含義,包括指針類型。因此,我們不可以定義:
int operator++(int i); // 錯誤
因為它試圖對int重新定義操作符 ++ 的含義。 我們也不可以定義:
int *operator++(int *i); // 錯誤
因為它試圖對 int * 重新定義操作符 ++ 的含義。
References vs. const pointers
C++ 中不允許定義”const reference”, 因為一個reference天生就是const。也就是說,一旦將一個reference綁定到一個對象,就無法再將它重新綁定到另一個不同的對象。在聲 明一個reference之後沒有寫法可以將它重新綁定到另外一個對象。例如:
int &ri = i;
將 ri 綁定到 i 。然後下面的賦值:
ri = j;
並不是把 ri 綁定到 j ,而是將 j 中的值賦給 ri 指向的對象,也就是賦給 i 。
簡而言之,一個pointer在它的有生之年可以指向許多不同的對象,而一個reference只能夠指向一個對象。有些人認為這才是 reference和 pointer最大的不同。我並不贊成。也許這是reference與pointer的一點不同, 但並不是reference和const pointer的不同。在強調一遍,一旦一個reference與一個對象綁定,就不能再將它改指向另外的東西。既然不能再綁定reference之後再 改變, 一個reference就必須在一出生就被綁定。否則這個reference就永遠不能被綁定到任何東西,也就毫無用處了。
上一段的討論也同樣完全適用於常量指針(const pointer)。(注意,我這裡說的是常量指針(const pointer), 而不是指向常量的指針 “pointers to const”。) 例如,一個reference聲明必須同時帶有一個初始化賦值,如下所示:
void f()
{
int &r = i;
…
}
省略這個初始化賦值將產生一個編譯錯誤:
void f()
{
int &r; //錯誤
…
}
一個常量指針的聲明也同樣必須帶有一個初始化賦值,如下所示:
void f()
{
int *const p = &i;
…
}
省略這個初始化賦值同樣會出錯:
void f(){
int *const p; // 錯誤
…
}
在我看來, 不能夠對reference二次綁定作為reference與pointer的不同。並不比常量指針和非常量指針的不同更為顯著。
Null references
除了顯示的不同,常量指針與reference還有一點非常不同,那就是,一個有效的reference必須指向一個對象;而一個指針不需要。一個指針,即使是一個常量指針, 都可以有空值。 一個空指針不指向任何東西。
這點不同就暗示當你想要確信一個參數必須指向一個對象的時候,應該使用reference作為參數類型。 例如,交換函數(swap function),它接受兩個int參數,並將兩個參數的數值對調,如下所示:
int i, j;
swap(i, j);
將原本在 i 中的值放到 j 中, 並將原本在 j 中的值放到 i 中。我們可以這樣寫這個函數:
void swap(int *v1, int *v2)
{
int temp = *v1;
*v1 = *v2;
*v2 = temp;
}
這種定義下,函數要像這樣被調用: swap(&i, &j);
這個接口暗示其中一個或兩個參數都有可能為空(null)。而這個暗示是誤導的。例如,調用
swap(&i, NULL);
的後果很可能是不愉快的。
而像下面這樣定義reference為參數:
void swap(int &v1, int &v2)
{
int temp = v1;
v1 = v2;
v2 = temp;
}
清晰的表明了調用swap應該提供兩個對象,它們的值將被交換。 並且這樣定義的另一個好處是,在調用這個函數的時候,不需要使用那些&符號,看起來更順眼:
swap(i, j);
更安全?
有些人認為既然reference不能夠為空,那麼它應該比指針更安全。 我認為reference可能要安全一點,但不會安全很多。雖然一個有效的reference不能為空,但是無效的可以呀。實際上,在很多情況下程序有可 能產生無效的reference,而不只是空的reference。 例如,你可以定義一個reference,使它綁定到一個指針指向的對象,如下所示:
int *p;
…
int &r = *p;
如果指針*p在reference定義時剛好為空,則這個reference為空。 從技術上來說,這個錯誤並不在於將reference綁定到一個空值,而是在於對一個空指針去參考。 對一個空指針去參考產生了一個不確定的操作,也就意味著很多事都可能發生,而且大部分都不是什麼好事。很有可能當程序將reference r 綁定到*p (p所指向的對象)的時候,p實際上沒有被去參考,甚至程序只是將p的值拷貝給實現r的指針。而程序將會繼續執行下去直到錯誤在後面的運行中更為明顯的表 現出來,產生不可預知的危害。
下面的函數展示了另外一種產生無效reference的方法:
int &f()
{
int i;
…
return i;
}
這個函數返回一個指向本地變量 i 的reference。然而當函數返回時,本地變量 i 的存儲空間也就消失了。因此這個函數實際返回了一個指向被回收了的空間的reference。這個操作與返回一個指向本地變量的指針的後果相同。有些編譯 器可以在編譯時發現這個錯誤,但也很有可能不會發現。
我喜歡reference,也有很好的理由使用它們代替pointer。但如果你期望使用reference來使你的程序健壯性顯著增強,那麼你多半會失望的。
參考資料:
Saks, Dan. “Introduction to References,” Embedded Systems Programming, January 2001, p. 81.
Saks, Dan. “References and const“, Embedded Systems Programming February 2001, p. 73.