數組(Array)是一系列具有相同類型的數據的集合,每一份數據叫做一個數組元素(Element)。數組中的所有元素在內存中是連續排列的,整個數組占用的是一塊內存。以
int arr[] = { 99, 15, 100, 888, 252 };
為例,該數組在內存中的分布如下圖所示:
定義數組時,要給出數組名和數組長度,數組名可以認為是一個指針,它指向數組的第 0 個元素。在C語言中,我們將第 0 個元素的地址稱為數組的首地址。以上面的數組為例,下圖是 arr 的指向:
數組名的本意是表示整個數組,也就是表示多份數據的集合,但在使用過程中經常會轉換為指向數組第 0 個元素的指針,所以上面使用了“認為”一詞,表示數組名和數組首地址並不總是等價。初學者可以暫時忽略這個細節,把數組名當做指向第 0 個元素的指針使用即可,我們將在VIP教程《數組和指針絕不等價,數組是另外一種類型》和《數組在什麼時候會轉換為指針》中再深入討論這一細節。
下面的例子演示了如何以指針的方式遍歷數組元素:
#include <stdio.h>
int main(){
int arr[] = { 99, 15, 100, 888, 252 };
int len = sizeof(arr) / sizeof(int); //求數組長度
int i;
for(i=0; i<len; i++){
printf("%d ", *(arr+i) ); //*(arr+i)等價於arr[i]
}
printf("\n");
return 0;
}
運行結果:
99 15 100 888 252
第 4 行代碼用來求數組的長度,sizeof(arr) 會獲得整個數組所占用的字節數,sizeof(int) 會獲得一個數組元素所占用的字節數,它們相除的結果就是數組包含的元素個數,也即數組長度。
第 8 行代碼中我們使用了
*(arr+i)
這個表達式,arr 是數組名,指向數組的第 0 個元素,表示數組首地址, arr+i 指向數組的第 i 個元素,*(arr+i) 表示取第 i 個元素的數據,它等價於 arr[i]。
arr 是int*
類型的指針,每次加 1 時它自身的值會增加 sizeof(int),加 i 時自身的值會增加 sizeof(int) * i,這在《指針變量的運算》中已經進行了詳細講解。
我們也可以定義一個指向數組的指針,例如:
int arr[] = { 99, 15, 100, 888, 252 };
int *p = arr;
arr 本身就是一個指針,可以直接賦值給指針變量 p。arr 是數組第 0 個元素的地址,所以
int *p = arr;
也可以寫作
int *p = &arr[0];
。也就是說,arr、p、&arr[0] 這三種寫法都是等價的,它們都指向數組第 0 個元素,或者說指向數組的開頭。
再強調一遍,“arr 本身就是一個指針”這種表述並不准確,嚴格來說應該是“arr 被轉換成了一個指針”。這裡請大家先忽略這個細節,我們將在VIP教程《數組和指針絕不等價,數組是另外一種類型》和《數組在什麼時候會轉換為指針》中深入討論。
如果一個指針指向了數組,我們就稱它為數組指針(Array Pointer)。
數組指針指向的是數組中的一個具體元素,而不是整個數組,所以數組指針的類型和數組元素的類型有關,上面的例子中,p 指向的數組元素是 int 類型,所以 p 的類型必須也是
int *
。
反過來想,p 並不知道它指向的是一個數組,p 只知道它指向的是一個整數,究竟如何使用 p 取決於程序員的編碼。
更改上面的代碼,使用數組指針來遍歷數組元素:
#include <stdio.h>
int main(){
int arr[] = { 99, 15, 100, 888, 252 };
int i, *p = arr, len = sizeof(arr) / sizeof(int);
for(i=0; i<len; i++){
printf("%d ", *(p+i) );
}
printf("\n");
return 0;
}
數組在內存中只是數組元素的簡單排列,沒有開始和結束標志,在求數組的長度時不能使用
sizeof(p) / sizeof(int)
,因為 p 只是一個指向 int 類型的指針,編譯器並不知道它指向的到底是一個整數還是一系列整數(數組),所以 sizeof(p) 求得的是 p 這個指針變量本身所占用的字節數,而不是整個數組占用的字節數。
也就是說,根據數組指針不能逆推出整個數組元素的個數,以及數組從哪裡開始、到哪裡結束等信息。不像字符串,數組本身也沒有特定的結束標志,如果不知道數組的長度,那麼就無法遍歷整個數組。
上節我們講到,對指針變量進行加法和減法運算時,是根據數據類型的長度來計算的。如果一個指針變量 p 指向了數組的開頭,那麼 p+i 就指向數組的第 i 個元素;如果 p 指向了數組的第 n 個元素,那麼 p+i 就是指向第 n+i 個元素;而不管 p 指向了數組的第幾個元素,p+1 總是指向下一個元素,p-1 也總是指向上一個元素。
更改上面的代碼,讓 p 指向數組中的第二個元素:
#include <stdio.h>
int main(){
int arr[] = { 99, 15, 100, 888, 252 };
int *p = &arr[2]; //也可以寫作 int *p = arr + 2;
printf("%d, %d, %d, %d, %d\n", *(p-2), *(p-1), *p, *(p+1), *(p+2) );
return 0;
}
運行結果:
99, 15, 100, 888, 252
引入數組指針後,我們就有兩種方案來訪問數組元素了,一種是使用下標,另外一種是使用指針。
1) 使用下標
也就是采用 arr[i] 的形式訪問數組元素。如果 p 是指向數組 arr 的指針,那麼也可以使用 p[i] 來訪問數組元素,它等價於 arr[i]。
2) 使用指針
也就是使用 *(p+i) 的形式訪問數組元素。另外數組名本身也是指針,也可以使用 *(arr+i) 來訪問數組元素,它等價於 *(p+i)。
不管是數組名還是數組指針,都可以使用上面的兩種方式來訪問數組元素。不同的是,數組名是常量,它的值不能改變,而數組指針是變量(除非特別指明它是常量),它的值可以任意改變。也就是說,數組名只能指向數組的開頭,而數組指針可以先指向數組開頭,再指向其他元素。
更改上面的代碼,借助自增運算符來遍歷數組元素:
#include <stdio.h>
int main(){
int arr[] = { 99, 15, 100, 888, 252 };
int i, *p = arr, len = sizeof(arr) / sizeof(int);
for(i=0; i<len; i++){
printf("%d ", *p++ );
}
printf("\n");
return 0;
}
運行結果:
99 15 100 888 252
第 8 行代碼中,*p++ 應該理解為 *(p++),每次循環都會改變 p 的值(p++ 使得 p 自身的值增加),以使 p 指向下一個數組元素。該語句不能寫為 *arr++,因為 arr 是常量,而 arr++ 會改變它的值,這顯然是錯誤的。
關於數組指針的謎題
假設 p 是指向數組 arr 中第 n 個元素的指針,那麼 *p++、*++p、(*p)++ 分別是什麼意思呢?
*p++ 等價於 *(p++),表示先取得第 n 個元素的值,再將 p 指向下一個元素,上面已經進行了詳細講解。
*++p 等價於 *(++p),會先進行 ++p 運算,使得 p 的值增加,指向下一個元素,整體上相當於 *(p+1),所以會獲得第 n+1 個數組元素的值。
(*p)++ 就非常簡單了,會先取得第 n 個元素的值,再對該元素的值加 1。假設 p 指向第 0 個元素,並且第 0 個元素的值為 99,執行完該語句後,第 0 個元素的值就會變為 100。