前言:先看下面類型的含義
1) int p;
這是一個普通的整型變量。
2) int *p;
從p處開始,先與*結合,說明p是一個指針,然後再與int結合,說明指針所指向的內容的類型為int型。所以p是一個指向整型數據的指針。
3) int p[3];
從p處開始,先與[]結合,說明p是一個數組,然後與int結合,說明數組裡的元素是整型的,所以p是一個由整型數據組成的數組。
4) int *p[3];
從p處開始,先與[]結合,因為[]優先級比*高,所以p是一個數組。然後再與*結合,說明數組裡的元素是指針類型。 然後再與int結合,說明指針所指向的內容的類型是整型的,所以p是一個由指向整型數據的指針所組成的數組。
5) int (*p)[3];
從p處開始,先與*結合,因為()的優先級最高,說明p是一個指針(與""這步可以忽略,只是為了改變優先級)。然後再與[]結合,說明指針所指向的內容是一個數組,然後再與int結合,說明數組裡的元素是整型的。所以p是一個指向由整型數據組成的數組的指針。
6) int **p;
從p開始,先與*結合,說是p是一個指針,然後再與*結合,說明指針所指向的元素仍是指針,然後再與int結合,說明該二重指針所指向的元素是整型數據。所以p是以個指向整形數據的二級指針。由於二級指針以及更高級的指針極少用在復雜類型中,所以後面更復雜的類型我們就不考慮多級指針了,最多只考慮一級指針。
7) int p(int);
從p處起,先與()結合,說明p是一個函數,然後進入()裡分析,說明該函數有一個整型變量的參數,然後再與外面的int結合,說明函數的返回值是一個整型數據。
8) int *p(int);
從p處開始,先與()結合,說明p是一個函數,然後進入()裡分析,說明該函數有一個整型變量的參數,然後再與外面的*結合,說明函數的返回值是一個指針,然後再與int結合,說明返回值的指針指向的類型為int型。
9) int (*p)(int);
從p處開始,先與*結合,說明p是一個指針,然後與()結合,說明指針指向的是一個函數,然後進入()裡分析,說明函數有一個int型的參數,再與最外層的int結合,說明函數的返回類型是整型,所以p是一個指向有一個整型參數且返回類型為整型的函數的指針。
10) int *(*p(int))[3];
可以先跳過,不看這個類型,過於復雜。從p開始,先與()結合,說明p是一個函數,然後進入()裡面分析,說明函數有一個int型的參數。然後再與外面的*結合,說明函數返回的是一個指針。然後到最外面一層,先與[]結合,說明返回的指針指向的是一個數組,然後再與*結合,說明數組裡的元素是指針,然後再與int結合,說明指針指向的內容是整型數據。所以p是一個參數為一個整數據且返回一個指向由整型指針變量組成的數組的指針變量的函數。
理解了這幾個類型,其它的類型對我們來說也是小菜了,不過我們一般不會用太復雜的類型,那樣會大大減小程序的可讀性,請慎用,這上面的幾種類型已經足夠我們用了。
1、理解指針
指針是一個特殊的變量,它裡面存儲的數值被解釋成為內存裡的一個地址。 要搞清一個指針需要搞清指針的四方面的內容:
1)指針的類型
2)指針所指向的類型
3)指針的值或者叫指針所指向的內存區
4)指針本身所占據的內存區
1.1指針的類型
從語法的角度看,你只要把指針聲明語句裡的指針名字去掉,剩下的部分就是這個指針的類型。這是指針本身所具有的類型。
(1)int*ptr; //指針的類型是int* (2)char*ptr; //指針的類型是char* (3)int**ptr; //指針的類型是int** (4)int(*ptr)[3]; //指針的類型是int(*)[3] (5)int*(*ptr)[4]; //指針的類型是int*(*)[4]
1.2指針所指向的類型
當你通過指針來訪問指針所指向的內存區時,指針所指向的類型決定了編譯器將把那片內存區裡的內容當做什麼來看待。從語法上看,你只須把指針聲明語句中的指針名字和名字左邊的指針聲明符*去掉,剩下的就是指針所指向的類型。
(1)int*ptr; //指針所指向的類型是int (2)char*ptr; //指針所指向的的類型是char (3)int**ptr; //指針所指向的的類型是int* (4)int(*ptr)[3]; //指針所指向的的類型是int()[3] (5)int*(*ptr)[4]; //指針所指向的的類型是int*()[4]
指針的類型(即指針本身的類型)和指針所指向的類型是兩個概念。當你對C越來越熟悉時,你會發現,把與指針攪和在一起的"類型"這個概念分成"指針的類型"和"指針所指向的類型"兩個概念,是精通指針的關鍵點之一
1.3指針的值或者叫指針所指向的內存區或地址
指針的值是指針本身存儲的數值,這個值將被編譯器當作一個地址,而不是一個一般的數值。在32位程序裡,所有類型的指針的值都是一個32位整數,因為32位程序裡內存地址全都是32位長。 指針所指向的內存區就是從指針的值所代表的那個內存地址開始,長度為sizeof(指針所指向的類型)的一片內存區。以後,我們說一個指針的值是XX,就相當於說該指針指向了以XX為首地址的一片內存區域;我們說一個指針指向了某塊內存區域,就相當於說該指針的值是這塊內存區域的首地址。
指針所指向的內存區和指針所指向的類型是兩個完全不同的概念。如"int *ptr;",指針所指向的類型已經有了,但由於指針還未初始化,所以它所指向的內存區是不存在的,或者說是無意義的。
1.4指針本身所占據的內存區
指針本身占了多大的內存?你只要用函數sizeof(指針的類型)測一下就知道了。在32位平台裡,指針本身占據了4個字節的長度。指針本身占據的內存這個概念在判斷一個指針表達式是否是左值時很有用。
左值簡單點說就是可以放在賦值運算符左邊的表達式。下面讓我們來看看他的定義:如果一個表達式可以引用到某一個對象,並且這個對象是一塊內存空間且可以被檢查和存儲,那麼這個表達式就可以做為一個左值。當然,有左值當然就會有右值這個概念:右值指的是引用了一個存儲在某個內存地址裡的數據。一個變量可以同時是左值,同時也是右值,兩者不是對立的。
2、指針運算
指針可以加上或減去一個整數。指針的這種運算的意義和通常的數值的加減運算的意義是不一樣的,以單元為單位:
char a[20]; int *ptr=(int *)a; //強制類型轉換並不會改變a的類型 ptr++;
在上例中,指針ptr的類型是int*,它指向的類型是int,它被初始化為指向整型變量a。接下來的第3句中,指針ptr被加了1,編譯器是這樣處理的:它把指針ptr的值加上了sizeof(int),在32位程序中,是被加上了4,因為在32位程序中,int占4個字節。由於地址是用字節做單位的,故ptr所指向的地址由原來的變量a的地址向高地址方向增加了4個字節。由於char類型的長度是一個字節,所以,原來ptr是指向數組a的第0號單元開始的四個字節,此時指向了數組a中從第4號單元開始的四個字節。
我們可以用一個指針和一個循環來遍歷一個數組:
int array[20]={0}; int *ptr=array; for(i=0;i<20;i++) { (*ptr)++; ptr++; }
這個例子將整型數組中各個單元的值加1。由於每次循環都將指針ptr加1個單元,所以每次循環都能訪問數組的下一個單元。
再看例子:
char a[20]="You_are_a_girl"; int *ptr=(int *)a; ptr+=5;
在這個例子中,ptr被加上了5,編譯器是這樣處理的:將指針ptr的值加上5乘sizeof(int),在32位程序中就是加上了5乘4=20。由於地址的單位是字節,故現在的ptr所指向的地址比起加5後的ptr所指向的地址來說,向高地址方向移動了20個字節。在這個例子中,沒加5前的ptr指向數組a的第0號單元開始的四個字節,加5後,ptr已經指向了數組a的合法范圍之外了。雖然這種情況在應用上會出問題,但在語法上卻是可以的。這也體現出了指針的靈活性。如果上例中,ptr是被減去5,那麼處理過程大同小異,只不過ptr的值是被減去5乘sizeof(int),新的ptr指向的地址將比原來的ptr所指向的地址向低地址方向移動了20個字節。
下面再舉一個例子:
#include<stdio.h> int main() { char a[20]="You_are_a_girl"; char *p=a; char **ptr=&p; //printf("p=%d\n",p); //printf("ptr=%d\n",ptr); //printf("*ptr=%d\n",*ptr); printf("**ptr=%c\n",**ptr); ptr++; //printf("ptr=%d\n",ptr); //printf("*ptr=%d\n",*ptr); printf("**ptr=%c\n",**ptr); }
誤區一、輸出答案為Y和o,誤解:ptr是一個char的二級指針,當執行"ptr++;"時,會使指針加一個sizeof(char),所以輸出如上結果,這個可能只是少部分人的結果。
誤區二、輸出答案為Y和a,誤解:ptr指向一個char*類型,當執行"ptr++;"時,會使指針加一個sizeof(char*)(有可能會有人認為這個值為1,那就會得到誤區一的答案。這個值應該是4,參考前面內容), 即&p+4。那進行一次取值運算不就指向數組中的第五個元素了嗎?那輸出的結果不就是數組中第五個元素了嗎?答案是否定的。
正解: ptr的類型是char**,指向的類型是一個char*類型,該指向的地址就是p的地址(&p),當執行"ptr++;"時,會使指針加一個sizeof(char*),即&p+4,那*(&p+4)指向哪呢,這個你去問上帝吧,或者他會告訴你在哪?所以最後的輸出會是一個隨機的值,或許是一個非法操作.。
總結:一個指針ptrold加(減)一個整數n後,結果是一個新的指針ptrnew,ptrnew的類型和ptrold的類型相同,ptrnew所指向的類型和ptrold所指向的類型也相同。ptrnew的值將比ptrold的值增加(減少)了n乘sizeof(ptrold所指向的類型)個字節。就是說,ptrnew所指向的內存區將比ptrold所指向的內存區向高(低)地址方向移動了n乘sizeof(ptrold所指向的類型)個字節。
指針和指針進行加減:兩個指針不能進行加法運算,這是非法操作,因為進行加法後,得到的結果指向一個不知所向的地方,而且毫無意義。兩個指針可以進行減法操作,但必須類型相同,一般用在數組方面。
3、指針表達式
一個表達式的結果如果是一個指針,那麼這個表達式就叫指針表達式。 下面是一些指針表達式的例子:
int a,b; int array[10]; int *pa; int *pb; int **ptr; pa=&a; //&a是一個指針表達式 ptr=&pa; //&pa也是一個指針表達式 *ptr=&b; //*ptr和&b都是指針表達式 pa=array; pa++; //這也是指針表達式 pb=*ptr; //*parr是指針表達式 pb=*(ptr+1); //*(ptr+1)是指針表達式
由於指針表達式的結果是一個指針,所以指針表達式也具有指針所具有的四個要素:指針的類型,指針所指向的類型,指針指向的內存區,指針自身占據的內存。 當一個指針表達式的結果指針已經明確地具有了指針自身占據的內存的話,這個指針表達式就是一個左值,否則就不是一個左值。
在上面例子中,&a不是一個左值,因為它還沒有占據明確的內存。*ptr是一個左值,因為*ptr這個指針已經占據了內存,其實*ptr就是指針pa,既然pa已經在內存中有了自己的位置,那麼*ptr當然也有了自己的位置。
4、指針和數組
數組的數組名其實可以看作一個指針。看下例:
int array[10] = {0,1,2,3,4,5,6,7,8,9}; int value; value = array[0]; //也可寫成:value=*array; value = array[3]; //也可寫成:value=*(array+3); value = array[4]; //也可寫成:value=*(array+4);
上例中,一般而言數組名array代表數組本身,類型是int[10],但如果把array看做指針的話,它指向數組的第0個單元,類型是int* ,所指向的類型是數組單元的類型即int。因此*array等於0就一點也不奇怪了。同理,array+3是一個指向數組第3個單元的指針,所以*(array+3)等於3,其它依此類推。
char *str[3]={"Hello,thisisasample!", "Hi,goodmorning.", "Helloworld"}; char s[80]; strcpy(s, str[0]); //也可寫成strcpy(s,*str); strcpy(s, str[1]); //也可寫成strcpy(s,*(str+1)); strcpy(s, str[2]); //也可寫成strcpy(s,*(str+2));
上例中,str是一個三單元的數組,該數組的每個單元都是一個指針,這些指針各指向一個字符串。把指針數組名str當作一個指針的話,它指向數組的第0號單元,它的類型是char **,它指向的類型是char *。*str也是一個指針,它的類型是char *,它所指向的類型是char,它指向的地址是字符串"Hello,thisisasample!"的第一個字符的地址,即'H'的地址。
注意:字符串相當於是一個數組,在內存中以數組的形式儲存,只不過字符串是一個數組常量,內容不可改變,且只能是右值。如果看成指針的話,他即是常量指針,也是指針常量。
常量指針:該指針是一個常量,不可改變,指向某個地址之後就不能改變了,但他所指向的內容是可以改變的,很容易與指針常量弄混。所以一般讀的時候讀成常量指向,從字面上看就是一個常量指向某個地址。
指針常量:說明該指針所指向的是內容不可改變,但其指針自身是一個變量,可以改變指向的內容,讀的時候讀成指向常量,從字面上看就是指向某個常量。
str+1也是一個指針,它指向數組的第1號單元,它的類型是char**,它指向的類型是char*。*(str+1)也是一個指針,它的類型是char*,它所指向的類型是char,它指向 "Hi,goodmorning."的第一個字符'H'。
下面總結一下數組的數組名(數組中儲存的也是數組)的問題:
聲明了一個數組TYPE array[n],則數組名稱array就有了兩重含義:第一,它代表整個數組,它的類型是TYPE[n];第二,它是一個常量指針,該指針的類型是TYPE*,該指針指向的類型是TYPE,也就是數組單元的類型,該指針指向的內存區就是數組第0號單元,該指針自己占有單獨的內存區,注意它和數組第0號單元占據的內存區是不同的。該指針的值是不能修改的,即類似array++的表達式是錯誤的。
在不同的表達式中數組名array可以扮演不同的角色。在表達式sizeof(array)中,數組名array代表數組本身,故這時sizeof函數測出的是整個數組的大小。在表達式*array中,array扮演的是指針,因此這個表達式的結果就是數組第0號單元的值。sizeof(*array)測出的是數組單元的大小。表達式array+n(其中n=0,1,2,.....)中,array扮演的是指針,故array+n的結果是一個指針,它的類型是TYPE *,它指向的類型是TYPE,它指向數組第n號單元。故sizeof(array+n)測出的是指針類型的大小。在32位程序中結果是4。
int array[10]; int (*ptr)[10]; ptr=&array;
上例中ptr是一個指針,它的類型是int(*)[10],他指向的類型是int[10] ,我們用整個數組的首地址來初始化它。在語句"ptr=&array"中,array代表數組本身。
5、指針和結構體
可以聲明一個指向結構類型對象的指針。
struct MyStruct { int a; int b; int c; }; struct MyStruct ss={20,30,40}; //聲明了結構對象ss,並把ss的成員初始化為20,30和40。 struct MyStruct *ptr=&ss; //聲明一個指向結構對象ss的指針。它的類型是MyStruct*,它指向的類型是MyStruct。 int *pstr=(int*)&ss; //聲明一個指向結構對象ss的指針。但是pstr和它被指向的類型ptr是不同的。
1)請問怎樣通過指針ptr來訪問ss的三個成員變量?
答案:
ptr->a; //指向運算符,或者可以這樣寫(*ptr).a,建議使用前者
ptr->b;
ptr->c;
2)請問怎樣通過指針pstr來訪問ss的三個成員變量?
答案:
*pstr; //訪問了ss的成員a。
*(pstr+1); //訪問了ss的成員b。
*(pstr+2); //訪問了ss的成員c。
要知道,這樣使用pstr來訪問結構成員是不正規的。即不能將結構體強轉成指針訪問。在存放結構對象的各個成員時,在某種編譯環境下,可能會需要字對齊或雙字對齊或者是別的什麼對齊,需要在相鄰兩個成員之間加若干個"填充字節",這就導致各個成員之間可能會有若干個字節的空隙。"*(pstr+1);"可能剛好訪問了這個空隙。
6、指針和函數
1)可以把一個指針聲明成為一個指向函數的指針。
int fun1(char *,int); int (*pfun1)(char *,int); pfun1=fun1; int a=(*pfun1)("abcdefg",7); //通過函數指針調用函數。
2)可以把指針作為函數的形參。在函數調用語句中,可以用指針表達式來作為實參。
int fun(char *); int a; char str[]="abcdefghijklmn"; a=fun(str); int fun(char *s) { int num=0; for(int i=0;;) { num+=*s;
s++; } return num; }
這個例子中的函數fun統計一個字符串中各個字符的ASCII碼值之和。前面說了,數組的名字也是一個指針。在函數調用中,當把str作為實參傳遞給形參s後,實際是把str的值傳遞給了s,s所指向的地址就和str所指向的地址一致,但是str和s各自占用各自的存儲空間。在函數體內對s進行自加1運算,並不意味著同時對str進行了自加1運算。
7、指針類型轉換
當我們初始化一個指針或給一個指針賦值時,賦值號的左邊是一個指針,賦值號的右邊是一個指針表達式。在我們前面所舉的例子中,絕大多數情況下,指針的類型和指針表達式的類型是一樣的,指針所指向的類型和指針表達式所指向的類型是一樣的。
float f=12.3; float *fptr=&f; int *p;
在上面的例子中,假如我們想讓指針p指向實數f,應該怎麼辦? "p=&f;"?不對。因為指針p的類型是int *,它指向的類型是int。表達式&f的結果是一個指針,指針的類型是float *,它指向的類型是float。兩者不一致,直接賦值的方法是不行的。為了實現我們的目的,需要進行強制類型轉換:"p=(int*)&f;"。
如果有一個指針p,我們需要把它的類型和所指向的類型改為TYEP *和TYPE, 那麼語法格式是:"(TYPE *)p;"。這樣強制類型轉換的結果是一個新指針,該新指針的類型是TYPE*,它指向的類型是TYPE,指向的地址是原指針指向的地址。而原指針p的一切屬性都沒有被修改(切記)。
一個函數如果使用了指針作為形參,那麼在函數調用語句的實參和形參的結合過程中,必須保證類型一致 ,否則需要強制轉換。
void fun(char*); int a=125,b; fun((char*)&a); void fun(char* s) { char c; c=*(s+3); *(s+3)=*(s+0); *(s+0)=c; c=*(s+2); *(s+2)=*(s+1); *(s+1)=c; }
注意這是一個32位程序,故int類型占了四個字節,char類型占一個字節。函數fun的作用是把一個整數的四個字節的順序來個顛倒。注意到了嗎?在函數調用語句中,實參&a的結果是一個指針,它的類型是int*,它指向的類型是int。形參這個指針的類型是char*,它指向的類型是char。這樣,在實參和形參的結合過程中,我們必須進行一次從int*類型到char*類型的轉換。
結合這個例子,我們可以這樣來想象編譯器進行轉換的過程:編譯器先構造一個臨時指針char *temp, 然後執行temp=(char *)&a,最後再把temp的值傳遞給s。所以最後的結果是:s的類型是char*,它指向的類型是char,它指向的地址就是a的首地址。
我們已經知道,指針的值就是指針指向的地址,在32位程序中,指針的值其實是一個32位整數。那可不可以把一個整數當作指針的值直接賦給指針呢?就象下面的語句:
unsigned int a; TYPE *ptr; //TYPE是int,char或結構類型等等類型 a=N; //N必須代表一個合法的地址 ptr=(TYPE*)a;
嚴格說來這裡的(TYPE*)和指針類型轉換中的(TYPE*)還不一樣。這裡的(TYPE*)的意思是把無符號整數a的值當作一個地址來看待。上面強調了a的值必須代表一個合法的地址,否則的話,在你使用ptr的時候,就會出現非法操作錯誤。
想想能不能反過來,把指針指向的地址即指針的值當作一個整數取出來。下面的例子演示了把一個指針的值當作一個整數取出來,然後再把這個整數當作一個地址賦給一個指針:
int a=123,b; int *ptr=&a; char *str; b=(int)ptr; //把指針ptr的值當作一個整數取出來 str=(char*)b; //把這個整數的值當作一個地址賦給指針str
8、指針的安全問題
char s='a'; int *ptr; ptr=(int *)&s; *ptr=1298;
上例中指針ptr是一個int *類型的指針,它指向的類型是int。它指向的地址就是s的首地址。在32位程序中,s占一個字節,int類型占四個字節。最後一條語句不但改變了s所占的一個字節,還把和s相臨的高地址方向的三個字節也改變了。這三個字節是干什麼的?只有編譯程序知道,而寫程序的人是不太可能知道的。也許這三個字節裡存儲了非常重要的數據,也許這三個字節裡正好是程序的一條代碼,而由於你對指針的馬虎應用,這三個字節的值被改變了!這會造成崩潰性的錯誤。
char a; int *ptr=&a; ptr++; *ptr=115;
上例完全可以通過編譯,並能執行。但是看到沒有?第3句對指針ptr進行自加1運算後,ptr指向了和整形變量a相鄰的高地址方向的一塊存儲區。這塊存儲區裡是什麼?我們不知道。有可能它是一個非常重要的數據,甚至可能是一條代碼。而第4句竟然往這片存儲區裡寫入一個數據!這是嚴重的錯誤。所以在使用指針時,程序員心裡必須非常清楚:我的指針究竟指向了哪裡。在用指針訪問數組的時候,也要注意不要超出數組的低端和高端界限,否則也會造成類似的錯誤。
在指針的強制類型轉換中:ptr1=(TYPE *)ptr2,如果sizeof(ptr2的類型)大於sizeof(ptr1的類型),那麼在使用指針ptr1來訪問ptr2所指向的存儲區時是安全的。如果sizeof(ptr2的類型)小於sizeof(ptr1的類型),那麼在使用指針ptr1來訪問ptr2所指向的存儲區時是不安全的。