指針---C/C++的靈魂 第一章 指針的概念 指針是一個特殊的變量,它裡面存儲的數值被解釋成為記憶體裡的一個位址。要搞清一個指針需要搞清指針的四方面的内容:指針的類型,指針所指向的類型,指針的值或者叫指針所指向的記憶體區,還有指針本身所占據的記憶體區。 讓我們分别說明。先聲明幾個指針放着做例子: 例一: int *ptr; char *ptr; int **ptr; int (*ptr)[3]; int *(*ptr)[4]; 如果看不懂後幾個例子的話,請參閱我前段時間貼出的文?lt;<如何了解c和c++的複雜類型聲明>>。 1。 指針的類型 從文法的角度看,你隻要把指針聲明語句裡的指針名字去掉,剩下的部分就是這個指針的類型。這是指針本身所具有的類型。讓我們看看例一中各個指針的類型: (1)int *ptr; //指針的類型是int * (2)char *ptr; //指針的類型是char * (3)int **ptr; //指針的類型是int ** (4)int (*ptr)[3]; //指針的類型是int(*)[3] (5)int *(*ptr)[4]; //指針的類型是int *(*)[4] 怎麼樣?找出指針的類型的方法是不是很簡單? 2。指針所指向的類型 當你通過指針來通路指針所指向的記憶體區時,指針所指向的類型決定了編譯器将把那片記憶體區裡的内容當做什麼來看待,從文法上看,你隻須把指針聲明語句中的指針名字和名字左邊的指針聲明符*去掉,剩下的就是指針所指向的類型。例如: (1)int *ptr; //指針所指向的類型是int (2)char *ptr; //指針所指向的的類型是char (3)int **ptr; //指針所指向的的類型是int * (4)int (*ptr)[3]; //指針所指向的的類型是int()[3] (5)int *(*ptr)[4]; //指針所指向的的類型是int *()[4] 在指針的算術運算中,指針所指向的類型有很大的作用。指針的類型(即指針本身的類型)和指針所指向的類型是兩個概念。當你對C越來越熟悉時,你會發現,把與指針攪和在一起的''類型''這個概念分成 ''指針的類型''和 ''指針所指向的類型''兩個概念,是精通指針的關鍵點之一。我看了不少書,發現有些寫得差的書中,就把指針的這兩個概念攪在一起了,是以看起書來前後沖突,越看越糊塗。 3。 指針的值,或者叫指針所指向的記憶體區域位址 指針的值是指針本身存儲的數值,這個值将被編譯器當作一個位址,而不是一個一般的數值。在32位程式裡,所有類型的指針的值都是一個32位整數,因為32位程式裡記憶體位址全都是32位長。指針所指向的記憶體區就是從指針的值所代表的那個記憶體位址開始,長度為 sizeof(指針所指向的類型)的一片記憶體區。以後,我們說一個指針的值是XX,就相當于說該指針指向了以XX為首位址的一片記憶體區域;我們說一個指針指向了某塊記憶體區域,就相當于說該指針的值是這塊記憶體區域的首位址。指針所指向的記憶體區和指針所指向的類型是兩個完全不同的概念。在例一中,指針所指向的類型已經有了,但由于指針還未初始化,是以它所指向的記憶體區是不存在的,或者說是無意義的。以後,每遇到一個指針,都應該問問:這個指針的類型是什麼?指針指向的類型是什麼?該指針指向了哪裡? 4。 指針本身所占據的記憶體區 指針本身占了多大的記憶體?你隻要用函數 sizeof(指針所指向的類型)測試一下就知道了。在32位平台裡,指針本身占據了4個位元組的長度。指針本身占據的記憶體這個概念在判斷一個指針表達式是否是左值時很有用。 第二章 指針的算術運算 指針可以加上或減去一個整數。指針的這種運算的意義和通常的數值的加減運算的意義是不一樣的。例如: 例二: 1。 char a[20]; 2。 int *ptr=a; ... ... 3。 ptr++; 在上例中,指針ptr的類型是int*,它指向的類型是int,它被初始化為指向整形變量a。接下來的第3句中,指針ptr被加了1,編譯器是這樣處理的:它把指針ptr的值加上了sizeof(int),在32位程式中,是被加上了4。由于位址是用位元組做機關的,故ptr所指向的位址由原來的變量a的位址向高位址方向增加了4個位元組。由于char類型的長度是一個位元組,是以,原來ptr是指向數組a的第0号單元開始的四個位元組,此時指向了數組a中從第4号單元開始的四個位元組。我們可以用一個指針和一個循環來周遊一個數組,看例子: 例三: int array[20]; int *ptr=array; ... //此處略去為整型數組指派的代碼。 ... for(i=0;i<20;i++) { (*ptr)++; ptr++; } 這個例子将整型數組中各個單元的值加1。由于每次循環都将指針ptr加1,是以每次循環都能通路數組的下一個單元。再看例子: 例四: 1。 char a[20]; 2。 int *ptr=a; ... ... 3。 ptr+=5; 在這個例子中,ptr被加上了5,編譯器是這樣處理的:将指針ptr的值加上5 *sizeof(int),在32位程式中就是加上了5*4=20。由于位址的機關是位元組,故現在的ptr所指向的位址比起加5後的ptr所指向的位址來說,向高位址方向移動了20個位元組。在這個例子中,沒加5前的ptr指向數組a的第0号單元開始的四個位元組,加5後,ptr已經指向了數組a的合法範圍之外了。雖然這種情況在應用上會出問題,但在文法上卻是可以的。這也展現出了指針的靈活性。 如果上例中,ptr是被減去5,那麼處理過程大同小異,隻不過ptr的值是被減去5 *sizeof(int),新的ptr指向的位址将比原來的ptr所指向的位址向低位址方向移動了20個位元組。總結一下,一個指針ptrold加上一個整數n後,結果是一個新的指針ptrnew,ptrnew的類型和ptrold的類型相同,ptrnew所指向的類型和ptrold所指向的類型 也相同。ptrnew的值将比ptrold的值增加了n*sizeof( ptrold所指向的類型)個位元組。就是說,ptrnew所指向的記憶體區将比ptrold所指向的記憶體區向高位址方向移動了n*sizeof( ptrold所指向的類型)個位元組。 第三章 運算&和* 這裡&是取位址運算符,*是...書上叫做"間接運算符"。&a的運算結果是一個指針,指針的類型是a的類型加個*,指針所指向的類型是a的類型,指針所指向的位址嘛,那就是a的位址。*p的運算結果就五花八門了。總之*p的結果是p所指向的東西,這個東西有這些特點:它的類型是p指向的類型,它所占用的位址是p所指向的位址。 例五: int a=12; int b; int *p; int **ptr; p=&a; // &a的結果是一個指針,類型是int*,指向的類型是int,指向的位址是 // a的位址 *p=24; // *p的結果,在這裡它的類型是int,它所占用的位址是p所指向的位址, // 顯然,*p就是變量a。 ptr=&p; // &p的結果是個指針,該指針的類型是p的類型加個*,在這裡是int**。 // 該指針所指向的類型是p的類型,這裡是int*。該指針所指向的位址就 // 是指針p自己的位址。 *ptr=&b; // *ptr是個指針,&b的結果也是個指針,且這兩個指針的類型和所指向的 // 類型是一樣的,是以用&b來給*ptr指派就是毫無問題的了。 **ptr=34; // *ptr的結果是ptr所指向的東西,在這裡是一個指針,對這個指針再做 // 一次*運算,結果就是一個int類型的變量。 第四章 指針表達式 一個表達式的最後結果如果是一個指針,那麼這個表達式就叫指針表達式。下面是一些指針表達式的例子: 例六: int a,b; int array[10]; int *pa; pa=&a;//&a是一個指針表達式。 int **ptr=&pa;//&pa也是一個指針表達式。 *ptr=&b;//*ptr和&b都是指針表達式。 pa=array; pa++;//這也是指針表達式。 例七: char *arr[20]; char **parr=arr;//如果把arr看作指針的話,arr也是指針表達式 char *str; str=*parr;//*parr是指針表達式 str=*(parr+1);//*(parr+1)是指針表達式 str=*(parr+2);//*(parr+2)是指針表達式 由于指針表達式的結果是一個指針,是以指針表達式也具有指針所具有的四個要素:指針的類型,指針所指向的類型,指針指向的記憶體區,指針自身占據的記憶體。好了,當一個指針表達式的結果指針已經明确地具有了指針自身占據的記憶體的話,這個指針表達式就是一個左值,否則就不是一個左值。在例七中,&a不是一個左值,因為它還沒有占據明确的記憶體。*ptr是一個左值,因為*ptr這個指針已經占據了記憶體,其實*ptr就是指針pa,既然pa已經在記憶體中有了自己的位置,那麼*ptr當然也有了自己的位置。 第五章 數組和指針的關系 數組的數組名其實可以看作一個指針。看下例: 例八: int array[10]={0,1,2,3,4,5,6,7,8,9},value; ... ... value=array[0];//也可寫成:value=*array; value=array[3];//也可寫成:value=*(array+3); value=array[4];//也可寫成:value=*(array+4); 上例中,一般而言數組名array代表數組本身,類型是int [10],但如果把array看做指針的話,它指向數組的第0個單元,類型是int *,所指向的類型是數組單元的類型即int。是以*array等于0就一點也不奇怪了。同理,array+3是一個指向數組第3個單元的指針,是以*(array+3)等于3。其它依此類推。 例九: char *str[3]={ "Hello,this is a sample!", "Hi,good morning.", "Hello world" }; char s[80]; strcpy(s,str[0]);//也可寫成strcpy(s,*str); strcpy(s,str[1]);//也可寫成strcpy(s,*(str+1)); strcpy(s,str[2]);//也可寫成strcpy(s,*(str+2)); 上例中,str是一個三單元的數組,該數組的每個單元都是一個指針,這些指針各指向一個字元串。把指針數組名str當作一個指針的話,它指向數組的第0号單元,它的類型是char**,它指向的類型是char *。*str也是一個指針,它的類型是char*,它所指向的類型是char,它指向的位址是字元串"Hello,this is a sample!"的第一個字元的位址,即'H'的位址。str+1也是一個指針,它指向數組的第1号單元,它的類型是char**,它指向的類型是char *。*(str+1)也是一個指針,它的類型是char*,它所指向的類型是char,它指向"Hi,good morning."的第一個字元'H',等等。 下面總結一下數組的數組名的問題。聲明了一個數組TYPE array[n],則數組名稱array就有了兩重含義:第一,它代表整個數組,它的類型是TYPE [n];第二,它是一個指針,該指針的類型是TYPE*,該指針指向的類型是TYPE,也就是數組單元的類型,該指針指向的記憶體區就是數組第0号單元,該指針自己占有單獨的記憶體區,注意它和數組第0号單元占據的記憶體區是不同的。該指針的值是不能修改的,即類似array++的表達式是錯誤的。在不同的表達式中數組名array可以扮演不同的角色。在表達式sizeof(array)中,數組名array代表數組本身,故這時sizeof函數測出的是整個數組的大小。在表達式*array中,array扮演的是指針,是以這個表達式的結果就是數組第 0号單元的值。sizeof(*array)測出的是數組單元的大小。表達式array+n(其中n=0,1,2,....。)中,array扮演的是指針,故array+n的結果是一個指針,它的類型是TYPE*,它指向的類型是TYPE,它指向數組第n号單元。故sizeof(array+n)測出的是指針類型的大小。 例十: int array[10]; int (*ptr)[10]; ptr=&array; 上例中ptr是一個指針,它的類型是int (*)[10],他指向的類型是int [10],我們用整個數組的首位址來初始化它。在語句ptr=&array中,array代表數組本身。本節中提到了函數sizeof(),那麼我來問一問,sizeof(指針名稱)測出的究竟是指針自身類型的大小呢還是指針所指向的類型的大小?答案是前者。例如: int (*ptr)[10]; 則在32位程式中,有: sizeof(int(*)[10])==4 sizeof(int [10])==40 sizeof(ptr)==4 實際上,sizeof(對象)測出的都是對象自身的類型的大小,而不是别的什麼類型的大小。 第六章 指針和結構類型的關系 可以聲明一個指向結構類型對象的指針。 例十一: struct MyStruct { int a; int b; int c; } MyStruct ss={20,30,40}; // 聲明了結構對象ss,并把ss的三個成員初始化為 // 20,30和40。 MyStruct *ptr=&ss; // 聲明了一個指向結構對象ss的指針。它的類型是 // MyStruct*,它指向的類型是MyStruct。 int *pstr=(int*)&ss; // 聲明了一個指向結構對象ss的指針。但是它的類 // 型和它指向的類型和ptr是不同的。 請問怎樣通過指針ptr來通路ss的三個成員變量? 答案: ptr->a; ptr->b; ptr->c; 又請問怎樣通過指針pstr來通路ss的三個成員變量? 答案: *pstr; // 通路了ss的成員a。 *(pstr+1); // 通路了ss的成員b。 *(pstr+2); // 通路了ss的成員c。 呵呵,雖然我在我的MSVC++6.0上調式過上述代碼,但是要知道,這樣使用pstr來通路結構成員是不正規的,為了說明為什麼不正規,讓我們看看怎樣通過指針來通路數組的各個單元: 例十二: int array[3]={35,56,37}; int *pa=array; 通過指針pa通路數組array的三個單元的方法是: *pa; // 通路了第0号單元 *(pa+1); // 通路了第1号單元 *(pa+2); // 通路了第2号單元 從格式上看倒是與通過指針通路結構成員的不正規方法的格式一樣。所有的C/C++編譯器在排列數組的單元時,總是把各個數組單元存放在連續的存儲區裡,單元和單元之間沒有空隙。但在存放結構對象的各個成員時,在某種編譯環境下,可能會需要字對齊或雙字對齊或者是别的什麼對齊,需要在相鄰兩個成員之間加若幹''填充位元組'',這就導緻各個成員之間可能會有若幹個位元組的空隙。是以,在例十二中,即使*pstr通路到了結構對象ss的第一個成員變量a,也不能保證*(pstr+1)就一定能通路到結構成員b。因為成員a和成員b之間可能會有若幹填充位元組,說不定*(pstr+1)就正好通路到了這些填充位元組呢。這也證明了指針的靈活性。要是你的目的就是想看看各個結構成員之間到底有沒有填充位元組,嘿,這倒是個不錯的方法。通過指針通路結構成員的正确方法應該是象例十二中使用指針ptr的方法。 第七章 指針和函數的關系 可以把一個指針聲明成為一個指向函數的指針。 int fun1(char*,int); int (*pfun1)(char*,int); pfun1=fun1; .... .... int a=(*pfun1)("abcdefg",7);//通過函數指針調用函數 可以把指針作為函數的形參。在函數調用語句中,可以用指針表達式來作為實參。 例十三: int fun(char*); int a; char str[]="abcdefghijklmn"; a=fun(str); ... ... int fun(char*s) { int num=0; for(int i=0;i < strlen(s); i++) { num += *s;s++; } return num; ) 這個例子中的函數fun統計一個字元串中各個字元的ASCII碼值之和。前面說了,數組的名字也是一個指針。在函數調用中,當把str作為實參傳遞給形參s後,實際是把str的值傳遞給了s, s所指向的位址就和str所指向的位址一緻,但是str和s各自占用各自的存儲空間。在函數體内對s進行自加1運算,并不意味着同 時對str進行了自加1運算。 第八章 指針類型轉換 當我們初始化一個指針或給一個指針指派時,指派号的左邊是一個指針,指派号的右邊是一個指針表達式。在我們前面所舉的例子中,絕大多數情況下,指針的類型和指針表達式的類型是一樣的,指針所指向的類型和指針表達式所指向的類型是一樣的。 例十四: 1。 float f=12.3; 2。 float *fptr=&f; 3。 int *p; 在上面的例子中,假如我們想讓指針p指向實數f,應該怎麼搞?是用下面的語句嗎? p=&f; 不對。因為指針p的類型是int*,它指向的類型是int。表達式&f的結果是一個指針,指針的類型是float*,它指向的類型是float。兩者不一緻,直接指派的方法是不行的。至少在我的MSVC++6.0上,對指針的指派語句要求指派号兩邊的類型一緻,所指向的類型也一緻,其它的編譯器上我沒試過,大家可以試試。為了實作我們的目的,需要進行''強制類型轉換'': p=(int*)&f; 如果有一個指針p,我們需要把它的類型和所指向的類型改為TYEP*和TYPE,那麼文法格式是: (TYPE*)p; 這樣強制類型轉換的結果是一個新指針,該新指針的類型是TYPE*,它指向的類型是TYPE,它指向的位址就是原指針指向的位址。而原來的指針p的一切屬性都沒有被修改。一個函數如果使用了指針作為形參,那麼在函數調用語句的實參和形參的結合過程中,也會發生指針類型的轉換。 例十五: void fun(char*); int a=125,b; fun((char*)&a); ... ... void fun(char*s) { char c; c=*(s+3);*(s+3)=*(s+0);*(s+0)=c; c=*(s+2);*(s+2)=*(s+1);*(s+1)=c; } 注意這是一個32位程式,故int類型占了四個位元組,char類型占一個位元組。函數fun的作用是把一個整數的四個位元組的順序來個颠倒。注意到了嗎?在函數調用語句中,實參&a的結果是一個指針,它的類型是int *,它指向的類型是int。形參這個指針的類型是char*,它指向的類型是char。這樣,在實參和形參的結合過程中,我們必須進行一次從int*類型到char*類型的轉換。結合這個例子,我們可以這樣來想象編譯器進行轉換的過程:編譯器先構造一個臨時指針 char*temp,然後執行temp=(char*)&a,最後再把temp的值傳遞給s。是以最後的結果是:s的 類型是char*,它指向的類型是char,它指向的位址就是a的首位址。 事實上,從彙編代碼來看在調用fun時的指令完全一緻,是以可以認為編譯器在調用的時候沒有做類型轉換: int i = 0x12345678; char c = ‘J'; func((char*)&i); // 1 func((char*)&c); // 2 1或2對應的彙編代碼都為 lea eax, [ebp- X] push eax call fun ... 我們已經知道,指針的值就是指針指向的位址,在32位程式中,指針的值其實是一個32位整數。那可不可以把一個整數當作指針的值直接賦給指針呢?就象下面的語句: unsigned int a; TYPE *ptr;//TYPE是int,char或結構類型等等類型。 ... ... a=20345686; ptr=20345686;//我們的目的是要使指針ptr指向位址20345686(十進制) ptr=a;//我們的目的是要使指針ptr指向位址20345686(十進制)編譯一下吧。 結果發現後面兩條語句全是錯的。那麼我們的目的就不能達到了嗎?不,還有辦法: unsigned int a; TYPE *ptr;//TYPE是int,char或結構類型等等類型。 ... ... a=某個數,這個數必須代表一個合法的位址; ptr=(TYPE*)a;//呵呵,這就可以了。 嚴格說來這裡的(TYPE*)和指針類型轉換中的(TYPE*)還不一樣。這裡的(TYPE*)的意思是把無符号整數a的值當作一個位址來看待。上面強調了a的值必須代表一個合法的位址,否則的話,在你使用ptr的時候 ,就會出現非法操作錯誤。想想能不能反過來,把指針指向的位址即指針的值當作一個整數取出來。完全可以。下面的例子示範了把一個指針的值當作一個整數取出來,然後再把這個整數當作一個位址賦給一個指針: 例十六: int a=123,b; int *ptr=&a; char *str; b=(int)ptr;//把指針ptr的值當作一個整數取出來。 str=(char*)b;//把這個整數的值當作一個位址賦給指針str。 好了,現在我們已經知道了,可以把指針的值當作一個整數取出來,也可以把一個整數值當作位址賦給一個指針。 第九章 指針的安全問題 看下面的例子: 例十七: char s='a'; int *ptr; ptr=(int*)&s; *ptr=1298; 指針ptr是一個int*類型的指針,它指向的類型是int。它指向的位址就是s的首位址。在32位程式中,s占一個位元組,int類型占四個位元組。最後一條語句不但改變了s所占的一個位元組,還把和s相臨的高位址方向的三個位元組也改變了。這三個位元組是幹什麼的?隻有編譯程式知道,而寫程式的人是不太可能知道的。也許這三個位元組裡存儲了非常重要的資料,也許這三個位元組裡正好是程式的一條代碼,而由于你對指針的馬虎應用,這三個位元組的值被改變了!這會造成崩潰性的錯誤。 讓我們再來看一例: 例十八: 1。 char a; 2。 int *ptr=&a; ... ... 3。 ptr++; 4。 *ptr=115; 該例子完全可以通過編譯,并能執行。但是看到沒有?第3句對指針ptr進行自加1運算後,ptr指向了和整形變量a相鄰的高位址方向的一塊存儲區。這塊存儲區裡是什麼?我們不知道。有可能它是一個非常重要的資料,甚至可能是一條代碼。而第4句竟然往這片存儲區裡寫入一個資料!這是嚴重的錯誤。是以在使用指針時,程式員心裡必須非常清楚:我的指針究竟指向了哪裡。在用指針通路數組的時候,也要注意不要超出數組的低端和高端界限,否則也會造成類似的錯誤。 在指針的強制類型轉換:ptr1=(TYPE*)ptr2中,如果sizeof(ptr2的類型)大于sizeof(ptr1的類型),那麼在使用指針ptr1來通路ptr2所指向的存儲區時是安全的。如果sizeof(ptr2的類型)小于sizeof(ptr1的類型),那麼在使用指針ptr1來通路ptr2所指向的存儲區時是不安全的。至于為什麼,讀者結合例十七來想一想,應該會明白的。