天天看點

C++記憶體分布

預備知識—程式的記憶體配置設定 

一個由C/C++編譯的程式占用的記憶體分為以下幾個部分 

1、棧區(stack)— 由編譯器自動配置設定釋放 ,存放函數的參數值,局部變量的值等。其操作方式類似于資料結構中的棧。 

2、堆區(heap) — 一般由程式員配置設定釋放, 若程式員不釋放,程式結束時可能由OS回收 。注意它與資料結構中的堆是兩回事,配置設定方式倒是類似于連結清單,呵呵。

3、全局區(靜态區)(static)—,全局變量和靜态變量的存儲是放在一塊的,初始化的全局變量和靜态變量在一塊區域, 未初始化的全局變量和未初始化的靜态變量在相鄰的另一塊區域。 - 程式結束後有系統釋放 

4、文字常量區 —常量字元串就是放在這裡的。 程式結束後由系統釋放 

5、程式代碼區—存放函數體的二進制代碼。

一個正常的程式在記憶體中通常分為程式段,資料端和堆棧三部分。程式段裡放着程式的機器碼和隻讀資料,這個段通常是隻讀,對它的寫操作是非法的。資料段放的是程式中的靜态資料。動态資料則通過堆棧來存放。在記憶體中,它們的位置如下: 

+------------------+ 記憶體低端 

| 程式段 | 

|------------------| 

| 資料段 | 

|------------------| 

| 堆棧 | 

+------------------+ 記憶體高端 

堆棧是記憶體中的一個連續的塊。一個叫堆棧指針的寄存器(SP)指向堆棧的棧頂。堆棧的底部是一個固定位址。堆棧有一個特點就是,後進先出。也就是說,後放入的資料第一個取出。它支援兩個操作,PUSH和POP。PUSH是将資料放到棧的頂端,POP是将棧頂的資料取出。

在進階語言中,程式函數調用和函數中的臨時變量都用到堆棧。為什麼呢?因為在調用一個函數時,我們需要對目前的操作進行保護,也為了函數執行後,程式可以正确的找到地方繼續執行,是以參數的傳遞和傳回值也用到了堆棧。通常對局部變量的引用是通過給出它們對SP的偏移量來實作的。另外還有一個基址指針(FP,在Intel晶片中是BP),許多編譯器實際上是用它來引用本地變量和參數的。通常,參數的相對FP的偏移是正的,局部變量是負的。 

當程式中發生函數調用時,計算機做如下操作:首先把參數壓入堆棧;然後儲存指令寄存器(IP)中的内容,做為傳回位址(RET);第三個放入堆棧的是基址寄存器(FP);然後把目前的棧指針(SP)拷貝到FP,做為新的基位址;最後為本地變量留出一定空間,把SP減去适當的數值。 

在函數體中定義的變量通常是在棧上,用malloc, calloc, realloc等配置設定記憶體的函數配置設定得到的就是在堆上。在所有函數體外定義的是全局量,加了static修飾符後不管在哪裡都存放在全局區(靜态區),在所有函數體外定義的static變量表示在該檔案中有效,不能extern到别的檔案用,在函數體内定義的static表示隻在該函數體内有效。另外,函數中的"adgfdf"這樣的字元串存放在常量區。

對比:

1 性能

棧:棧存在于RAM中。棧是動态的,它的存儲速度是第二快的。stack

堆:堆位于RAM中,是一個通用的記憶體池。所有的對象都存儲在堆中。heap

2 申請方式

stack: 由系統自動配置設定。 例如,聲明在函數中一個局部變量 int b; 系統自動在棧中為b開辟空間 

heap: 需要程式員自己申請,并指明大小,在c中malloc函數 如p1 = (char *)malloc(10); 

在C++中用new運算符 如p2 = (char *)malloc(10); 但是注意p1、p2本身是在棧中的。

3 申請後系統的響應

棧:隻要棧的剩餘空間大于所申請空間,系統将為程式提供記憶體,否則将報異常提示棧溢出。 

堆:首先應該知道作業系統有一個記錄空閑記憶體位址的連結清單,當系統收到程式的申請時, 

會周遊該連結清單,尋找第一個空間大于所申請空間的堆結點,然後将該結點從空閑結點連結清單中删除,并将該結點的空間配置設定給程式,另外,對于大多數系統,會在這塊記憶體空間中的首位址處記錄本次配置設定的大小,這樣,代碼中的delete語句才能正确的釋放本記憶體空間。另外,由于找到的堆結點的大小不一定正好等于申請的大小,系統會自動的将多餘的那部分重新放入空閑連結清單中。

4 申請大小的限制

棧:在Windows下,棧是向低位址擴充的資料結構,是一塊連續的記憶體的區域。這句話的意思是棧頂的位址和棧的最大容量是系統預先規定好的,在WINDOWS下,棧的大小是2M(也有的說是1M,總之是一個編譯時就确定的常數),如果申請的空間超過棧的剩餘空間時,将提示overflow。是以,能從棧獲得的空間較小。 

堆:堆是向高位址擴充的資料結構,是不連續的記憶體區域。這是由于系統是用連結清單來存儲的空閑記憶體位址的,自然是不連續的,而連結清單的周遊方向是由低位址向高位址。堆的大小受限于計算機系統中有效的虛拟記憶體。由此可見,堆獲得的空間比較靈活,也比較大。

5 申請效率的比較

棧由系統自動配置設定,速度較快。但程式員是無法控制的。 

堆是由new配置設定的記憶體,一般速度比較慢,而且容易産生記憶體碎片,不過用起來最友善. 

另外,在WINDOWS下,最好的方式是用VirtualAlloc配置設定記憶體,他不是在堆,也不是在棧是直接在程序的位址空間中保留一快記憶體,雖然用起來最不友善。但是速度快,也最靈活。

6 堆和棧中的存儲内容

棧:在函數調用時,第一個進棧的是主函數中後的下一條指令(函數調用語句的下一條可執行語句)的位址,然後是函數的各個參數,在大多數的C編譯器中,參數是由右往左入棧的,然後是函數中的局部變量。注意靜态變量是不入棧的。 

當本次函數調用結束後,局部變量先出棧,然後是參數,最後棧頂指針指向最開始存的位址,也就是主函數中的下一條指令,程式由該點繼續運作。 

堆:一般是在堆的頭部用一個位元組存放堆的大小。堆中的具體内容有程式員安排。

7 存取效率的比較

char s1[] = "aaaaaaaaaaaaaaa"; 

char *s2 = "bbbbbbbbbbbbbbbbb"; 

aaaaaaaaaaa是在運作時刻指派的; 

而bbbbbbbbbbb是在編譯時就确定的; 

但是,在以後的存取中,在棧上的數組比指針所指向的字元串(例如堆)快。 

比如: 

#include 

void main() 

char a = 1; 

char c[] = "1234567890"; 

char *p ="1234567890"; 

a = c[1]; 

a = p[1]; 

return; 

對應的彙編代碼 

10: a = c[1]; 

00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh] 

0040106A 88 4D FC mov byte ptr [ebp-4],cl 

11: a = p[1]; 

0040106D 8B 55 EC mov edx,dword ptr [ebp-14h] 

00401070 8A 42 01 mov al,byte ptr [edx+1] 

00401073 88 45 FC mov byte ptr [ebp-4],al 

第一種在讀取時直接就把字元串中的元素讀到寄存器cl中,而第二種則要先把指針值讀到edx中,在根據edx讀取字元,顯然慢了。 

小結: 

堆和棧的差別可以用如下的比喻來看出: 

使用棧就象我們去飯館裡吃飯,隻管點菜(發出申請)、付錢、和吃(使用),吃飽了就走,不必理會切菜、洗菜等準備工作和洗碗、刷鍋等掃尾工作,他的好處是快捷,但是自由度小。 

使用堆就象是自己動手做喜歡吃的菜肴,比較麻煩,但是比較符合自己的口味,而且自由度大。

全局變量、靜态資料、常量存放在全局資料區,所有函數的代碼存放在代碼區,為運作函數而配置設定的局部變量、函數參數、傳回資料、傳回位址等存放在棧區。   

是以在同一個程序裡,多個任務(線程)的全局變量和靜态變量都應該是共享同一塊記憶體(全局資料區)   

而在不同的程序裡,重新加載了代碼,各個程序間的全局變量和靜态變量當然不是擁有同一塊記憶體。   

在psos下,各個任務是不同的線程,是以各個任務的全局變量和靜态變量是在同一塊記憶體。而我的另一個程式中(在sco unix),是每次運作都是一個新的程序,是以各個程序的全局變量和靜态變量擁有不同的記憶體