天天看點

探索C++的底層機制

探索c++的底層機制

在看這篇文章之前,請你先要明白一點:那就是c++為我們所提供的各種存取控制僅僅是在編譯階段給我們的限制,也就是說是編譯器確定了你在完成任務之前的正确行為,如果你的行為不正确,那麼你休想構造出任何可執行程式來。但如果真正到了産生可執行代碼階段,無論是c,c++,還是pascal,大家都一樣,你認為c和c++編譯器産生的機器代碼會有所不同嗎,你認為c++産生的機器代碼會有通路限制嗎?那麼你錯了。什麼const,private,統統沒有(const變量或許會放入隻讀資料段),它不會再給你任何的限制,你可以利用一切記憶體修改工具或者是自己寫一個程式對某一程序空間的某一變量進行修改,不管它在你的印象中是private,還是public,對于此時的你來說都一樣,想怎樣便怎樣。另外,你也不要為c++所提供的什麼晚期捆綁等機制大呼神奇,它也僅僅是在所産生的代碼中多加了幾條而已,它遠沒有你想象的那麼智能,所有的工作都是編譯器幫你完成,真正到了執行的時候,計算機會完全按照編譯器産生的代碼一絲不苟的執行。你明白我在說什麼嗎?對了,如果你從前接觸過彙編,隻要你反彙編一段c++代碼,你就會說:原來是這麼回事呀,c++隻不過是把我們的問題進行了更高層次的抽象,但隻要你解開面紗,回到問題的本源,一切都将變得不再神秘……

(以下的反彙編代碼均來自visial c++ 7.0)

一.讓我們從變量開始-----并非你想象的那麼簡單

變量是什麼,變量就是一個在程式執行過程中可以改變的量。換一個角度,變量是一塊記憶體區域的名字,它就代表這塊記憶體區域,當我們對變量進行修改的時候,會引起記憶體區域中内容的改變。但是你若是學習過彙編或是計算機組成原理,那麼你就會清楚對于一塊記憶體區域來說,根本就不存在什麼名字,它所僅有的标志就是他的位址,是以我們若想修改一塊記憶體區域的内容,隻有知道他的位址方能實作。看來所謂的變量一說隻不過是編譯器給我們進行的一種抽象,讓我們不必去了解更多的細節,降低我們的思維跨度而已。例如下面這條語句:

int

a=10;

按照我們的思維習慣來講,就是“存在一個變量a,它的值是10”,一切都顯得那麼的自然。我們不必去在乎什麼所謂的位址以及其他的一些細節。然而在這條語句的底層實作中,a已經不能算是一個變量了,它僅僅是一個标記,代表一個位址的标記:

mov

dword

ptr[a],0ah;

怎麼樣,這條語句不像上面那條易于接受吧,因為它需要了解更多的細節,你幾乎不能得到編譯器的任何幫助,一切思維上的跨越必須由你自己完成。這條語句應該解釋為“把10寫入以a為位址的記憶體區域”。你說什麼?a有些像指針?對,的确像,但還不是,隻不過他們的過程似乎是類似的。這裡所說的跨越實際上就是從一個現實問題到具體位址以及記憶體區域的跨越。

二.引用:你可以擁有引用,但編譯器僅擁有指針(位址)

看過了第一條,你一定對編譯器的工作有了一定的了解,實際上編譯器就是程式員與底層之間的一個轉換層,它把一個進階語言代碼轉換為低級語言代碼,一個編譯器完成的轉換跨度越大,那麼它也就會越複雜,因為程式員的工作都由他代為完成了。c++編譯器必然比彙編編譯器複雜就是這個道理。如果我問你引用和指針是一樣的嗎?你或許會說當然不一樣了,指針容易産生不安全的因素,引用卻不會,真的不會嗎?我們來看下面這段代碼:

*e=new int(10);

int &f=*e;

delete

e;

f=30;

你認為上面這段代碼怎麼樣,我感覺就不很安全,它和指針有相同的隐患。因為它所引用的記憶體區域就不合法。

我個人認為,所謂的引用其實就是一種指針,隻不過二者的接口并不相同,引用的接口有一定的限制。指針可以一對多,而引用卻隻能一對一,即&refer不能被改變,但卻并不能說一對一就是安全的,隻不過危險的系數降低罷了。引用比指針更容易控制。

ok,下面來說說指針,曾經有過彙編經驗的人一定會說,恩,指針的某些地方有些像彙編,尤其是那個“*”,怎麼就那麼像彙編中的“[]”啊。呵呵,的确,它也涵蓋了一個尋址的過程。看來指針的确是個比較低級的東西。然而引用卻并不那麼直接,雖然程式員用起來友善安全了許多。但是你要清楚,隻有你可以擁有引用,編譯器可沒有這個工具,計算機并不認識這個東西。是以,它的底層機制實際上是和指針一樣的。不要相信隻有一塊記憶體拷貝,不要認為引用可以為你節省一個指針的空間,因為這一切不會發生,編譯器還是會把引用解釋為指針。不管你相不相信,請看下面這段代碼:

int&

b=a;

lea eax,[a];

mov dword ptr[b],eax;把a的位址賦給位址為b的一塊記憶體

b=50;

mov eax,dword ptr[b];

mov dword ptr[eax],32h;

int *d=&a;

mov dword ptr[d],eax

*d=60;

mov eax,dword ptr[d]

mov dword

ptr[eax],3ch;

以上的代碼均來自具體的編譯器,怎麼樣,相信了吧,好,讓我再來做一個或許不怎麼恰當的比拟,你一定編過有關線性表和棧的程式吧,線性表是一個非常靈活的資料結構,在他上面有許多的操作,然而棧呢,它是一個限制性操作的線性表,它的底層操作實際上是由線性表操作實作的。就好比stack與vector的關系,是以指針和引用的關系就好比線性表和棧的關系,引用也就是受限的指針,它對外的接口和指針雖然并不一樣,但底層是相同的。

下面再來看看引用的一個重要用途,作為函數的參數傳遞的時候是怎樣的情形:

void

swapr(int &a, int &b);

void swapr(int* a, int *b);

int a=10;

int b=20;

swapr(a, b);

push eax; //把a的位址壓入堆棧

lea

ecx,[b];

push ecx;

call swapr;

swapr(&a, &b);

push eax;

lea ecx,[b];

push

ecx;

call

swapr;

怎麼樣,用引用和指針傳遞參數無論是在效率上還是在空間上都是完全一樣的,如果妄想不傳入位址就修改實參的值,簡直就是天方夜譚,這就說明引用的本質就是指針。畢竟它們的行為都太相似了,如果不是這樣,你還有什麼方法去實作引用嗎?記住,引用隻不過是編譯器為你提供的一個有用且安全的工具,對于機器代碼可無法表示它,它把指針一對多的缺點去除,禁止了你的不安全的操作。但回到問題的本源,他們沒有任何差別。

ok,現在關于引用我想說的就這些,不知道你有什麼看法呢,這篇文章中一定存在着許多錯誤以及誤解,我希望你能指正,

參考

http://blog.csdn.net/delphicodehome/article/details/500847

--------------------------------------------------------------------------------

我也看過指針與引用的彙編代碼,它們的底層實作是一樣的。指針和引用僅僅是編譯器考慮的範疇。