天天看點

關于調用約定(cdecl、fastcall、、thiscall) 的一點知識

函數調用規範
 

 
   
 

       

當進階語言函數被編譯成機器碼時,有一個問題就必須解決:因為CPU沒有辦法知道一個函數調用需要多少個、什麼樣的參數。即

計算機不知道怎麼給這個函數傳遞參數,傳遞參數的工作必須由函數調用者和函數本身來協調。為此,計算機提供了一種被稱為棧

的資料結構來支援參數傳遞。

 函數調用時,調用者依次把參數壓棧,然後調用函數,函數被調用以後,在堆棧中取得資料,并進行計算。函數計算結束以後,或

者調用者、或者函數本身修改堆棧,使堆棧恢複原裝。在參數傳遞中,有兩個很重要的問題必須得到明确說明:

1) 當參數個數多于一個時,按照什麼順序把參數壓入堆棧;

2) 函數調用後,由誰來把堆棧恢複原裝;

3)函數的傳回值放在什麼地方;

在進階語言中,通過函數調用規範(Calling Conventions)來說明這兩個問題。常見的調用規範有:stdcall cdecl fastcall

thiscall naked call

stdcall調用規範

stdcall很多時候被稱為pascal調用規範,因為pascal是早期很常見的一種教學用計算機程式設計語言,其文法嚴謹,使用的函數調

用約定是stdcall。在Microsoft C++系列的C/C++編譯器中,常常用PASCAL宏來聲明這個調用約定,類似的宏還有WINAPI和

CALLBACK。

stdcall調用規範聲明的文法為:int __stdcall function(int a,int b)

stdcall的調用約定意味着:      
1)參數從右向左壓入堆棧;      
2)函數自身修改堆棧;      
3) 函數名自動加前導的下劃線,後面緊跟一個@符号,其後緊跟着參數的尺寸。      
以上述這個函數為例,參數b首先被壓棧,然後是參數a,函數調用function(1,2)調用處翻譯成彙編語言将變成:      
push 2          第二個參數入棧      
push 1          第一個參數入棧      
call function   調用參數,注意此時自動把cs:eip入棧      
而對于函數自身,則可以翻譯為:      

push ebp 儲存ebp寄存器,該寄存器将用來儲存堆棧的棧頂指針,可以在函數退出時恢複 mov ebp,esp 儲存堆棧指針 mov eax,[ebp + 8H] 堆棧中ebp指向位置之前依次儲存有ebp,cs:eip,a,b,ebp +8指向a add eax,[ebp + 0CH] 堆棧中ebp + 12處儲存了b mov esp,ebp 恢複esp pop ebp ret 8

而在編譯時,這個函數的名字被翻譯成[email protected]

注意不同編譯器會插入自己的彙編代碼以提供編譯的通用性,但是大體代碼如此。其中在函數開始處保留esp到ebp中,在函數結束

恢複是編譯器常用的方法。

從函數調用看,2和1依次被push進堆棧,而在函數中又通過相對于ebp(即剛進函數時的堆棧指針)的偏移量存取參數。函數結束後,

ret 8表示清理8個位元組的堆棧,函數自己恢複了堆棧。

cdecl調用規範

cdecl調用約定又稱為C調用約定,是C語言預設的調用約定,它的定義文法是: int function (int a ,int b) // 不加修飾就是C調用約定

int __cdecl function(int a,int b) // 明确指出C調用約定

cdecl調用約定的參數壓棧順序是和stdcall是一樣的,參數首先由有向左壓入堆棧。所不同的是,函數本身不清理堆棧,調用者負責清理堆棧。      
由于這種變化,C調用約定允許函數的參數的個數是不固定的,這也是C語言的一大特色。對于前面的function函數,使用cdecl後的彙編碼變成:      
調用處

push   2
push   1
call   function
add    esp,8              注意:這裡調用者在恢複堆棧

被調用函數_function處

push   ebp                儲存ebp寄存器,該寄存器将用來儲存堆棧的棧頂指針,可以在函數退出時恢複
mov    ebp,esp            儲存堆棧指針
mov    eax,[ebp + 8H]     堆棧中ebp指向位置之前依次儲存有ebp,cs:eip,a,b,ebp +8指向a
add    eax,[ebp + 0CH]    堆棧中ebp + 12處儲存了b      
mov    esp,ebp            恢複esp      
pop    ebp      
ret                       注意,這裡沒有修改堆棧      

MSDN中說,該修飾自動在函數名前加前導的下劃線,是以函數名在符号表中被記錄為_function。 

由于參數按照從右向左順序壓棧,是以最開始的參數在最接近棧頂的位置,是以當采用不定個數參數時,第一個參數在棧中的位置肯定能知道,

隻要不定的參數個數能夠根據第一個後者後續的明确的參數确定下來,就可以使用不定參數,例如對于sprintf函數,定義為:

int sprintf(char* buffer,constchar* format,...)

由于所有的不定參數都可以通過format确定,是以使用不定個數的參數是沒有問題的。      

fastcall調用規範

fastcall調用約定和stdcall類似,它意味着:
1) 函數的第一個和第二個DWORD參數(或者尺寸更小的)通過ecx和edx傳遞,其他參數通過從右向左的順序壓棧;
2) 被調用函數清理堆棧;
3) 函數名修改規則同stdcall。
      
其聲明文法為:int __fastcall function(int a,int b)      

thiscall調用規範

thiscall是唯一一個不能明确指明的函數修飾,因為thiscall不是關鍵字。它是C++類成員函數預設的調用約定。由于成員函數調用還有一個this指

針,是以必須特殊處理,thiscall意味着:

1) 參數從右向左入棧;
2) 如果參數個數确定,this指針通過ecx傳遞給被調用者;如果參數個數不确定,this指針在所有參數壓棧後被壓入堆棧;
3) 對參數個數不定的,調用者清理堆棧,否則函數自己清理堆棧。
      
為了說明這個調用約定,定義如下類和使用代碼:      
class A      
{      
public:

        int function1(int a,int b);

        int function2(int a,...);

};

int A::function1 (int a,int b)

{

        return a+b;

}

int A::function2(int a,...)

{

        va_list ap;

        va_start(ap,a);

        int i;

        int result = 0;

        for(i = 0 ; i < a ; i ++)

        {

                result += va_arg(ap,int);

        }

        return result;

}

void callee()

{

        A a;

        a.function1(1,2);

        a.function2(3,1,2,3);

}
														      
callee函數被翻譯成彙編後就變成:
  // 函數function1調用

  0401C1D    push        2

  00401C1F   push        1

  00401C21   lea         ecx,[ebp-8]

  00401C24   call   function1             注意,這裡this沒有被入棧

  // 函數function2調用

  00401C29   push        3

  00401C2B   push        2

  00401C2D   push        1

  00401C2F   push        3

  00401C31   lea         eax,[ebp-8]      這裡引入this指針

  00401C34   push        eax

  00401C35   call   function2

  00401C3A   add         esp,14h      
可見,對于參數個數固定情況下,它類似于stdcall,不定時則類似cdecl

naked call調用規範

這是一個很少見的調用約定,一般程式設計者建議不要使用。編譯器不會給這種函數增加初始化和清理代碼,更特殊的是,不能用return傳回傳回值, 隻能用插入彙編傳回結果。這一般用于實模式驅動程式設計,假設定義一個求和的加法程式,可以定義為:
__declspec(naked) int  add(int a,int b)
{

       __asm mov eax,a

       __asm add eax,b

       __asm ret

   }
														      
注意,這個函數沒有顯式的return傳回值,傳回通過修改eax寄存器實作,而且連退出函數的ret指令都必須顯式插入。上面代碼被翻譯成彙編以後變成:
   mov    eax,[ebp+8]

   add    eax,[ebp+12]

   ret    8      
注意這個修飾是和__stdcall及cdecl結合使用的,前面是它和cdecl結合使用的代碼,對于和stdcall結合的代碼,則變成:
   __declspec(naked) int __stdcall function(int a,int b)

   {

       __asm mov eax,a

       __asm add eax,b

       __asm ret 8//注意後面的8

   }
														      
至于這種函數被調用,則和普通的cdecl及stdcall調用函數一緻。

函數調用約定導緻的常見問題

如果定義的約定和使用的約定不一緻,則将導緻堆棧被破壞,導緻嚴重問題,下面是兩種常見的問題:
1) 函數原型聲明和函數體定義不一緻

2) DLL導入函數時聲明了不同的函數約定      

繼續閱讀