KEY WORDS:C++ THUNK 記憶體模式
在網際網路上看到這樣一段代碼,有些網友不知其然,我簡單的把它分析一下。
#pragma pack(push,1)
// structure to store the machine code
struct Thunk
{
char m_jmp; // op code of jmp instruction
unsigned long m_relproc; // relative jmp
};
#pragma pack(pop)
//This type of structure can contain then thunk code, which can be executed on the fly. Let's take a look at the simple case in which we are going to execute our required function by thunk.
//Program 77
#include <iostream>
#include <windows.h>
using namespace std;
class C;
C* g_pC = NULL;
typedef void(*pFUN)();
class C
{
public:
Thunk m_thunk;
//virtual void g(){};
void Init(pFUN pFun, void* pThis)
{
// op code of jump instruction
m_thunk.m_jmp = 0xe9;
// address of the appripriate function
m_thunk.m_relproc = (int)pFun - ((int)this+sizeof(Thunk));
FlushInstructionCache(GetCurrentProcess(),
&m_thunk, sizeof(m_thunk));
}
// this is cour call back function
static void CallBackFun()
{
C* pC = g_pC;
// initilize the thunk
pC->Init(StaticFun, pC);
// get the address of thunk code
pFUN pFun = (pFUN)&(pC->m_thunk);
// start executing thunk code which will call StaticFun
pFun();
cout << "C::CallBackFun" << endl;
}
static void StaticFun()
{
cout << "C::StaticFun" << endl;
}
};
int main()
{
C objC;
g_pC = &objC;
C::CallBackFun();
return 0;
}
C++在實作多重繼承中,要求有一種機制來實作對this指針的動态修改,比較好的一種實作技術就是采用THUNK技術,通常它是由一小段ASM所完成的實作位址轉變和函數調用的程式。上面這段代碼采用C++語言實作THUNK技術。
大家都知道,在程式調到記憶體中後:
由低到高把記憶體分為:
低------0
系統占用區
代碼區
全程資料區
堆區
棧區
DLL區[有DLL自己的堆棧等]
....
沒有占用區
高-----4GB
當程式運作時,函數
static void StaticFun()
{
cout << "C::StaticFun" << endl;
}
在記憶體的中adress已經确定了,我們假設它為 addr_fun_staticfun
當main函數執行到
C objC;
時,就為objC在資料區->棧内配置設定一個位址為 addr_data_objC ,長度為sizeof(C)的記憶體塊
至少這段塊記憶體在main函數運作其間是固定不變的。是以我們可知全程指針 g_pC ,以及static void CallBackFun()中的C* pC的值都是addr_data_objC[記得它是棧内],現在我們看pC->Init(StaticFun, pC);函數内部:
void Init(pFUN pFun, void* pThis)
{
m_thunk.m_jmp = 0xe9; //先不管
m_thunk.m_relproc = (int)pFun - ((int)this+sizeof(Thunk));
FlushInstructionCache(GetCurrentProcess(),
&m_thunk, sizeof(m_thunk));
}
由C類聲明可知,C類對象objC記憶體布局中隻有 Thunk m_thunk;一個資料成員 。連vptr也沒有。
是以我們得出結果 &objC.m_thunk = addr_data_objC = (int)this
m_thunk.m_relproc = (int)pFun - ((int)this+sizeof(Thunk));一句
的.m_relproc的值應為addr_fun_staticfun – (addr_data_objC + sizeof(Thunk)) [win32 中sizeof(Thunk) = 5]
FlushInstructionCache(GetCurrentProcess(), &m_thunk, sizeof(m_thunk));
一句的作用,是填指令緩沖區 ,将記憶體位址為 &objC.m_thunk 處起大小為 sizeof(m_thunk)填充到指令緩沖[我覺得這句函數指令是起到優化的作用,沒有什麼必要性]。
這樣,可以了解為在函數Init内部把在記憶體位址起始為&objC.m_thunk = addr_data_objC 起[在資料棧内] sizeof(thunk)一段資料設定為
m_thunk.m_jmp = 0xe9;
m_thunk.m_relproc = (int)pFun - ((int)this+sizeof(Thunk));
而這部分資料的二進制資料從代碼角度講是起跳轉到addr_fun_staticfun的作用。
如果在C類中位于m_thunk之前聲明一個成員或增加類虛拟成員函數,那會讓(int)this <> &m_thunk,是以代碼不能正常工作[這是建立在類對象記憶體布局按用一範圍(Private,Public,pro..)成員變量聲明ORDER配置設定的基礎上],如果想要代碼正常工作,就要在
m_thunk.m_relproc = (int)pFun - ((int)this+sizeof(Thunk));
處作出相當的修改:
m_thunk.m_relproc = (int)pFun - ((int)this+sizeof(Thunk)+SIZEOF(增加的變量));
請大家指正。