我對C++中THUNK一種實作技術的分析

我對 C++ 中 THUNK 一種實作技術的分析

KEY WORDS：C++ THUNK 記憶體模式

在網際網路上看到這樣一段代碼，有些網友不知其然，我簡單的把它分析一下。

#pragma pack(push,1)

// structure to store the machine code

struct Thunk

{

char m_jmp; // op code of jmp instruction

unsigned long m_relproc; // relative jmp

};

#pragma pack(pop)

//This type of structure can contain then thunk code, which can be executed on the fly. Let's take a look at the simple case in which we are going to execute our required function by thunk.

//Program 77

#include <iostream>

#include <windows.h>

using namespace std;

class C;

C* g_pC = NULL;

typedef void(*pFUN)();

class C

{

public:

Thunk m_thunk;

//virtual void g(){};

void Init(pFUN pFun, void* pThis)

{

// op code of jump instruction

m_thunk.m_jmp = 0xe9;

// address of the appripriate function

m_thunk.m_relproc = (int)pFun - ((int)this+sizeof(Thunk));

FlushInstructionCache(GetCurrentProcess(),

&m_thunk, sizeof(m_thunk));

}

// this is cour call back function

static void CallBackFun()

{

C* pC = g_pC;

// initilize the thunk

pC->Init(StaticFun, pC);

// get the address of thunk code

pFUN pFun = (pFUN)&(pC->m_thunk);

// start executing thunk code which will call StaticFun

pFun();

cout << "C::CallBackFun" << endl;

}

static void StaticFun()

{

cout << "C::StaticFun" << endl;

}

};

int main()

{

C objC;

g_pC = &objC;

C::CallBackFun();

return 0;

}

C++在實作多重繼承中，要求有一種機制來實作對this指針的動态修改，比較好的一種實作技術就是采用THUNK技術，通常它是由一小段ASM所完成的實作位址轉變和函數調用的程式。上面這段代碼采用C++語言實作THUNK技術。

大家都知道，在程式調到記憶體中後：

由低到高把記憶體分為：

低------0

系統占用區

代碼區

全程資料區

堆區

棧區

DLL區[有DLL自己的堆棧等]

....

沒有占用區

高-----4GB

當程式運作時，函數

static void StaticFun()

{

cout << "C::StaticFun" << endl;

}

在記憶體的中adress已經确定了，我們假設它為 addr_fun_staticfun

當main函數執行到

C objC;

時，就為objC在資料區->棧内配置設定一個位址為 addr_data_objC ,長度為sizeof(C)的記憶體塊

至少這段塊記憶體在main函數運作其間是固定不變的。是以我們可知全程指針 g_pC ,以及static void CallBackFun()中的C* pC的值都是addr_data_objC[記得它是棧内],現在我們看pC->Init(StaticFun, pC);函數内部：

void Init(pFUN pFun, void* pThis)

{

m_thunk.m_jmp = 0xe9; //先不管

m_thunk.m_relproc = (int)pFun - ((int)this+sizeof(Thunk));

FlushInstructionCache(GetCurrentProcess(),

&m_thunk, sizeof(m_thunk));

}

由C類聲明可知，C類對象objC記憶體布局中隻有 Thunk m_thunk;一個資料成員。連vptr也沒有。

是以我們得出結果 &objC.m_thunk = addr_data_objC = (int)this

m_thunk.m_relproc = (int)pFun - ((int)this+sizeof(Thunk));一句

的.m_relproc的值應為addr_fun_staticfun – (addr_data_objC + sizeof(Thunk)) [win32 中sizeof(Thunk) = 5]

FlushInstructionCache(GetCurrentProcess(), &m_thunk, sizeof(m_thunk));

一句的作用，是填指令緩沖區 ,将記憶體位址為 &objC.m_thunk 處起大小為 sizeof(m_thunk)填充到指令緩沖[我覺得這句函數指令是起到優化的作用，沒有什麼必要性]。

這樣，可以了解為在函數Init内部把在記憶體位址起始為&objC.m_thunk = addr_data_objC 起[在資料棧内] sizeof(thunk)一段資料設定為

m_thunk.m_jmp = 0xe9;

m_thunk.m_relproc = (int)pFun - ((int)this+sizeof(Thunk));

而這部分資料的二進制資料從代碼角度講是起跳轉到addr_fun_staticfun的作用。

如果在C類中位于m_thunk之前聲明一個成員或增加類虛拟成員函數，那會讓(int)this <> &m_thunk,是以代碼不能正常工作[這是建立在類對象記憶體布局按用一範圍(Private,Public,pro..)成員變量聲明ORDER配置設定的基礎上],如果想要代碼正常工作，就要在

m_thunk.m_relproc = (int)pFun - ((int)this+sizeof(Thunk));

處作出相當的修改：

m_thunk.m_relproc = (int)pFun - ((int)this+sizeof(Thunk)+SIZEOF(增加的變量));

請大家指正。

我對C++中THUNK一種實作技術的分析

繼續閱讀

POJ 1284 Primitive Roots (歐拉函數&原根定理)

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

成員函數初始化清單

2021-08-13c++——類之操作符重載

swmm與lisflood-fp源碼如何一起編譯 CMake指令

Windows下VS開發環境環境安裝工程項目設定關于Debug和Release的提示

一文看懂字元串的加減乘除

C++ 第十五周報告1--《冒泡法排序》

[轉]九大排序算法——C語言實作及詳解

C++實作簡單順序表

無元件上傳圖檔到資料庫中，最完整解決方案

C經典書籍筆記——C陷阱與缺陷②(文法陷阱之優先級)一、錯誤案列二、優先級規律

QR碼編碼原理三（日本漢字和中文編碼）

線性表之順序表的實作

C++判斷素數、求最大公約數代碼判斷一個數是否為素數求兩個數的最大公約數

SequoiaDB巨杉資料庫C++驅動概述