天天看點

c++ 虛函數的實作機制:筆記

1、c++實作多态的方法

其實很多人都知道,虛函數在c++中的實作機制就是用虛表和虛指針,但是具體是怎樣的呢?從more effecive c++其中一篇文章裡面可以知道:是每個類用了一個虛表,每個類的對象用了一個虛指針。具體的用法如下:

class A

{

public:

    virtual void f();

    virtual void g();

private:

    int a

};

class B : public A

{

public:

    void g();

private:

    int b;

};

//A,B的實作省略

因為A有virtual void f(),和g(),是以編譯器為A類準備了一個虛表vtableA,内容如下:

A::f 的位址
A::g 的位址

B因為繼承了A,是以編譯器也為B準備了一個虛表vtableB,内容如下:

A::f 的位址
B::g 的位址

注意:因為B::g是重寫了的,是以B的虛表的g放的是B::g的入口位址,但是f是從上面的A繼承下來的,是以f的位址是A::f的入口位址。

然後某處有語句 B bB;的時候,編譯器配置設定空間時,除了A的int a,B的成員int b;以外,還配置設定了一個虛指針vptr,指向B的虛表vtableB,bB的布局如下:

vptr : 指向B的虛表vtableB
int a: 繼承A的成員
int b: B成員

當如下語句的時候:

A *pa = &bB;

pa的結構就是A的布局(就是說用pa隻能通路的到bB對象的前兩項,通路不到第三項int b)

那麼pa->g()中,編譯器知道的是,g是一個聲明為virtual的成員函數,而且其入口位址放在表格(無論是vtalbeA表還是vtalbeB表)的第2項,那麼編譯器編譯這條語句的時候就如是轉換:call *(pa->vptr)[1](C語言的數組索引從0開始哈~)。

這一項放的是B::g()的入口位址,則就實作了多态。(注意bB的vptr指向的是B的虛表vtableB)

另外要注意的是,如上的實作并不是唯一的,C++标準隻要求用這種機制實作多态,至于虛指針vptr到底放在一個對象布局的哪裡,标準沒有要求,每個編譯器自己決定。我以上的結果是根據g++ 4.3.4經過反彙編分析出來的。

2、兩種多态實作機制及其優缺點

除了c++的這種多态的實作機制之外,還有另外一種實作機制,也是查表,不過是按名稱查表,是smalltalk等語言的實作機制。這兩種方法的優缺點如下:

(1)、按照絕對位置查表,這種方法由于編譯階段已經做好了索引和表項(如上面的call *(pa->vptr[1]) ),是以運作速度比較快;缺點是:當A的virtual成員比較多(比如1000個),而B重寫的成員比較少(比如2個),這種時候,B的vtableB的剩下的998個表項都是放A中的virtual成員函數的指針,如果這個派生體系比較大的時候,就浪費了很多的空間。

比如:GUI庫,以MFC庫為例,MFC有很多類,都是一個繼承體系;而且很多時候每個類隻是1,2個成員函數需要在派生類重寫,如果用C++的虛函數機制,每個類有一個虛表,每個表裡面有大量的重複,就會造成空間使用率不高。于是MFC的消息映射機制不用虛函數,而用第二種方法來實作多态,那就是:

(2)、按照函數名稱查表,這種方案可以避免如上的問題;但是由于要比較名稱,有時候要周遊所有的繼承結構,時間效率性能不是很高。(關于MFC的消息映射的實作,看下一篇文章)

3、總結:

如果繼承體系的基類的virtual成員不多,而且在派生類要重寫的部分占了其中的大多數時候,用C++的虛函數機制是比較好的;

但是如果繼承體系的基類的virtual成員很多,或者是繼承體系比較龐大的時候,而且派生類中需要重寫的部分比較少,那就用名稱查找表,這樣效率會高一些,很多的GUI庫都是這樣的,比如MFC,QT

PS. 其實,自從計算機出現之後,時間和空間就成了永恒的主題,因為兩者在98%的情況下都無法協調,此長彼消;這個就是計算機科學中的根本瓶頸之所在。軟體科學和算法的發展,就看能不能突破這對時空權衡了。呵呵

何止計算機科學如此,整個宇宙又何嘗不是如此呢?最基本的宇宙之謎,還是時間和空間~