天天看點

标準C++類string的Copy-On-Write技術(一) 1、             概念 2、             标準C++類std::string的Copy-On-Write

标準C++類std::string的

記憶體共享和Copy-On-Write技術

陳皓

Scott Meyers在《More Effective C++》中舉了個例子,不知你是否還記得?在你還在上學的時候,你的父母要你不要看電視,而去複習功課,于是你把自己關在房間裡,做出一副正在複習功課的樣子,其實你在幹着别的諸如給班上的某位女生寫情書之類的事,而一旦你的父母出來在你房間要檢查你是否在複習時,你才真正撿起課本看書。這就是“拖延戰術”,直到你非要做的時候才去做。

當然,這種事情在現實生活中時往往會出事,但其在程式設計世界中搖身一變,就成為了最有用的技術,正如C++中的可以随處聲明變量的特點一樣,Scott Meyers推薦我們,在真正需要一個存儲空間時才去聲明變量(配置設定記憶體),這樣會得到程式在運作時最小的記憶體花銷。執行到那才會去做配置設定記憶體這種比較耗時的工作,這會給我們的程式在運作時有比較好的性能。必竟,20%的程式運作了80%的時間。

當然,拖延戰術還并不隻是這樣一種類型,這種技術被我們廣泛地應用着,特别是在作業系統當中,當一個程式運作結束時,作業系統并不會急着把其清除出記憶體,原因是有可能程式還會馬上再運作一次(從磁盤把程式裝入到記憶體是個很慢的過程),而隻有當記憶體不夠用了,才會把這些還駐留記憶體的程式清出。

寫時才拷貝(Copy-On-Write)技術,就是程式設計界“懶惰行為”——拖延戰術的産物。舉個例子,比如我們有個程式要寫檔案,不斷地根據網絡傳來的資料寫,如果每一次fwrite或是fprintf都要進行一個磁盤的I/O操作的話,都簡直就是性能上巨大的損失,是以通常的做法是,每次寫檔案操作都寫在特定大小的一塊記憶體中(磁盤緩存),隻有當我們關閉檔案時,才寫到磁盤上(這就是為什麼如果檔案不關閉,所寫的東西會丢失的原因)。更有甚者是檔案關閉時都不寫磁盤,而一直等到關機或是記憶體不夠時才寫磁盤,Unix就是這樣一個系統,如果非正常退出,那麼資料就會丢失,檔案就會損壞。

呵呵,為了性能我們需要冒這樣大的風險,還好我們的程式是不會忙得忘了還有一塊資料需要寫到磁盤上的,是以這種做法,還是很有必要的。

在我們經常使用的STL标準模闆庫中的string類,也是一個具有寫時才拷貝技術的類。C++曾在性能問題上被廣泛地質疑和指責過,為了提高性能,STL中的許多類都采用了Copy-On-Write技術。這種偷懶的行為的确使使用STL的程式有着比較高要性能。

這裡,我想從C++類或是設計模式的角度為各位揭開Copy-On-Write技術在string中實作的面紗,以供各位在用C++進行類庫設計時做一點參考。

在講述這項技術之前,我想簡單地說明一下string類記憶體配置設定的概念。通過常,string類中必有一個私有成員,其是一個char*,使用者記錄從堆上配置設定記憶體的位址,其在構造時配置設定記憶體,在析構時釋放記憶體。因為是從堆上配置設定記憶體,是以string類在維護這塊記憶體上是格外小心的,string類在傳回這塊記憶體位址時,隻傳回const char*,也就是隻讀的,如果你要寫,你隻能通過string提供的方法進行資料的改寫。

由表及裡,由感性到理性,我們先來看一看string類的Copy-On-Write的表面特征。讓我們寫下下面的一段程式:

#include.h>

#include

using namespace std;

main()

{

       string str1 = "hello world";

       string str2 = str1;

       printf ("Sharing the memory:\n");

       printf ("\tstr1's address: %x\n", str1.c_str() );

       printf ("\tstr2's address: %x\n", str2.c_str() );

    str1[1]='q';

       str2[1]='w';

       printf ("After Copy-On-Write:\n");

       return 0;

}

這個程式的意圖就是讓第二個string通過第一個string構造,然後列印出其存放資料的記憶體位址,然後分别修改str1和str2的内容,再查一下其存放記憶體的位址。程式的輸出是這樣的(我在VC6.0和g++ 2.95都得到了同樣的結果):

> g++ -o stringTest stringTest.cpp

> ./stringTest

Sharing the memory:

        str1's address: 343be9

        str2's address: 343be9

After Copy-On-Write:

        str1's address: 3407a9

從結果中我們可以看到,在開始的兩個語句後,str1和str2存放資料的位址是一樣的,而在修改内容後,str1的位址發生了變化,而str2的位址還是原來的。從這個例子,我們可以看到string類的Copy-On-Write技術。

本文轉自 haoel 51CTO部落格,原文連結:http://blog.51cto.com/haoel/124638,如需轉載請自行聯系原作者

繼續閱讀