天天看點

關于Hibernate的效率問題的總結

近段研究了一些關于hibernate效率問題,整理如下:

1、JDBC仍然是最快的通路方式,不論是Create還是Read操作,都是JDBC快。

2、Hibernate使用uuid.hex構造主鍵,性能稍微有點損失,但是不大。

3、Create操作,JDBC在使用批處理的方式下速度比Hibernate快,使用批處理方式耗用JVM記憶體比不使用批處理方式要多得多。

4、讀取資料,Hibernate的Iterator速度非常緩慢,因為他是每次next的時候才去資料庫取資料,這一點從觀察任務管理器的java程序占用記憶體的變化也可以看得很清楚,記憶體是幾十K幾十K的增加。

5、讀取資料,Hibernate的List速度很快,因為他是一次性把資料取完,這一點從觀察任務管理器的java程序占用記憶體的變化也可以看得很清楚,記憶體幾乎是10M的10M的增加。

6、JDBC讀取資料的方式和Hibernate的List方式是一樣的(這跟JDBC驅動有很大關系,不同的JDBC驅動,結果會很不一樣),這從觀察 java程序記憶體變化可以判斷出來,由于JDBC不需要像Hibernate那樣構造一堆Cat對象執行個體,是以占用JVM記憶體要比Hibernate的 List方式大概少一半左右。

7、Hibernate的Iterator方式并非一無是處,它适合于從大的結果集中選取少量的資料,即不需要占用很多記憶體,又可以迅速得到結果。另外Iterator适合于使用JCS緩沖。

最終結論:

由于MySQL的JDBC驅動的重大缺陷,使得測試結果變得毫無意義,不具備任何參考價值,隻是我們能夠大概判斷出一些結論:

一、精心編寫的JDBC無論如何都是最快的。

二、Hibernate List和Iterator适用的場合不同,不存在孰優孰劣的問題

我個人認為Hibernate Iterator是JDBC Result的封裝,Hibernate List是Scrollable Result的封裝,是以我推測,如果在Oracle或者DB2上面做同樣的Read測試,如果結果集小于FetchSize,4者在速度上應該都不會有 差别;如果結果集大于FetchSize的話,但是不是FetchSize的很多倍,速度排名應該是:

JDBC Scrollable Result (消耗時間最少) < Hibernate List < JDBC Result < Hibernate Iterator

如果結果集非常大,但是隻取結果集中的部分記錄,那麼速度排名:

JDBC Result < Hibernate Iterator < JDBC Scrollable Result < Hibernate List

為了避免造成誤導,我最後強調一下我的結論:

一、“精心編寫”的JDBC一定是性能最好的

實際上,不管CMP,Hibernate,JDO等等,所有的ORM都是對JDBC的封裝,CMP則是一個重量級封裝,JDO中度封 裝,Hibernate是輕量級的封裝。從理論上來說,ORM永遠也不可能比JDBC性能好。就像任何進階語言的運作性能永遠也不會好過彙編語言一個道 理。

對于Create和Update操作來說,由于普通的Java程式員未必會使用JDBC的Batch的功能,是以Hibernate會表現出超過JDBC的運作速度。

對于Read的操作來說,ORM普遍都會帶有雙層緩沖,即PrepreadStatement緩沖和ResultSet緩沖,而JDBC本身沒有緩沖機 制,在使用連接配接池的情況下,一些連接配接池将會提供PrepreadStatement緩沖,有的甚至提供ResultSet緩沖,但是普遍情況下,Java 程式員一般都不會考慮到在寫JDBC的時候優化緩沖,而且這樣做也不太現實,是以在某些情況下,ORM會表現出超過JDBC的Read速度。

二、Hibernate List和Iterator方式的比較

這是我在測試中想要重點考察的方面,但是由于JDBC驅動問題,結果變的很不可信,不過仍然可以得到一些有用的結論。

Read操作包括兩步:第一步是把資料庫的資料取出,構造結果集,把資料放入到結果集中;第二步是周遊結果集,取每行資料。

List方式是1次性把所有的資料全部取到記憶體中,構造一個超大的結果集,主要的時間開銷是這一步,這一步的時間開銷要遠遠超過JDBC和 Iterator方式下構造結果集的時間開銷,并且記憶體開銷也很驚人;而對結果集的周遊操作,速度則是非常的驚人(從上面的測試結果來看,30萬記錄的内 存周遊不到100ms,由于這一步不受JDBC影響,是以結果可信)。是以,List方式适合于對結果集進行反複多次操作的情況,例如分頁顯示,往後往前 周遊,跳到第一行,跳到最後一行等等。

Iterator方式隻取記錄id到記憶體中,并沒有把所有資料取到記憶體中,是以構造結果集的時間開銷很小,比JDBC和List方式都要少,并且記憶體開銷 也小很多。而對結果集的周遊的操作的時候,Iterator仍然要通路資料庫,所有主要的時間開銷都花在這裡。是以,Iterator方式适合于隻對結果 集進行1次周遊操作的情況,并且Iterator方式特别适合于從超大結果集中取少量資料,這種情況Iterator性能非常好。另外Iterator方 式可以利用JCS緩沖,在使用緩沖的情況下Iterator方式的周遊操作速度将不受資料庫通路速度的影響,得到徹底的提升。

Hibernate Iterator JCS方式應該是最快的,Hibernate List速度和JDBC比較接近,而Hibernate Iterator速度還是慢的離譜。另外JDBC和List受到Fetch Size的影響很大,當Fetch Size大于50的時候,速度有非常顯著的提升,而Hibernate Iterator的速度似乎不受Fetch Size的影響。