天天看點

《深入了解Java虛拟機》讀書筆記:垃圾收集算法

作者:知北遊zzz

由于垃圾收集算法的實作涉及大量的程式細節,而且各個平台的虛拟機操作記憶體的方法又各不相同,是以本節不打算過多地讨論算法的實作,隻是介紹幾種算法的思想及其發展過程。

《深入了解Java虛拟機》讀書筆記:垃圾收集算法

垃圾收集算法概要

1、 标記-清除算法

标記-清除算法最基礎的收集算法是“标記-清除”(Mark-Sweep)算法,算法分為“标記”和“清除”兩個階段:首先标記出所有需要回收的對象,在标記完成後統一回收所有被标記的對象,它的标記過程其實在前一節講述對象标記判定時已經介紹過了。之是以說它是最基礎的收集算法,是因為後續的收集算法都是基于這種思路并對其不足進行改進而得到的。它的主要不足有兩個:一個是效率問題,标記和清除兩個過程的效率都不高;另一個是空間問題,标記清除之後會産生大量不連續的記憶體碎片,空間碎片太多可能會導緻以後在程式運作過程中需要配置設定較大對象時,無法找到足夠的連續記憶體而不得不提前觸發另一次垃圾收集動作。标記—清除算法的執行過程如圖3-2所示。

《深入了解Java虛拟機》讀書筆記:垃圾收集算法

圖3-2“标記-清除”算法示意圖

2、複制算法

為了解決效率問題,一種稱為“複制”(Copying)的收集算法出現了,它将可用記憶體按容量劃分為大小相等的兩塊,每次隻使用其中的一塊。當這一塊的記憶體用完了,就将還存活着的對象複制到另外一塊上面,然後再把已使用過的記憶體空間一次清理掉。這樣使得每次都是對整個半區進行記憶體回收,記憶體配置設定時也就不用考慮記憶體碎片等複雜情況,隻要移動堆頂指針,按順序配置設定記憶體即可,實作簡單,運作高效。隻是這種算法的代價是将記憶體縮小為了原來的一半,未免太高了一點。複制算法的執行過程如圖3-3所示。

現在的商業虛拟機都采用這種收集算法來回收新生代,IBM公司的專門研究表明,新生代中的對象98%是“朝生夕死”的,是以并不需要按照1∶1的比例來劃分記憶體空間,而是将記憶體分為一塊較大的Eden空間和兩塊較小的Survivor空間,每次使用Eden和其中一塊Survivor[插圖]。當回收時,将Eden和Survivor中還存活着的對象一次性地複制到另外一塊Survivor空間上,最後清理掉Eden和剛才用過的Survivor空間。HotSpot虛拟機預設Eden和Survivor的大小比例是8∶1,也就是每次新生代中可用記憶體空間為整個新生代容量的90%(80%+10%),隻有10%的記憶體會被“浪費”。

《深入了解Java虛拟機》讀書筆記:垃圾收集算法

圖3-3 複制算法示意圖

3、标記-整理算法

“标記-整理”(Mark-Compact)算法,标記過程仍然與“标記-清除”算法一樣,但後續步驟不是直接對可回收對象進行清理,而是讓所有存活的對象都向一端移動,然後直接清理掉端邊界以外的記憶體,“标記-整理”算法的示意圖如圖3-4所示。

《深入了解Java虛拟機》讀書筆記:垃圾收集算法

圖3-4“标記-整理”算法示意圖

4、分代收集算法

目前商業虛拟機的垃圾收集都采用“分代收集”(Generational Collection)算法,根據對象存活周期的不同将記憶體劃分為幾塊。一般是把Java堆分為新生代和老年代,這樣就可以根據各個年代的特點采用最适當的收集算法。在新生代中,每次垃圾收集時都發現有大批對象死去,隻有少量存活,那就選用複制算法,隻需要付出少量存活對象的複制成本就可以完成收集。而老年代中因為對象存活率高、沒有額外空間對它進行配置設定擔保,就必須使用“标記—清理”或者“标記—整理”算法來進行回收。

繼續閱讀