天天看點

深入了解JVM:垃圾收集算法

标記-清除算法

首先标記出所有需要回收的對象,在标記完成以後統一回收所有被标記的對象,之是以說他是最基礎的收集算法,是因為後續收集算法都是基于這種思路并對其不足進行改進而得到的。他的不足主要有兩個:一是效率問題,标記和清除過程的效率都不高;另一個是空間問題,标記清除之後會産生大量不連續記憶體碎片,碎片太多會導緻以後在程式運作過程中需要配置設定較大對象時,無法找到足夠的連續記憶體而不得不提前觸發另一次垃圾收集動作。

複制算法

為了解決效率問題,一種稱為複制的收集算法出現了,他将可用記憶體按容量劃分為大小相等的兩塊,每次隻使用其中一塊。當這一塊用完了,就将好存活着的對象複制到另一塊上面,然後再把已使用過的記憶體空間一次清理掉。這樣使得每次都對整個半區進行記憶體回收,記憶體配置設定時也就不用考慮記憶體碎片等複制情況,隻要一動堆指針,按順序配置設定記憶體即可。這種算法的代價是将記憶體縮小為原來的一半,未免太高了。

現在的商業虛拟機都采用這種收集算法來回收新生代,IBM研究表明,新生代中的對象98%是朝生夕死,是以并不需要按照1:1的比例來劃分記憶體空間,而是将記憶體分為一塊較大的Eden空間和兩塊較小的Survivor空間,每次使用Eden和其中一塊Survivor。當回收時,将Eden和Survivor中還存活着的對象一次性複制到另一塊Survivor空間上,最後清理掉Eden和剛才用過的Survivor空間。

Hotspot虛拟機預設Eden和Survivor的大小比例是8:1,也就是每次新生代中可用記憶體空間為整個新生代容量的90%,隻有10%的記憶體會被浪費,當Survivor空間不夠用時,需要依賴其他記憶體(這裡隻老年代)進行配置設定擔保。

标記-整理算法

複制收集算法在對象存活率較高時就要進行較多的複制操作,效率将會變低。更關鍵的是,如果不想浪費50%的空間,就需要有額外的空間進行配置設定擔保,以應對被使用的記憶體中所有對象都100%存活的極端情況,是以,在老年代一般不能直接選用這種算法。

根據老年代特點,有人提出使用标記-整理算法,标記過程和标記-清除一樣,但後續步驟不是直接對可回收對象進行清理,而是讓所有對象都向一端移動,然後直接清理掉端邊界以外的記憶體。

分代收集算法

目前商業虛拟機的垃圾收集都采用分代收集算法,這種算法并沒有新的思想,知識根據對象存活周期的不同将記憶體劃分為幾塊。一般是把java堆分為新生代和老年代,這樣就可以根據各個年代的特點采用最合适的收集算法。在新生代中,每次垃圾收集都發現有大批對象死去,隻有少量存活,那就選用複制算法。而老年代中因為對象存活率高,沒有額外空間對他進行配置設定擔保,就必須使用标記-清理或者标記-整理算法來回收。

繼續閱讀