天天看點

深入了解JVM——常見垃圾收集器

如果說收集算法是記憶體回收的方法論, 那垃圾收集器就是記憶體回收的實踐者。 《Java虛拟機規

範》 中對垃圾收集器應該如何實作并沒有做出任何規定, 是以不同的廠商、 不同版本的虛拟機所包含的垃圾收集器都可能會有很大差别, 不同的虛拟機一般也都會提供各種參數供使用者根據自己的應用特點和要求組合出各個記憶體分代所使用的收集器。

深入了解JVM——常見垃圾收集器

一、串行收集器:Serial收集器

  • 最古老,最穩定
  • 簡單而高效
  • 可能會産生較長的停頓
  • -XX:+UseSerialGC
  • 新生代、老年代都會使用串行回收
  • 新生代複制算法,老年代标記整理

總結:Serial收集器對于運作在Client模式下的虛拟機來說是一個很好的選擇。

這個收集器是一個單線程的收集器,但它的單線程的意義并不僅僅說明它隻會使用一個CPU或一條收集線程去完成垃圾收集工作,更重要的是在它進行垃圾收集時,必須暫停其他所有的工作線程,直到它收集結束。收集器的運作過程如下圖所示:

深入了解JVM——常見垃圾收集器

二、并行收集器:

從ParNew收集器開始, 後面還将會接觸到若幹款涉及“并發”和“并行”概念的收集器。在談論垃圾收集器的上下文語境中, 它們可以了解為:

·并行(Parallel) : 并行描述的是多條垃圾收集器線程之間的關系, 說明同一時間有多條這樣的線程在協同工作, 通常預設此時使用者線程是處于等待狀态。

·并發(Concurrent) : 并發描述的是垃圾收集器線程與使用者線程之間的關系,說明同一時間垃圾收集器線程與使用者線程都在運作。 由于使用者線程并未被當機, 是以程式仍然能響應服務請求, 但由于垃圾收集器線程占用了一部分系統資源, 此時應用程式的處理的吞吐量将受到一定影響。

1、ParNew收集器:

  • ParNew收集器其實就是Serial收集器新生代的并行版本。
  • 多線程,需要多核支援。
  • -XX:+UseParNewGC

    新生代并行

    老年代串行

  • -XX:ParallelGCThreads 限制線程數量
深入了解JVM——常見垃圾收集器

ParNew收集器除了支援多線程并行收集之外, 其他與Serial收集器相比并沒有太多創新之處。除了Serial收集器外, 目前隻有它能與CMS收集器配合工作。

2、Parallel Scanvenge收集器:

Parallel Scavenge收集器提供了兩個參數用于精确控制吞吐量, 分别是控制最大垃圾收集停頓時間的-XX: MaxGCPauseMillis參數以及直接設定吞吐量大小的-XX: GCTimeRatio參數。

  • 類似ParNew,更加關注吞吐量:運作使用者代碼時間 /(運作使用者代碼時間+運作垃圾收集時間)
  • -XX:+UseParallelGC  使用Parallel Scanvenge收集器:新生代并行,老年代串行

3、Parallel Old收集器:

深入了解JVM——常見垃圾收集器
  • Parallel Old收集器是Parallel Scanvenge收集器的老年代版本
  • -XX:+UseParallelGC  使用Parallel Old收集器:新生代并行,老年代并行

三、CMS收集器:

CMS收集器(Concurrent Mark Sweep:并發标記清除)是一種以擷取最短回收停頓時間為目标的收集器。适合應用在網際網路站或者B/S系統的伺服器上,這類應用尤其重視伺服器的響應速度,希望系統停頓時間最短。

從名字(包含“Mark Sweep”)上就可以看出CMS收集器是基于“标記-清除”算法實作的,它的運作過程相對于前面幾種收集器來說要更複雜一些,整個過程分為4個步驟,包括:

  • 初始标記(CMS initial mark)
  • 并發标記(CMS concurrent mark)
  • 重新标記(CMS remark)
  • 并發清除(CMS concurrent sweep)

其中初始标記、重新标記這兩個步驟仍然需要“Stop The World”。初始标記僅僅隻是标記一下GC Roots能直接關聯到的對象,速度很快,并發标記階段就是進行GC Roots Tracing的過程,而重新标記階段則是為了修正并發标記期間,因使用者程式繼續運作而導緻标記産生變動的那一部分對象的标記記錄,這個階段的停頓時間一般會比初始标記階段稍長一些,但遠比并發标記的時間短。

由于整個過程中耗時最長的并發标記和并發清除過程中,收集器線程都可以與使用者線程一起工作,是以總體上來說,CMS收集器的記憶體回收過程是與使用者線程一起并發地執行。老年代收集器(新生代使用ParNew)

優點: 并發收集、低停頓

缺點: 産生大量空間碎片、并發階段會降低吞吐量、由于CMS收集器無法處理“浮動垃圾”(Floating Garbage) , 有可能出現“Con-current Mode Failure”失敗進而導緻另一次完全“Stop The World”的Full GC的産生。

參數控制:

-XX:+UseConcMarkSweepGC

 使用CMS收集器

-XX:+ UseCMSCompactAtFullCollection

 Full GC後,進行一次碎片整理;整理過程是獨占的,會引起停頓時間變長

-XX:+CMSFullGCsBeforeCompaction

 設定進行幾次Full GC後,進行一次碎片整理

-XX:ParallelCMSThreads

 設定CMS的線程數量(一般情況約等于可用CPU數量)

深入了解JVM——常見垃圾收集器

四、G1收集器

G1是目前技術發展的最前沿成果之一,HotSpot開發團隊賦予它的使命是未來可以替換掉JDK1.5中釋出的CMS收集器。與CMS收集器相比G1收集器有以下特點:

  1. 空間整合,G1收集器采用标記整理算法,不會産生記憶體空間碎片。配置設定大對象時不會因為無法找到連續空間而提前觸發下一次GC。
  2. 可預測停頓,這是G1的另一大優勢,降低停頓時間是G1和CMS的共同關注點,但G1除了追求低停頓外,還能建立可預測的停頓時間模型,能讓使用者明确指定在一個長度為N毫秒的時間片段内,消耗在垃圾收集上的時間不得超過N毫秒,這幾乎已經是實時Java(RTSJ)的垃圾收集器的特征了。

上面提到的垃圾收集器,收集的範圍都是整個新生代或者老年代,而G1不再是這樣。使用G1收集器時,Java堆的記憶體布局與其他收集器有很大差别,它将整個Java堆劃分為多個大小相等的獨立區域(Region),雖然還保留有新生代和老年代的概念,但新生代和老年代不再是實體隔閡了,它們都是一部分(可以不連續)Region的集合。

G1的新生代收集跟ParNew類似,當新生代占用達到一定比例的時候,開始出發收集。和CMS類似,G1收集器收集老年代對象會有短暫停頓。

收集步驟:

深入了解JVM——常見垃圾收集器

1、标記階段,首先初始标記(Initial-Mark),這個階段是停頓的(Stop the World Event),并且會觸發一次普通Mintor GC。對應GC log:GC pause (young) (inital-mark)

深入了解JVM——常見垃圾收集器

2、Root Region Scanning,程式運作過程中會回收survivor區(存活到老年代),這一過程必須在young GC之前完成。

3、Concurrent Marking,在整個堆中進行并發标記(和應用程式并發執行),此過程可能被young GC中斷。在并發标記階段,若發現區域對象中的所有對象都是垃圾,那個這個區域會被立即回收(圖中打X)。同時,并發标記過程中,會計算每個區域的對象活性(區域中存活對象的比例)。

4、Remark, 再标記,會有短暫停頓(STW)。再标記階段是用來收集 并發标記階段 産生新的垃圾(并發階段和應用程式一同運作);G1中采用了比CMS更快的初始快照算法:snapshot-at-the-beginning (SATB)。

5、Copy/Clean up,多線程清除失活對象,會有STW。G1将回收區域的存活對象拷貝到新區域,清除Remember Sets,并發清空回收區域并把它傳回到空閑區域連結清單中。

6、複制/清除過程後。回收區域的活性對象已經被集中回收到深藍色和深綠色區域。

常用的收集器組合

新生代GC政策 老年老代GC政策 說明
組合1 Serial Serial Old Serial和Serial Old都是單線程進行GC,特點就是GC時暫停所有應用線程。
組合2 Serial CMS+Serial Old CMS(Concurrent Mark Sweep)是并發GC,實作GC線程和應用線程并發工作,不需要暫停所有應用線程。另外,當CMS進行GC失敗時,會自動使用Serial Old政策進行GC。
組合3 ParNew CMS 使用 

-XX:+UseParNewGC

選項來開啟。ParNew是Serial的并行版本,可以指定GC線程數,預設GC線程數為CPU的數量。可以使用-XX:ParallelGCThreads選項指定GC的線程數。如果指定了選項 

-XX:+UseConcMarkSweepGC

選項,則新生代預設使用ParNew GC政策。
組合4 ParNew Serial Old 使用 

-XX:+UseParNewGC

選項來開啟。新生代使用ParNew GC政策,年老代預設使用Serial Old GC政策。
組合5 Parallel Scavenge Serial Old Parallel Scavenge政策主要是關注一個可控的吞吐量:應用程式運作時間 / (應用程式運作時間 + GC時間),可見這會使得CPU的使用率盡可能的高,适用于背景持久運作的應用程式,而不适用于互動較多的應用程式。
組合6 Parallel Scavenge Parallel Old Parallel Old是Serial Old的并行版本
組合7 G1GC G1GC

-XX:+UnlockExperimentalVMOptions

-XX:+UseG1GC

 #開啟; 

-XX:MaxGCPauseMillis=50

 #暫停時間目标; 

-XX:GCPauseIntervalMillis=200

 #暫停間隔目标; 

-XX:+G1YoungGenSize=512m

 #年輕代大小; 

-XX:SurvivorRatio=6

 #幸存區比例