天天看點

java垃圾回收機制算法分析垃圾回收機制概述記憶體洩露垃圾回收機制算法垃圾收集器總結

原文參考:螞蟻課堂餘勝軍老師。

垃圾回收機制概述

 Java語言中一個顯著的特點就是引入了垃圾回收機制,使c++程式員最頭疼的記憶體管理的問題迎刃而解,它使得Java程式員在編寫程式的時候不再需要考慮記憶體管理。由于有個垃圾回收機制,Java中的對象不再有“作用域”的概念,隻有對象的引用才有“作用域”。垃圾回收可以有效的防止記憶體洩露,有效的使用空閑的記憶體。

  ps:記憶體洩露是指該記憶體空間使用完畢之後未回收,在不涉及複雜資料結構的一般情況下,Java 的記憶體洩露表現為一個記憶體對象的生命周期超出了程式需要它的時間長度,我們有時也将其稱為“對象遊離”。

垃圾回收簡要過程

  這裡必須點出一個很重要的誤區:不可達的對象并不會馬上就會被直接回收,而是至少要經過兩次标記的過程。 

        第一次被标記過的對象,會檢查該對象是否重寫了finalize()方法。如果重寫了該方法,則将其放入一個F-Queue隊列中,否則,直接将對象加入“即将回收”集合。在第二次标記之前,F-Queue隊列中的所有對象會逐個執行finalize()方法,但是不保證該隊列中所有對象的finalize()方法都能被執行,這是因為JVM建立一個低優先級的線程去運作此隊列中的方法,很可能在沒有周遊完之前,就已經被剝奪了運作的權利。那麼運作finalize()方法的意義何在呢?這是對象避免自己被清理的最後手段:如果在執行finalize()方法的過程中,使得此對象重新與GC Roots引用鍊相連,則會在第二次标記過程中将此對象從F-Queue隊列中清除,避免在這次回收中被清除,恢複成了一個“正常”的對象。但顯然這種好事不能無限的發生,對于曾經執行過一次finalize()的對象來說,之後如果再被标記,則不會再執行finalize()方法,隻能等待被清除的命運。 

        之後,GC将對F-Queue中的對象進行第二次小規模的标記,将隊列中重新與GC Roots引用鍊恢複連接配接的對象清除出“即将回收”集合。所有此集合中的内容将被回收。

手動GC回收

public class JVMDemo05 {

    public static void main(String[] args) {

        JVMDemo05 jvmDemo05 = new JVMDemo05();

        //jvmDemo05 = null;

        System.gc();

    }

    protected void finalize() throws Throwable {

       System.out.println("gc在回收對象...");

    }

}

finalize作用

Java技術使用finalize()方法在垃圾收集器将對象從記憶體中清除出去前,做必要的清理工作。這個方法是由垃圾收集器在确定這個對象沒有被引用時對這個對象調用的。它是在Object類中定義的,是以所有的類都繼承了它。子類覆寫finalize()方法以整理系統資源或者執行其他清理工作。finalize()方法是在垃圾收集器删除對象之前對這個對象調用的。

記憶體洩露

記憶體洩漏的定義:對象已經沒有被應用程式使用,但是垃圾回收器沒辦法移除它們,因為還在被引用着。

要想了解這個定義,我們需要先了解一下對象在記憶體中的狀态。下面的這張圖就解釋了什麼是無用對象以及什麼是未被引用對象。

java垃圾回收機制算法分析垃圾回收機制概述記憶體洩露垃圾回收機制算法垃圾收集器總結

上面圖中可以看出,裡面有被引用對象和未被引用對象。未被引用對象會被垃圾回收器回收,而被引用的對象卻不會。未被引用的對象當然是不再被使用的對象,因為沒有對象再引用它。然而無用對象卻不全是未被引用對象。其中還有被引用的。就是這種情況導緻了記憶體洩漏。

如何防止記憶體洩露

下面是幾條容易上手的建議,來幫助你防止記憶體洩漏的發生。

  • 特别注意一些像HashMap、ArrayList的集合對象,它們經常會引發記憶體洩漏。當它們被聲明為static時,它們的生命周期就會和應用程式一樣長。
  • 特别注意事件監聽和回調函數。當一個監聽器在使用的時候被注冊,但不再使用之後卻未被反注冊。
  • “如果一個類自己管理記憶體,那開發人員就得小心記憶體洩漏問題了。” 通常一些成員變量引用其他對象,初始化的時候需要置空。

垃圾回收機制算法

引用計數法

1.1概述

給對象中添加一個引用計數器,每當有一個地方引用它時,計數器值就加1;當引用失效時,計數器值就減1;任何時刻計數器都為0的對象就是不再被使用的,垃圾收集器将回收該對象使用的記憶體。

1.2優缺點

優點:

引用計數收集器可以很快的執行,交織在程式運作中。對程式需要不被長時間打斷的實時環境比較有利。

缺點:

無法檢測出循環引用。如父對象有一個對子對象的引用,子對象反過來引用父對象。這樣,他們的引用計數永遠不可能為0.而且每次加減非常浪費記憶體。

複制算法

s0和s1将可用記憶體按容量分成大小相等的兩塊,每次隻使用其中一塊,當這塊記憶體使用完了,就将還存活的對象複制到另一塊記憶體上去,然後把使用過的記憶體空間一次清理掉。這樣使得每次都是對其中一塊記憶體進行回收,記憶體配置設定時不用考慮記憶體碎片等複雜情況,隻需要移動堆頂指針,按順序配置設定記憶體即可,實作簡單,運作高效。

複制算法的缺點顯而易見,可使用的記憶體降為原來一半。

注:複制算法用于在新生代垃圾回收(s0,s1區)

标記清除算法

标記-清除(Mark-Sweep)算法顧名思義,主要就是兩個動作,一個是标記,另一個就是清除。

标記就是根據特定的算法(如:引用計數算法,可達性分析算法等)标出記憶體中哪些對象可以回收,哪些對象還要繼續用。

标記訓示回收(不可達),那就直接收掉;标記訓示對象還能用(可達),那就原地不動留下。

java垃圾回收機制算法分析垃圾回收機制概述記憶體洩露垃圾回收機制算法垃圾收集器總結

缺點

  1. 标記與清除沒有連續性效率低;
  2. 清除之後記憶體會産生大量碎片;

标記-壓縮算法

标記壓縮法在标記清除基礎之上做了優化,把存活的對象壓縮到記憶體一端,而後進行垃圾清理。(java中老年代使用的就是标記壓縮法)

分代收集算法

根據記憶體中對象的存活周期不同,将記憶體劃分為幾塊,java的虛拟機中一般把記憶體劃分為新生代和年老代,當新建立對象時一般在新生代中配置設定記憶體空間,當新生代垃圾收集器回收幾次之後仍然存活的對象會被移動到年老代記憶體中,當大對象在新生代中無法找到足夠的連續記憶體時也直接在年老代中建立。

對于新生代和老年代來說,新生代回收頻率很高,但是每次回收耗時很短,而老年代回收頻率較低,但是耗時會相對較長,是以應該盡量減少老年代的GC.

垃圾回收時的停頓現象

垃圾回收的任務是識别和回收垃圾對象進行記憶體清理,為了讓垃圾回收器可以更高效的執行,大部分情況下,會要求系統進入一個停頓的狀态。停頓的目的是為了暫停所有的應用線程,隻有這樣系統才不會有新垃圾的産生。同時停頓保證了系統狀态在某一個瞬間的一緻性,也有利于更好的标記垃圾對象。是以在垃圾回收時,都會産生應用程式的停頓。

垃圾收集器

什麼是Java垃圾回收器

Java垃圾回收器是Java虛拟機(JVM)的三個重要子產品(另外兩個是解釋器和多線程機制)之一,為應用程式提供記憶體的自動配置設定(Memory Allocation)、自動回收(Garbage Collect)功能,這兩個操作都發生在Java堆上(一段記憶體快)。某一個時點,一個對象如果有一個以上的引用(Rreference)指向它,那麼該對象就是活着的(Live),否則死亡(Dead),視為垃圾,可被垃圾回收器回收再利用。垃圾回收操作需要消耗CPU、線程、時間等資源,是以容易了解的是垃圾回收操作不是實時的發生(即并不是對象死亡馬上釋放),當記憶體消耗完或者是達到某一個名額(Threshold,使用記憶體占總記憶體的比列,比如0.75)時,觸發垃圾回收操作。有一個對象死亡的例外,java.lang.Thread類型的對象即使沒有引用,隻要線程還在運作,就不會被回收。

串行回收器(Serial Collector)

單線程執行回收操作,回收期間暫停所有應用線程的執行,client模式下的預設回收器,通過-XX:+UseSerialGC指令行可選項強制指定。參數可以設定使用新生代串行和老年代串行回收器。

年輕代的回收算法(Minor Collection):

把Eden區的存活對象移到To區,To區裝不下直接移到年老代,把From區的移到To區,To區裝不下直接移到年老代,From區裡面年齡很大的更新到年老代。 回收結束之後,Eden和From區都為空,此時把From和To的功能互換,From變To,To變From,每一輪回收之前To都是空的。設計的選型為複制。

年老代的回收算法(Full Collection):

年老代的回收分為三個步驟,标記(Mark)、清除(Sweep)、合并(Compact)。标記階段把所有存活的對象标記出來,清除階段釋放所有死亡的對象,合并階段 把所有活着的對象合并到年老代的前部分,把空閑的片段都留到後面。設計的選型為合并,減少記憶體的碎片。

并行回收

并行回收器(ParNew回收器)

并行回收器在串行回收器基礎上做了改進,他可以使用多個線程同時進行垃

圾回收,對于計算能力強的計算機而言,可以有效的縮短垃圾回收所需的尖

際時間。

ParNew 回收器是一個工作在新生代的垃圾回收器,它隻是簡單地将串行回收器多線程化 ,它的回收政策,算法以及參數和新生代串行回收器一樣。

使用-XX:+UseParNewGC 新生代ParNew回收器,老年代則使用串行回收器,

ParNew回收器工作時的線程數量可以使用XX:ParaleiGCThreads參數指

定,一般最好和計算機的CPU相當,避免過多的栽程影響性能。

并行回收集器(ParallelGC回收器)

老年代ParallelOldGC回收器也是一種多線程的回收器,和新生代的

ParallelGC回收器一樣,也是一種關往吞吐量的回收器,他使用了标記壓縮

算法進行實作。

-XX:+UseParallelOldGC 進行設定

-XX:+ParallelCThread也可以設定垃圾收集時的線程教量。

CMS(并發GC)收集器

CMS(Concurrent Mark Sweep)收集器是一種以擷取最短回收停頓時間為目标的收集器。CMS收集器是基于“标記-清除”算法實作的,整個收集過程大緻分為4個步驟:

①.初始标記(CMS initial mark)

②.并發标記(CMS concurrenr mark)

③.重新标記(CMS remark)

④.并發清除(CMS concurrent sweep)

     其中初始标記、重新标記這兩個步驟仍然需要停頓其他使用者線程。初始标記僅僅隻是标記出GC ROOTS能直接關聯到的對象,速度很快,并發标記階段是進行GC ROOTS 根搜尋算法階段,會判定對象是否存活。而重新标記階段則是為了修正并發标記期間,因使用者程式繼續運作而導緻标記産生變動的那一部分對象的标記記錄,這個階段的停頓時間會被初始标記階段稍長,但比并發标記階段要短。

     由于整個過程中耗時最長的并發标記和并發清除過程中,收集器線程都可以與使用者線程一起工作,是以整體來說,CMS收集器的記憶體回收過程是與使用者線程一起并發執行的。

CMS收集器的優點:并發收集、低停頓,但是CMS還遠遠達不到完美,CMS收集器主要有三個顯著缺點:

CMS收集器對CPU資源非常敏感。在并發階段,雖然不會導緻使用者線程停頓,但是會占用CPU資源而導緻引用程式變慢,總吞吐量下降。CMS預設啟動的回收線程數是:(CPU數量+3) / 4。

CMS收集器無法處理浮動垃圾,可能出現“Concurrent Mode Failure“,失敗後而導緻另一次Full GC的産生。由于CMS并發清理階段使用者線程還在運作,伴随程式的運作自然會有新的垃圾不斷産生,這一部分垃圾出現在标記過程之後,CMS無法在本次收集中處理它們,隻好留待下一次GC時将其清理掉。這一部分垃圾稱為“浮動垃圾”。也是由于在垃圾收集階段使用者線程還需要運作,即需要預留足夠的記憶體空間給使用者線程使用,是以CMS收集器不能像其他收集器那樣等到老年代幾乎完全被填滿了再進行收集,需要預留一部分記憶體空間提供并發收集時的程式運作使用。在預設設定下,CMS收集器在老年代使用了68%的空間時就會被激活,也可以通過參數-XX:CMSInitiatingOccupancyFraction的值來提供觸發百分比,以降低記憶體回收次數提高性能。要是CMS運作期間預留的記憶體無法滿足程式其他線程需要,就會出現“Concurrent Mode Failure”失敗,這時候虛拟機将啟動後備預案:臨時啟用Serial Old收集器來重新進行老年代的垃圾收集,這樣停頓時間就很長了。是以說參數-XX:CMSInitiatingOccupancyFraction設定的過高将會很容易導緻“Concurrent Mode Failure”失敗,性能反而降低。

最後一個缺點,CMS是基于“标記-清除”算法實作的收集器,使用“标記-清除”算法收集後,會産生大量碎片。空間碎片太多時,将會給對象配置設定帶來很多麻煩,比如說大對象,記憶體空間找不到連續的空間來配置設定不得不提前觸發一次Full GC。為了解決這個問題,CMS收集器提供了一個-XX:UseCMSCompactAtFullCollection開關參數,用于在Full GC之後增加一個碎片整理過程,還可通過-XX:CMSFullGCBeforeCompaction參數設定執行多少次不壓縮的Full GC之後,跟着來一次碎片整理過程。

G1回收器

G1回收器(Garbage-First)實在jdk1.7中提出的垃圾回收器,從長期目标來看是為了取

代CMS回收器,G1回收器擁有獨特的垃圾回收政策,G1屬于分代垃圾回收器,區分

新生代和老年代,依然有eden和from/to區,它并不要求整個eden區或者新生代、老

年代的空間都連續,它使用了分區算法。

并行性: G1回收期間可多線程同時工作。

并發性:G1擁有與應用程式交替執行能力,部分工作可與應用程式同時執行,在整個

GC期間不會完全阻塞應用程式。

分代GC: G1依然是一個分代的收集器,但是它是非兩新生代和老年代一杯政的雜尊。

空間整理:G1在回收過程中,不會像CMS那樣在若幹次GC後要進行碎片整理。G1采用了有效複制對象的方式,減少空間碎片。

可預見性:由于分區的原因,G1可以隻選取部分區域進行回收,縮小了回收的範圍,提升了性能。

使用-XX:+UseG1GC應用G1收集器

使用-XX:MaxGCPausel指定最大停頓時間(Mills)

使用-XX:ParallelGCThreads設定并行回收的線程數量

總結

初始堆值和最大堆記憶體記憶體越大,吞吐量就越高。

最好使用并行收集器,因為并行收集器速度比串行吞吐量高,速度快。

設定堆記憶體新生代的比例和老年代的比例最好為1:2或者1:3。

減少GC對老年代的回收。