天天看點

老生常談Java虛拟機垃圾回收機制(必看篇)

在Java虛拟機中,對象和數組的記憶體都是在堆中配置設定的,垃圾收集器主要回收的記憶體就是再堆記憶體中。如果在Java程式運作過程中,動态建立的對象或者數組沒有及時得到回收,持續積累,最終堆記憶體就會被占滿,導緻OOM。

JVM提供了一種垃圾回收機制,簡稱GC機制。通過GC機制,能夠在運作過程中将堆中的垃圾對象不斷回收,進而保證程式的正常運作。

垃圾對象的判定

我們都知道,所謂“垃圾”對象,就是指我們在程式的運作過程中不再有用的對象,即不再存活的對象。那麼怎麼來判斷堆中的對象是“垃圾”、不再存活的對象呢?

引用計數法

每個對象都有一個引用計數的屬性,用來儲存該對象被引用的次數。當引用次數為0時,就意味着該對象沒有被引用了,也就不會在使用這個對象了,可以判定為垃圾對象。但是,這種方式有一個很大的Bug,就是無法解決對象間互相引用或者循環引用的問題:當兩個對象互相引用,他們兩個和其他任何對象也沒有引用關系,它倆的引用次數都不為0,是以不會被回收,但實際上這兩個對象已經不再有用了。

可達性分析(根搜尋法)

為了避免使用引用計數法帶來的問題,Java采用了可達性分析法來判斷垃圾對象。

這種方式可以将所有對象的引用關系想象成一棵樹,從樹的根節點GC Root周遊所有引用的對象,樹的節點就為可達對象,其他沒有處于節點的對象則為不可達對象。

老生常談Java虛拟機垃圾回收機制(必看篇)

那麼什麼樣的對象可以作為GC的根節點呢?

虛拟機棧(幀棧中的本地變量表)中引用的對象

方法區中靜态屬性引用的對象

方法區中常量引用的對象

本地方法棧中JNI引用的對象

引用狀态

垃圾回收機制,不管采用是引用計數法,還是可達性分析法,都與對象的引用有關,Java中存在四種引用狀态:

強引用 - 我們使用的大部分引用實際上都是強引用,這是使用最普遍的引用。如果一個對象具有強引用,就表示它處于可達狀态,垃圾回收器絕不會回收它,即便系統記憶體非常緊張,Java虛拟機甯願抛出 OutOfMemoryError 錯誤,使程式異常終止,也不會回收被強引用所引用的對象。是以,強引用是造成Java記憶體洩露的主要原因之一。

軟引用 - 一個對象隻具有軟引用,如果記憶體空間足夠,垃圾回收器就不會回收它,如果記憶體空間不足了,就會回收這些對象的記憶體。隻要垃圾回收器沒有回收它,該對象就可以被程式使用。

弱引用 - 一個對象隻具有弱引用,那就類似于是可有可無的。弱引用和軟引用很像,但弱引用的引用級别更低。弱引用與軟引用的差別在于:隻具有弱引用的對象擁有更短暫的生命周期。在垃圾回收器線程掃描它所管轄的記憶體區域的過程中,一旦發現了隻具有弱引用的對象,不管目前記憶體空間足夠與否,都會回收它的記憶體。

虛引用 - 一個對象僅持有虛引用,那麼它就和沒有任何引用一樣,在任何時候都可能被垃圾回收器回收。虛引用主要用來跟蹤對象被垃圾回收的活動,我們平常一般不會使用。

垃圾回收算法

通過可達性分析算法能夠判定哪些對象是需要回收的了,那麼回收具體需要怎樣去執行呢?

标記-清除算法

首先需要标記可以回收的對象記憶體,然後在對回收的記憶體進行清除。

老生常談Java虛拟機垃圾回收機制(必看篇)

标記-清除算法(回收前)

老生常談Java虛拟機垃圾回收機制(必看篇)

标記-清除算法(回收後)

但是這樣的話,随着程式的運作,會不斷配置設定釋放記憶體,在堆中會産生很多的不連續的空閑記憶體區,即記憶體碎片。這樣即使有足夠多的空閑記憶體,也不一定能配置設定出足夠大的記憶體,并且可能會造成頻繁的GC,影響效率,甚至OOM。

标記-整理算法

和标記-清除算法不同的是,标記-整理算法在标記後不直接清理可回收記憶體,而是将存活對象都移動到一端,然後清除掉可回收記憶體。

老生常談Java虛拟機垃圾回收機制(必看篇)

标記-整理算法(回收前)

老生常談Java虛拟機垃圾回收機制(必看篇)

标記-整理算法(回收後)

這樣做的好處就是不會産生記憶體碎片。

複制算法

複制算法需要先将記憶體分為兩塊,先在其中一塊記憶體上配置設定記憶體,當這塊記憶體被配置設定完後,則執行垃圾回收,然後把存活對象全部複制到另一塊記憶體上,第一塊記憶體則全部清空。

老生常談Java虛拟機垃圾回收機制(必看篇)

複制算法(回收前)

老生常談Java虛拟機垃圾回收機制(必看篇)

複制算法(回收後)

這種算法不會産生記憶體碎片,但是相當于隻能使用一半的記憶體空間。同時,複制算法和存活對象的數量有關,如果存活對象的數量多,那麼複制算法的效率會大大降低。

分代收集算法

在Java虛拟機中,對象的生命周期有長有短,大部分對象的生命周期很短,隻有少部分的對象才會在記憶體中存留較長時間,是以可以依據對象生命周期的長短将它們放在不同的區域。在采用分代收集算法的Java虛拟機堆中,一般分為三個區域,用來分别儲存這三類對象:

新生代 - 剛建立的對象,在代碼運作時一般都會持續不斷地建立新的對象,這些新建立的對象有很多是局部變量,很快就會變成垃圾對象。這些對象被放在一塊稱為新生代的記憶體區域。新生代的特點是垃圾對象多,存活對象少。

老年代 - 一些對象很早被建立了,經曆了多次GC也沒有被回收,而是一直存活下來。這些對象被放在一塊稱為老年代的區域。老年代的特點是存活對象多,垃圾對象少。

永久代 - 一些伴随虛拟機生命周期永久存在的對象,比如一些靜态對象,常量等。這些對象被放在一塊稱為永久代的區域。永久代的特點是這些對象一般不需要垃圾回收,會在虛拟機運作過程中一直存活。(在Java1.7之前,方法區中存儲的是永久代對象,Java1.7方法區的永久代對象移到了堆中,而在Java1.8永久代已經從堆中移除了,這塊記憶體給了元空間。)

分代收集算法也就根據新生代和老年代來進行垃圾回收的。

對于新生代區域,每次GC都會有很多垃圾對象被回收,隻有少量存活。是以采用複制回收算法,GC時把剩餘很少的存活對象複制過去即可。

在新生代區域中,并不是按照1:1的比例來進行複制回收,而是按照8:1:1的比例分為了Eden、SurvivorA、SurvivorB三個區域。其中Eden意為伊甸園,形容有很多新生對象在裡面建立;Survivor區則為幸存者,即經曆GC後仍然存活下來的對象。

Eden區對外提供堆記憶體。當Eden區快要滿了,則進行Minor GC(新生代GC),把存活對象放入SurvivorA區,清空Eden區;

Eden區被清空後,繼續對外提供堆記憶體;

當Eden區再次被填滿,此時對Eden區和SurvivorA區同時進行Minor GC(新生代GC),把存活對象放入SurvivorB區,此時同時清空Eden區和SurvivorA區;

Eden區繼續對外提供堆記憶體,并重複上述過程,即在 Eden 區填滿後,把Eden區和某個Survivor區的存活對象放到另一個Survivor區;

當某個Survivor區被填滿,且仍有對象未被複制完畢時,或者某些對象在反複Survive 15次左右時,則把這部分剩餘對象放到老年代區域;當老年區也被填滿時,進行Major GC(老年代GC),對老年代區域進行垃圾回收。

老年代區域對象一般存活周期較長,每次GC時,存活的對象比較多,是以采用标記-整理算法,GC時移動少量存活對象,不會産生記憶體碎片。

觸發GC的類型

Java虛拟機會把每次觸發GC的資訊列印出來,可以根據日志來分析觸發GC的原因。

GC_FOR_MALLOC:表示是在堆上配置設定對象時記憶體不足觸發的GC。

GC_CONCURRENT:當我們應用程式的堆記憶體達到一定量,或者可以了解為快要滿的時候,系統會自動觸發GC操作來釋放記憶體。

GC_EXPpCIT:表示是應用程式調用System.gc、VMRuntime.gc接口或者收到SIGUSR1信号時觸發的GC。

GC_BEFORE_OOM:表示是在準備抛OOM異常之前進行的最後努力而觸發的GC。