天天看點

JAVA 垃圾收集算法,回收機制,垃圾收集器(多博文整理版!!!!!!)垃圾收集器

原文位址:https://www.cnblogs.com/1024Community/p/honery.html#341-%E5%B9%B4%E8%BD%BB%E4%BB%A3young-generation%E7%9A%84%E5%9B%9E%E6%94%B6%E7%AE%97%E6%B3%95

https://blog.csdn.net/yhyr_ycy/article/details/52566105

https://blog.csdn.net/ymrfzr/article/details/51354380

一、 技術背景你要了解吧

  按照套路是要先裝裝X,談談JVM垃圾回收的前世今生的。說起垃圾回收(GC),大部分人都把這項技術當做Java語言的伴生産物。事實上,GC的曆史比Java久遠,早在1960年Lisp這門語言中就使用了記憶體動态配置設定和垃圾回收技術。設計和優化C++這門語言的專家們要長點心啦~~

二、 哪些記憶體需要回收?

  猿們都知道JVM的記憶體結構包括五大區域:程式計數器、虛拟機棧、本地方法棧、堆區、方法區。其中程式計數器、虛拟機棧、本地方法棧3個區域随線程而生、随線程而滅,是以這幾個區域的記憶體配置設定和回收都具備确定性,就不需要過多考慮回收的問題,因為方法結束或者線程結束時,記憶體自然就跟随着回收了。而Java堆區和方法區則不一樣、不一樣!(怎麼不一樣說的朗朗上口),這部分記憶體的配置設定和回收是動态的,正是垃圾收集器所需關注的部分。

       程式計數器:目前線程所執行的位元組碼行号訓示器,用于分支,循環,跳轉,異常處理等。程式計數器也是所有JVM記憶體區域中唯一一個沒有定義OutOfMemoryError的區域。

       虛拟機棧:每個方法被執行的時候都會同時建立一個棧幀( Stack Frame)用于存儲局部變量表、操作棧、動态連結、方法出口等資訊。每一個方法被調用直至執行完成的過程,就對應着一個棧幀在虛拟機棧中從入棧到出棧的過程。 

局部變量表存放了編譯期可知的8種基本資料類型.對象引用( reference 類型,它不等同于對象本身,根據不同的虛拟機實作,它可能是一個指向對象起始位址的引用指針,也可能指向一個代表對象的句柄或者其他與此對象相關的位置)和 returnAddress 類型(指向了一條位元組碼指令的位址) 局部變量表所需的記憶體空間在編譯期間完成配置設定,當進入一個方法時,這個方法需要在幀中配置設定多大的局部變量空間是完全确定的,在方法運作期間不會改變局部變量表的大小。 

      如果線程請求的棧深度大于虛拟機所允許的深度,将抛出 StackOverflowError 異常 

      如果虛拟機棧擴充時無法申請到足夠的記憶體時會抛出 OutOfMemoryError 異常。

     本地方法棧:和虛拟機棧,差不多,隻不過虛拟機棧為java方法提供服務,本地方法棧為native方法服務。

     堆:被所有線程共享的一塊區域,該記憶體區域的唯一目的就是存放對象執行個體。如果在執行垃圾回收之後,仍沒有足夠的記憶體配置設定,也不能再擴充,将會抛出OutOfMemoryError:Java Heap Space異常。

     方法區:被所有線程共享的一款區域,它用于存儲已被虛拟機加載的類資訊、常量、靜态變量、即時編譯器編譯後的代碼等資料。這個區域的記憶體回收目标主要是針對常量池的回收和對類型的解除安裝.當方法區使用的記憶體超過它允許的大小時,就會抛出OutOfMemory:PermGen Space異常。

非JVM規範的記憶體區域:直接記憶體

直接記憶體并不是虛拟機規範定義的資料區的一部分,也不是虛拟機運作時資料區的一部分。但是這部分記憶體也被頻繁的使用,而且也可能導緻OOM。

在JDK1.4中新加入了NIO類,引入了一種基于通道與緩沖區的I/O方式。它可以使用Native函數庫直接配置設定堆外記憶體,然後通過一個存儲在Java堆中的DirectByteBuffer對象作為這塊記憶體的引用進行操作。這樣能在一些場合中顯著提高性能,因為避免了在Java堆和Native堆中來回複制資料。

  垃圾收集器在對堆區和方法區進行回收前,首先要确定這些區域的對象哪些可以被回收,哪些暫時還不能回收,這就要用到判斷對象是否存活的算法!(面試官肯定沒少問你吧)

2.1 引用計數算法

2.1.1 算法分析

  引用計數是垃圾收集器中的早期政策。在這種方法中,堆中每個對象執行個體都有一個引用計數。當一個對象被建立時,就将該對象執行個體配置設定給一個變量,該變量計數設定為1。當任何其它變量被指派為這個對象的引用時,計數加1(a = b,則b引用的對象執行個體的計數器+1),但當一個對象執行個體的某個引用超過了生命周期或者被設定為一個新值時,對象執行個體的引用計數器減1。任何引用計數器為0的對象執行個體可以被當作垃圾收集。當一個對象執行個體被垃圾收集時,它引用的任何對象執行個體的引用計數器減1。

2.1.2 優缺點

優點:引用計數收集器可以很快的執行,交織在程式運作中。對程式需要不被長時間打斷的實時環境比較有利。

缺點:無法檢測出循環引用。如父對象有一個對子對象的引用,子對象反過來引用父對象。這樣,他們的引用計數永遠不可能為0。

2.1.3 是不是很無趣,來段代碼壓壓驚

<span style="color:#333333"><code><span style="color:#0000ff">public</span> <span style="color:#0000ff">class</span> <span style="color:#a31515">ReferenceFindTest</span> {
    <span style="color:#0000ff">public</span> <span style="color:#0000ff">static</span> <span style="color:#0000ff">void</span> <span style="color:#a31515">main</span>(String[] args) {
        MyObject object1 = <span style="color:#0000ff">new</span> MyObject();
        MyObject object2 = <span style="color:#0000ff">new</span> MyObject();
          
        object1.object = object2;
        object2.object = object1;
          
        object1 = <span style="color:#0000ff">null</span>;
        object2 = <span style="color:#0000ff">null</span>;
    }
}</code></span>
           

  這段代碼是用來驗證引用計數算法不能檢測出循環引用。最後面兩句将

object1

object2

指派為

null

,也就是說

object1

object2

指向的對象已經不可能再被通路,但是由于它們互相引用對方,導緻它們的引用計數器都不為0,那麼垃圾收集器就永遠不會回收它們。

2.2 可達性分析算法

  可達性分析算法是從離散數學中的圖論引入的,程式把所有的引用關系看作一張圖,從一個節點GC ROOT開始,尋找對應的引用節點,找到這個節點以後,繼續尋找這個節點的引用節點,當所有的引用節點尋找完畢之後,剩餘的節點則被認為是沒有被引用到的節點,即無用的節點,無用的節點将會被判定為是可回收的對象。

JAVA 垃圾收集算法,回收機制,垃圾收集器(多博文整理版!!!!!!)垃圾收集器

  在Java語言中,可作為GC Roots的對象包括下面幾種:

  a) 虛拟機棧中引用的對象(棧幀中的本地變量表);

  b) 方法區中類靜态屬性引用的對象;

  c) 方法區中常量引用的對象;

  d) 本地方法棧中JNI(Native方法)引用的對象。

2.3 Java中的引用你了解多少

  無論是通過引用計數算法判斷對象的引用數量,還是通過可達性分析算法判斷對象的引用鍊是否可達,判定對象是否存活都與“引用”有關。在Java語言中,将引用又分為強引用、軟引用、弱引用、虛引用4種,這四種引用強度依次逐漸減弱。

  • 強引用

  在程式代碼中普遍存在的,類似 

Object obj = new Object()

 這類引用,隻要強引用還存在,垃圾收集器永遠不會回收掉被引用的對象。

  • 軟引用

  用來描述一些還有用但并非必須的對象。對于軟引用關聯着的對象,在系統将要發生記憶體溢出異常之前,将會把這些對象列進回收範圍之中進行第二次回收。如果這次回收後還沒有足夠的記憶體,才會抛出記憶體溢出異常。

  • 弱引用

  也是用來描述非必需對象的,但是它的強度比軟引用更弱一些,被弱引用關聯的對象隻能生存到下一次垃圾收集發生之前。當垃圾收集器工作時,無論目前記憶體是否足夠,都會回收掉隻被弱引用關聯的對象。

  • 虛引用

  也叫幽靈引用或幻影引用(名字真會取,很魔幻的樣子),是最弱的一種引用關系。一個對象是否有虛引用的存在,完全不會對其生存時間構成影響,也無法通過虛引用來取得一個對象執行個體。它的作用是能在這個對象被收集器回收時收到一個系統通知。

  不要被概念吓到,也别擔心,還沒跑題,再深入,可就不好說了。小編羅列這四個概念的目的是為了說明,無論引用計數算法還是可達性分析算法都是基于強引用而言的。

2.4 對象死亡(被回收)前的最後一次掙紮

  即使在可達性分析算法中不可達的對象,也并非是“非死不可”,這時候它們暫時處于“緩刑”階段,要真正宣告一個對象死亡,至少要經曆兩次标記過程。

  第一次标記:如果對象在進行可達性分析後發現沒有與GC Roots相連接配接的引用鍊,那它将會被第一次标記;

  第二次标記:第一次标記後接着會進行一次篩選,篩選的條件是此對象是否有必要執行

finalize()

方法。在

finalize()

方法中沒有重新與引用鍊建立關聯關系的,将被進行第二次标記。

  第二次标記成功的對象将真的會被回收,如果對象在

finalize()

方法中重新與引用鍊建立了關聯關系,那麼将會逃離本次回收,繼續存活。猿們還跟的上吧,嘿嘿。

2.5 方法區如何判斷是否需要回收

  猿們,方法區存儲内容是否需要回收的判斷可就不一樣咯。方法區主要回收的内容有:廢棄常量和無用的類。對于廢棄常量也可通過引用的可達性來判斷,但是對于無用的類則需要同時滿足下面3個條件:

  • 該類所有的執行個體都已經被回收,也就是Java堆中不存在該類的任何執行個體;
  • 加載該類的

    ClassLoader

    已經被回收;
  • 該類對應的

    java.lang.Class

    對象沒有在任何地方被引用,無法在任何地方通過反射通路該類的方法。

講了半天,主角終于要粉墨登場了。

三、常用的垃圾收集算法

3.1 标記-清除算法

  标記-清除算法采用從根集合(GC Roots)進行掃描,對存活的對象進行标記,标記完畢後,再掃描整個空間中未被标記的對象,進行回收,如下圖所示。标記-清除算法不需要進行對象的移動,隻需對不存活的對象進行處理,在存活對象比較多的情況下極為高效,但由于标記-清除算法直接回收不存活的對象,是以會造成記憶體碎片。

JAVA 垃圾收集算法,回收機制,垃圾收集器(多博文整理版!!!!!!)垃圾收集器

3.2 複制算法

  複制算法的提出是為了克服句柄的開銷和解決記憶體碎片的問題。它開始時把堆分成 一個對象 面和多個空閑面, 程式從對象面為對象配置設定空間,當對象滿了,基于copying算法的垃圾 收集就從根集合(GC Roots)中掃描活動對象,并将每個 活動對象複制到空閑面(使得活動對象所占的記憶體之間沒有空閑洞),這樣空閑面變成了對象面,原來的對象面變成了空閑面,程式會在新的對象面中配置設定記憶體。

JAVA 垃圾收集算法,回收機制,垃圾收集器(多博文整理版!!!!!!)垃圾收集器

3.3 标記-整理算法

  标記-整理算法采用标記-清除算法一樣的方式進行對象的标記,但在清除時不同,在回收不存活的對象占用的空間後,會将所有的存活對象往左端空閑空間移動,并更新對應的指針。标記-整理算法是在标記-清除算法的基礎上,又進行了對象的移動,是以成本更高,但是卻解決了記憶體碎片的問題。具體流程見下圖:

JAVA 垃圾收集算法,回收機制,垃圾收集器(多博文整理版!!!!!!)垃圾收集器

3.4 分代收集算法

  分代收集算法是目前大部分JVM的垃圾收集器采用的算法。它的核心思想是根據對象存活的生命周期将記憶體劃分為若幹個不同的區域。一般情況下将堆區劃分為老年代(Tenured Generation)和新生代(Young Generation),在堆區之外還有一個代就是永久代(Permanet Generation)。老年代的特點是每次垃圾收集時隻有少量對象需要被回收,而新生代的特點是每次垃圾回收時都有大量的對象需要被回收,那麼就可以根據不同代的特點采取最适合的收集算法。

JAVA 垃圾收集算法,回收機制,垃圾收集器(多博文整理版!!!!!!)垃圾收集器

3.4.1 年輕代(Young Generation)的回收算法

a) 所有新生成的對象首先都是放在年輕代的。年輕代的目标就是盡可能快速的收集掉那些生命周期短的對象。

b) 新生代記憶體按照8:1:1的比例分為一個eden區和兩個survivor(survivor0,survivor1)區。一個Eden區,兩個 Survivor區(一般而言)。大部分對象在Eden區中生成。回收時先将eden區存活對象複制到一個survivor0區,然後清空eden區,當這個survivor0區也存放滿了時,則将eden區和survivor0區存活對象複制到另一個survivor1區,然後清空eden和這個survivor0區,此時survivor0區是空的,然後将survivor0區和survivor1區交換,即保持survivor1區為空, 如此往複。

c) 當survivor1區不足以存放 eden和survivor0的存活對象時,就将存活對象直接存放到老年代。若是老年代也滿了就會觸發一次Full GC,也就是新生代、老年代都進行回收。

d) 新生代發生的GC也叫做Minor GC,MinorGC發生頻率比較高(不一定等Eden區滿了才觸發)。

3.4.2 年老代(Old Generation)的回收算法

a) 在年輕代中經曆了N次垃圾回收後仍然存活的對象,就會被放到年老代中。是以,可以認為年老代中存放的都是一些生命周期較長的對象。

b) 記憶體比新生代也大很多(大概比例是1:2),當老年代記憶體滿時觸發Major GC即Full GC,Full GC發生頻率比較低,老年代對象存活時間比較長,存活率标記高。

3.4.3 持久代(Permanent Generation)的回收算法

  用于存放靜态檔案,如Java類、方法等。持久代對垃圾回收沒有顯著影響,但是有些應用可能動态生成或者調用一些class,例如Hibernate 等,在這種時候需要設定一個比較大的持久代空間來存放這些運作過程中新增的類。持久代也稱方法區,具體的回收可參見上文2.5節。

猿們加油跟上,離offer不遠啦!!!

四、常見的垃圾收集器

下面一張圖是HotSpot虛拟機包含的所有收集器,圖是借用過來滴:

JAVA 垃圾收集算法,回收機制,垃圾收集器(多博文整理版!!!!!!)垃圾收集器
  • Serial(串行)收集器(複制算法)

    新生代單線程收集器,标記和清理都是單線程,優點是簡單高效。是client級别預設的GC方式,可以通過

    -XX:+UseSerialGC

    來強制指定。
  • Serial Old(串行)收集器(标記-整理算法)

    老年代單線程收集器,Serial收集器的老年代版本。

  • ParNew收集器(并行)(複制算法) 

    新生代收集器,可以認為是Serial收集器的多線程版本,在多核CPU環境下有着比Serial更好的表現。

  • Parallel Scavenge(并行)收集器(複制算法)

    新生代收集器,并行收集器,追求高吞吐量,高效利用CPU。吞吐量一般為99%, 吞吐量= 使用者線程時間/(使用者線程時間+GC線程時間)。适合背景應用等對互動相應要求不高的場景。是server級别預設采用的GC方式,可用

    -XX:+UseParallelGC

    來強制指定,用

    -XX:ParallelGCThreads=4

    來指定線程數。
  • Parallel Old(并行)收集器(标記-整理算法)

    Parallel Scavenge收集器的老年代版本,并行收集器,吞吐量優先。

  • CMS(Concurrent Mark Sweep)(并發)收集器(标記-清除算法)

    老年代收集器,高并發、低停頓,追求最短GC回收停頓時間,cpu占用比較高,響應時間快,停頓時間短,多核cpu 追求高響應時間的選擇。

  • G1收集器(并行&并發)(标記-整理算法)
  • 多條垃圾收集程序并行執行,同時不影響其他程序并發運作。分代收集,空間整合(标記-整理),可預測的停頓(能讓使用者明确指定在一個長度為M毫秒的時間片段内,消耗在垃圾收集上的時間不得超過N毫秒),G1将新生代,老年代的實體空間劃分取消了。
  • 一般遵從以下規則:新生代是複制算法,老年代是标記-整理算法(CMS除外它是标記-清除算法)
  • 垃圾收集器

  • 一、七種垃圾收集器

    (1) Serial(串行GC)-XX:+UseSerialGC

    (2) ParNew(并行GC)-XX:+UseParNewGC

    (3) Parallel Scavenge(并行回收GC)

    (4) Serial Old(MSC)(串行GC)-XX:+UseSerialGC

    (5) CMS(并發GC)-XX:+UseConcMarkSweepGC

    (6) Parallel Old(并行GC)-XX:+UseParallelOldGC

    (7) G1(JDK1.7update14才可以正式商用)

    JAVA 垃圾收集算法,回收機制,垃圾收集器(多博文整理版!!!!!!)垃圾收集器

    二.1~3用于年輕代垃圾回收:年輕代的垃圾回收稱為minor GC

    三.4~6用于年老代垃圾回收(當然也可以用于方法區的回收):年老代的垃圾回收稱為full GC

    G1獨立完成"分代垃圾回收"

    注意:并行與并發

    并行:多條垃圾回收線程同時操作

    并發:垃圾回收線程與使用者線程一起操作

    四、常用五種組合

    Serial/Serial Old

    ParNew/Serial Old:與上邊相比,隻是比年輕代多了多線程垃圾回收而已

    ParNew/CMS:當下比較高效的組合

    Parallel Scavenge/Parallel Old:自動管理的組合

    G1:最先進的收集器,但是需要JDK1.7update14以上

    五. Serial/Serial Old

    年輕代Serial收集器采用單個GC線程實作"複制"算法(包括掃描、複制)

    年老代Serial Old收集器采用單個GC線程實作"标記-整理"算法

    Serial與Serial Old都會暫停所有使用者線程(即STW)

    說明:

    STW(stop the world):編譯代碼時為每一個方法注入safepoint(方法中循環結束的點、方法執行結束的點),在暫停應用時,需要等待所有的使用者線程進入safepoint,之後暫停所有線程,然後進行垃圾回收。

    适用場合:

    CPU核數<2,實體記憶體<2G的機器(簡單來講,單CPU,新生代空間較小且對STW時間要求不高的情況下使用)

    -XX:UseSerialGC:強制使用該GC組合

    -XX:PrintGCApplicationStoppedTime:檢視STW時間

    六.ParNew/Serial Old:

    ParNew除了采用多GC線程來實作複制算法以外,其他都與Serial一樣,但是此組合中的Serial Old又是一個單GC線程,是以該組合是一個比較尴尬的組合,在單CPU情況下沒有Serial/Serial Old速度快(因為ParNew多線程需要切換),在多CPU情況下又沒有之後的三種組合快(因為Serial Old是單GC線程),是以使用其實不多。

    -XX:ParallelGCThreads:指定ParNew GC線程的數量,預設與CPU核數相同,該參數在于CMS GC組合時,也可能會用到

    七.Parallel Scavenge/Parallel Old:

    特點:

    年輕代Parallel Scavenge收集器采用多個GC線程實作"複制"算法(包括掃描、複制)年老代Parallel Old收集器采用多個GC線程實作"标記-整理"算ParallelScavenge與Parallel Old都會暫停所有使用者線程(即STW)

    說明:

    吞吐量:CPU運作代碼時間/(CPU運作代碼時間+GC時間)CMS主要注重STW的縮短(該時間越短,使用者體驗越好,是以主要用于處理很多的互動任務的情況)Parallel Scavenge/Parallel Old主要注重吞吐量(吞吐量越大,說明CPU使用率越高,是以主要用于處理很多的CPU計算任務而使用者互動任務較少的情況)

    參數設定:

    -XX:+UseParallelOldGC:使用該GC組合

    -XX:GCTimeRatio:直接設定吞吐量大小,假設設為19,則允許的最大GC時間占總時間的1/(1+19),預設值為99,即1/(1+99)

    -XX:MaxGCPauseMillis:最大GC停頓時間,該參數并非越小越好

    -XX:+UseAdaptiveSizePolicy:開啟該參數,-Xmn/-XX:SurvivorRatio/-XX:PretenureSizeThreshold這些參數就不起作用了,虛拟機會自動收集監控資訊,動态調整這些參數以提供最合适的的停頓時間或者最大的吞吐量(GC自适應調節政策),而我們需要設定的就是-Xmx,-XX:+UseParallelOldGC或-XX:GCTimeRatio兩個參數就好(當然-Xms也指定上與-Xmx相同就好)

    注意:

    -XX:GCTimeRatio和-XX:MaxGCPauseMillis設定一個就好

    不開啟-XX:+UseAdaptiveSizePolicy,-Xmn/-XX:SurvivorRatio/-XX:PretenureSizeThreshold這些參數依舊可以配置,以resin伺服器為例

    -Xms2048m -Xmx2048m -Xmn512m -Xss1m -XX:PermSize=256M -XX:MaxPermSize=256M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=15 -XX:+UseParallelOldGC -XX:GCTimeRatio=19 -XX:+PrintGCDetails -XX:+PrintGCTimeStamps View Code

    适用場合:

    很多的CPU計算任務而使用者互動任務較少的情況不想自己去過多的關注GC參數,想讓虛拟機自己進行調優工作

  • 吞吐量優先和響應優先的垃圾收集器如何選擇?

    (1) 吞吐量優先的并行收集器 

    參數配置: 

    1, -Xmx4g -Xms4g -Xmn2g -Xss200k -XX:+UseParallelGC -XX:ParallelGCThreads=8 

    說明:選擇Parallel Scavenge收集器,然後配置多少個線程進行回收,最好與處理器數目相等。

    2,-Xmx4g -Xms4g -Xmn2g -Xss200k -XX:+UseParallelGC -XX:ParallelGCThreads=8 -XX:+UseParallelOldGC 

    說明:配置老年代使用Parallel Old

    3,-Xmx4g -Xms4g -Xmn2g -Xss200k -XX:+UseParallelGC -XX:MaxGCPauseMills=100 

    說明:設定每次年輕代垃圾回收的最長時間。如何不能滿足,那麼就會調整年輕代大小,滿足這個設定

    4,-Xmx4g -Xms4g -Xmn2g -Xss200k -XX:+UseParallelGC -XX:MaxGCPauseMills=100 -XX:+UseAdaptiveSizePolicy 

    說明:并行收集器會自動選擇年輕代區大小和Survivor區的比例。

    (2)響應時間優先的并發收集器 

    1, -Xmx4g -Xms4g -Xmn2g -Xss200k -XX:+UseConcMarkSweepGC -XX:+UseParNewGC 

    說明:設定老年代的收集器是CMS,年輕代是ParNew

    2,-Xmx4g -Xms4g -Xmn2g -Xss200k -XX:+UseConcMarkSweepGC -XX:CMSFullGCsBeforeCompaction=5 -XX:+UseCMSCompactAtFullCollection 

    說明:首先設定運作多少次GC後對記憶體空間進行壓縮,整理。同時打開對年老代的壓縮(會影響性能)

    spark面試順便問道,Spark Streaming應該選擇何種垃圾收集器?

    --driver-java-options和 spark.executor.extraJavaOptions這兩個參數将driver和Executor垃圾回收器設定為cms,以提高響應速度。

  • 八、調優方法

    8.1 新對象預留新生代

    由于fullGC(老年代)的成本遠比minorGC(新生代和老年代)的成本大,是以給應用配置設定一個合理的新生代空間,盡量将對象配置設定到新生代減小fullGC的頻率

    8.2 大對象進入老年代

    将大對象直接配置設定到老年代,保持新生代對象的結構的完整性,以提高GC效率, 以通過-XX:PretenureSizeThreshold設定進入老年代的閥值

    8.3 穩定與震蕩的堆大小

    穩定的對大小是對垃圾回收有利的,方法将-Xms和-Xmx的大小一緻

    8.4 吞吐量優先

    盡可能減少系統執行垃圾回收的總時間,故采用并行垃圾回收器

    -XX:+UseParallelGC或使用-XX:+UseParallelOldGC

    8.5 降低停頓

    使用CMS回收器,同時減少fullGC的次數

    九、擷取gc資訊的方法

    9.1 -verbose:gc或者-XX:+PrintGC  擷取gc資訊

    9.2 -XX:+PrintGCDetails  擷取更加詳細的gc資訊

    9.3 -XX:+PrintGCTimeStamps  擷取GC的頻率和間隔

    9.4 -XX:+PrintHeapAtGC  擷取堆的使用情況

    9.5 -Xloggc:D:\gc.log  指定日志情況的儲存路徑

    十、jvm調優實戰-tomcat啟動加速

    在tomcat的bin/catalina.bat檔案的開頭添加相關的配置

    六:監控工具

    監控工具:一般問題定位,性能調優都會使用到。

    (一)、jps

    Jps是參照Unix系統的取名規則命名的,而他的功能和ps的功能類似,可以列舉正在運作的餓虛拟機程序并顯示虛拟機執行的主類以及這些程序的唯一ID(LVMID,對應本機來說和PID相同),他的用法如下:

    Jps [option] [hostid]

    jps -q 隻輸出LVMID

    jps -m 輸出JVM啟動時傳給主類的方法

    jps -l 輸出主類的全名,如果是Jar則輸出jar的路徑

    jps -v 輸出JVM的啟動參數

    (二)、jstat 

     jstat主要用于監控虛拟機的各種運作狀态資訊,如類的裝載、記憶體、垃圾回收、JIT編譯器等,在沒有GUI的伺服器上,這款工具是首選的一款監控工具。其用法如下:

    jstat [option vmid [interval [s|ms] [vount] ] ]

    jstat 監控内容 線程好 重新整理時間間隔 次數

    jstat –gc 20445 1 20    :監視Java堆,包含eden、2個survivor區、old區和永久帶區域的容量、已用空間、GC時間合計等資訊

    jstat –gcutil 20445 1 20:監視内容與-gc相同,但輸出主要關注已使用空間占總空間的百分比

    jstat –class 20445 1 20:監視類的裝載、解除安裝數量以及類的裝載總空間和耗費時間等

    .......-gccapcity......:監視内容與-gc相同,但輸出主要關注Java區域用到的最大和最小空間

    .......-gccause........:與-gcutil輸出資訊相同,額外輸出導緻上次GC産生的原因

    .......-gcnew..........:監控新生代的GC情況

    .......-gcnewcapacity..:與-gcnew監控資訊相同,輸出主要關注使用到的最大和最小空間

    .......-gcold..........:監控老生代的GC情況

    .......-gcoldcapacity..:與-gcold監控資訊相同,輸出主要關注使用到的最大和最小空間

    .......-gcpermcapacity.:輸出永久帶用到的最大和最小空間

    .......-compiler.......:輸出JIT編譯器編譯過的方法、耗時資訊

    .......-printcompilation:輸出已經被JIT編譯的方法

    (三)、jinfo

    jinfo的作用是實時檢視虛拟機的各項參數資訊jps –v可以檢視虛拟機在啟動時被顯式指定的參數資訊,但是如果你想知道預設的一些參數資訊呢?除了去查詢對應的資料以外,jinfo就顯得很重要了。jinfo的用法如下:

    Jinfo [option] pid

    (四)、jmap

    map用于生成堆快照(heapdump)。當然我們有很多方法可以取到對應的dump資訊,如我們通過JVM啟動時加入啟動參數 –XX:HeapDumpOnOutOfMemoryError參數,可以讓JVM在出現記憶體溢出錯誤的時候自動生成dump檔案,亦可以通過-XX:HeapDumpOnCtrlBreak參數,在運作時使用ctrl+break按鍵生成dump檔案,當然我們也可以使用kill -3 pid的方式去恐吓JVM生成dump檔案。Jmap的作用不僅僅是為了擷取dump檔案,還可以用于查詢finalize執行隊列、Java堆和永久帶的詳細資訊,如空間使用率、垃圾回收器等。其運作格式如下:

    Jmap [option] vmip

    監控堆棧資訊主要用來定位問題的原因,生成堆棧快照

    .......-dump......:生成對應的dump資訊,用法為-dump:[live,]format=b,file={fileName}

    .......-finalizerinfo......:顯示在F-Queue中等待的Finalizer方法的對象(隻在linux下生效)

    .......-heap......:顯示堆的詳細資訊、垃圾回收器資訊、參數配置、分代詳情等

    .......-histo......:顯示堆棧中的對象的統計資訊,包含類、執行個體數量和合計容量

    .......-permstat......:以ClassLoder為統計口徑顯示永久帶的記憶體狀态

    .......-F......:虛拟機對-dump無響應時可使用這個選項強制生成dump快照

    例子:jmap -dump:format=b,file=yhj.dump 20445

    (五)、jstack

    Jstack用于JVM目前時刻的線程快照,又稱threaddump檔案,它是JVM目前每一條線程正在執行的堆棧資訊的集合。生成線程快照的主要目的是為了定位線程出現長時間停頓的原因,如線程死鎖、死循環、請求外部時長過長導緻線程停頓的原因。通過jstack我們就可以知道哪些程序在背景做些什麼?在等待什麼資源等!其運作格式如下:

    Jstack [option] vmid

    -F 當正常輸出的請求不響應時強制輸出線程堆棧

    -l 除堆棧資訊外,顯示關于鎖的附加資訊

    -m 顯示native方法的堆棧資訊

    (六)、jconsole

    在JDK的bin目錄下,監控記憶體,thread,堆棧等

    (七)、jprofile

    類似于jconsole,比jconsole監控資訊更全面,記憶體,線程,包,cup 類,堆棧,等等

五、GC是什麼時候觸發的(面試最常見的問題之一)

  由于對象進行了分代處理,是以垃圾回收區域、時間也不一樣。GC有兩種類型:Minor GC和Full GC。

5.1 Minor GC

  一般情況下,當新對象生成,并且在Eden申請空間失敗時,就會觸發Minor GC,對Eden區域進行GC,清除非存活對象,并且把尚且存活的對象移動到Survivor區。然後整理Survivor的兩個區。這種方式的GC是對年輕代的Eden區進行,不會影響到年老代。因為大部分對象都是從Eden區開始的,同時Eden區不會配置設定的很大,是以Eden區的GC會頻繁進行。因而,一般在這裡需要使用速度快、效率高的算法,使Eden去能盡快空閑出來。

5.2 Full GC

  對整個堆進行整理,包括Young、Tenured和Perm。Full GC因為需要對整個堆進行回收,是以比Minor GC要慢,是以應該盡可能減少Full GC的次數。在對JVM調優的過程中,很大一部分工作就是對于Full GC的調節。有如下原因可能導緻Full GC:

(1)調用System.gc時,系統建議執行Full GC,但是不必然執行

(2)老年代空間不足

(3)方法區空間不足

(4)通過Minor GC後進入老年代的平均大小大于老年代的可用記憶體

(5)由Eden區、From Space區向To Space區複制時,對象大小大于To Space可用記憶體,則把該對象轉存到老年代,且老年代的可用記憶體小于該對象大小