天天看點

[轉帖]Jvm Tuning

JVM調優總結

最近總結的一些東西,基本上是網上一些資料的彙總。

一、相關概念

基本回收算法

  1. 引用計數(Reference Counting)

    比較古老的回收算法。原理是此對象有一個引用,即增加一個計數,删除一個引用則減少一個計數。垃圾回收時,隻用收集計數為0的對象。此算法最緻命的是無法處理循環引用的問題。

  2. 标記-清除(Mark-Sweep)

    此算法執行分兩階段。第一階段從引用根節點開始标記所有被引用的對象,第二階段周遊整個堆,把未标記的對象清除。此算法需要暫停整個應用,同時,會産生記憶體碎片。

  3. 複制(Copying)

    此算法把記憶體空間劃為兩個相等的區域,每次隻使用其中一個區域。垃圾回收時,周遊目前使用區域,把正在使用中的對象複制到另外一個區域中。次算法每次隻處理正在使用中的對象,是以複制成本比較小,同時複制過去以後還能進行相應的記憶體整理,不過出現“碎片”問題。當然,此算法的缺點也是很明顯的,就是需要兩倍記憶體空間。

  4. 标記-整理(Mark-Compact)

    此算法結合了“标記-清除”和“複制”兩個算法的優點。也是分兩階段,第一階段從根節點開始标記所有被引用對象,第二階段周遊整個堆,把清除未标記對象并且把存活對象“壓縮”到堆的其中一塊,按順序排放。此算法避免了“标記-清除”的碎片問題,同時也避免了“複制”算法的空間問題。

  5. 增量收集(Incremental Collecting)

    實施垃圾回收算法,即:在應用進行的同時進行垃圾回收。不知道什麼原因JDK5.0中的收集器沒有使用這種算法的。

  6. 分代(Generational Collecting)

    基于對對象生命周期分析後得出的垃圾回收算法。把對象分為年青代、年老代、持久代,對不同生命周期的對象使用不同的算法(上述方式中的一個)進行回收。現在的垃圾回收器(從J2SE1.2開始)都是使用此算法的。

分代垃圾回收詳述

[轉帖]Jvm Tuning

如上圖所示,為Java堆中的各代分布。

  1. Young(年輕代)

    年輕代分三個區。一個Eden區,兩個Survivor區。大部分對象在Eden區中生成。當Eden區滿時,還存活的對象将被複制到Survivor區(兩個中的一個),當這個Survivor區滿時,此區的存活對象将被複制到另外一個Survivor區,當這個Survivor去也滿了的時候,從第一個Survivor區複制過來的并且此時還存活的對象,将被複制“年老區(Tenured)”。需要注意,Survivor的兩個區是對稱的,沒先後關系,是以同一個區中可能同時存在從Eden複制過來 對象,和從前一個Survivor複制過來的對象,而複制到年老區的隻有從第一個Survivor去過來的對象。而且,Survivor區總有一個是空的。

  2. Tenured(年老代)

    年老代存放從年輕代存活的對象。一般來說年老代存放的都是生命期較長的對象。

  3. Perm(持久代)

    用于存放靜态檔案,如今Java類、方法等。持久代對垃圾回收沒有顯著影響,但是有些應用可能動态生成或者調用一些class,例如Hibernate等,在這種時候需要設定一個比較大的持久代空間來存放這些運作過程中新增的類。持久代大小通過-XX:MaxPermSize=<n></n>進行設定。

GC類型

GC有兩種類型: Scavenge GC和Full GC。

  1. Scavenge GC

    一般情況下,當新對象生成,并且在Eden申請空間失敗時,就好觸發Scavenge GC,堆Eden區域進行GC,清除非存活對象,并且把尚且存活的對象移動到Survivor區。然後整理Survivor的兩個區。

  2. Full GC

    對整個堆進行整理,包括Young、Tenured和Perm。Full GC比Scavenge GC要慢,是以應該盡可能減少Full GC。有如下原因可能導緻Full GC:

    • Tenured被寫滿
    • Perm域被寫滿
    • System.gc()被顯示調用
    • 上一次GC之後Heap的各域配置設定政策動态變化

分代垃圾回收過程示範

[轉帖]Jvm Tuning
[轉帖]Jvm Tuning
[轉帖]Jvm Tuning
[轉帖]Jvm Tuning

二、垃圾回收器

目前的收集器主要有三種:串行收集器、并行收集器、并發收集器。

  1. 串行收集器
    [轉帖]Jvm Tuning
    使用單線程處理所有垃圾回收工作,因為無需多線程互動,是以效率比較高。但是,也無法使用多處理器的優勢,是以此收集器适合單處理器機器。當然,此收集器也可以用在小資料量(100M左右)情況下的多處理器機器上。可以使用-XX:+UseSerialGC打開。
  2. 并行收集器
    1. [轉帖]Jvm Tuning
      對年輕代進行并行垃圾回收,是以可以減少垃圾回收時間。一般在多線程多處理器機器上使用。使用-XX:+UseParallelGC.打開。并行收集器在J2SE5.0第六6更新上引入,在Java SE6.0中進行了增強--可以堆年老代進行并行收集。如果年老代不使用并發收集的話,是使用單線程進行垃圾回收,是以會制約擴充能力。使用-XX:+UseParallelOldGC打開。
    2. 使用-XX:ParallelGCThreads=<n></n>設定并行垃圾回收的線程數。此值可以設定與機器處理器數量相等。
    3. 此收集器可以進行如下配置:
      • 最大垃圾回收暫停:指定垃圾回收時的最長暫停時間,通過-XX:MaxGCPauseMillis=<n></n>指定。<n></n>為毫秒.如果指定了此值的話,堆大小和垃圾回收相關參數會進行調整以達到指定值。設定此值可能會減少應用的吞吐量。
      • 吞吐量:吞吐量為垃圾回收時間與非垃圾回收時間的比值,通過-XX:GCTimeRatio=<n></n>來設定,公式為1/(1+N)。例如,-XX:GCTimeRatio=19時,表示5%的時間用于垃圾回收。預設情況為99,即1%的時間用于垃圾回收。
  3. 并發收集器

    可以保證大部分工作都并發進行(應用不停止),垃圾回收隻暫停很少的時間,此收集器适合對響應時間要求比較高的中、大規模應用。使用-XX:+UseConcMarkSweepGC打開。

    1. [轉帖]Jvm Tuning
      并發收集器主要減少年老代的暫停時間,他在應用不停止的情況下使用獨立的垃圾回收線程,跟蹤可達對象。在每個年老代垃圾回收周期中,在收集初期并發收集器會對整個應用進行簡短的暫停,在收集中還會再暫停一次。第二次暫停會比第一次稍長,在此過程中多個線程同時進行垃圾回收工作。
    2. 并發收集器使用處理器換來短暫的停頓時間。在一個N個處理器的系統上,并發收集部分使用K/N個可用處理器進行回收,一般情況下1<=K<=N/4。
    3. 在隻有一個處理器的主機上使用并發收集器,設定為incremental mode模式也可獲得較短的停頓時間。
    4. 浮動垃圾:由于在應用運作的同時進行垃圾回收,是以有些垃圾可能在垃圾回收進行完成時産生,這樣就造成了“Floating Garbage”,這些垃圾需要在下次垃圾回收周期時才能回收掉。是以,并發收集器一般需要20%的預留白間用于這些浮動垃圾。
    5. Concurrent Mode Failure:并發收集器在應用運作時進行收集,是以需要保證堆在垃圾回收的這段時間有足夠的空間供程式使用,否則,垃圾回收還未完成,堆空間先滿了。這種情況下将會發生“并發模式失敗”,此時整個應用将會暫停,進行垃圾回收。
    6. 啟動并發收集器:因為并發收集在應用運作時進行收集,是以必須保證收集完成之前有足夠的記憶體空間供程式使用,否則會出現“Concurrent Mode Failure”。通過設定-XX:CMSInitiatingOccupancyFraction=<n></n>指定還有多少剩餘堆時開始執行并發收集
  4. 小結
    • 串行處理器:

       --适用情況:資料量比較小(100M左右);單處理器下并且對響應時間無要求的應用。

       --缺點:隻能用于小型應用

    • 并行處理器:

       --适用情況:“對吞吐量有高要求”,多CPU、對應用響應時間無要求的中、大型應用。舉例:背景處理、科學計算。

       --缺點:應用響應時間可能較長

    • 并發處理器:

       --适用情況:“對響應時間有高要求”,多CPU、對應用響應時間有較高要求的中、大型應用。舉例:Web伺服器/應用伺服器、電信交換、內建開發環境。

三、常見配置舉例

  1. 堆大小設定

    JVM 中最大堆大小有三方面限制:相關作業系統的資料模型(32-bt還是64-bit)限制;系統的可用虛拟記憶體限制;系統的可用實體記憶體限制。32位系統下,一般限制在1.5G~2G;64為作業系統對記憶體無限制。我在Windows Server 2003 系統,3.5G實體記憶體,JDK5.0下測試,最大可設定為1478m。

    典型設定:

    • java -Xmx3550m -Xms3550m -Xmn2g

      -Xss128k

      -

      Xmx3550m:設定JVM最大可用記憶體為3550M。

      -Xms3550m

      :設定JVM促使記憶體為3550m。此值可以設定與-Xmx相同,以避免每次垃圾回收完成後JVM重新配置設定記憶體。

      -Xmn2g

      :設定年輕代大小為2G。整個堆大小=年輕代大小 + 年老代大小 + 持久代大小。持久代一般固定大小為64m,是以增大年輕代後,将會減小年老代大小。此值對系統性能影響較大,Sun官方推薦配置為整個堆的3/8。

      -Xss128k

      :設定每個線程的堆棧大小。JDK5.0以後每個線程堆棧大小為1M,以前每個線程堆棧大小為256K。更具應用的線程所需記憶體大小進行調整。在相同實體記憶體下,減小這個值能生成更多的線程。但是作業系統對一個程序内的線程數還是有限制的,不能無限生成,經驗值在3000~5000左右。

    • java -Xmx3550m -Xms3550m

      -Xss128k -XX:NewRatio=4 -XX:SurvivorRatio=4 -XX:MaxPermSize=16m -XX:MaxTenuringThreshold=0

      -XX:NewRatio=4

      :設定年輕代(包括Eden和兩個Survivor區)與年老代的比值(除去持久代)。設定為4,則年輕代與年老代所占比值為1:4,年輕代占整個堆棧的1/5

      -XX:SurvivorRatio=4

      :設定年輕代中Eden區與Survivor區的大小比值。設定為4,則兩個Survivor區與一個Eden區的比值為2:4,一個Survivor區占整個年輕代的1/6

      -XX:MaxPermSize=16m

      :設定持久代大小為16m。

      -XX:MaxTenuringThreshold=0

      :設定垃圾最大年齡。如果設定為0的話,則年輕代對象不經過Survivor區,直接進入年老代。對于年老代比較多的應用,可以提高效率。如果将此值設定為一個較大值,則年輕代對象會在Survivor區進行多次複制,這樣可以增加對象再年輕代的存活時間,增加在年輕代即被回收的概論。

  2. 回收器選擇

    JVM給了三種選擇:串行收集器、并行收集器、并發收集器,但是串行收集器隻适用于小資料量的情況,是以這裡的選擇主要針對并行收集器和并發收集器。預設情況下,JDK5.0以前都是使用串行收集器,如果想使用其他收集器需要在啟動時加入相應參數。JDK5.0以後,JVM會根據目前系統配置進行判斷。

    1. 吞吐量優先的并行收集器

      如上文所述,并行收集器主要以到達一定的吞吐量為目标,适用于科學技術和背景處理等。

      典型配置:

      • java -Xmx3800m -Xms3800m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20

        -XX:+UseParallelGC

        :選擇垃圾收集器為并行收集器。此配置僅對年輕代有效。即上述配置下,年輕代使用并發收集,而年老代仍舊使用串行收集。

        -XX:ParallelGCThreads=20

        :配置并行收集器的線程數,即:同時多少個線程一起進行垃圾回收。此值最好配置與處理器數目相等。

      • java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20 -XX:+UseParallelOldGC

        -XX:+UseParallelOldGC

        :配置年老代垃圾收集方式為并行收集。JDK6.0支援對年老代并行收集。

      • java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC  -XX:MaxGCPauseMillis=100

        -XX:MaxGCPauseMillis=100

        :設定每次年輕代垃圾回收的最長時間,如果無法滿足此時間,JVM會自動調整年輕代大小,以滿足此值。

      • java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC  -XX:MaxGCPauseMillis=100

        -XX:+UseAdaptiveSizePolicy

        -XX:+UseAdaptiveSizePolicy:設定此選項後,并行收集器會自動選擇年輕代區大小和相應的Survivor區比例,以達到目标系統規定的最低相應時間或者收集頻率等,此值建議使用并行收集器時,一直打開。

    2. 響應時間優先的并發收集器

      如上文所述,并發收集器主要是保證系統的響應時間,減少垃圾收集時的停頓時間。适用于應用伺服器、電信領域等。

      典型配置:

      • java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:ParallelGCThreads=20 -XX:+UseConcMarkSweepGC -XX:+UseParNewGC

        -XX:+UseConcMarkSweepGC

        :設定年老代為并發收集。測試中配置這個以後,

        -XX:NewRatio=4的配置失效了,原因不明。是以,此時年輕代大小最好用-Xmn設定。

        -XX:+UseParNewGC

        :

        設定年輕代為并行收集。可與CMS收集同時使用。JDK5.0以上,JVM會根據系統配置自行設定,是以無需再設定此值。

      • java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseConcMarkSweepGC

        -XX:CMSFullGCsBeforeCompaction=5

        -XX:+UseCMSCompactAtFullCollection

        -XX:CMSFullGCsBeforeCompaction:由于并發收集器不對記憶體空間進行壓縮、整理,是以運作一段時間以後會産生“碎片”,使得運作效率降低。此值設定運作多少次GC以後對記憶體空間進行壓縮、整理。

        -XX:+UseCMSCompactAtFullCollection:打開對年老代的壓縮。可能會影響性能,但是可以消除碎片
  3. 輔助資訊

    JVM提供了大量指令行參數,列印資訊,供調試使用。主要有以下一些:

    • -XX:+PrintGC

      輸出形式:[GC 118250K->113543K(130112K), 0.0094143 secs]

                      [Full GC 121376K->10414K(130112K), 0.0650971 secs]

    • -XX:+Printetails

      輸出形式:[GC [DefNew: 8614K->781K(9088K), 0.0123035 secs] 118250K->113543K(130112K), 0.0124633 secs]

                      [GC [DefNew: 8614K->8614K(9088K), 0.0000665 secs][Tenured: 112761K->10414K(121024K), 0.0433488 secs] 121376K->10414K(130112K), 0.0436268 secs]

    • -XX:+PrintGCTimeStamps -XX:+PrintGC:PrintGCTimeStamps可與上面兩個混合使用

      輸出形式:11.851: [GC 98328K->93620K(130112K), 0.0082960 secs]

    • -XX:+PrintGCApplicationConcurrentTime:列印每次垃圾回收前,程式未中斷的執行時間。可與上面混合使用

      輸出形式:Application time: 0.5291524 seconds

    • -XX:+PrintGCApplicationStoppedTime:列印垃圾回收期間程式暫停的時間。可與上面混合使用

      輸出形式:Total time for which application threads were stopped: 0.0468229 seconds

    • -XX:PrintHeapAtGC:列印GC前後的詳細堆棧資訊

      輸出形式:

      34.702: [GC {Heap before gc invocations=7:

       def new generation   total 55296K, used 52568K [0x1ebd0000, 0x227d0000, 0x227d0000)

      eden space 49152K,  99% used [0x1ebd0000, 0x21bce430, 0x21bd0000)

      from space 6144K,  55% used [0x221d0000, 0x22527e10, 0x227d0000)

        to   space 6144K,   0% used [0x21bd0000, 0x21bd0000, 0x221d0000)

       tenured generation   total 69632K, used 2696K [0x227d0000, 0x26bd0000, 0x26bd0000)

      the space 69632K,   3% used [0x227d0000, 0x22a720f8, 0x22a72200, 0x26bd0000)

       compacting perm gen  total 8192K, used 2898K [0x26bd0000, 0x273d0000, 0x2abd0000)

         the space 8192K,  35% used [0x26bd0000, 0x26ea4ba8, 0x26ea4c00, 0x273d0000)

          ro space 8192K,  66% used [0x2abd0000, 0x2b12bcc0, 0x2b12be00, 0x2b3d0000)

          rw space 12288K,  46% used [0x2b3d0000, 0x2b972060, 0x2b972200, 0x2bfd0000)

      34.735: [DefNew: 52568K->3433K(55296K), 0.0072126 secs] 55264K->6615K(124928K)Heap after gc invocations=8:

       def new generation   total 55296K, used 3433K [0x1ebd0000, 0x227d0000, 0x227d0000)

      eden space 49152K,   0% used [0x1ebd0000, 0x1ebd0000, 0x21bd0000)

        from space 6144K,  55% used [0x21bd0000, 0x21f2a5e8, 0x221d0000)

        to   space 6144K,   0% used [0x221d0000, 0x221d0000, 0x227d0000)

       tenured generation   total 69632K, used 3182K [0x227d0000, 0x26bd0000, 0x26bd0000)

      the space 69632K,   4% used [0x227d0000, 0x22aeb958, 0x22aeba00, 0x26bd0000)

       compacting perm gen  total 8192K, used 2898K [0x26bd0000, 0x273d0000, 0x2abd0000)

         the space 8192K,  35% used [0x26bd0000, 0x26ea4ba8, 0x26ea4c00, 0x273d0000)

          ro space 8192K,  66% used [0x2abd0000, 0x2b12bcc0, 0x2b12be00, 0x2b3d0000)

          rw space 12288K,  46% used [0x2b3d0000, 0x2b972060, 0x2b972200, 0x2bfd0000)

      }

      , 0.0757599 secs]

    • -Xloggc:filename:與上面幾個配合使用,把相關日志資訊記錄到檔案以便分析。
  4. 常見配置彙總
    1. 堆設定
      • -Xms:初始堆大小
      • -Xmx:最大堆大小
      • -XX:NewSize=n:設定年輕代大小
      • -XX:NewRatio=n:設定年輕代和年老代的比值。如:為3,表示年輕代與年老代比值為1:3,年輕代占整個年輕代年老代和的1/4
      • -XX:SurvivorRatio=n:年輕代中Eden區與兩個Survivor區的比值。注意Survivor區有兩個。如:3,表示Eden:Survivor=3:2,一個Survivor區占整個年輕代的1/5
      • -XX:MaxPermSize=n:設定持久代大小
    2. 收集器設定
      • -XX:+UseSerialGC:設定串行收集器
      • -XX:+UseParallelGC:設定并行收集器
      • -XX:+UseParalledlOldGC:設定并行年老代收集器
      • -XX:+UseConcMarkSweepGC:設定并發收集器
    3. 垃圾回收統計資訊
      • -XX:+PrintGC
      • -XX:+Printetails
      • -XX:+PrintGCTimeStamps
      • -Xloggc:filename
    4. 并行收集器設定
      • -XX:ParallelGCThreads=n:設定并行收集器收集時使用的CPU數。并行收集線程數。
      • -XX:MaxGCPauseMillis=n:設定并行收集最大暫停時間
      • -XX:GCTimeRatio=n:設定垃圾回收時間占程式運作時間的百分比。公式為1/(1+n)
    5. 并發收集器設定
      • -XX:+CMSIncrementalMode:設定為增量模式。适用于單CPU情況。
      • -XX:ParallelGCThreads=n:設定并發收集器年輕代收集方式為并行收集時,使用的CPU數。并行收集線程數。

四、調優總結

  1. 年輕代大小選擇
    • 響應時間優先的應用:盡可能設大,直到接近系統的最低響應時間限制(根據實際情況選擇)。在此種情況下,年輕代收集發生的頻率也是最小的。同時,減少到達年老代的對象。
    • 吞吐量優先的應用:盡可能的設定大,可能到達Gbit的程度。因為對響應時間沒有要求,垃圾收集可以并行進行,一般适合8CPU以上的應用。
  2. 年老代大小選擇
    • 響應時間優先的應用:年老代使用并發收集器,是以其大小需要小心設定,一般要考慮并發會話率和會話持續時間等一些參數。如果堆設定小了,可以會造成記憶體碎片、高回收頻率以及應用暫停而使用傳統的标記清除方式;如果堆大了,則需要較長的收集時間。最優化的方案,一般需要參考以下資料獲得:
      • 并發垃圾收集資訊
      • 持久代并發收集次數
      • 傳統GC資訊
      • 花在年輕代和年老代回收上的時間比例
      減少年輕代和年老代花費的時間,一般會提高應用的效率
    • 吞吐量優先的應用:一般吞吐量優先的應用都有一個很大的年輕代和一個較小的年老代。原因是,這樣可以盡可能回收掉大部分短期對象,減少中期的對象,而年老代盡存放長期存活對象。
  3. 較小堆引起的碎片問題

    因為年老代的并發收集器使用标記、清除算法,是以不會對堆進行壓縮。當收集器回收時,他會把相鄰的空間進行合并,這樣可以配置設定給較大的對象。但是,當堆空間較小時,運作一段時間以後,就會出現“碎片”,如果并發收集器找不到足夠的空間,那麼并發收集器将會停止,然後使用傳統的标記、清除方式進行回收。如果出現“碎片”,可能需要進行如下配置:

    • -XX:+UseCMSCompactAtFullCollection:使用并發收集器時,開啟對年老代的壓縮。
    • -XX:CMSFullGCsBeforeCompaction=0:上面配置開啟的情況下,這裡設定多少次Full GC後,對年老代進行壓縮

五、參考文獻

  • Java 理論與實踐: 垃圾收集簡史
  • Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning
  • Improving Java Application Performance and Scalability by Reducing Garbage Collection Times and Sizing Memory Using JDK 1.4.1
  • Hotspot memory management whitepaper
  • Java Tuning White Paper
  • Diagnosing a Garbage Collection problem
  • Java HotSpot VM Options
  • A Collection of JVM Options
  • Frequently Asked Questions about Garbage Collection in the HotspotTM JavaTM Virtual Machine
上一篇: SWOT分析法

繼續閱讀