天天看點

jvm出現OutOfMemoryError時處理方法/jvm原理和優化參考

The heap  stores all of the objects created by your java program.The heap's contents is monitored by the garbage collector,which frees memory from the heap when you stop using an object.

This is in contrast with the  stack , which stores primitive types like ints and chars, and are typically local variables and function return values. Thess are not garbage collected.

Class在被 Load的時候被放入PermGen space區域,Instance存放在Heap區域

Java中關于OOM的場景及解決方法

1、OOM for Heap=>例如:java.lang.OutOfMemoryError: Java heap space

分  析

此OOM是由于JVM中heap的最大值不滿足需要,将設定heap的最大值調高即可,參數樣例為:-Xmx2G

解決方法

調高heap的最大值,即-Xmx的值調大。

2、OOM for Perm=>例如:java.lang.OutOfMemoryError: Java perm space

分  析

此OOM是由于JVM中perm的最大值不滿足需要,将設定perm的最大值調高即可,參數樣例為:-XX:MaxPermSize=512M

解決方法

調高heap的最大值,即-XX:MaxPermSize的值調大。

另外,注意一點,Perm一般是在JVM啟動時加載類進來,如果是JVM運作較長一段時間而不是剛啟動後溢出的話,很有可能是由于運作時有類被動态加載進來,此時建議用CMS政策中的類解除安裝配置。

如:-XX:+UseConcMarkSweepGC -XX:+CMSClassUnloadingEnabled

3、OOM for GC=>例如:java.lang.OutOfMemoryError: GC overhead limit exceeded

分  析

此OOM是由于JVM在GC時,對象過多,導緻記憶體溢出,建議調整GC的政策,在一定比例下開始GC而不要使用預設的政策,或者将新代和老代設定合适的大小,需要進行微調存活率。

解決方法

改變GC政策,在老代80%時就是開始GC,并且将-XX:SurvivorRatio(-XX:SurvivorRatio=8)和-XX:NewRatio(-XX:NewRatio=4)設定的更合理

jvm原理和優化參考:

JVM工作原理和特點主要是指作業系統裝入JVM是通過jdk中Java.exe來完成,通過下面4步來完成JVM環境.

1.建立JVM裝載環境和配置

2.裝載JVM.dll

3.初始化JVM.dll并挂界到JNIENV(JNI調用接口)執行個體

4.調用JNIEnv執行個體裝載并處理class類。

在我們運作和調試Java程式的時候,經常會提到一個JVM的概念.JVM是Java程式運作的環境,但是他同時一個作業系統的一個應用程式一個程序,是以他也有他自己的運作的生命周期,也有自己的代碼和資料空間.

首先來說一下JVM工作原理中的jdk這個東西,不管你是初學者還是高手,是j2ee程式員還是j2se程式員,jdk總是在幫我們做一些事情.我們在了解Java之前首先大師們會給我們提供說jdk這個東西.它在Java整個體系中充當着什麼角色呢?我很驚歎sun大師們設計天才,能把一個如此完整的體系結構化的如此完美.jdk在這個體系中充當一個生産加工中心,産生所有的資料輸出,是所有指令和戰略的執行中心.本身它提供了Java的完整方案,可以開發目前Java能支援的所有應用和系統程式.這裡說一個問題,大家會問,那為什麼還有j2me,j2ee這些東西,這兩個東西目的很簡單,分别用來簡化各自領域内的開發和建構過程.jdk除了JVM之外,還有一些核心的API,內建API,使用者工具,開發技術,開發工具和API等組成

好了,廢話說了那麼多,來點于主題相關的東西吧.JVM在整個jdk中處于最底層,負責于作業系統的互動,用來屏蔽作業系統環境,提供一個完整的Java運作環境,是以也就虛拟計算機. 作業系統裝入JVM是通過jdk中Java.exe來完成,通過下面4步來完成JVM環境.

1.建立JVM裝載環境和配置

2.裝載JVM.dll

3.初始化JVM.dll并挂界到JNIENV(JNI調用接口)執行個體

4.調用JNIEnv執行個體裝載并處理class類。

一.JVM裝入環境,JVM提供的方式是作業系統的動态連接配接檔案.既然是檔案那就一個裝入路徑的問題,Java是怎麼找這個路徑的呢?當你在調用Java test的時候,作業系統會在path下在你的Java.exe程式,Java.exe就通過下面一個過程來确定JVM的路徑和相關的參數配置了.下面基于Windows的實作的分析.

首先查找jre路徑,Java是通過GetApplicationHome api來獲得目前的Java.exe絕對路徑,c:\j2sdk1.4.2_09\bin\Java.exe,那麼它會截取到絕對路徑c:\j2sdk1.4.2_09\,判斷c:\j2sdk1.4.2_09\bin\Java.dll檔案是否存在,如果存在就把c:\j2sdk1.4.2_09\作為jre路徑,如果不存在則判斷c:\j2sdk1.4.2_09\jre\bin\Java.dll是否存在,如果存在這c:\j2sdk1.4.2_09\jre作為jre路徑.如果不存在調用GetPublicJREHome查HKEY_LOCAL_MACHINE\Software\JavaSoft\Java Runtime Environment\“目前JRE版本号”\JavaHome的路徑為jre路徑。

然後裝載JVM.cfg檔案JRE路徑+\lib+\ARCH(CPU構架)+\JVM.cfgARCH(CPU構架)的判斷是通過Java_md.c中GetArch函數判斷的,該函數中windows平台隻有兩種情況:WIN64的‘ia64’,其他情況都為‘i386’。以我的為例:C:\j2sdk1.4.2_09\jre\lib\i386\JVM.cfg.主要的内容如下:

  1. -client KNOWN   
  2. -server KNOWN   
  3. -hotspot ALIASED_TO -client   
  4. -classic WARN   
  5. -native ERROR   
  6. -green ERROR  

在我們的jdk目錄中jre\bin\server和jre\bin\client都有JVM.dll檔案存在,而Java正是通過JVM.cfg配置檔案來管理這些不同版本的JVM.dll的.通過檔案我們可以定義目前jdk中支援那些JVM,前面部分(client)是JVM名稱,後面是參數,KNOWN表示JVM存在,ALIASED_TO表示給别的JVM取一個别名,WARN表示不存在時找一個JVM替代,ERROR表示不存在抛出異常.在運作Java XXX是,Java.exe會通過CheckJVMType來檢查目前的JVM類型,Java可以通過兩種參數的方式來指定具體的JVM類型,一種按照JVM.cfg檔案中的JVM名稱指定,第二種方法是直接指定,它們執行的方法分别是“Java -J”、“Java -XXaltJVM=”或“Java -J-XXaltJVM=”。如果是第一種參數傳遞方式,CheckJVMType函數會取參數‘-J’後面的JVM名稱,然後從已知的JVM配置參數中查找如果找到同名的則去掉該JVM名稱前的‘-’直接傳回該值;而第二種方法,會直接傳回“-XXaltJVM=”或“-J-XXaltJVM=”後面的JVM類型名稱;如果在運作Java時未指定上面兩種方法中的任一一種參數,CheckJVMType會取配置檔案中第一個配置中的JVM名稱,去掉名稱前面的‘-’傳回該值。CheckJVMType函數的這個傳回值會在下面的函數中彙同jre路徑組合成JVM.dll的絕對路徑。如果沒有指定這會使用JVM.cfg中第一個定義的JVM.可以通過set _Java_LAUNCHER_DEBUG=1在控制台上測試.

最後獲得JVM.dll的路徑,JRE路徑+\bin+\JVM類型字元串+\JVM.dll就是JVM的檔案路徑了,但是如果在調用Java程式時用-XXaltJVM=參數指定的路徑path,就直接用path+\JVM.dll檔案做為JVM.dll的檔案路徑.

二:裝載JVM.dll

通過第一步已經找到了JVM的路徑,Java通過LoadJavaVM來裝入JVM.dll檔案.裝入工作很簡單就是調用Windows API函數:

LoadLibrary裝載JVM.dll動态連接配接庫.然後把JVM.dll中的導出函數JNI_CreateJavaVM和JNI_GetDefaultJavaVMInitArgs挂接到InvocationFunctions變量的CreateJavaVM和GetDefaultJavaVMInitArgs函數指針變量上。JVM.dll的裝載工作宣告完成。

三:初始化JVM,獲得本地調用接口,這樣就可以在Java中調用JVM的函數了.調用InvocationFunctions->CreateJavaVM也就是JVM中JNI_CreateJavaVM方法獲得JNIEnv結構的執行個體.

四:運作Java程式.

Java程式有兩種方式一種是jar包,一種是class. 運作jar,Java -jar XXX.jar運作的時候,Java.exe調用GetMainClassName函數,該函數先獲得JNIEnv執行個體然後調用Java類Java.util.jar.JarFileJNIEnv中方法getManifest()并從傳回的Manifest對象中取getAttributes("Main-Class")的值即jar包中檔案:META-INF/MANIFEST.MF指定的Main-Class的主類名作為運作的主類。之後main函數會調用Java.c中LoadClass方法裝載該主類(使用JNIEnv執行個體的FindClass)。main函數直接調用Java.c中LoadClass方法裝載該類。如果是執行class方法。main函數直接調用Java.c中LoadClass方法裝載該類。

然後main函數調用JNIEnv執行個體的GetStaticMethodID方法查找裝載的class主類中

“public static void main(String[] args)”方法,并判斷該方法是否為public方法,然後調用JNIEnv執行個體的

CallStaticVoidMethod方法調用該Java類的main方法。 

以下轉自:http://blog.csdn.net/cnhzgb/article/details/7179419

= GC 基礎 =====================

JAVA堆的描述如下:

jvm出現OutOfMemoryError時處理方法/jvm原理和優化參考

記憶體由 Perm 和 Heap 組成. 其中

Heap = {Old + NEW = { Eden , from, to } }

JVM記憶體模型中分兩大塊,一塊是 NEW Generation, 另一塊是Old Generation. 在New Generation中,有一個叫Eden的空間,主要是用來存放新生的對象,還有兩個Survivor Spaces(from,to), 它們用來存放每次垃圾回收後存活下來的對象。在Old Generation中,主要存放應用程式中生命周期長的記憶體對象,還有個Permanent Generation,主要用來放JVM自己的反射對象,比如類對象和方法對象等。

垃圾回收描述:

在New Generation塊中,垃圾回收一般用Copying的算法,速度快。每次GC的時候,存活下來的對象首先由Eden拷貝到某個Survivor Space, 當Survivor Space空間滿了後, 剩下的live對象就被直接拷貝到Old Generation中去。是以,每次GC後,Eden記憶體塊會被清空。在Old Generation塊中,垃圾回收一般用mark-compact的算法,速度慢些,但減少記憶體要求.

垃圾回收分多級,0級為全部(Full)的垃圾回收,會回收OLD段中的垃圾;1級或以上為部分垃圾回收,隻會回收NEW中的垃圾,記憶體溢出通常發生于OLD段或Perm段垃圾回收後,仍然無記憶體空間容納新的Java對象的情況。

當一個URL被通路時,記憶體申請過程如下:

A. JVM會試圖為相關Java對象在Eden中初始化一塊記憶體區域

B. 當Eden空間足夠時,記憶體申請結束。否則到下一步

C. JVM試圖釋放在Eden中所有不活躍的對象(這屬于1或更進階的垃圾回收), 釋放後若Eden空間仍然不足以放入新對象,則試圖将部分Eden中活躍對象放入Survivor區

D. Survivor區被用來作為Eden及OLD的中間交換區域,當OLD區空間足夠時,Survivor區的對象會被移到Old區,否則會被保留在Survivor區

E. 當OLD區空間不夠時,JVM會在OLD區進行完全的垃圾收集(0級)

F. 完全垃圾收集後,若Survivor及OLD區仍然無法存放從Eden複制過來的部分對象,導緻JVM無法在Eden區為新對象建立記憶體區域,則出現”out of memory錯誤”

JVM調優建議:

ms/mx:定義YOUNG+OLD段的總尺寸,ms為JVM啟動時YOUNG+OLD的記憶體大小;mx為最大可占用的YOUNG+OLD記憶體大小。在使用者生産環境上一般将這兩個值設為相同,以減少運作期間系統在記憶體申請上所花的開銷。

NewSize/MaxNewSize:定義YOUNG段的尺寸,NewSize為JVM啟動時YOUNG的記憶體大小;MaxNewSize為最大可占用的YOUNG記憶體大小。在使用者生産環境上一般将這兩個值設為相同,以減少運作期間系統在記憶體申請上所花的開銷。

PermSize/MaxPermSize:定義Perm段的尺寸,PermSize為JVM啟動時Perm的記憶體大小;MaxPermSize為最大可占用的Perm記憶體大小。在使用者生産環境上一般将這兩個值設為相同,以減少運作期間系統在記憶體申請上所花的開銷。

SurvivorRatio:設定Survivor空間和Eden空間的比例

記憶體溢出的可能性

1. OLD段溢出

這種記憶體溢出是最常見的情況之一,産生的原因可能是:

1) 設定的記憶體參數過小(ms/mx, NewSize/MaxNewSize)

2) 程式問題

單個程式持續進行消耗記憶體的處理,如循環幾千次的字元串處理,對字元串處理應建議使用StringBuffer。此時不會報記憶體溢出錯,卻會使系統持續垃圾收集,無法處理其它請求,相關問題程式可通過Thread Dump擷取(見系統問題診斷一章)單個程式所申請記憶體過大,有的程式會申請幾十乃至幾百兆記憶體,此時JVM也會因無法申請到資源而出現記憶體溢出,對此首先要找到相關功能,然後交予程式員修改,要找到相關程式,必須在Apache日志中尋找。

當Java對象使用完畢後,其所引用的對象卻沒有銷毀,使得JVM認為他還是活躍的對象而不進行回收,這樣累計占用了大量記憶體而無法釋放。由于目前市面上還沒有對系統影響小的記憶體分析工具,故此時隻能和程式員一起定位。

2. Perm段溢出

通常由于Perm段裝載了大量的Servlet類而導緻溢出,目前的解決辦法:

1) 将PermSize擴大,一般256M能夠滿足要求

2) 若别無選擇,則隻能将servlet的路徑加到CLASSPATH中,但一般不建議這麼處理

3. C Heap溢出

系統對C Heap沒有限制,故C Heap發生問題時,Java程序所占記憶體會持續增長,直到占用所有可用系統記憶體

其他:

JVM有2個GC線程。第一個線程負責回收Heap的Young區。第二個線程在Heap不足時,周遊Heap,将Young 區更新為Older區。Older區的大小等于-Xmx減去-Xmn,不能将-Xms的值設的過大,因為第二個線程被迫運作會降低JVM的性能。

為什麼一些程式頻繁發生GC?有如下原因:

l         程式内調用了System.gc()或Runtime.gc()。

l         一些中間件軟體調用自己的GC方法,此時需要設定參數禁止這些GC。

l         Java的Heap太小,一般預設的Heap值都很小。

l         頻繁執行個體化對象,Release對象。此時盡量儲存并重用對象,例如使用StringBuffer()和String()。

如果你發現每次GC後,Heap的剩餘空間會是總空間的50%,這表示你的Heap處于健康狀态。許多Server端的Java程式每次GC後最好能有65%的剩餘空間。

經驗之談:

1.Server端JVM最好将-Xms和-Xmx設為相同值。為了優化GC,最好讓-Xmn值約等于-Xmx的1/3[2]。

2.一個GUI程式最好是每10到20秒間運作一次GC,每次在半秒之内完成[2]。

注意:

1.增加Heap的大小雖然會降低GC的頻率,但也增加了每次GC的時間。并且GC運作時,所有的使用者線程将暫停,也就是GC期間,Java應用程式不做任何工作。

2.Heap大小并不決定程序的記憶體使用量。程序的記憶體使用量要大于-Xmx定義的值,因為Java為其他任務配置設定記憶體,例如每個線程的Stack等。

2.Stack的設定

每個線程都有他自己的Stack。

-Xss 每個線程的 Stack 大小

Stack的大小限制着線程的數量。如果Stack過大就好導緻記憶體溢漏。-Xss參數決定Stack大小,例如-Xss1024K。如果Stack太小,也會導緻Stack溢漏。

3.硬體環境

硬體環境也影響GC的效率,例如機器的種類,記憶體,swap空間,和CPU的數量。

如果你的程式需要頻繁建立很多transient對象,會導緻JVM頻繁GC。這種情況你可以增加機器的記憶體,來減少Swap空間的使用[2]。

4.4種GC

第一種為單線程GC,也是預設的GC。,該GC适用于單CPU機器。

第二種為Throughput GC,是多線程的GC,适用于多CPU,使用大量線程的程式。第二種GC與第一種GC相似,不同在于GC在收集Young區是多線程的,但在Old區和第一種一樣,仍然采用單線程。-XX:+UseParallelGC參數啟動該GC。

第三種為Concurrent Low Pause GC,類似于第一種,适用于多CPU,并要求縮短因GC造成程式停滞的時間。這種GC可以在Old區的回收同時,運作應用程式。-XX:+UseConcMarkSweepGC參數啟動該GC。

第四種為Incremental Low Pause GC,适用于要求縮短因GC造成程式停滞的時間。這種GC可以在Young區回收的同時,回收一部分Old區對象。-Xincgc參數啟動該GC。

按照基本回收政策分

引用計數(Reference Counting):

比較古老的回收算法。原理是此對象有一個引用,即增加一個計數,删除一個引用則減少一個計數。垃圾回收時,隻用收集計數為0的對象。此算法最緻命的是無法處理循環引用的問題。

标記-清除(Mark-Sweep):

jvm出現OutOfMemoryError時處理方法/jvm原理和優化參考

此算法執行分兩階段。第一階段從引用根節點開始标記所有被引用的對象,第二階段周遊整個堆,把未标記的對象清除。此算法需要暫停整個應用,同時,會産生記憶體碎片。

複制(Copying):

jvm出現OutOfMemoryError時處理方法/jvm原理和優化參考

此算法把記憶體空間劃為兩個相等的區域,每次隻使用其中一個區域。垃圾回收時,周遊目前使用區域,把正在使用中的對象複制到另外一個區域中。算法每次隻處理正在使用中的對象,是以複制成本比較小,同時複制過去以後還能進行相應的記憶體整理,不會出現“碎片”問題。當然,此算法的缺點也是很明顯的,就是需要兩倍記憶體空間。

标記-整理(Mark-Compact):

jvm出現OutOfMemoryError時處理方法/jvm原理和優化參考

此算法結合了“标記-清除”和“複制”兩個算法的優點。也是分兩階段,第一階段從根節點開始标記所有被引用對象,第二階段周遊整個堆,把清除未标記對象并且把存活對象“壓縮”到堆的其中一塊,按順序排放。此算法避免了“标記-清除”的碎片問題,同時也避免了“複制”算法的空間問題。

按分區對待的方式分

增量收集(Incremental Collecting):實時垃圾回收算法,即:在應用進行的同時進行垃圾回收。不知道什麼原因JDK5.0中的收集器沒有使用這種算法的。

分代收集(Generational Collecting):基于對對象生命周期分析後得出的垃圾回收算法。把對象分為年青代、年老代、持久代,對不同生命周期的對象使用不同的算法(上述方式中的一個)進行回收。現在的垃圾回收器(從J2SE1.2開始)都是使用此算法的。

按系統線程分

串行收集:串行收集使用單線程處理所有垃圾回收工作,因為無需多線程互動,實作容易,而且效率比較高。但是,其局限性也比較明顯,即無法使用多處理器的優勢,是以此收集适合單處理器機器。當然,此收集器也可以用在小資料量(100M左右)情況下的多處理器機器上。

并行收集:并行收集使用多線程處理垃圾回收工作,因而速度快,效率高。而且理論上CPU數目越多,越能展現出并行收集器的優勢。(串型收集的并發版本,需要暫停jvm) 并行paralise指的是多個任務在多個cpu中一起并行執行,最後将結果合并。效率是N倍。

并發收集:相對于串行收集和并行收集而言,前面兩個在進行垃圾回收工作時,需要暫停整個運作環境,而隻有垃圾回收程式在運作,是以,系統在垃圾回收時會有明顯的暫停,而且暫停時間會因為堆越大而越長。(和并行收集不同,并發隻有在開頭和結尾會暫停jvm)并發concurrent指的是多個任務在一個cpu僞同步執行,但其實是串行排程的,效率并非直接是N倍。

分代垃圾回收

    分代的垃圾回收政策,是基于這樣一個事實:不同的對象的生命周期是不一樣的。是以,不同生命周期的對象可以采取不同的收集方式,以便提高回收效率。

    在Java程式運作的過程中,會産生大量的對象,其中有些對象是與業務資訊相關,比如Http請求中的Session對象、線程、Socket連接配接,這類對象跟業務直接挂鈎,是以生命周期比較長。但是還有一些對象,主要是程式運作過程中生成的臨時變量,這些對象生命周期會比較短,比如:String對象,由于其不變類的特性,系統會産生大量的這些對象,有些對象甚至隻用一次即可回收。

    試想,在不進行對象存活時間區分的情況下,每次垃圾回收都是對整個堆空間進行回收,花費時間相對會長,同時,因為每次回收都需要周遊所有存活對象,但實際上,對于生命周期長的對象而言,這種周遊是沒有效果的,因為可能進行了很多次周遊,但是他們依舊存在。是以,分代垃圾回收采用分治的思想,進行代的劃分,把不同生命周期的對象放在不同代上,不同代上采用最适合它的垃圾回收方式進行回收。

jvm出現OutOfMemoryError時處理方法/jvm原理和優化參考

如圖所示:

    虛拟機中的共劃分為三個代:年輕代(Young Generation)、年老點(Old Generation)和持久代(Permanent Generation)。其中持久代主要存放的是Java類的類資訊,與垃圾收集要收集的Java對象關系不大。年輕代和年老代的劃分是對垃圾收集影響比較大的。

年輕代:

    所有新生成的對象首先都是放在年輕代的。年輕代的目标就是盡可能快速的收集掉那些生命周期短的對象。年輕代分三個區。一個Eden區,兩個Survivor區(一般而言)。大部分對象在Eden區中生成。當Eden區滿時,還存活的對象将被複制到Survivor區(兩個中的一個),當這個Survivor區滿時,此區的存活對象将被複制到另外一個Survivor區,當這個Survivor區也滿了的時候,從第一個Survivor區複制過來的并且此時還存活的對象,将被複制“年老區(Tenured)”。需要注意,Survivor的兩個區是對稱的,沒先後關系,是以同一個區中可能同時存在從Eden複制過來 對象,和從前一個Survivor複制過來的對象,而複制到年老區的隻有從第一個Survivor去過來的對象。而且,Survivor區總有一個是空的。同時,根據程式需要,Survivor區是可以配置為多個的(多于兩個),這樣可以增加對象在年輕代中的存在時間,減少被放到年老代的可能。

年老代:

    在年輕代中經曆了N次垃圾回收後仍然存活的對象,就會被放到年老代中。是以,可以認為年老代中存放的都是一些生命周期較長的對象。

持久代:

    用于存放靜态檔案,如今Java類、方法等。持久代對垃圾回收沒有顯著影響,但是有些應用可能動态生成或者調用一些class,例如Hibernate等,在這種時候需要設定一個比較大的持久代空間來存放這些運作過程中新增的類。持久代大小通過-XX:MaxPermSize=<N>進行設定。

什麼情況下觸發垃圾回收 

由于對象進行了分代處理,是以垃圾回收區域、時間也不一樣。GC有兩種類型:Scavenge GC和Full GC。

Scavenge GC

    一般情況下,當新對象生成,并且在Eden申請空間失敗時,就會觸發Scavenge GC,對Eden區域進行GC,清除非存活對象,并且把尚且存活的對象移動到Survivor區。然後整理Survivor的兩個區。這種方式的GC是對年輕代的Eden區進行,不會影響到年老代。因為大部分對象都是從Eden區開始的,同時Eden區不會配置設定的很大,是以Eden區的GC會頻繁進行。因而,一般在這裡需要使用速度快、效率高的算法,使Eden去能盡快空閑出來。

Full GC

    對整個堆進行整理,包括Young、Tenured和Perm。Full GC因為需要對整個對進行回收,是以比Scavenge GC要慢,是以應該盡可能減少Full GC的次數。在對JVM調優的過程中,很大一部分工作就是對于FullGC的調節。有如下原因可能導緻Full GC:

· 年老代(Tenured)被寫滿

· 持久代(Perm)被寫滿 

· System.gc()被顯示調用 

·上一次GC之後Heap的各域配置設定政策動态變化

jvm出現OutOfMemoryError時處理方法/jvm原理和優化參考
jvm出現OutOfMemoryError時處理方法/jvm原理和優化參考
jvm出現OutOfMemoryError時處理方法/jvm原理和優化參考
jvm出現OutOfMemoryError時處理方法/jvm原理和優化參考

= G1 ===================================

傳說中的G1,傳說中的low-pause垃圾收集。Java SE 6的update14版本中已經包含測試版,可以在啟動時加JVM參數來啟用

-XX:+UnlockExperimentalVMOptions -XX:+UseG1GC

http://www.blogjava.net/BlueDavy/archive/2009/03/11/259230.html

本文摘自《建構高性能的大型分布式Java應用》一書,Garbage First簡稱G1,它的目标是要做到盡量減少GC所導緻的應用暫停的時間,讓應用達到準實時的效果,同時保持JVM堆空間的使用率,将作為CMS的替代者在JDK 7中閃亮登場,其最大的特色在于允許指定在某個時間段内GC所導緻的應用暫停的時間最大為多少,例如在100秒内最多允許GC導緻的應用暫停時間為1秒,這個特性對于準實時響應的系統而言非常的吸引人,這樣就再也不用擔心系統突然會暫停個兩三秒了。

G1要做到這樣的效果,也是有前提的,一方面是硬體環境的要求,必須是多核的CPU以及較大的記憶體(從規範來看,512M以上就滿足條件了),另外一方面是需要接受吞吐量的稍微降低,對于實時性要求高的系統而言,這點應該是可以接受的。

為了能夠達到這樣的效果,G1在原有的各種GC政策上進行了吸收和改進,在G1中可以看到增量收集器和CMS的影子,但它不僅僅是吸收原有GC政策的優點,并在此基礎上做出了很多的改進,簡單來說,G1吸收了增量GC以及CMS的精髓,将整個jvm Heap劃分為多個固定大小的region,掃描時采用Snapshot-at-the-beginning的并發marking算法(具體在後面内容詳細解釋)對整個heap中的region進行mark,回收時根據region中活躍對象的bytes進行排序,首先回收活躍對象bytes小以及回收耗時短(預估出來的時間)的region,回收的方法為将此region中的活躍對象複制到另外的region中,根據指定的GC所能占用的時間來估算能回收多少region,這點和以前版本的Full GC時得處理整個heap非常不同,這樣就做到了能夠盡量短時間的暫停應用,又能回收記憶體,由于這種政策在回收時首先回收的是垃圾對象所占空間最多的region,是以稱為Garbage First。

看完上面對于G1政策的簡短描述,并不能清楚的掌握G1,在繼續詳細看G1的步驟之前,必須先明白G1對于JVM Heap的改造,這些對于習慣了劃分為new generation、old generation的大家來說都有不少的新意。

G1将Heap劃分為多個固定大小的region,這也是G1能夠實作控制GC導緻的應用暫停時間的前提,region之間的對象引用通過remembered set來維護,每個region都有一個remembered set,remembered set中包含了引用目前region中對象的region的對象的pointer,由于同時應用也會造成這些region中對象的引用關系不斷的發生改變,G1采用了Card Table來用于應用通知region修改remembered sets,Card Table由多個512位元組的Card構成,這些Card在Card Table中以1個位元組來辨別,每個應用的線程都有一個關聯的remembered set log,用于緩存和順序化線程運作時造成的對于card的修改,另外,還有一個全局的filled RS buffers,當應用線程執行時修改了card後,如果造成的改變僅為同一region中的對象之間的關聯,則不記錄remembered set log,如造成的改變為跨region中的對象的關聯,則記錄到線程的remembered set log,如線程的remembered set log滿了,則放入全局的filled RS buffers中,線程自身則重新建立一個新的remembered set log,remembered set本身也是一個由一堆cards構成的哈希表。

盡管G1将Heap劃分為了多個region,但其預設采用的仍然是分代的方式,隻是僅簡單的劃分為了年輕代(young)和非年輕代,這也是由于G1仍然堅信大多數新建立的對象都是不需要長的生命周期的,對于應用新建立的對象,G1将其放入辨別為young的region中,對于這些region,并不記錄remembered set logs,掃描時隻需掃描活躍的對象,G1在分代的方式上還可更細的劃分為:fully young或partially young,fully young方式暫停的時候僅處理young regions,partially同樣處理所有的young regions,但它還會根據允許的GC的暫停時間來決定是否要加入其他的非young regions,G1是運作到fully-young方式還是partially young方式,外部是不能決定的,在啟動時,G1采用的為fully-young方式,當G1完成一次Concurrent Marking後,則切換為partially young方式,随後G1跟蹤每次回收的效率,如果回收fully-young中的regions已經可以滿足記憶體需要的話,那麼就切換回fully young方式,但當heap size的大小接近滿的情況下,G1會切換到partially young方式,以保證能提供足夠的記憶體空間給應用使用。

除了分代方式的劃分外,G1還支援另外一種pure G1的方式,也就是不進行代的劃分,pure方式和分代方式的具體不同在下面的具體執行步驟中進行描述。

掌握了這些概念後,繼續來看G1的具體執行步驟:

1.         Initial Marking

G1對于每個region都儲存了兩個辨別用的bitmap,一個為previous marking bitmap,一個為next marking bitmap,bitmap中包含了一個bit的位址資訊來指向對象的起始點。

開始Initial Marking之前,首先并發的清空next marking bitmap,然後停止所有應用線程,并掃描辨別出每個region中root可直接通路到的對象,将region中top的值放入next top at mark start(TAMS)中,之後恢複所有應用線程。

觸發這個步驟執行的條件為:

l  G1定義了一個JVM Heap大小的百分比的閥值,稱為h,另外還有一個H,H的值為(1-h)*Heap Size,目前這個h的值是固定的,後續G1也許會将其改為動态的,根據jvm的運作情況來動态的調整,在分代方式下,G1還定義了一個u以及soft limit,soft limit的值為H-u*Heap Size,當Heap中使用的記憶體超過了soft limit值時,就會在一次clean up執行完畢後在應用允許的GC暫停時間範圍内盡快的執行此步驟;

l  在pure方式下,G1将marking與clean up組成一個環,以便clean up能充分的使用marking的資訊,當clean up開始回收時,首先回收能夠帶來最多記憶體空間的regions,當經過多次的clean up,回收到沒多少空間的regions時,G1重新初始化一個新的marking與clean up構成的環。

2.         Concurrent Marking

按照之前Initial Marking掃描到的對象進行周遊,以識别這些對象的下層對象的活躍狀态,對于在此期間應用線程并發修改的對象的以來關系則記錄到remembered set logs中,新建立的對象則放入比top值更高的位址區間中,這些新建立的對象預設狀态即為活躍的,同時修改top值。

3.         Final Marking Pause

當應用線程的remembered set logs未滿時,是不會放入filled RS buffers中的,在這樣的情況下,這些remebered set logs中記錄的card的修改就會被更新了,是以需要這一步,這一步要做的就是把應用線程中存在的remembered set logs的内容進行處理,并相應的修改remembered sets,這一步需要暫停應用,并行的運作。

4.         Live Data Counting and Cleanup

值得注意的是,在G1中,并不是說Final Marking Pause執行完了,就肯定執行Cleanup這步的,由于這步需要暫停應用,G1為了能夠達到準實時的要求,需要根據使用者指定的最大的GC造成的暫停時間來合理的規劃什麼時候執行Cleanup,另外還有幾種情況也是會觸發這個步驟的執行的:

l  G1采用的是複制方法來進行收集,必須保證每次的”to space”的空間都是夠的,是以G1采取的政策是當已經使用的記憶體空間達到了H時,就執行Cleanup這個步驟;

l  對于full-young和partially-young的分代模式的G1而言,則還有情況會觸發Cleanup的執行,full-young模式下,G1根據應用可接受的暫停時間、回收young regions需要消耗的時間來估算出一個yound regions的數量值,當JVM中配置設定對象的young regions的數量達到此值時,Cleanup就會執行;partially-young模式下,則會盡量頻繁的在應用可接受的暫停時間範圍内執行Cleanup,并最大限度的去執行non-young regions的Cleanup。

這一步中GC線程并行的掃描所有region,計算每個region中低于next TAMS值中marked data的大小,然後根據應用所期望的GC的短延時以及G1對于region回收所需的耗時的預估,排序region,将其中活躍的對象複制到其他region中。

G1為了能夠盡量的做到準實時的響應,例如估算暫停時間的算法、對于經常被引用的對象的特殊處理等,G1為了能夠讓GC既能夠充分的回收記憶體,又能夠盡量少的導緻應用的暫停,可謂費盡心思,從G1的論文中的性能評測來看效果也是不錯的,不過如果G1能允許開發人員在編寫代碼時指定哪些對象是不用mark的就更完美了,這對于有巨大緩存的應用而言,會有很大的幫助,G1将随JDK 6 Update 14 beta釋出。

= CMS ==================================

http://www.iteye.com/topic/1119491

1.總體介紹:

CMS(Concurrent Mark-Sweep)是以犧牲吞吐量為代價來獲得最短回收停頓時間的垃圾回收器。并發意味着除了開頭和結束階段,需要暫停JVM,其它時間gc和應用一起執行。對于要求伺服器響應速度的應用上,這種垃圾回收器非常适合。在啟動JVM參數加上-XX:+UseConcMarkSweepGC ,這個參數表示對于老年代的回收采用CMS。CMS采用的基礎算法是:标記—清除。預設會開啟 -XX :+UseParNewGC,在年輕代使用并行複制收集。

2.CMS過程:

  • 初始标記(STW initial mark)
  • 并發标記(Concurrent marking)
  • 并發預清理(Concurrent precleaning)
  • 重新标記(STW remark)
  • 并發清理(Concurrent sweeping)
  • 并發重置(Concurrent reset)

初始标記 :在這個階段,需要虛拟機停頓正在執行的任務,官方的叫法STW(Stop The Word)。這個過程從垃圾回收的"根對象"開始,隻掃描到能夠和"根對象"直接關聯的對象,并作标記。是以這個過程雖然暫停了整個JVM,但是很快就完成了。

并發标記 :這個階段緊随初始标記階段,在初始标記的基礎上繼續向下追溯标記。并發标記階段,應用程式的線程和并發标記的線程并發執行,是以使用者不會感受到停頓。

并發預清理 :并發預清理階段仍然是并發的。在這個階段,虛拟機查找在執行并發标記階段新進入老年代的對象(可能會有一些對象從新生代晉升到老年代, 或者有一些對象被配置設定到老年代)。通過重新掃描,減少下一個階段"重新标記"的工作,因為下一個階段會Stop The World。

重新标記 :這個階段會暫停虛拟機,收集器線程掃描在CMS堆中剩餘的對象。掃描從"跟對象"開始向下追溯,并處理對象關聯。

并發清理 :清理垃圾對象,這個階段收集器線程和應用程式線程并發執行。

并發重置 :這個階段,重置CMS收集器的資料結構,等待下一次垃圾回收。

CSM執行過程: 

jvm出現OutOfMemoryError時處理方法/jvm原理和優化參考

3.CMS缺點

  • CMS回收器采用的基礎算法是Mark-Sweep。所有CMS不會整理、壓縮堆空間。這樣就會有一個問題:經過CMS收集的堆會産生空間碎片。 CMS不對堆空間整理壓縮節約了垃圾回收的停頓時間,但也帶來的堆空間的浪費。為了解決堆空間浪費問題,CMS回收器不再采用簡單的指針指向一塊可用堆空 間來為下次對象配置設定使用。而是把一些未配置設定的空間彙總成一個清單,當JVM配置設定對象空間的時候,會搜尋這個清單找到足夠大的空間來hold住這個對象。
  • 需要更多的CPU資源。從上面的圖可以看到,為了讓應用程式不停頓,CMS線程和應用程式線程并發執行,這樣就需要有更多的CPU,單純靠線程切 換是不靠譜的。并且,重新标記階段,為空保證STW快速完成,也要用到更多的甚至所有的CPU資源。當然,多核多CPU也是未來的趨勢!
  • CMS的另一個缺點是它需要更大的堆空間。因為CMS标記階段應用程式的線程還是在執行的,那麼就會有堆空間繼續配置設定的情況,為了保證在CMS回 收完堆之前還有空間配置設定給正在運作的應用程式,必須預留一部分空間。也就是說,CMS不會在老年代滿的時候才開始收集。相反,它會嘗試更早的開始收集,已 避免上面提到的情況:在回收完成之前,堆沒有足夠空間配置設定!預設當老年代使用68%的時候,CMS就開始行動了。 – XX:CMSInitiatingOccupancyFraction =n 來設定這個閥值。

總得來說,CMS回收器減少了回收的停頓時間,但是降低了堆空間的使用率。

4.啥時候用CMS

如果你的應用程式對停頓比較敏感,并且在應用程式運作的時候可以提供更大的記憶體和更多的CPU(也就是硬體牛逼),那麼使用CMS來收集會給你帶來好處。還有,如果在JVM中,有相對較多存活時間較長的對象(老年代比較大)會更适合使用CMS。

= 調試工具 ==================================

jmap

jmap -heap pid  (不能觀察G1模式)

using parallel threads in the new generation.

using thread-local object allocation.

Concurrent Mark-Sweep GC

Heap Configuration:

   MinHeapFreeRatio = 40

   MaxHeapFreeRatio = 70

   MaxHeapSize      = 2147483648 (2048.0MB)

   NewSize          = 268435456 (256.0MB)

   MaxNewSize       = 268435456 (256.0MB)

   OldSize          = 805306368 (768.0MB)

   NewRatio         = 7

   SurvivorRatio    = 8

   PermSize         = 134217728 (128.0MB)

   MaxPermSize      = 134217728 (128.0MB)

Heap Usage:

New Generation (Eden + 1 Survivor Space):

   capacity = 241631232 (230.4375MB)

   used     = 145793088 (139.03912353515625MB)

   free     = 95838144 (91.39837646484375MB)

   60.33702133340114% used

Eden Space:

   capacity = 214827008 (204.875MB)

   used     = 132689456 (126.54252624511719MB)

   free     = 82137552 (78.33247375488281MB)

   61.7657236095752% used

From Space:

   capacity = 26804224 (25.5625MB)

   used     = 13103632 (12.496597290039062MB)

   free     = 13700592 (13.065902709960938MB)

   48.886444166411984% used

To Space:

   capacity = 26804224 (25.5625MB)

   used     = 0 (0.0MB)

   free     = 26804224 (25.5625MB)

   0.0% used

concurrent mark-sweep generation: (old區)

   capacity = 1879048192 (1792.0MB)

   used     = 1360638440 (1297.6059341430664MB)

   free     = 518409752 (494.3940658569336MB)

   72.41104543209076% used

Perm Generation:

   capacity = 134217728 (128.0MB)

   used     = 65435064 (62.40373992919922MB)

   free     = 68782664 (65.59626007080078MB)

   48.75292181968689% used

jmap -histo:live pid

num     #instances         #bytes  class name

----------------------------------------------

   1:       3148147      209172848  [B

   2:       2584345      144723320  java.lang.ref.SoftReference

   3:       2578827      123783696  sun.misc.CacheEntry

   4:        781560      112544640  com.sun.net.ssl.internal.ssl.SSLSessionImpl

   5:       1385200       89970592  [C

   6:        783287       87807200  [Ljava.util.Hashtable$Entry;

   7:       1421399       56855960  java.lang.String

   8:            12       56828880  [Lsun.misc.CacheEntry;

   9:       2343358       56240592  com.sun.net.ssl.internal.ssl.SessionId

  10:        783185       50123840  java.util.Hashtable

  11:        783094       50118016  java.lang.ref.Finalizer

  12:        287243       36086720  [Ljava.lang.Object;

  13:        263376       33712128  org.apache.commons.pool.impl.GenericObjectPool

jstat

jstat -gccause 31169 60000 1000

(sweep 1,2) (Eden) (Old) (Perm) (Young GC, GCTime)(Full GC, GCTime)

  S0         S1     E         O         P     YGC     YGCT     FGC    FGCT      GCT             LGCC                 GCC                 

 48.80   0.00  68.94  69.55  48.86  30202  725.319 51835 5083.298 5808.616 unknown GCCause      No GC               

 47.98   0.00  37.47  69.61  48.86  30206  725.385 51835 5083.298 5808.682 unknown GCCause      No GC               

 50.73   0.00  51.72  69.65  48.86  30210  725.459 51835 5083.298 5808.757 unknown GCCause      No GC               

  0.00  50.02  82.67  69.60  48.84  30213  725.508 51836 5091.572 5817.081 unknown GCCause      No GC               

jstat -gcutil $pid

  S0         S1     E         O       P       YGC     YGCT    FGC    FGCT     GCT   

 74.79   0.00  95.15   0.86  37.35      2        0.112     0        0.000      0.112

O = old occupied

YGC = young gc time ( new part )

YGCT = young gc total cost time

FGC = full gc time ( old part )

FGCT = full gc total cost time

GCT = all gc cost time

jvisualvm

window下啟動遠端監控,并在被監控服務端,啟動jstatd服務。

建立安全政策檔案,并命名為jstatd.all.policy

grant codebase "file:${java.home}/../lib/tools.jar" {

    permission java.security.AllPermission;

};

jstatd -J-Djava.security.policy=jstatd.all.policy -p 8080 &

======================== Tunning =================

典型配置:

-server -Xmx2g -Xms2g -Xmn512m -XX:PermSize=128m -Xss256k -XX:+DisableExplicitGC -XX:+UseConcMarkSweepGC -XX:+UseParNewGC -XX:+CMSParallelRemarkEnabled -XX:+UseCMSCompactAtFullCollection -XX:LargePageSizeInBytes=128m -XX:+UseFastAccessorMethods -XX:+UseCMSInitiatingOccupancyOnly -XX:CMSInitiatingOccupancyFraction=70 -Djava.awt.headless=true -Djava.net.preferIPv4Stack=true
      

http://java.sun.com/performance/reference/whitepapers/tuning.html

http://www.oracle.com/technetwork/java/gc-tuning-5-138395.html

+AggressiveOpts 激進優化,預設開啟,使用java新特性優化

1. 預設使用串行收集器, 單個cpu時适用

2. 吞吐收集器(throughput collector):指令行參數:-XX:+UseParallelGC。在新生代使用并行清除收集政策,在舊生代和預設收集器相同。 适用:a、擁有2個以上cpu, b、臨時對象較多的程式 -XX:ParallelGCThreads 并行收集線程數量,最好和cpu數量相當

3. 并發收集器(concurrent low pause collector):指令行參數:-XX:+UseConcMarkSweepGC。在舊生代使用并發收集政策,大部分收集工作都是和應用并發進行的,在進行收集的時候,應用的暫停時間很短。預設配套打開 -XX:+UseParNewGC,會在新生代使用并行複制收集。 适用:a、擁有多個cpu, b、老對象較多的程式

如果使用了UseParNewGC,那麼同時使用CMSParallelRemarkEnabled參數可以降低辨別暫停

-XX:+UseCMSCompactAtFullCollection:打開對年老代的壓縮。可能會影響性能,但是可以消除碎片

-XX:+UseFastAccessorMethods 原始類型的快速優化 -XX:SurvivorRatio 新生區中,eden&survivor的比例,設定為8 -XX:TargetSurvivorRatio 生存區需要做垃圾回收的比例值,預設為50%,設定高些可以更好的利用該區

jvm出現OutOfMemoryError時處理方法/jvm原理和優化參考

各個垃圾收集器之間的差別: http://www.javaperformancetuning.com/news/qotm026.shtml

新生代,單獨區域單獨收集,不會影響老生代,因為區域小,且允許漏收集,采用複制清除的方法,更快。

The (original) copying collector (Enabled by default). When this collector kicks in, all application threads are stopped, and the copying collection proceeds using one thread (which means only one CPU even if on a multi-CPU machine). This is known as a stop-the-world collection, because basically the JVM pauses everything else until the collection is completed.

The parallel copying collector (Enabled using -XX:+UseParNewGC). Like the original copying collector, this is a stop-the-world collector. However this collector parallelizes the copying collection over multiple threads, which is more efficient than the original single-thread copying collector for multi-CPU machines (though not for single-CPU machines). This algorithm potentially speeds up young generation collection by a factor equal to the number of CPUs available, when compared to the original singly-threaded copying collector.

The parallel scavenge collector (Enabled using -XX:UseParallelGC). This is like the previous parallel copying collector, but the algorithm is tuned for gigabyte heaps (over 10GB) on multi-CPU machines. This collection algorithm is designed to maximize throughput while minimizing pauses. It has an optional adaptive tuning policy which will automatically resize heap spaces. If you use this collector, you can only use the the original mark-sweep collector in the old generation (i.e. the newer old generation concurrent collector cannot work with this young generation collector).

UserParallelGC使用了更高效的算法,用于處理大規模記憶體>10G場景,提供了大吞吐量功能。但是,同時在老生代,隻能使用串行的标記清除方法。

老生代,必須做fullgc,必須從root開始全面辨別收集。

  • The (original) mark-sweep collector (Enabled by default). This uses a stop-the-world mark-and-sweep collection algorithm. The collector is single-threaded, the entire JVM is paused and the collector uses only one CPU until completed.
  • The concurrent collector (Enabled using -XX:+UseConcMarkSweepGC). This collector tries to allow application processing to continue as much as possible during the collection. Splitting the collection into six phases described shortly, four are concurrent while two are stop-the-world:

    1. the initial-mark phase (stop-the-world, snapshot the old generation so that we can run most of the rest of the collection concurrent to the application threads);

    2. the mark phase (concurrent, mark the live objects traversing the object graph from the roots);

    3. the pre-cleaning phase (concurrent);

    4. the re-mark phase (stop-the-world, another snapshot to capture any changes to live objects since the collection started);

    5. the sweep phase (concurrent, recycles memory by clearing unreferenced objects);

    6. the reset phase (concurrent).

    If "the rate of creation" of objects is too high, and the concurrent collector is not able to keep up with the concurrent collection, it falls back to the traditional mark-sweep collector.

  • The incremental collector (Enabled using -Xincgc). The incremental collector uses a "train" algorithm to collect small portions of the old generation at a time. This collector has higher overheads than the mark-sweep collector, but because small numbers of objects are collected each time, the (stop-the-world) garbage collection pause is minimized at the cost of total garbage collection taking longer. The "train" algorithm does not guarantee a maximum pause time, but pause times are typically less than ten milliseconds.

繼續閱讀