本系列的最後一部分是有關垃圾收集(GC)日志的JVM參數。GC日志是一個很重要的工具,它準确記錄了每一次的GC的執行時間和執行結果,通過分析GC日志可以優化堆設定和GC設定,或者改進應用程式的對象配置設定模式。
-XX:+PrintGC
參數-XX:+PrintGC(或者-verbose:gc)開啟了簡單GC日志模式,為每一次新生代(young generation)的GC和每一次的Full GC列印一行資訊。下面舉例說明:
| |
| |
每行開始首先是GC的類型(可以是“GC”或者“Full GC”),然後是在GC之前和GC之後已使用的堆空間,再然後是目前的堆容量,最後是GC持續的時間(以秒計)。
第一行的意思就是GC将已使用的堆空間從246656K減少到243120K,目前的堆容量(譯者注:GC發生時)是376320K,GC持續的時間是0.0929090秒。
簡單模式的GC日志格式是與GC算法無關的,日志也沒有提供太多的資訊。在上面的例子中,我們甚至無法從日志中判斷是否GC将一些對象從young generation移到了old generation。是以詳細模式的GC日志更有用一些。
-XX:PrintGCDetails
如果不是使用-XX:+PrintGC,而是-XX:PrintGCDetails,就開啟了詳細GC日志模式。在這種模式下,日志格式和所使用的GC算法有關。我們首先看一下使用Throughput垃圾收集器在young generation中生成的日志。為了便于閱讀這裡将一行日志分為多行并使用縮進。
| |
| |
| |
| |
我們可以很容易發現:這是一次在young generation中的GC,它将已使用的堆空間從246648K減少到了243136K,用時0.0935090秒。此外我們還可以得到更多的資訊:所使用的垃圾收集器(即PSYoungGen)、young generation的大小和使用情況(在這個例子中“PSYoungGen”垃圾收集器将young generation所使用的堆空間從142816K減少到10752K)。
既然我們已經知道了young generation的大小,是以很容易判定發生了GC,因為young generation無法配置設定更多的對象空間:已經使用了142848K中的142816K。我們可以進一步得出結論,多數從young generation移除的對象仍然在堆空間中,隻是被移到了old generation:通過對比綠色的和藍色的部分可以發現即使young generation幾乎被完全清空(從142816K減少到10752K),但是所占用的堆空間仍然基本相同(從246648K到243136K)。
詳細日志的“Times”部分包含了GC所使用的CPU時間資訊,分别為作業系統的使用者空間和系統空間所使用的時間。同時,它顯示了GC運作的“真實”時間(0.09秒是0.0929090秒的近似值)。如果CPU時間(譯者注:0.55秒+0.10秒)明顯多于”真實“時間(譯者注:0.09秒),我們可以得出結論:GC使用了多線程運作。這樣的話CPU時間就是所有GC線程所花費的CPU時間的總和。實際上我們的例子中的垃圾收集器使用了8個線程。
接下來看一下Full GC的輸出日志
| |
| |
| |
| |
| |
除了關于young generation的詳細資訊,日志也提供了old generation和permanent generation的詳細資訊。對于這三個generations,一樣也可以看到所使用的垃圾收集器、堆空間的大小、GC前後的堆使用情況。需要注意的是顯示堆空間的大小等于young generation和old generation各自堆空間的和。以上面為例,堆空間總共占用了241951K,其中9707K在young generation,232244K在old generation。Full GC持續了大約1.53秒,使用者空間的CPU執行時間為10.96秒,說明GC使用了多線程(和之前一樣8個線程)。
對不同generation詳細的日志可以讓我們分析GC的原因,如果某個generation的日志顯示在GC之前,堆空間幾乎被占滿,那麼很有可能就是這個generation觸發了GC。但是在上面的例子中,三個generation中的任何一個都不是這樣的,在這種情況下是什麼原因觸發了GC呢。對于Throughput垃圾收集器,在某一個generation被過度使用之前,GC ergonomics(參考本系列第6節)決定要啟動GC。
Full GC也可以通過顯式的請求而觸發,可以是通過應用程式,或者是一個外部的JVM接口。這樣觸發的GC可以很容易在日志裡分辨出來,因為輸出的日志是以“Full GC(System)”開頭的,而不是“Full GC”。
對于Serial垃圾收集器,詳細的GC日志和Throughput垃圾收集器是非常相似的。唯一的差別是不同的generation日志可能使用了不同的GC算法(例如:old generation的日志可能以Tenured開頭,而不是ParOldGen)。使用垃圾收集器作為一行日志的開頭可以友善我們從日志就判斷出JVM的GC設定。
對于CMS垃圾收集器,young generation的詳細日志也和Throughput垃圾收集器非常相似,但是old generation的日志卻不是這樣。對于CMS垃圾收集器,在old generation中的GC是在不同的時間片内與應用程式同時運作的。GC日志自然也和Full GC的日志不同。而且在不同時間片的日志夾雜着在此期間young generation的GC日志。但是了解了上面介紹的GC日志的基本元素,也不難了解在不同時間片内的日志。隻是在解釋GC運作時間時要特别注意,由于大多數時間片内的GC都是和應用程式同時運作的,是以和那種獨占式的GC相比,GC的持續時間更長一些并不說明一定有問題。
正如我們在第7節中所了解的,即使CMS垃圾收集器沒有完成一個CMS周期,Full GC也可能會發生。如果發生了GC,在日志中會包含觸發Full GC的原因,例如衆所周知的”concurrent mode failure“。
為了避免過于冗長,我這裡就不詳細說明CMS垃圾收集器的日志了。另外,CMS垃圾收集器的作者做了詳細的說明(在這裡),強烈建議閱讀。
-XX:+PrintGCTimeStamps和-XX:+PrintGCDateStamps
使用-XX:+PrintGCTimeStamps可以将時間和日期也加到GC日志中。表示自JVM啟動至今的時間戳會被添加到每一行中。例子如下:
| |
| |
| |
如果指定了-XX:+PrintGCDateStamps,每一行就添加上了絕對的日期和時間。
| |
| |
| |
如果需要也可以同時使用兩個參數。推薦同時使用這兩個參數,因為這樣在關聯不同來源的GC日志時很有幫助。
-Xloggc
預設的GC日志時輸出到終端的,使用-Xloggc:也可以輸出到指定的檔案。需要注意這個參數隐式的設定了參數-XX:+PrintGC和-XX:+PrintGCTimeStamps,但為了以防在新版本的JVM中有任何變化,我仍建議顯示的設定這些參數。
可管理的JVM參數
一個常常被讨論的問題是在生産環境中GC日志是否應該開啟。因為它所産生的開銷通常都非常有限,是以我的答案是需要開啟。但并不一定在啟動JVM時就必須指定GC日志參數。
HotSpot JVM有一類特别的參數叫做可管理的參數。對于這些參數,可以在運作時修改他們的值。我們這裡所讨論的所有參數以及以“PrintGC”開頭的參數都是可管理的參數。這樣在任何時候我們都可以開啟或是關閉GC日志。比如我們可以使用JDK自帶的jinfo工具來設定這些參數,或者是通過JMX用戶端調用
HotSpotDiagnostic MXBean的
setVMOption方法來設定這些參數。