業界有很多強大的java profile的工具,比如Jporfiler,yourkit,這些收費的東西我就不想說了,想說的是,其實java自己就提供了很多記憶體監控的小工具,下面列舉的工具隻是一小部分,仔細研究下jdk的工具,還是蠻有意思的呢:)
1:gc日志輸出
在jvm啟動參數中加入 -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimestamps -XX:+PrintGCApplicationStopedTime,jvm将會按照這些參數順序輸出gc概要資訊,詳細資訊,gc時間資訊,gc造成的應用暫停時間。如果在剛才的參數後面加入參數 -Xloggc:檔案路徑,gc資訊将會輸出到指定的檔案中。其他參數還有
-verbose:gc和-XX:+PrintTenuringDistribution等。
2:jconsole
jconsole是jdk自帶的一個記憶體分析工具,它提供了圖形界面。可以檢視到被監控的jvm的記憶體資訊,線程資訊,類加載資訊,MBean資訊。
jconsole位于jdk目錄下的bin目錄,在windows下是jconsole.exe,在unix和linux下是jconsole.sh,jconsole可以監控本地應用,也可以監控遠端應用。 要監控本地應用,執行jconsole pid,pid就是運作的java程序id,如果不帶上pid參數,則執行jconsole指令後,會看到一個對話框彈出,上面列出了本地的java程序,可以選擇一個進行監控。如果要遠端監控,則要在遠端伺服器的jvm參數裡加入一些東西,因為jconsole的遠端監控基于jmx的,關于jconsole詳細用法,請見專門介紹jconsle的文章,我也會在部落格裡專門詳細介紹jconsole。
3:jviusalvm
在JDK6 update 7之後,jdk推出了另外一個工具:jvisualvm,java可視化虛拟機,它不但提供了jconsole類似的功能,還提供了jvm記憶體和cpu實時診斷,還有手動dump出jvm記憶體情況,手動執行gc。
和jconsole一樣,運作jviusalvm,在jdk的bin目錄下執行jviusalvm,windows下是jviusalvm.exe,linux和unix下是jviusalvm.sh。
4:jmap
jmap是jdk自帶的jvm記憶體分析的工具,位于jdk的bin目錄。jdk1.6中jmap指令用法:
Usage:
jmap -histo
(to connect to running process and print histogram of java object heap
jmap -dump:
(to connect to running process and dump java heap)
dump-options:
format=b binary default
file= dump heap to
Example: jmap -dump:format=b,file=heap.bin
jmap -histo 在螢幕上顯示出指定pid的jvm記憶體狀況。以我本機為例,執行該指令,螢幕顯示:
num #instances #bytes class name
----------------------------------------------
1: 24206 2791864
2: 22371 2145216 [C
3: 24206 1940648
4: 1951 1364496
5: 26543 1282560
6: 6377 1081744 [B
7: 1793 909688
8: 1471 614624
9: 14581 548336 [Ljava.lang.Object;
10: 3863 513640 [I
11: 20677 496248 java.lang.String
12: 3621 312776 [Ljava.util.HashMap$Entry;
13: 3335 266800 java.lang.reflect.Method
14: 8256 264192 java.io.ObjectStreamClass$WeakClassKey
15: 7066 226112 java.util.TreeMap$Entry
16: 2355 173304 [S
17: 1687 161952 java.lang.Class
18: 2769 150112 [[I
19: 3563 142520 java.util.HashMap
20: 5562 133488 java.util.HashMap$Entry
Total 239019 17140408
為了友善檢視,我删掉了一些行。從上面的資訊很容易看出,#instance指的是對象數量,#bytes指的是這些對象占用的記憶體大小,class name指的是對象類型。
再看jmap的dump選項,這個選項是将jvm的堆中記憶體資訊輸出到一個檔案中,在我本機執行
jmap -dump:file=c:\dump.txt 340
注意340是我本機的java程序pid,dump出來的檔案比較大有10幾M,而且我隻是開了tomcat,跑了一個很簡單的應用,且沒有任何通路,可以想象,大型繁忙的伺服器上,dump出來的檔案該有多大。需要知道的是,dump出來的檔案資訊是很原始的,絕不适合人直接觀看,而jmap -histo顯示的内容又太簡單,例如隻顯示某些類型的對象占用多大記憶體,以及這些對象的數量,但是沒有更詳細的資訊,例如這些對象分别是由誰建立的。那這麼說,dump出來的檔案有什麼用呢?當然有用,因為有專門分析jvm的記憶體dump檔案的工具。
5:jhat
上面說了,有很多工具都能分析jvm的記憶體dump檔案,jhat就是sun jdk6及以上版本自帶的工具,位于jdk的bin目錄,執行 jhat -J -Xmx512m [file] ,file就是dump檔案路徑。jhat内置一個簡單的web伺服器,此指令執行後,jhat在指令行裡顯示分析結果的通路位址,可以用-port選項指定端口,具體用法可以執行jhat -heap檢視幫助資訊。通路指定位址後,就能看到頁面上顯示的資訊,比jmap -histo指令顯示的豐富得多,更為詳細。
6:eclipse記憶體分析器
上面說了jhat,它能分析jvm的dump檔案,但是全部是文字顯示,eclipse memory analyzer,是一個eclipse提供用于分析jvm 堆dump的插件,網址為 http://www.eclipse.org/mat ,它的分析速度比jhat快,分析結果是圖形界面顯示,比jhat的可讀性更高。其實jvisualvm也可以分析dump檔案,也是有圖形界面顯示的。
7:jstat
如果說jmap傾向于分析jvm記憶體中對象資訊的話,那麼jsta就是傾向于分析jvm記憶體的gc情況。都是jvm記憶體分析工具,但顯然,它們是從不同次元來分析的。jsat常用的參數有很多,如 -gc,-gcutil,-gccause,這些選項具體作用可檢視jsat幫助資訊,我經常用-gcutil,這個參數的作用不斷的顯示目前指定的jvm記憶體的垃圾收集的資訊。
我在本機執行 jstat -gcutil 340 10000,這個指令是每個10秒鐘輸出一次jvm的gc資訊,10000指的是間隔時間為10000毫秒。螢幕上顯示如下資訊(我隻取了第一行,因為是按的一定頻率顯示,是以實際執行的時候,會有很多行):
S0 S1 E O P YGC YGCT FGC FGCT GCT
54.62 0.00 42.87 43.52 86.24 1792 5.093 33 7.670 12.763
額……怎麼說呢,要看懂這些資訊代表什麼意思,還必須對jvm的gc機制有一定的了解才行啊。其實如果對sun的 hot spot jvm的gc比較了解的人,應該很容易看懂這些資訊,但是不清楚gc機制的人,有點莫名其妙,是以在這裡我還是先講講sun的jvm的gc機制吧。說到gc,其實不僅僅隻是java的概念,其實在java之前,就有很多語言有gc的概念了,gc嘛就是垃圾收集的意思,更多的是一種算法性的東西,而跟具體語言沒太大關系,是以關于gc的曆史,gc的主流算法我就不講了,那扯得太遠了,扯得太遠了就是扯淡。sun現在的jvm,記憶體的管理模型是分代模型,是以gc當然是分代收集了。分代是什麼意思呢?就是将對象按照生命周期分成三個層次,分别是:新生代,舊生代,持久代。對象剛開始配置設定的時候,大部分都在新生代,當新生代gc送出被觸發後了,執行一次新生代範圍内的gc,這叫minor gc,如果執行了幾次minor gc後,還有對象存活,将這些對象轉入舊生代,因為這些對象已經經過了組織的重重考驗了哇。舊生代的gc頻率會更低一些,如果舊生代執行了gc,那就是full gc,因為不是局部gc,而是全記憶體範圍的gc,這會造成應用停頓,因為全記憶體收集,必須封鎖記憶體,不許有新的對象配置設定到記憶體,持久代就是一些jvm期間,基本不會消失的對象,例如class的定義,jvm方法區資訊,例如靜态塊。需要主要的是,新生代裡又分了三個空間:eden,susvivor0,susvivor1,按字面上來了解,就是伊甸園區,幸存1區,幸存2區。新對象配置設定在eden區中,eden區滿時,采用标記-複制算法,即檢查出eden區存活 的對象,并将這些對象複制到是s0或s1中,然後清空eden區。jvm的gc說開來,不隻是這麼簡單,例如還有串行收集,并行收集,并發收集,還有着名的火車算法,不過那說得太遠了,現在對這個有大緻了解就好。說到這裡,再來看一下上面輸出的資訊:
S0:新生代的susvivor0區,空間使用率為5462%
S1:新生代的susvivor1區,空間使用率為0.00%(因為還沒有執行第二次minor收集)
E:eden區,空間使用率42.87%
O:舊生代,空間使用率43.52%
P:持久帶,空間使用率86.24%
YGC:minor gc執行次數1792次
YGCT:minor gc耗費的時間5.093毫秒
FGC:full gc執行次數33
FGCT:full gc耗費的時間7.670毫秒
GCT:gc耗費的總時間12.763毫秒
怎樣選擇工具
上面列舉的一些工具,各有利弊,其實如果在開發環境,使用什麼樣的工具是無所謂的,隻要能得到結果就好。但是在生産環境裡,卻不能亂選擇,因為這些工具本身就會耗費大量的系統資源,如果在一個生産伺服器壓力很大的時候,貿然執行這些工具,可能會造成很意外的情況。最好不要在伺服器本機監控,遠端監控會比較好一些,但是如果要遠端監控,伺服器端的啟動腳本要加入一些jvm參數,例如用jconsloe遠端監控tomcat或jboss等,都需要設定jvm的jmx參數,如果僅僅隻是分析伺服器的記憶體配置設定和gc資訊,強烈推薦,先用jmap導出伺服器端的jvm的堆dump檔案,然後再用jhat,或者jvisualvm,或者eclipse記憶體分析器來分析記憶體狀況。