天天看點

Java記憶體檢視與分析

業界有很多強大的java profile的工具,比如Jporfiler,yourkit,這些收費的東西我就不想說了,想說的是,其實java自己就提供了很多記憶體監控的小工具,下面列舉的工具隻是一小部分,仔細研究下jdk的工具,還是蠻有意思的呢:)

  1:gc日志輸出

  在jvm啟動參數中加入 -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimestamps -XX:+PrintGCApplicationStopedTime,jvm将會按照這些參數順序輸出gc概要資訊,詳細資訊,gc時間資訊,gc造成的應用暫停時間。如果在剛才的參數後面加入參數 -Xloggc:檔案路徑,gc資訊将會輸出到指定的檔案中。其他參數還有

  -verbose:gc和-XX:+PrintTenuringDistribution等。

  2:jconsole

  jconsole是jdk自帶的一個記憶體分析工具,它提供了圖形界面。可以檢視到被監控的jvm的記憶體資訊,線程資訊,類加載資訊,MBean資訊。

  jconsole位于jdk目錄下的bin目錄,在windows下是jconsole.exe,在unix和linux下是jconsole.sh,jconsole可以監控本地應用,也可以監控遠端應用。 要監控本地應用,執行jconsole pid,pid就是運作的java程序id,如果不帶上pid參數,則執行jconsole指令後,會看到一個對話框彈出,上面列出了本地的java程序,可以選擇一個進行監控。如果要遠端監控,則要在遠端伺服器的jvm參數裡加入一些東西,因為jconsole的遠端監控基于jmx的,關于jconsole詳細用法,請見專門介紹jconsle的文章,我也會在部落格裡專門詳細介紹jconsole。

  3:jviusalvm

  在JDK6 update 7之後,jdk推出了另外一個工具:jvisualvm,java可視化虛拟機,它不但提供了jconsole類似的功能,還提供了jvm記憶體和cpu實時診斷,還有手動dump出jvm記憶體情況,手動執行gc。

  和jconsole一樣,運作jviusalvm,在jdk的bin目錄下執行jviusalvm,windows下是jviusalvm.exe,linux和unix下是jviusalvm.sh。

  4:jmap

  jmap是jdk自帶的jvm記憶體分析的工具,位于jdk的bin目錄。jdk1.6中jmap指令用法:

  Usage:

  jmap -histo

  (to connect to running process and print histogram of java object heap

  jmap -dump:

  (to connect to running process and dump java heap)

  dump-options:

  format=b binary default

  file= dump heap to

  Example: jmap -dump:format=b,file=heap.bin

  jmap -histo 在螢幕上顯示出指定pid的jvm記憶體狀況。以我本機為例,執行該指令,螢幕顯示:

  num #instances #bytes class name

  ----------------------------------------------

  1: 24206 2791864

  2: 22371 2145216 [C

  3: 24206 1940648

  4: 1951 1364496

  5: 26543 1282560

  6: 6377 1081744 [B

  7: 1793 909688

  8: 1471 614624

  9: 14581 548336 [Ljava.lang.Object;

  10: 3863 513640 [I

  11: 20677 496248 java.lang.String

  12: 3621 312776 [Ljava.util.HashMap$Entry;

  13: 3335 266800 java.lang.reflect.Method

  14: 8256 264192 java.io.ObjectStreamClass$WeakClassKey

  15: 7066 226112 java.util.TreeMap$Entry

  16: 2355 173304 [S

  17: 1687 161952 java.lang.Class

  18: 2769 150112 [[I

  19: 3563 142520 java.util.HashMap

  20: 5562 133488 java.util.HashMap$Entry

  Total 239019 17140408

  為了友善檢視,我删掉了一些行。從上面的資訊很容易看出,#instance指的是對象數量,#bytes指的是這些對象占用的記憶體大小,class name指的是對象類型。

  再看jmap的dump選項,這個選項是将jvm的堆中記憶體資訊輸出到一個檔案中,在我本機執行

  jmap -dump:file=c:\dump.txt 340

  注意340是我本機的java程序pid,dump出來的檔案比較大有10幾M,而且我隻是開了tomcat,跑了一個很簡單的應用,且沒有任何通路,可以想象,大型繁忙的伺服器上,dump出來的檔案該有多大。需要知道的是,dump出來的檔案資訊是很原始的,絕不适合人直接觀看,而jmap -histo顯示的内容又太簡單,例如隻顯示某些類型的對象占用多大記憶體,以及這些對象的數量,但是沒有更詳細的資訊,例如這些對象分别是由誰建立的。那這麼說,dump出來的檔案有什麼用呢?當然有用,因為有專門分析jvm的記憶體dump檔案的工具。

  5:jhat

  上面說了,有很多工具都能分析jvm的記憶體dump檔案,jhat就是sun jdk6及以上版本自帶的工具,位于jdk的bin目錄,執行 jhat -J -Xmx512m [file] ,file就是dump檔案路徑。jhat内置一個簡單的web伺服器,此指令執行後,jhat在指令行裡顯示分析結果的通路位址,可以用-port選項指定端口,具體用法可以執行jhat -heap檢視幫助資訊。通路指定位址後,就能看到頁面上顯示的資訊,比jmap -histo指令顯示的豐富得多,更為詳細。

  6:eclipse記憶體分析器

  上面說了jhat,它能分析jvm的dump檔案,但是全部是文字顯示,eclipse memory analyzer,是一個eclipse提供用于分析jvm 堆dump的插件,網址為 http://www.eclipse.org/mat ,它的分析速度比jhat快,分析結果是圖形界面顯示,比jhat的可讀性更高。其實jvisualvm也可以分析dump檔案,也是有圖形界面顯示的。

  7:jstat

  如果說jmap傾向于分析jvm記憶體中對象資訊的話,那麼jsta就是傾向于分析jvm記憶體的gc情況。都是jvm記憶體分析工具,但顯然,它們是從不同次元來分析的。jsat常用的參數有很多,如 -gc,-gcutil,-gccause,這些選項具體作用可檢視jsat幫助資訊,我經常用-gcutil,這個參數的作用不斷的顯示目前指定的jvm記憶體的垃圾收集的資訊。

  我在本機執行 jstat -gcutil 340 10000,這個指令是每個10秒鐘輸出一次jvm的gc資訊,10000指的是間隔時間為10000毫秒。螢幕上顯示如下資訊(我隻取了第一行,因為是按的一定頻率顯示,是以實際執行的時候,會有很多行):

  S0 S1 E O P YGC YGCT FGC FGCT GCT

  54.62 0.00 42.87 43.52 86.24 1792 5.093 33 7.670 12.763

  額……怎麼說呢,要看懂這些資訊代表什麼意思,還必須對jvm的gc機制有一定的了解才行啊。其實如果對sun的 hot spot jvm的gc比較了解的人,應該很容易看懂這些資訊,但是不清楚gc機制的人,有點莫名其妙,是以在這裡我還是先講講sun的jvm的gc機制吧。說到gc,其實不僅僅隻是java的概念,其實在java之前,就有很多語言有gc的概念了,gc嘛就是垃圾收集的意思,更多的是一種算法性的東西,而跟具體語言沒太大關系,是以關于gc的曆史,gc的主流算法我就不講了,那扯得太遠了,扯得太遠了就是扯淡。sun現在的jvm,記憶體的管理模型是分代模型,是以gc當然是分代收集了。分代是什麼意思呢?就是将對象按照生命周期分成三個層次,分别是:新生代,舊生代,持久代。對象剛開始配置設定的時候,大部分都在新生代,當新生代gc送出被觸發後了,執行一次新生代範圍内的gc,這叫minor gc,如果執行了幾次minor gc後,還有對象存活,将這些對象轉入舊生代,因為這些對象已經經過了組織的重重考驗了哇。舊生代的gc頻率會更低一些,如果舊生代執行了gc,那就是full gc,因為不是局部gc,而是全記憶體範圍的gc,這會造成應用停頓,因為全記憶體收集,必須封鎖記憶體,不許有新的對象配置設定到記憶體,持久代就是一些jvm期間,基本不會消失的對象,例如class的定義,jvm方法區資訊,例如靜态塊。需要主要的是,新生代裡又分了三個空間:eden,susvivor0,susvivor1,按字面上來了解,就是伊甸園區,幸存1區,幸存2區。新對象配置設定在eden區中,eden區滿時,采用标記-複制算法,即檢查出eden區存活 的對象,并将這些對象複制到是s0或s1中,然後清空eden區。jvm的gc說開來,不隻是這麼簡單,例如還有串行收集,并行收集,并發收集,還有着名的火車算法,不過那說得太遠了,現在對這個有大緻了解就好。說到這裡,再來看一下上面輸出的資訊:

  S0:新生代的susvivor0區,空間使用率為5462%

  S1:新生代的susvivor1區,空間使用率為0.00%(因為還沒有執行第二次minor收集)

  E:eden區,空間使用率42.87%

  O:舊生代,空間使用率43.52%

  P:持久帶,空間使用率86.24%

  YGC:minor gc執行次數1792次

  YGCT:minor gc耗費的時間5.093毫秒

  FGC:full gc執行次數33

  FGCT:full gc耗費的時間7.670毫秒

  GCT:gc耗費的總時間12.763毫秒

  怎樣選擇工具

  上面列舉的一些工具,各有利弊,其實如果在開發環境,使用什麼樣的工具是無所謂的,隻要能得到結果就好。但是在生産環境裡,卻不能亂選擇,因為這些工具本身就會耗費大量的系統資源,如果在一個生産伺服器壓力很大的時候,貿然執行這些工具,可能會造成很意外的情況。最好不要在伺服器本機監控,遠端監控會比較好一些,但是如果要遠端監控,伺服器端的啟動腳本要加入一些jvm參數,例如用jconsloe遠端監控tomcat或jboss等,都需要設定jvm的jmx參數,如果僅僅隻是分析伺服器的記憶體配置設定和gc資訊,強烈推薦,先用jmap導出伺服器端的jvm的堆dump檔案,然後再用jhat,或者jvisualvm,或者eclipse記憶體分析器來分析記憶體狀況。