現實企業級Java應用開發、維護中,有時候我們會碰到下面這些問題:
- OutOfMemoryError,記憶體不足
- 記憶體洩露
- 線程死鎖
- 鎖争用(Lock Contention)
- Java程序消耗CPU過高
- ......
這些問題在日常開發、維護中可能被很多人忽視(比如有的人遇到上面的問題隻是重新開機伺服器或者調大記憶體,而不會深究問題根源),但能夠了解并解決這些問題是Java程式員進階的必備要求。本文将對一些常用的JVM性能調優監控工具進行介紹,希望能起抛磚引玉之用。
而且這些監控、調優工具的使用,無論你是運維、開發、測試,都是必須掌握的。
A、 jps(Java Virtual Machine Process Status Tool)
jps主要用來輸出JVM中運作的程序狀态資訊。文法格式如下:

如果不指定hostid就預設為目前主機或伺服器。
指令行參數選項說明如下:
比如下面:
B、 jstack
jstack主要用來檢視某個Java程序内的線程堆棧資訊。文法格式如下:
指令行參數選項說明如下:
jstack可以定位到線程堆棧,根據堆棧資訊我們可以定位到具體代碼,是以它在JVM性能調優中使用得非常多。下面我們來一個執行個體找出某個Java程序中最耗費CPU的Java線程并定位堆棧資訊,用到的指令有ps、top、printf、jstack、grep。
第一步先找出Java程序ID,我部署在伺服器上的Java應用名稱為mrf-center:
得到程序ID為21711,第二步找出該程序内最耗費CPU的線程,可以使用ps -Lfp pid或者ps -mp pid -o THREAD, tid, time或者top -Hp pid,我這裡用第三個,輸出如下:
TIME列就是各個Java線程耗費的CPU時間,CPU時間最長的是線程ID為21742的線程,用
得到21742的十六進制值為54ee,下面會用到。
OK,下一步終于輪到jstack上場了,它用來輸出程序21711的堆棧資訊,然後根據線程ID的十六進制值grep,如下:
可以看到CPU消耗在PollIntervalRetrySchedulerThread這個類的Object.wait(),我找了下我的代碼,定位到下面的代碼:
它是輪詢任務的空閑等待代碼,上面的sigLock.wait(timeUntilContinue)就對應了前面的Object.wait()。
C、 jmap(Memory Map)和jhat(Java Heap Analysis Tool)
jmap用來檢視堆記憶體使用狀況,一般結合jhat使用。
jmap文法格式如下:
如果運作在64位JVM上,可能需要指定-J-d64指令選項參數。
列印程序的類加載器和類加載器加載的持久代對象資訊,輸出:類加載器名稱、對象是否存活(不可靠)、對象位址、父類加載器、已加載的類大小等資訊,如下圖:
使用jmap -heap pid檢視程序堆記憶體使用情況,包括使用的GC算法、堆配置參數和各代中堆記憶體使用情況。比如下面的例子:
使用jmap -histo[:live] pid檢視堆記憶體中的對象數目、大小統計直方圖,如果帶上live則隻統計活對象,如下:
class name是對象類型,說明如下:
還有一個很常用的情況是:用jmap把程序記憶體使用情況dump到檔案中,再用jhat分析檢視。jmap進行dump指令格式如下:
我一樣地對上面程序ID為21711進行Dump:
dump出來的檔案可以用MAT、VisualVM等工具檢視,這裡用jhat檢視:
注意如果Dump檔案太大,可能需要加上-J-Xmx512m這種參數指定最大堆記憶體,即jhat -J-Xmx512m -port 9998 /tmp/dump.dat。然後就可以在浏覽器中輸入主機位址:9998檢視了:
上面紅線框出來的部分大家可以自己去摸索下,最後一項支援OQL(對象查詢語言)。
D、jstat(JVM統計監測工具)
文法格式如下:
vmid是Java虛拟機ID,在Linux/Unix系統上一般就是程序ID。interval是采樣時間間隔。count是采樣數目。比如下面輸出的是GC資訊,采樣時間間隔為250ms,采樣數為4:
[email protected]:/# jstat -gc 21711 250 4 S0C S1C S0U S1U EC EU OC OU PC PU YGC YGCT FGC FGCT GCT 192.0 192.0 64.0 0.0 6144.0 1854.9 32000.0 4111.6 55296.0 25472.7 702 0.431 3 0.218 0.649192.0 192.0 64.0 0.0 6144.0 1972.2 32000.0 4111.6 55296.0 25472.7 702 0.431 3 0.218 0.649192.0 192.0 64.0 0.0 6144.0 1972.2 32000.0 4111.6 55296.0 25472.7 702 0.431 3 0.218 0.649192.0 192.0 64.0 0.0 6144.0 2109.7 32000.0 4111.6 55296.0 25472.7 702 0.431 3 0.218 0.649
要明白上面各列的意義,先看JVM堆記憶體布局:
可以看出:
現在來解釋各列含義:
E、hprof(Heap/CPU Profiling Tool)
hprof能夠展現CPU使用率,統計堆記憶體使用情況。
文法格式如下:
完整的指令選項如下:
來幾個官方指南上的執行個體。
CPU Usage Sampling Profiling(cpu=samples)的例子:
上面每隔20毫秒采樣CPU消耗資訊,堆棧深度為3,生成的profile檔案名稱是java.hprof.txt,在目前目錄。
CPU Usage Times Profiling(cpu=times)的例子,它相對于CPU Usage Sampling Profile能夠獲得更加細粒度的CPU消耗資訊,能夠細到每個方法調用的開始和結束,它的實作使用了位元組碼注入技術(BCI):
Heap Allocation Profiling(heap=sites)的例子:
Heap Dump(heap=dump)的例子,它比上面的Heap Allocation Profiling能生成更詳細的Heap Dump資訊:
雖然在JVM啟動參數中加入-Xrunprof:heap=sites參數可以生成CPU/Heap Profile檔案,但對JVM性能影響非常大,不建議線上上伺服器環境使用。