JVM 性能調優監控工具 jps、jstack、jmap、jhat、jstat、hprof 詳解

現實企業級Java應用開發、維護中，有時候我們會碰到下面這些問題：

OutOfMemoryError，記憶體不足
記憶體洩露
線程死鎖
鎖争用（Lock Contention）
Java程序消耗CPU過高
......

這些問題在日常開發、維護中可能被很多人忽視（比如有的人遇到上面的問題隻是重新開機伺服器或者調大記憶體，而不會深究問題根源），但能夠了解并解決這些問題是Java程式員進階的必備要求。

本文将對一些常用的JVM性能調優監控工具進行介紹，希望能起抛磚引玉之用。

一、 jps(Java Virtual Machine Process Status Tool) ：基礎工具

jps主要用來輸出JVM中運作的程序狀态資訊。文法格式如下：

jps [options] [hostid]

如果不指定hostid就預設為目前主機或伺服器。

指令行參數選項說明如下：

-q 不輸出類名、Jar名和傳入main方法的參數

-m 輸出傳入main方法的參數

-l 輸出main類或Jar的全限名

-v 輸出傳入JVM的參數

比如下面：

[email protected]:/# jps -m -l
2458 org.artifactory.standalone.main.Main /usr/local/artifactory-2.2.5/etc/jetty.xml
29920 com.sun.tools.hat.Main -port 9998 /tmp/dump.dat
3149 org.apache.catalina.startup.Bootstrap start
30972 sun.tools.jps.Jps -m -l
8247 org.apache.catalina.startup.Bootstrap start
25687 com.sun.tools.hat.Main -port 9999 dump.dat
21711 mrf-center.jar

二、 jstack

jstack主要用來檢視某個Java程序内的線程堆棧資訊。文法格式如下：

jstack [option] pid
jstack [option] executable core
jstack [option] [[email protected]]remote-hostname-or-ip

指令行參數選項說明如下：

-l long listings，會列印出額外的鎖資訊，在發生死鎖時可以用jstack -l pid來觀察鎖持有情況-m mixed mode，不僅會輸出Java堆棧資訊，還會輸出C/C++堆棧資訊（比如Native方法）

jstack可以定位到線程堆棧，根據堆棧資訊我們可以定位到具體代碼，是以它在JVM性能調優中使用得非常多。

下面我們來一個執行個體找出某個Java程序中最耗費CPU的Java線程并定位堆棧資訊，用到的指令有ps、top、printf、jstack、grep。

第一步先找出Java程序ID，我部署在伺服器上的Java應用名稱為mrf-center：

[email protected]:/# ps -ef | grep mrf-center | grep -v grep
root     21711     1  1 14:47 pts/3    00:02:10 java -jar mrf-center.jar

得到程序ID為21711，第二步找出該程序内最耗費CPU的線程，可以使用ps -Lfp pid或者ps -mp pid -o THREAD, tid, time或者top -Hp pid，我這裡用第三個，輸出如下：

JVM 性能調優監控工具 jps、jstack、jmap、jhat、jstat、hprof 詳解

TIME列就是各個Java線程耗費的CPU時間，CPU時間最長的是線程ID為21742的線程，用

printf "%x
" 21742

得到21742的十六進制值為54ee，下面會用到。

OK，下一步終于輪到jstack上場了，它用來輸出程序21711的堆棧資訊，然後根據線程ID的十六進制值grep，如下：

[email protected]:/# jstack 21711 | grep 54ee
"PollIntervalRetrySchedulerThread" prio=10 tid=0x00007f950043e000 nid=0x54ee in Object.wait() [0x00007f94c6eda000]

可以看到CPU消耗在

PollIntervalRetrySchedulerThread這個類的Object.wait()，我找了下我的代碼，定位到下面的代碼：

// Idle wait
getLog().info("Thread [" + getName() + "] is idle waiting...");
schedulerThreadState = PollTaskSchedulerThreadState.IdleWaiting;
long now = System.currentTimeMillis();
long waitTime = now + getIdleWaitTime();
long timeUntilContinue = waitTime - now;
synchronized(sigLock) {try {
    if(!halted.get()) {
    sigLock.wait(timeUntilContinue);
    }
    } catch (InterruptedException ignore) {
    }
}

它是輪詢任務的空閑等待代碼，上面的sigLock.wait(timeUntilContinue)就對應了前面的Object.wait()。

三、 jmap（Memory Map）和 jhat（Java Heap Analysis Tool）：

jmap導出堆記憶體，然後使用jhat來進行分析，jmap文法格式如下：

jmap [option] pid
jmap [option] executable core
jmap [option] [[email protected]]remote-hostname-or-ip

如果運作在64位JVM上，可能需要指定-J-d64指令選項參數。

jmap -permstat pid

列印程序的類加載器和類加載器加載的持久代對象資訊，輸出：類加載器名稱、對象是否存活（不可靠）、對象位址、父類加載器、已加載的類大小等資訊，如下圖：

JVM 性能調優監控工具 jps、jstack、jmap、jhat、jstat、hprof 詳解

使用jmap -heap pid檢視程序堆記憶體使用情況，包括使用的GC算法、堆配置參數和各代中堆記憶體使用情況。比如下面的例子：

[email protected]:/# jmap -heap 21711
Attaching to process ID 21711, please wait...
Debugger attached successfully.
Server compiler detected.
JVM version is 20.10-b01

using thread-local object allocation.
Parallel GC with 4 thread(s)

Heap Configuration:
MinHeapFreeRatio = 40   
MaxHeapFreeRatio = 70   
MaxHeapSize      = 2067791872 (1972.0MB)
NewSize          = 1310720 (1.25MB)
MaxNewSize       = 17592186044415 MB
OldSize          = 5439488 (5.1875MB)
NewRatio         = 2   
SurvivorRatio    = 8   
PermSize         = 21757952 (20.75MB)
MaxPermSize      = 85983232 (82.0MB)

Heap Usage:
PS Young Generation
Eden Space:
   capacity = 6422528 (6.125MB)
   used     = 5445552 (5.1932830810546875MB)
   free     = 976976 (0.9317169189453125MB)
   84.78829520089286% used
From Space:
   capacity = 131072 (0.125MB)
   used     = 98304 (0.09375MB)
   free     = 32768 (0.03125MB)
   75.0% used
To Space:
   capacity = 131072 (0.125MB)
   used     = 0 (0.0MB)
   free     = 131072 (0.125MB)
   0.0% used
PS Old Generation
   capacity = 35258368 (33.625MB)
   used     = 4119544 (3.9287033081054688MB)
   free     = 31138824 (29.69629669189453MB)
   11.683876009235595% used
PS Perm Generation
   capacity = 52428800 (50.0MB)
   used     = 26075168 (24.867218017578125MB)
   free     = 26353632 (25.132781982421875MB)
   49.73443603515625% used
   ....

使用jmap -histo[:live] pid檢視堆記憶體中的對象數目、大小統計直方圖，如果帶上live則隻統計活對象，如下：

[email protected]:/# jmap -histo:live 21711 | more
num     #instances         #bytes  class name----------------------------------------------
   1:         38445        5597736  <constMethodKlass>
   2:         38445        5237288  <methodKlass>
   3:          3500        3749504  <constantPoolKlass>
   4:         60858        3242600  <symbolKlass>
   5:          3500        2715264  <instanceKlassKlass>
   6:          2796        2131424  <constantPoolCacheKlass>
   7:          5543        1317400  [I
   8:         13714        1010768  [C
   9:          4752        1003344  [B
  10:          1225         639656  <methodDataKlass>
  11:         14194         454208  java.lang.String
  12:          3809         396136  java.lang.Class
  13:          4979         311952  [S
  14:          5598         287064  [[I
  15:          3028         266464  java.lang.reflect.Method
  16:           280         163520  <objArrayKlassKlass>
  17:          4355         139360  java.util.HashMap$Entry
  18:          1869         138568  [Ljava.util.HashMap$Entry;
  19:          2443          97720  java.util.LinkedHashMap$Entry
  20:          2072          82880  java.lang.ref.SoftReference
  21:          1807          71528  [Ljava.lang.Object;
  22:          2206          70592  java.lang.ref.WeakReference
  23:           934          52304  java.util.LinkedHashMap
  24:           871          48776  java.beans.MethodDescriptor
  25:          1442          46144  java.util.concurrent.ConcurrentHashMap$HashEntry
  26:           804          38592  java.util.HashMap
  27:           948          37920  java.util.concurrent.ConcurrentHashMap$Segment
  28:          1621          35696  [Ljava.lang.Class;
  29:          1313          34880  [Ljava.lang.String;
  30:          1396          33504  java.util.LinkedList$Entry
  31:           462          33264  java.lang.reflect.Field
  32:          1024          32768  java.util.Hashtable$Entry
  33:           948          31440  [Ljava.util.concurrent.ConcurrentHashMap$HashEntry;

class name是對象類型，說明如下：

B  byte
C  char
D  double
F  float
I  int
J  long
Z  boolean
[  數組，如[I表示int[]
[L+類名 其他對象

還有一個很常用的情況是：用jmap把程序記憶體使用情況dump到檔案中，再用jhat分析檢視。jmap進行dump指令格式如下：

jmap -dump:format=b,file=dumpFileName pid

我一樣地對上面程序ID為21711進行Dump：

[email protected]:/# jmap -dump:format=b,file=/tmp/dump.dat 21711
Dumping heap to /tmp/dump.dat ...
Heap dump file created

dump出來的檔案可以用MAT、VisualVM等工具檢視，這裡用jhat檢視：

[email protected]:/# jhat -port 9998 /tmp/dump.dat
Reading from /tmp/dump.dat...
Dump file created Tue Jan 28 17:46:14 CST 2014Snapshot read, resolving...
Resolving 132207 objects...
Chasing references, expect 26 dots..........................
Eliminating duplicate references..........................
Snapshot resolved.
Started HTTP server on port 9998Server is ready.

注意如果Dump檔案太大，可能需要加上-J-Xmx512m這種參數指定最大堆記憶體，即jhat -J-Xmx512m -port 9998 /tmp/dump.dat。然後就可以在浏覽器中輸入主機位址:9998檢視了：

JVM 性能調優監控工具 jps、jstack、jmap、jhat、jstat、hprof 詳解

上面紅線框出來的部分大家可以自己去摸索下，最後一項支援OQL（對象查詢語言）。

四、jstat（JVM統計監測工具）:

看看各個區記憶體和GC的情況

文法格式如下：

jstat [ generalOption | outputOptions vmid [interval[s|ms] [count]] ]

vmid是Java虛拟機ID，在Linux/Unix系統上一般就是程序ID。interval是采樣時間間隔。count是采樣數目。比如下面輸出的是GC資訊，采樣時間間隔為250ms，采樣數為4：

[email protected]:/# jstat -gc 21711 250 4
S0C    S1C    S0U    S1U      EC       EU        OC         OU       PC     PU    YGC     YGCT    FGC    FGCT     GCT
192.0  192.0   64.0   0.0    6144.0   1854.9   32000.0     4111.6   55296.0 25472.7    702    0.431   3      0.218    0.649
192.0  192.0   64.0   0.0    6144.0   1972.2   32000.0     4111.6   55296.0 25472.7    702    0.431   3      0.218    0.649
192.0  192.0   64.0   0.0    6144.0   1972.2   32000.0     4111.6   55296.0 25472.7    702    0.431   3      0.218    0.649
192.0  192.0   64.0   0.0    6144.0   2109.7   32000.0     4111.6   55296.0 25472.7    702    0.431   3      0.218    0.649

要明白上面各列的意義，先看JVM堆記憶體布局：

JVM 性能調優監控工具 jps、jstack、jmap、jhat、jstat、hprof 詳解

可以看出：

堆記憶體 = 年輕代 + 年老代 + 永久代
年輕代 = Eden區 + 兩個Survivor區（From和To）

現在來解釋各列含義：

S0C、S1C、S0U、S1U：Survivor 0/1區容量（Capacity）和使用量（Used）
EC、EU：Eden區容量和使用量
OC、OU：年老代容量和使用量
PC、PU：永久代容量和使用量
YGC、YGT：年輕代GC次數和GC耗時
FGC、FGCT：Full GC次數和Full GC耗時
GCT：GC總耗時

五、hprof（Heap/CPU Profiling Tool）：

hprof能夠展現CPU使用率，統計堆記憶體使用情況。

文法格式如下：

java -agentlib:hprof[=options] ToBeProfiledClass
java -Xrunprof[:options] ToBeProfiledClass
javac -J-agentlib:hprof[=options] ToBeProfiledClass

完整的指令選項如下：

Option Name and Value  Description                    Default
---------------------  -----------                    -------
heap=dump|sites|all    heap profiling                 all
cpu=samples|times|old  CPU usage                      off
monitor=y|n            monitor contention             n
format=a|b             text(txt) or binary output     a
file=<file>            write data to file             java.hprof[.txt]
net=<host>:<port>      send data over a socket        off
depth=<size>           stack trace depth              4
interval=<ms>          sample interval in ms          10
cutoff=<value>         output cutoff point            0.0001
lineno=y|n             line number in traces?         y
thread=y|n             thread in traces?              n
doe=y|n                dump on exit?                  y
msa=y|n                Solaris micro state accounting n
force=y|n              force output to <file>         y
verbose=y|n            print messages about dumps     y

來幾個官方指南上的執行個體。

CPU Usage Sampling Profiling(cpu=samples)的例子：

java -agentlib:hprof=cpu=samples,interval=20,depth=3 Hello

上面每隔20毫秒采樣CPU消耗資訊，堆棧深度為3，生成的profile檔案名稱是java.hprof.txt，在目前目錄。

CPU Usage Times Profiling(cpu=times)的例子，它相對于CPU Usage Sampling Profile能夠獲得更加細粒度的CPU消耗資訊，能夠細到每個方法調用的開始和結束，它的實作使用了位元組碼注入技術（BCI）：

javac -J-agentlib:hprof=cpu=times Hello.java

Heap Allocation Profiling(heap=sites)的例子：

javac -J-agentlib:hprof=heap=sites Hello.java

Heap Dump(heap=dump)的例子，它比上面的Heap Allocation Profiling能生成更詳細的Heap Dump資訊：

javac -J-agentlib:hprof=heap=dump Hello.java

雖然在JVM啟動參數中加入-Xrunprof:heap=sites參數可以生成CPU/Heap Profile檔案，但對JVM性能影響非常大，不建議線上上伺服器環境使用

本文來源：

JVM 性能調優監控工具 jps、jstack、jmap、jhat、jstat、hprof 詳解

繼續閱讀

關于Gradle配置的小結

Java小案例——随機數猜測随機數猜測

nginx location中斜線的位置的重要性

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的簡單使用

neo4j之cypher使用文檔

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

mybatis_入門程式Mybatis入門

AOP程式設計_Android優雅權限架構(1)概念基礎，2021金三銀四前言正文大綱正文

Effective Java 8:通用程式設計

OOM三種類型

工廠模式-三種類型

【遞歸】高效率求2的n次幂

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method