天天看點

一文學會Java死鎖和CPU 100% 問題的排查技巧

做一個積極的人

編碼、改bug、提升自己

我有一個樂園,面向程式設計,春暖花開

工欲善其事,必先利其器

00 本文簡介

作為一名搞技術的程式猿或者是攻城獅,想必你應該是對下面這兩個問題有所了解,說不定你在實際的工作或者面試就有遇到過:

第一個問題:Java死鎖如何排查和解決?

第二個問題:伺服器CPU占用率高達到100%排查和解決?

第三個問題:有哪些工具能夠快速檢視線程使用情況?

本文對這三個問題進行總結整理,通過執行個體示範講解,精彩幹貨,不容錯過啊!

前戲就這麼多,高潮會很多,做好了,讓我們直奔主題,發動小船,Let's go!

一文學會Java死鎖和CPU 100% 問題的排查技巧

01 Java死鎖排查和解決

要排查和解決死鎖,首先思考三個問題:

1. 什麼是死鎖?

2. 為什麼會出現死鎖?

3. 怎麼排查代碼中出現了死鎖?

4. 如何避免寫出死鎖的代碼?

作為技術人員(工程師),在出現問題的時候,能夠盡快的去解決這個問題。但是在學習技術知識的時候,還是腳踏實地,多問一些為什麼,一個好的問題,能夠讓自己思考,這方面的能力也一定要鍛煉鍛煉哦,這樣才能更好的了解和掌握知識,并探究/觸碰到更深入的地方。

1、啥是死鎖?

死鎖是指兩個或兩個以上的程序在執行過程中,由于競争資源或者由于彼此通信而造成的一種阻塞的現象,若無外力作用,它們都将無法推進下去。此時稱系統處于死鎖狀态或系統産生了死鎖,這些永遠在互相等待的程序稱為死鎖程序。[百度百科:死鎖]

注:程序和線程都可以發生死鎖,隻要滿足死鎖的條件!

2、為啥子會出現死鎖?

從上面的概念中我們知道

(1)必須是兩個或者兩個以上程序(線程)

(2)必須有競争資源

3、怎麼排查代碼中出現了死鎖?【重點來了】

首先整一個死鎖的代碼,看例子:

一文學會Java死鎖和CPU 100% 問題的排查技巧

上面這段代碼執行後,就會出現死鎖,那麼排查的方法有如下:

第一個姿勢:使用 jps + jstack

一:在windons指令視窗,使用

jps -l

【不會使用jps請自行查詢資料】

二:使用

jstack -l 12316

【不會使用jstack請自行查詢資料】

第二個姿勢:使用jconsole

在window打開 JConsole,JConsole是一個圖形化的監控工具!

一:在windons指令視窗 ,輸出

JConsole

,如下圖:

二:選擇到線程的tab上,如下截圖。

第三個姿勢:使用Java Visual VM

在window打開 jvisualvm,jvisualvm是一個圖形化的監控工具!

jvisualvm

二:依然是切換到線程這個TAB上,很明顯的就有提示!

4、如何避免死鎖?

上面說了死鎖出現的原因以及通過三種方式來檢測和排查死鎖,下面更重要的東西來了,就是如何避免死鎖,如果能夠讓寫出的代碼避免死鎖出現也就沒有上面這些排查的過程了。最好的是從源頭控制問題,而不是後期遇到問題在去填坑。

我看了阿裡巴巴中最新的開發規約,裡面有對避免死鎖的說明,具體如下:

【強制】對多個資源、資料庫表、對象同時加鎖時,需要保持一緻的加鎖順序,否則可能會

造成死鎖。

說明:線程一需要對表 A、B、C 依次全部加鎖後才可以進行更新操作,那麼線程二的加鎖順序也必須是

A、B、C,否則可能出現死鎖。

02、Java CPU 100% 排查技巧

第一個姿勢,步驟有點多,難度四星

平時多積累一點,這樣在遇到問題的時候就少句求人的話。如果在實際的開發中遇到CPU 100%問題,要怎麼排查呢?如果你沒有遇到過這個問題,請先自己思考10s,如果你遇到過,這個時候也正好可以在回顧一遍。

一、 使用

top

指令檢視cpu占用資源較高的PID

目前占用cup100% 的PID為3455。

二、通過

jps

找到目前使用者下的java程式PID

執行

jps -l

能夠列印出所有的應用的PID,找到有一個PID和這個cpu使用100%一樣的ID!!!就知道是哪一個服務了。知道了對應的服務,在接着後續的分析步驟。

三、 使用

pidstat -p < PID > 1 3 -u -t

-p:指定程序号
-u:預設的參數,顯示各個程序的cpu使用統計
-t:顯示選擇任務的線程的統計資訊外的額外資訊           

四、找到cpu占用較高的線程TID ,通過上圖發現是

3467

的TID占用cup較大

五、 因為jstack指令輸出檔案記錄的線程ID是16進制。是以我們先将TID轉換為十六進制的表示方式,轉換方式可以參考下圖。

3467

轉為十六進制

d8d

,注意是小寫!! 記錄下來,後面會使用。

六、通過

jstack [-l] PID

輸出目前程序的線程資訊

jstack PID  /temp/test.log           

七、查找 TID對應的線程(輸出的線程id為十六進制),找到對應的代碼,使用指令查找哦,不要肉眼比對,具體指令請思考,給你表現機會。

找到之後具體分析這個線程在幹什麼,為什麼會占用這麼多的 CUP資源。

PS:線程的幾種狀态如下說明:

NEW,未啟動的。不會出現在Dump中。
RUNNABLE,在虛拟機内執行的。
BLOCKED,受阻塞并等待螢幕鎖。
WATING,無限期等待另一個線程執行特定操作。
TIMED_WATING,有時限的等待另一個線程的特定操作。
TERMINATED,已退出的。           

第二個姿勢,待開發[奸笑臉]

此處省略......,好多字。

03 推薦兩個高效排查問題工具

一 :

show-busy-java-threads

一文學會Java死鎖和CPU 100% 問題的排查技巧

官網位址:

show-busy-java-threads

https://github.com/oldratlee/useful-scripts/blob/master/docs/java.md#-show-busy-java-threads

簡單安裝和使用過程:

  1. 下載下傳
  2. 上傳伺服器,然後進行解壓
  3. 然後執行對應的指令

二:阿裡開源的問題定位神器

arthas

來定位問題。

arthas https://alibaba.github.io/arthas/index.html

這個裡面有很多指令,如

thread

支援一鍵展示目前最忙的前N個線程并列印堆棧,最簡單的

thread -n 10

即可将最忙碌的十個線程快照列印出來,真正高效。

一文學會Java死鎖和CPU 100% 問題的排查技巧

定位神器

arthas

安裝過程就做介紹了,如果你還沒有用過這個工具,我建議一定去用一下,說不定你會愛上它!

04 總結

本文内容比較多,基本上是手把手的教程了,希望能夠對你有所幫助,也建議沒有遇到類似問題的夥伴,看完之後一定要親自去實踐一下操作過程,如果沒有環境可以自行想辦法搞一個測試例子。還是老話:不要眼高手低,看了和做了本質上兩個概念,最終收獲的也一定不同。

05 彩蛋-另一個姿勢

也可以通過使用

jstack

找到系統的代碼性能問題

1、在進行壓力測試的時候,使用jps找到應用的PID

2、然後使用

jstack

輸出出壓力測試時候應用的dump資訊

3、分析輸出的日志檔案中那個方法

block

線程占用最多,這裡可能是性能有問題,找到對應的代碼分析

謝謝你的閱讀,如果您覺得這篇博文對你有幫助,請點贊或者喜歡,讓更多的人看到!祝你每天開心愉快!

不管做什麼,隻要堅持下去就會看到不一樣!在路上,不卑不亢!

部落格首頁 : https://aflyun.blog.csdn.net/

願你我在人生的路上能都變成最好的自己,能夠成為一個獨擋一面的人

繼續閱讀