天天看點

Linux中檢視負載

行車過橋

一隻單核的處理器可以形象得比喻成一條單車道。設想下,你現在需要收取這條道路的過橋 費 — 忙于處理那些将要過橋的車輛。你首先當然需要了解些資訊,例如車輛的載重、以及 還有多少車輛正在等待過橋。如果前面沒有車輛在等待,那麼你可以告訴後面的司機通過。 如果車輛衆多,那麼需要告知他們可能需要稍等一會。

是以,需要些特定的代号表示目前的車流情況,例如:

0.00 表示目前橋面上沒有任何的車流。 實際上這種情況與 0.00 和 1.00 之間是相同的,總而言之很通暢,過往的車輛可以絲毫不用等待的通過。

1.00 表示剛好是在這座橋的承受範圍内。 這種情況不算糟糕,隻是車流會有些堵,不過這種情況可能會造成交通越來越慢。

超過 1.00,那麼說明這座橋已經超出負荷,交通嚴重的擁堵。 那麼情況有多糟糕? 例如 2.00 的情況說明車流已經超出了橋所能承受的一倍,那麼将有多餘過橋一倍的車輛正在焦急的等待。3.00 的話情況就更不妙了,說明這座橋基本上已經快承受不了,還有超出橋負載兩倍多的車輛正在等待。

上面的情況和處理器的負載情況非常相似。一輛汽車的過橋時間就好比是處理器處理某線程 的實際時間。Unix 系統定義的程序運作時長為所有處理器核心的處理時間加上線程 在隊列中等待的時間。

和收過橋費的管理者一樣,你當然希望你的汽車(操作)不會被焦急的等待。是以,理想狀态 下,都希望負載平均值小于 1.00 。當然不排除部分峰值會超過 1.00,但長此以往保持這 個狀态,就說明會有問題,這時候你應該會很焦急。

“是以你說的理想負荷為 1.00 ?”

嗯,這種情況其實并不完全正确。負荷 1.00 說明系統已經沒有剩餘的資源了。在實際情況中 ,有經驗的系統管理者都會将這條線劃在 0.70:

“需要進行調查法則”: 如果長期你的系統負載在 0.70 上下,那麼你需要在事情變得更糟糕之前,花些時間了解其原因。

“現在就要修複法則”:1.00 。 如果你的伺服器系統負載長期徘徊于 1.00,那麼就應該馬上解決這個問題。否則,你将半夜接到你上司的電話,這可不是件令人愉快的事情。

“淩晨三點半鍛煉身體法則”:5.00。 如果你的伺服器負載超過了 5.00 這個數字,那麼你将失去你的睡眠,還得在會議中說明這情況發生的原因,總之千萬不要讓它發生。

那麼多個處理器呢?我的均值是 3.00,但是系統運作正常!

哇喔,你有四個處理器的主機?那麼它的負載均值在 3.00 是很正常的。

在多處理器系統中,負載均值是基于核心的數量決定的。以 100% 負載計算,1.00 表示單個處理器,而 2.00 則說明有兩個雙處理器,那麼 4.00 就說明主機具有四個處理器。

回到我們上面有關車輛過橋的比喻。1.00 我說過是“一條單車道的道路”。那麼在單車道 1.00 情況中,說明這橋梁已經被車塞滿了。而在雙處理器系統中,這意味着多出了一倍的 負載,也就是說還有 50% 的剩餘系統資源 — 因為還有另外條車道可以通行。

是以,單處理器已經在負載的情況下,雙處理器的負載滿額的情況是 2.00,它還有一倍的資源可以利用。

多核與多處理器

先脫離下主題,我們來讨論下多核心處理器與多處理器的差別。從性能的角度上了解,一台主 機擁有多核心的處理器與另台擁有同樣數目的處理性能基本上可以認為是相差無幾。當然實際 情況會複雜得多,不同數量的緩存、處理器的頻率等因素都可能造成性能的差異。

但即便這些因素造成的實際性能稍有不同,其實系統還是以處理器的核心數量計算負載均值 。這使我們有了兩個新的法則:

“有多少核心即為有多少負荷”法則: 在多核進行中,你的系統均值不應該高于處理器核心的總數量。

“核心的核心”法則: 核心分布在分别幾個單個實體進行中并不重要,其實兩顆四核的處理器 等于 四個雙核處理器 等于 八個單處理器。是以,它應該有八個處理器核心。

讓我們再來看看 uptime 的輸出

~ $ uptime

23:05 up 14 days, 6:08, 7 users, load averages: 0.65 0.42 0.36

這是個雙核處理器,從結果也說明有很多的空閑資源。實際情況是即便它的峰值會到 1.7,我也從來沒有考慮過它的負載問題。

那麼,怎麼會有三個數字的确讓人困擾。我們知道,0.65、0.42、0.36 分别說明上一分鐘、最後五分鐘以及最後十五分鐘的系統負載均值。那麼這又帶來了一個問題:

我們以哪個數字為準?一分鐘?五分鐘?還是十五分鐘?

其實對于這些數字我們已經談論了很多,我認為你應該着眼于五分鐘或者十五分鐘的平均數 值。坦白講,如果前一分鐘的負載情況是 1.00,那麼仍可以說明認定伺服器情況還是正常的。 但是如果十五分鐘的數值仍然保持在 1.00,那麼就值得注意了(根據我的經驗,這時候你應 該增加的處理器數量了)。

那麼我如何得知我的系統裝備了多少核心的處理器?

在 Linux 下,可以使用

cat /proc/cpuinfo

擷取你系統上的每個處理器的資訊。如果你隻想得到數字,那麼就使用下面的指令:

grep 'model name' /proc/cpuinfo | wc -l

Popularity: 11% [?]

1、cat /proc/loadavg

0.27 0.36 0.37 4/83 4828/

參數含義

1.平均負載:0.54, 0.40, 0.20

最近1分鐘、5分鐘、15分鐘系統的負載

2.程序數:4/83

分子是正在運作的程序數,分母是程序總數

3.程序号:4828

最近運作的程序ID号

2、uptime

名稱: uptime

使用權限: 所有使用者

使用方式: uptime [-V]

說明: uptime 提供使用者下面的資訊,不需其他參數:

現在的時間 系統開機運轉到現在經過的時間 連線的使用者數量 最近一分鐘,五分鐘和十五分鐘的系統負載

參數: -V 顯示版本資訊。

範例: uptime

其結果為:

10:41am up 5 days, 10 min, 1 users, load average: 0.00, 0.00, 1.99

參數含義

1.目前時間  04:03:58

2.系統已運作的時間 10 days, 13:19

3.前線上使用者  1 user

4.平均負載:0.54, 0.40, 0.20

最近1分鐘、5分鐘、15分鐘系統的負載

/proc/uptime檔案裡包含兩個數字,如:

[[email protected] ~]# cat /proc/uptime

1232468.44 1111331.67

第一個數值代表系統總的啟動時間,第二個數值則代表系統空閑的時間,都是用秒來表示的。如果系統裡第二個數字比第一個數字還要大,則說明你的cpu是多核的,cpu0上閑了一秒, cpu1上閑了兩秒,加起就是三秒。

3、w

功能說明:顯示目前登入系統的使用者資訊。

語  法:w [-fhlsuV][使用者名稱]

補充說明:執行這項指令可得知目前登入系統的使用者有那些人,以及他們正在執行的程式。單獨執行w

指令會顯示所有的使用者,您也可指定使用者名稱,僅顯示某位使用者的相關資訊。

參  數:

-f  開啟或關閉顯示使用者從何處登入系統。

-h  不顯示各欄位的标題資訊列。

-l  使用詳細格式清單,此為預設值。

-s  使用簡潔格式清單,不顯示使用者登入時間,終端機階段作業和程式所耗費的CPU時間。

-u  忽略執行程式的名稱,以及該程式耗費CPU時間的資訊。

-V  顯示版本資訊。

4、top

功能說明:顯示,管理執行中的程式。

語  法:top [bciqsS][d <間隔秒數>][n <執行次數>]

補充說明:執行top指令可顯示目前正在系統中執行的程式,并通過它所提供的互動式界面,用熱鍵加以管理。

參  數:

 b  使用批處理模式。

 c  列出程式時,顯示每個程式的完整指令,包括指令名稱,路徑和參數等相關資訊。

 d<間隔秒數>  設定top監控程式執行狀況的間隔時間,機關以秒計算。

 i  執行top指令時,忽略閑置或是已成為Zombie的程式。

 n<執行次數>  設定監控資訊的更新次數。

 q  持續監控程式執行的狀況。

 s  使用保密模式,消除互動模式下的潛在危機。

 S  使用累計模式,其效果類似ps指令的"-S"參數。

5、tload

功能說明:顯示系統負載狀況。

語  法:tload [-V][-d <間隔秒數>][-s <刻度大小>][終端機編号]

補充說明:tload指令使用ASCII字元簡單地以文字模式顯示系統負載狀态。假設不給予終端機編号,則會在執行tload指令的終端機顯示負載情形。

參  數:

 -d<間隔秒數>  設定tload檢測系統負載的間隔時間,機關以秒計算。

 -s<刻度大小>  設定圖表的垂直刻度大小,機關以列計算。

 -V  顯示版本資訊。

繼續閱讀