天天看點

vmstat 指令詳解

Linux vmstat指令實戰詳解

vmstat指令是最常見的Linux/Unix監控工具,可以展現給定時間間隔的伺服器的狀态值,包括伺服器的CPU使用率,記憶體使用,虛拟記憶體交換情況,IO讀寫情況。這個指令是我檢視Linux/Unix最喜愛的指令,一個是Linux/Unix都支援,二是相比top,我可以看到整個機器的CPU,記憶體,IO的使用情況,而不是單單看到各個程序的CPU使用率和記憶體使用率(使用場景不一樣)。

一般vmstat工具的使用是通過兩個數字參數來完成的,第一個參數是采樣的時間間隔數,機關是秒,第二個參數是采樣的次數,如:

[root@localhost net]# vmstat 2 1

procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----

 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st

 1  0      0 1567052  14088 186644    0    0     7     0   20   26  0  0 100  0  0

2表示每個兩秒采集一次伺服器狀态,1表示隻采集一次。

實際上,在應用過程中,我們會在一段時間内一直監控,不想監控直接結束vmstat就行了,例如:

[root@localhost net]# vmstat 3

 1  0      0 1567144  14096 186676    0    0     7     0   20   26  0  0 100  0  0

 1  0      0 1567020  14096 186676    0    0     0     0   46   60  0  0 100  0  0

 0  0      0 1567020  14096 186676    0    0     0     0   42   58  0  0 100  0  0

 0  0      0 1567020  14096 186676    0    0     0     0   47   61  0  0 100  0  0

這表示vmstat每2秒采集資料,一直采集,直到我結束程式,這裡采集了4次資料我就結束了程式。

好了,指令介紹完畢,現在我們開始講解每個參數的意思。

r 表示運作隊列(就是說多少個程序真的配置設定到CPU),我測試的伺服器目前CPU比較空閑,沒什麼程式在跑,當這個值超過了CPU數目,就會出現CPU瓶頸了。這個也和top的負載有關系,一般負載超過了3就比較高,超過了5就高,超過了10就不正常了,伺服器的狀态很危險。top的負載類似每秒的運作隊列。如果運作隊列過大,表示你的CPU很繁忙,一般會造成CPU使用率很高。

b 表示阻塞的程序,這個不多說,程序阻塞,大家懂的。

swpd 虛拟記憶體已使用的大小,如果大于0,表示你的機器實體記憶體不足了,如果不是程式記憶體洩露的原因,那麼你該更新記憶體了或者把耗記憶體的任務遷移到其他機器。

free   空閑的實體記憶體的大小,我的機器記憶體總共2G,剩餘1.5G。

buff   Linux/Unix系統是用來存儲,目錄裡面有什麼内容,權限等的緩存,我本機大概占用14多M

cache cache直接用來記憶我們打開的檔案,給檔案做緩沖,我本機大概占用186多M(這裡是Linux/Unix的聰明之處,把空閑的實體記憶體的一部分拿來做檔案和目錄的緩存,是為了提高 程式執行的性能,當程式使用記憶體時,buffer/cached會很快地被使用。)

si  每秒從磁盤讀入虛拟記憶體的大小,如果這個值大于0,表示實體記憶體不夠用或者記憶體洩露了,要查找耗記憶體程序解決掉。我的機器記憶體充裕,一切正常。

so  每秒虛拟記憶體寫入磁盤的大小,如果這個值大于0,同上。

bi  塊裝置每秒接收的塊數量,這裡的塊裝置是指系統上所有的磁盤和其他塊裝置,預設塊大小是1024byte,我本機上沒什麼IO操作,是以一直是0,但是我曾在處理拷貝大量資料(2-3T)的機器上看過可以達到140000/s,磁盤寫入速度差不多140M每秒

bo 塊裝置每秒發送的塊數量,例如我們讀取檔案,bo就要大于0。bi和bo一般都要接近0,不然就是IO過于頻繁,需要調整。

in 每秒CPU的中斷次數,包括時間中斷

cs 每秒上下文切換次數,例如我們調用系統函數,就要進行上下文切換,線程的切換,也要程序上下文切換,這個值要越小越好,太大了,要考慮調低線程或者程序的數目,例如在apache和nginx這種web伺服器中,我們一般做性能測試時會進行幾千并發甚至幾萬并發的測試,選擇web伺服器的程序可以由程序或者線程的峰值一直下調,壓測,直到cs到一個比較小的值,這個程序和線程數就是比較合适的值了。系統調用也是,每次調用系統函數,我們的代碼就會進入核心空間,導緻上下文切換,這個是很耗資源,也要盡量避免頻繁調用系統函數。上下文切換次數過多表示你的CPU大部分浪費在上下文切換,導緻CPU幹正經事的時間少了,CPU沒有充分利用,是不可取的。

us 使用者CPU時間,我曾經在一個做加密解密很頻繁的伺服器上,可以看到us接近100,r運作隊列達到80(機器在做壓力測試,性能表現不佳)。

sy 系統CPU時間,如果太高,表示系統調用時間長,例如是IO操作頻繁。

id  空閑 CPU時間,一般來說,id + us + sy = 100,一般我認為id是空閑CPU使用率,us是使用者CPU使用率,sy是系統CPU使用率。

wt 等待IO CPU時間。

本文轉自伺服器運維部落格51CTO部落格,原文連結http://blog.51cto.com/shamereedwine/1981192如需轉載請自行聯系原作者

neijiade10000