Linux vmstat指令詳解

vmstat指令是最常見的linux/unix監控工具，可以展現給定時間間隔的伺服器的狀态值,包括伺服器的cpu使用率，記憶體使用，虛拟記憶體交換情況,io讀寫情況。這個指令是我檢視linux/unix最喜愛的指令，一個是linux/unix都支援，二是相比top，我可以看到整個機器的cpu,記憶體,io的使用情況，而不是單單看到各個程序的cpu使用率和記憶體使用率(使用場景不一樣)。

vmstat指令：用來獲得有關程序、虛存、頁面交換空間及 cpu活動的資訊。這些資訊反映了系統的負載情況

vmstat [-a] [-n] [-s unit] [delay [ count]]

vmstat [-s] [-n] [-s unit]

vmstat [-m] [-n] [delay [ count]]

vmstat [-d] [-n] [delay [ count]]

vmstat [-p disk partition] [-n] [delay [ count]]

vmstat [-f]

vmstat [-v]

-a：顯示活躍和非活躍記憶體

-f：顯示從系統啟動至今的fork數量。

-m：顯示slabinfo

-n：隻在開始時顯示一次各字段名稱。

-s：顯示記憶體相關統計資訊及多種系統活動數量。

delay：重新整理時間間隔。如果不指定，隻顯示一條結果。

count：重新整理次數。如果不指定重新整理次數，但指定了重新整理時間間隔，這時重新整理次數為無窮。

-d：顯示磁盤相關統計資訊。

-p：顯示指定磁盤分區統計資訊

-s：使用指定機關顯示。參數有 k 、k 、m 、m ，分别代表1000、1024、1000000、1048576位元組（byte）。預設機關為k（1024 bytes）

-v：顯示vmstat版本資訊。

一般vmstat工具的使用是通過兩個數字參數來完成的，第一個參數是采樣的時間間隔數，機關是秒，第二個參數是采樣的次數，如:

2表示每個兩秒采集一次伺服器狀态，1表示隻采集一次。

實際上，在應用過程中，我們會在一段時間内一直監控，不想監控直接結束vmstat就行了,例如:

這表示vmstat每2秒采集資料，一直采集，直到我結束程式，這裡采集了5次資料我就結束了程式。

好了，指令介紹完畢，現在開始實戰講解每個參數的意思。

r 表示運作隊列(就是說多少個程序真的配置設定到cpu)，我測試的伺服器目前cpu比較空閑，沒什麼程式在跑，當這個值超過了cpu數目，就會出現cpu瓶頸了。這個也和top的負載有關系，一般負載超過了3就比較高，超過了5就高，超過了10就不正常了，伺服器的狀态很危險。top的負載類似每秒的運作隊列。如果運作隊列過大，表示你的cpu很繁忙，一般會造成cpu使用率很高。

b 表示阻塞的程序,這個不多說，程序阻塞，大家懂的。

swpd 虛拟記憶體已使用的大小，如果大于0，表示你的機器實體記憶體不足了，如果不是程式記憶體洩露的原因，那麼你該更新記憶體了或者把耗記憶體的任務遷移到其他機器。

free

空閑的實體記憶體的大小，我的機器記憶體總共8g，剩餘3415m。

buff

linux/unix系統是用來存儲，目錄裡面有什麼内容，權限等的緩存，我本機大概占用300多m

cache cache直接用來記憶我們打開的檔案,給檔案做緩沖，我本機大概占用300多m(這裡是linux/unix的聰明之處，把空閑的實體記憶體的一部分拿來做檔案和目錄的緩存，是為了提高

程式執行的性能，當程式使用記憶體時，buffer/cached會很快地被使用。)

si 每秒從磁盤讀入虛拟記憶體的大小，如果這個值大于0，表示實體記憶體不夠用或者記憶體洩露了，要查找耗記憶體程序解決掉。我的機器記憶體充裕，一切正常。

so 每秒虛拟記憶體寫入磁盤的大小，如果這個值大于0，同上。

bi 塊裝置每秒接收的塊數量，這裡的塊裝置是指系統上所有的磁盤和其他塊裝置，預設塊大小是1024byte，我本機上沒什麼io操作，是以一直是0，但是我曾在處理拷貝大量資料(2-3t)的機器上看過可以達到140000/s，磁盤寫入速度差不多140m每秒

bo 塊裝置每秒發送的塊數量，例如我們讀取檔案，bo就要大于0。bi和bo一般都要接近0，不然就是io過于頻繁，需要調整。

in 每秒cpu的中斷次數，包括時間中斷

cs 每秒上下文切換次數，例如我們調用系統函數，就要進行上下文切換，線程的切換，也要程序上下文切換，這個值要越小越好，太大了，要考慮調低線程或者程序的數目,例如在apache和nginx這種web伺服器中，我們一般做性能測試時會進行幾千并發甚至幾萬并發的測試，選擇web伺服器的程序可以由程序或者線程的峰值一直下調，壓測，直到cs到一個比較小的值，這個程序和線程數就是比較合适的值了。系統調用也是，每次調用系統函數，我們的代碼就會進入核心空間，導緻上下文切換，這個是很耗資源，也要盡量避免頻繁調用系統函數。上下文切換次數過多表示你的cpu大部分浪費在上下文切換，導緻cpu幹正經事的時間少了，cpu沒有充分利用，是不可取的。

us 使用者cpu時間，我曾經在一個做加密解密很頻繁的伺服器上，可以看到us接近100,r運作隊列達到80(機器在做壓力測試，性能表現不佳)。

sy 系統cpu時間，如果太高，表示系統調用時間長，例如是io操作頻繁。

id 空閑

cpu時間，一般來說，id + us + sy = 100,一般我認為id是空閑cpu使用率，us是使用者cpu使用率，sy是系統cpu使用率。

wa wa過高時，說明io等待比較嚴重，這可能是由于磁盤大量随機通路造成的，也有可能是磁盤的帶寬出現瓶頸。

常見問題處理

如果r經常大于4，且id經常少于40，表示cpu的負荷很重。

如果pi，po長期不等于0，表示記憶體不足。

如果disk經常不等于0，且在b中的隊列大于3，表示io性能不好。

1.)如果在processes中運作的序列(process r)是連續的大于在系統中的cpu的個數表示系統現在運作比較慢,有多數的程序等待cpu。

2.)如果r的輸出數大于系統中可用cpu個數的4倍的話,則系統面臨着cpu短缺的問題,或者是cpu的速率過低,系統中有多數的程序在等待cpu,造成系統中程序運作過慢。

3.)如果空閑時間(cpu id)持續為0并且系統時間(cpu sy)是使用者時間的兩倍(cpu us)系統則面臨着cpu資源的短缺。

解決辦法:

當發生以上問題的時候請先調整應用程式對cpu的占用情況.使得應用程式能夠更有效的使用cpu.同時可以考慮增加更多的cpu. 關于cpu的使用情況還可以結合mpstat, ps aux top prstat –a等等一些相應的指令來綜合考慮關于具體的cpu的使用情況,和那些程序在占用大量的cpu時間.一般情況下，應用程式的問題會比較大一些.比如一些sql語句不合理等等都會造成這樣的現象.

記憶體問題現象:

記憶體的瓶頸是由scan rate (sr)來決定的.scan rate是通過每秒的始終算法來進行頁掃描的.如果scan rate(sr)連續的大于每秒200頁則表示可能存在記憶體缺陷.同樣的如果page項中的pi和po這兩欄表示每秒頁面的調入的頁數和每秒調出的頁數.如果該值經常為非零值,也有可能存在記憶體的瓶頸,當然,如果個别的時候不為0的話,屬于正常的頁面排程這個是虛拟記憶體的主要原理.

解決辦法:

1.調節applications & servers使得對記憶體和cache的使用更加有效.

2.增加系統的記憶體.

3. implement priority paging in s in pre solaris 8 versions by adding line "set priority paging=1" in /etc/system. remove this line if upgrading from solaris 7 to 8 & retaining old /etc/system file.

關于記憶體的使用情況還可以結ps aux top prstat –a等等一些相應的指令來綜合考慮關于具體的記憶體的使用情況,和那些程序在占用大量的記憶體.一般情況下，如果記憶體的占用率比較高,但是,cpu的占用很低的時候,可以考慮是有很多的應用程式占用了記憶體沒有釋放,但是,并沒有占用cpu時間,可以考慮應用程式,對于未占用cpu時間和一些背景的程式,釋放記憶體的占用。

Linux vmstat指令詳解

繼續閱讀

修改or隐藏nginx版本号

Nginx安全改動：隐藏Nginx版本号背景解決serve_tokens指令參考

版本号隐藏

Nginx服務優化（版本隐藏、版本号僞裝、逾時管理、程序管理、日志分割）Nginx服務優化未完待續

httpd服務的部署、啟動、配置和簡單優化一、部署二、啟動三、配置檔案

配置網頁内容通路

手動安裝Intel network I217-LM網卡的Linux驅動

禁止ubuntu系統彈出報錯界面

nginx location中斜線的位置的重要性

Ubuntu Linux下Apache的配置檔案

neo4j之cypher使用文檔

samba伺服器的功能

sqlServer根據經緯查距離

【Linux】UDP廣播封包接收速率問題

Linux裝置模型（中）之上層容器

PowerPC平台 Linux移植三