監控項 #監控 #算法 #Linux #測試技術 #緩存 #監控項問題 #同步監控 #修改監控項 #雲監控監控項

每秒查詢率QPS是對一個特定的查詢伺服器在規定時間内所處理流量多少的衡量标準。在網際網路上，作為域名系統伺服器的機器的性能經常用每秒查詢率來衡量。

即每秒的響應請求數，也即是最大吞吐能力。

原理：每天80%的通路集中在20%的時間裡，這20%時間叫做峰值時間

公式：( 總PV數 80% ) / ( 每天秒數 20% ) = 峰值時間每秒請求數(QPS)

機器：峰值時間每秒QPS / 單台機器的QPS = 需要的機器

問：每天300w PV 的在單台機器上，這台機器需要多少QPS？

答：( 3000000 0.8 ) / (86400 0.2 ) = 139 (QPS)

問：如果一台機器的QPS是58，需要幾台機器來支援？

答：139 / 58 = 3

壓測：

合理的并發，且保證qps在一定範圍沒有明顯下降。

一、什麼是系統平均負載(Load average)

在Linux系統中，uptime、w、top等指令都會有系統平均負載load average的輸出，那麼什麼是系統平均負載呢？

　　系統平均負載被定義為在特定時間間隔内運作隊列中的平均程序樹。如果一個程序滿足以下條件則其就會位于運作隊列中：

特定時間間隔内運作隊列中的平均程序數

好象還不夠明白：就是程序隊列的長度，有多少個程序在排隊等待運作

(通俗的說，運作隊列中的程序樹正在消耗記憶體和CPU資源，進而能算出消耗資源的比例。）

　　- 它沒有主動進入等待狀态(也就是沒有調用'wait')

　　- 沒有被停止(例如：等待終止)

例如：

（1）# uptime

7:51pm up 2 days, 5:43, 2 users, load average: 8.13, 5.90, 4.94

指令輸出的最後内容表示在過去的1、5、15分鐘内運作隊列中的平均程序數量。

一般來說隻要每個CPU的目前活動程序數不大于3那麼系統的性能就是良好的，如果每個CPU的任務數大于5，那麼就表示這台機器的性能有嚴重問題。對于上面的例子來說，假設系統有兩個CPU，那麼其每個CPU的目前任務數為：8.13/2=4.065。這表示該系統的性能是可以接受的。

（2）# cat /proc/loadavg

0.27 0.36 0.37 4/83 4828/

前三個數字大家都知道，是1、5、15分鐘内的平均程序數（有人認為是系統負荷的百分比，其實不然，有些時候可以看到200甚至更多）。後面兩個呢，一個的分子是正在運作的程序數，分母是程序總數；另一個是最近運作的程序ID号。

（3）# w

功能說明：顯示目前登入系統的使用者資訊。

語　　法：w [-fhlsuV][使用者名稱]

補充說明：執行這項指令可得知目前登入系統的使用者有那些人，以及他們正在執行的程式。單獨執行w

指令會顯示所有的使用者，您也可指定使用者名稱，僅顯示某位使用者的相關資訊。

參　　數：

-f 　開啟或關閉顯示使用者從何處登入系統。

-h 　不顯示各欄位的标題資訊列。

-l 　使用詳細格式清單，此為預設值。

-s 　使用簡潔格式清單，不顯示使用者登入時間，終端機階段作業和程式所耗費的CPU時間。

-u 　忽略執行程式的名稱，以及該程式耗費CPU時間的資訊。

-V 　顯示版本資訊。

（4）# top

功能說明：顯示，管理執行中的程式。

語　　法：top [bciqsS][d <間隔秒數>][n <執行次數>]

補充說明：執行top指令可顯示目前正在系統中執行的程式，并通過它所提供的互動式界面，用熱鍵加以管理。

b 　使用批處理模式。

c 　列出程式時，顯示每個程式的完整指令，包括指令名稱，路徑和參數等相關資訊。

d<間隔秒數> 　設定top監控程式執行狀況的間隔時間，機關以秒計算。

i 　執行top指令時，忽略閑置或是已成為Zombie的程式。

n<執行次數> 　設定監控資訊的更新次數。

q 　持續監控程式執行的狀況。

s 　使用保密模式，消除互動模式下的潛在危機。

S 　使用累計模式，其效果類似ps指令的"-S"參數。

第一行：

10:01:23 — 目前系統時間

126 days, 14:29 — 系統已經運作了126天14小時29分鐘（在這期間沒有重新開機過）

2 users — 目前有2個使用者登入系統

load average: 1.15, 1.42, 1.44 — load average後面的三個數分别是1分鐘、5分鐘、15分鐘的負載情況。

load average資料是每隔5秒鐘檢查一次活躍的程序數，然後按特定算法計算出的數值。如果這個數除以邏輯CPU的數量，結果高于5的時候就表明系統在超負荷運轉了。

第二行：

Tasks — 任務（程序），系統現在共有183個程序，其中處于運作中的有1個，182個在休眠（sleep），stoped狀态的有0個，zombie狀态（僵屍）的有0個。

第三行：cpu狀态

6.7% us — 使用者空間占用CPU的百分比。

0.4% sy — 核心空間占用CPU的百分比。

0.0% ni — 改變過優先級的程序占用CPU的百分比

92.9% id — 空閑CPU百分比

0.0% wa — IO等待占用CPU的百分比

0.0% hi — 硬中斷（Hardware IRQ）占用CPU的百分比

0.0% si — 軟中斷（Software Interrupts）占用CPU的百分比

第四行：記憶體狀态

8306544k total — 實體記憶體總量（8GB）

7775876k used — 使用中的記憶體總量（7.7GB）

530668k free — 空閑記憶體總量（530M）

79236k buffers — 緩存的記憶體量（79M）

第五行：swap交換分區

2031608k total — 交換區總量（2GB）

2556k used — 使用的交換區總量（2.5M）

2029052k free — 空閑交換區總量（2GB）

4231276k cached — 緩沖的交換區總量（4GB）

第七行以下：各程序（任務）的狀态監控

PID — 程序id

USER — 程序所有者

PR — 程序優先級

NI — nice值。負值表示高優先級，正值表示低優先級

VIRT — 程序使用的虛拟記憶體總量，機關kb。VIRT=SWAP+RES

RES — 程序使用的、未被換出的實體記憶體大小，機關kb。RES=CODE+DATA

SHR — 共享記憶體大小，機關kb

S — 程序狀态。D=不可中斷的睡眠狀态 R=運作 S=睡眠 T=跟蹤/停止 Z=僵屍程序

%CPU — 上次更新到現在的CPU時間占用百分比

%MEM — 程序使用的實體記憶體百分比

TIME+ — 程序使用的CPU時間總計，機關1/100秒

COMMAND — 程序名稱（指令名/指令行）

多U多核CPU監控

在top基本視圖中，按鍵盤數字“1”，可監控每個邏輯CPU的狀況：

本文轉自周新宇1991 51CTO部落格，原文連結：http://blog.51cto.com/zhouxinyu1991/2045605，如需轉載請自行聯系原作者

監控項

繼續閱讀

Ubuntu14.04 LTS下安裝mongodb

筆試面試題目：滑動視窗(二)

httpd服務的部署、啟動、配置和簡單優化一、部署二、啟動三、配置檔案

配置網頁内容通路

手動安裝Intel network I217-LM網卡的Linux驅動

禁止ubuntu系統彈出報錯界面

資料結構與算法（27）——排序（二）

Ubuntu Linux下Apache的配置檔案

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

samba伺服器的功能

【Linux】UDP廣播封包接收速率問題

Linux裝置模型（中）之上層容器

PowerPC平台 Linux移植三

hdu7108哈希