排查這些問題,你還在用指令行查詢伺服器各項名額嗎?曆史快照怎麼拿?想要預警怎麼辦?煩死寶寶啦。
雲監控為阿裡雲使用者提供主機監控功能,一鍵安裝插件後,即可檢視30餘個監控項的監控圖表,設定報警更是天然支援~~也可以安裝在非 ecs 的伺服器上,有沒有很開心~
程序監控預設為您采集最近一段時間内活躍程序消耗的cpu使用率、記憶體使用率,以及程序的檔案打開數。如果您添加了程序關鍵字,還會采集包含關鍵字的程序個數。
如果您查詢的時間範圍内,top5的程序不固定,程序清單中會展示這段時間内全部進入過top5的程序,清單中的時間表示該程序最後一次進入top5的時間。
隻有進入top5 的程序才會采集程序的cpu使用率、記憶體使用率和打開檔案數,是以如果該程序在查詢的時間範圍内未持續進入top5,會出現監控圖中資料點不連續的情況,資料點的密集程度則表明了該程序在伺服器上的活躍程度。
以下為cpu使用率相關監控名額,可參考linux的top指令來了解各項名額含義。
監控項名稱
監控項含義
機關
說明
host.cpu.idle
目前空閑cpu百分比
%
host.cpu.system
目前核心空間占用cpu百分比
指系統上下文切換的消耗,該監控項數值比較高,說明伺服器開了太多的程序或者線程
host.cpu.user
目前使用者空間占用cpu百分比
使用者程序對cpu的消耗
host.cpu.iowait
目前等待io操作的cpu百分比
該項數值比較高說明有很頻繁的io操作
host.cpu.other
其他占用cup百分比
其他消耗,計算方式為(nice + softirq + irq + stolen)的消耗
host.cpu.total
目前消耗的總cpu百分比
指以上各項cpu消耗的總和,通常用于報警
以下為記憶體相關監控項,可參考free指令來了解各項名額含義。
host.mem.total
記憶體總量
bytes
伺服器的記憶體總量
host.mem.used
已用記憶體量
使用者程式使用的記憶體 + buffers + cached,buffers為緩沖區占用的記憶體空間,cached為系統緩存占用的記憶體空間
host.mem.actualused
使用者實際使用的記憶體
計算方法為(used - buffers - cached)
host.mem.free
剩餘記憶體量
計算方法為(記憶體總量-已用記憶體量)
host.mem.freeutilization
剩餘記憶體百分比
計算方法為(剩餘記憶體量/記憶體總量*100%)
host.mem.usedutilization
記憶體使用率
計算方法為( actual used/total*100%)
以下為系統平均負載相關監控項,可參考linux top指令來了解各項名額含義。監控項數值越高代表系統越繁忙。
host.load1
過去1分鐘的系統平均負載,windows作業系統沒有此名額
無
host.load5
過去5分鐘的系統平均負載,windows作業系統沒有此名額
host.load15
過去15分鐘的系統平均負載,windows作業系統沒有此名額
磁盤使用率與inode使用率可參考linux df指令。
磁盤讀寫名額可參考linux iostat指令。
host.diskusage.used
磁盤的已用存儲空間
host.disk.utilization
磁盤使用率
host.diskusage.free
磁盤的剩餘存儲空間
bytes/s
host.diskussage.total
磁盤存儲總量
host.disk.readbytes
磁盤每秒讀取的位元組數
host.disk.writebytes
磁盤每秒寫入的位元組數
host.disk.readiops
磁盤每秒的讀請求數量
次/秒
host.disk.writeiops
磁盤每秒的寫請求數量
host.fs.inode
inode使用率,unix/linux系統内部使用inode号碼來識别檔案,磁盤還未存滿,但inode已經配置設定完時會出現無法在磁盤建立檔案的情況,windows作業系統沒有此名額
inode數量代表檔案系統檔案數量,大量小檔案會導緻inode使用率過高
以下為網絡相關名額,可參考linux iftop。tcp連接配接數的采集,可參考linux ss指令。
tcp連接配接數會預設采集 tcp_total(總連接配接數)、established(正常連接配接狀态),non_established(非連接配接的狀态連接配接數,established以外的所有狀态),如果您需要擷取各個狀态連接配接數的數量,請按如下說明操作:
host.netin.rate
網卡每秒接收的比特數,即網卡的上行帶寬
bits/s
host.netout.rate
網卡每秒發送的比特數,即網卡的下行帶寬
host.netin.packages
網卡每秒接收的資料包數
個/秒
host.netout.packages
網卡每秒發送的資料包數
host.netin.errorpackage
裝置驅動器檢測到的接收錯誤包的數量
host.netout.errorpackages
裝置驅動器檢測到的發送錯誤包的數量
host.tcpconnection
各種狀态下的tcp連接配接數包括listen、syn_sent、established、syn_recv、fin_wait1、close_wait、fin_wait2、last_ack、time_wait、closing、closed
個
程序的cpu使用率、記憶體使用率可參考linux top指令,cpu使用率為多核使用情況。
host.process.openfile 可參考linux lsof指令。
host.process.number 可參考linux ps aux |grep '關鍵字' 指令。
host.process.cpu
某個程序消耗的cpu百分比
host.process.memory
某個程序消耗的記憶體百分比
host.process.openfile
目前程序打開檔案數
host.process.number
指定關鍵字的程序數