天天看點

Prometheus之新版node_exporter監控主機設定

  新版node_exporter監控主機對應key與之前版本有所不同,本文介紹新版node_exporter監控主機部分監控公式配置

  環境檢視

  系統版本

Prometheus之新版node_exporter監控主機設定

   軟體版本

# /usr/local/prometheus/prometheus --version
prometheus, version 2.20.0 (branch: HEAD, revision: e5a06b483527d4fe0704b8fa3a2b475b661c526f)
  build user:       root@ac954b6d5c6e
  build date:       20200722-18:51:45
  go version:       go1.14.6
(base) [root@prd-zabbix scripts]# /usr/local/node_exporter/node_exporter --version
node_exporter, version 1.0.1 (branch: HEAD, revision: 3715be6ae899f2a9b9dbfd9c39f3e09a7bd4559f)
  build user:       root@1f76dbbcfa55
  build date:       20200616-12:44:12
  go version:       go1.14.4
(base) [root@prd-zabbix scripts]# grafana-server -v
Version 7.1.1 (commit: 3039f9c3bd, branch: HEAD)
      
Prometheus之新版node_exporter監控主機設定

   CPU使用率

  監控公式

(1-sum(increase(node_cpu_seconds_total{mode="idle"} [1m]) ) by(instance) / sum(increase(node_cpu_seconds_total [1m]) ) by(instance) )*100
      

   公式解釋

Prometheus之新版node_exporter監控主機設定

   圖形展示

Prometheus之新版node_exporter監控主機設定

   記憶體使用率

  公式

(1-((node_memory_Buffers_bytes+ node_memory_Cached_bytes+ node_memory_MemFree_bytes) / node_memory_MemTotal_bytes)) * 100 
      

   公式解釋:(1-Buffer記憶體+空閑記憶體/總記憶體)*100得出記憶體使用率

  圖形展示

Prometheus之新版node_exporter監控主機設定

   網絡IO

rate(node_network_transmit_bytes_total[1m])/1024/1024
      

   公式解釋 :一分鐘内網絡流量除以兩次1024等待M/分鐘流量

Prometheus之新版node_exporter監控主機設定

   磁盤IO

rate(node_disk_read_bytes_total[1m])+rate(node_disk_written_bytes_total[1m]) /1024/1024>0
      

   公式解釋:硬碟讀取流量+硬碟寫流量再除以兩次1024等到磁盤流量/秒

Prometheus之新版node_exporter監控主機設定

   CPU iowait率

(sum(increase(node_cpu_seconds_total{mode="iowait"} [1m]) ) by(instance) / sum(increase(node_cpu_seconds_total[1m]) ) by(instance))*100
      

   公式解釋: iowait時間/總時間 乘以100計算CPU iowait率

Prometheus之新版node_exporter監控主機設定

   磁盤使用率

(node_filesystem_free_bytes/node_filesystem_size_bytes)<0.3
      

   公式解釋:磁盤空閑/磁盤總量 如果小于多少則顯示

Prometheus之新版node_exporter監控主機設定

   TCP等待連結數

increase(count_netstat_wait_connections[5m])