天天看點

運維監控理論

  監控

  1,識别監控對象

  2,了解監控對象

  3,細分監控對象的名額

  4,确定告警的基準線 

  預中級

  1,工具化和監控分離

  2,監控對象分離

    2.1 硬體監控(方法:機房巡檢,IPMI,SNMP)

    2.2 系統監控(對象:CPU,記憶體,IO[磁盤,網絡])

    2.3 服務監控(對象:各類服務[Nginx|Tomcat|RabbitMQ|OpenStack|MySQL|*])

    2.4 日志監控(方法:ELK)

    2.5 網絡監控(方法:第三方,Smokeping)

    2.6 APM應用性能管理(工具:聽雲 PINPoint)

    2.7流量監控(工具:Piwik)

    2.8其他監控(安全監控,業務監控,輿論監控)

  3,掌握一個監控工具。例如Zabbix  

  中級

  1,标準化監控(标準化的腳步,模闆)

  2,分布式監控(主動,被動,分布式)

  3,自動化監控(自動發現,主動注冊[Agent主動注冊,Server主動添加(API)])

  4,性能優化(資料采集,資料存儲,資料查詢)

  5,二次開發(定制的報表,api調用)

  進階

  1,動态告警

  2,智能告警: 告警去重  依賴

  3,故障自愈(事件驅動,主動控制)

  4,大規模

  硬體監控

  1,機房巡檢

  2,通過網絡巡檢

  Dell iDRAC

  HP ILO

  IBM IMM

  系統監控

  CPU

    程序:每一個程序,至少有一個線程。每個程序可以有多個線程  

    監控CPU指令

yum -y install sysstat
vmstat 1 10
mpstat 1 10 
cat /proc/loadavg 
lscpu
      

  

  記憶體

  IO

yum -t install iotop
      

    

  網絡IO

  iftop

  制定網卡檢視

iftop -i eth0
      

  檢視程序占用的流量

nethogs
      

  網絡監控

  ping檢測 http://ping.chinaz.com/

  工具 SmokePing

繼續閱讀