監控
1,識别監控對象
2,了解監控對象
3,細分監控對象的名額
4,确定告警的基準線
預中級
1,工具化和監控分離
2,監控對象分離
2.1 硬體監控(方法:機房巡檢,IPMI,SNMP)
2.2 系統監控(對象:CPU,記憶體,IO[磁盤,網絡])
2.3 服務監控(對象:各類服務[Nginx|Tomcat|RabbitMQ|OpenStack|MySQL|*])
2.4 日志監控(方法:ELK)
2.5 網絡監控(方法:第三方,Smokeping)
2.6 APM應用性能管理(工具:聽雲 PINPoint)
2.7流量監控(工具:Piwik)
2.8其他監控(安全監控,業務監控,輿論監控)
3,掌握一個監控工具。例如Zabbix
中級
1,标準化監控(标準化的腳步,模闆)
2,分布式監控(主動,被動,分布式)
3,自動化監控(自動發現,主動注冊[Agent主動注冊,Server主動添加(API)])
4,性能優化(資料采集,資料存儲,資料查詢)
5,二次開發(定制的報表,api調用)
進階
1,動态告警
2,智能告警: 告警去重 依賴
3,故障自愈(事件驅動,主動控制)
4,大規模
硬體監控
1,機房巡檢
2,通過網絡巡檢
Dell iDRAC
HP ILO
IBM IMM
系統監控
CPU
程序:每一個程序,至少有一個線程。每個程序可以有多個線程
監控CPU指令
yum -y install sysstat
vmstat 1 10
mpstat 1 10
cat /proc/loadavg
lscpu
記憶體
IO
yum -t install iotop
網絡IO
iftop
制定網卡檢視
iftop -i eth0
檢視程序占用的流量
nethogs
網絡監控
ping檢測 http://ping.chinaz.com/
工具 SmokePing