開發者學堂課程【運維監控系統第一課時:運維監控系統建設】學習筆記,與課程緊密聯系,讓使用者快速學習知識。
課程位址:
https://developer.aliyun.com/learning/course/805/detail/13879運維監控系統建設
内容簡介:
一.運維監控系統簡介
二.對運維監控系統的設計目标
三.運維監控系統流程
l 監控系統就是一套解決應用、服務或系統故障發現、故障預警、故障定位,運作狀态展示等多種功能融合一體的一個解決文案。也可以稱之為一套系統。
l 監控系統是整個運維環節,乃至整個産品生命周期中最重要的一環,事前及時預警發現故障,事後提供翔實的資料用于追查定位問題。
l 監控系統的核心是資料的采集和處理。
分類
l 應用性能監控(Application Performance Monitoring)
l 業務交易監控(Business Transaction Monitoring)
l 網絡性能監控(Network Monitoring)
l 作業系統監控(System Monitoring)
l 網絡站點監控(Website Monitoring)
二.對運維監控系統的設計目标
l 對系統、服務或平台的運作狀态實行實時不間斷監控
l 不間斷實時反應系統、服務或平台的運作狀态資訊
l 提前預知可能存在的故障風險
l 實作故障預警報警功能通過監控資料快速定位故障原因最終保證系統持續、穩定、安全運作
l 狀态資料可視化與統計、導出、歸檔(曆史資料可追溯)
三.運維監控系統流程

工作原理:監控系統一般可以分為兩部分:資料采集部分和資料展示部分。資料展示部分還承擔了資料告警等職責。
資料采集協定:根據面臨的場景不同,監控系統往往支援不同的資料采集協定。私有協定:監控系統自研的用戶端,采用私有協定采集資料;公開協定:常見的協定包括SNMP、IPMI、SSH、Telnet 等協定。
營運監控系統的采集模式
l 主動采集模式: Push模式,用戶端主動上報資料到伺服器端
l 被動采集模式: Pull 模式,從伺服器端到用戶端采集資料
結論:被動模式對監控控制端伺服器的開銷較大,适合小規模的監控環境;主動模式對監控控制端伺服器的開銷較小,适合大規模的監控環境。
運維監控系統的代理架構
l 對于結構筒単的系統,可以采用筒単的Client/ Server模式迸行監控.
l 對于複雜的系統,需要在Client/ Server中向加入Proxy,對資料進行簡單的處理.
常見開源監控解決方案