運維伴随資訊技術的發展而生,經曆了從手工管理到工具化運維,發展至平台化運維,最終實作自動化、智能化運維的四個階段。
圖一:運維發展階段及特點
在資訊化發展初期,業務流量不大,伺服器數量相對較少,系統複雜度不高。此階段缺少運維工具和操作流程、标準,運維工作的開展主要依賴于個人知識、技術及經驗的積累。
随着伺服器規模、系統複雜度的增加,全人工的操作方式已經不能滿足業務的快速發展需要。此時運維進入工具化階段,在此階段運維流程、标準等開始建立,運維人員逐漸開始使用工具進行管理,針對不同運維操作出現了不同的腳本程式。
在第三個階段,網絡架構異構,運維需求疊代頻繁、快速,同時對于運維效率和誤操作率有了更高的要求,使用者開始建立運維平台,進入平台運維階段,此時,手工執行腳本逐漸轉化為平台化操作,運維資料更加可視,運維實作跨團隊線上協作,運維效率、品質有了極大提升。
在業務逐漸龐大、海量資料不斷積累的階段,随着AI技術的逐漸成熟,運維逐漸步入智能運維(AIOps)階段,目前大多數使用者和運維廠商都處于實踐初期,基本實作單一場景智能化、自動化處理,并向機器決策、無人值守運維模式探索。
以大資料為支撐,保障運維數字化轉型
随着人工智能技術的不斷深入,人的角色主動性不斷提高,對資料和平台的掌控能力不斷增強。在采集到原始資料後,通過大資料分析可視化,進行辨別、編排、模型預訓練,将結構化的知識抽取,最終将專家的知識經驗衍生為可重複應用的知識體系,進而固化到平台中,進而顯示運維平台的自動化和智能化更新。
圖二:北京智和信通自動化運維平台架構
作為逐漸進入智能化運維階段的自主研發運維工具企業,北京智和信通技術有限公司重點關注“萬物互聯”理念,在傳統運維的基礎上,以更具智能化、更具安全性為研發方向,形成全棧式立體運維監控産品體系。融合人工智能、大資料、物聯網等技術,提取靜态資料(曆史資料)和動态資料(實時、流式傳輸資料),通過資料采集、資料存儲、資料治理,聚合有效資料,配合自動化程式,逐漸實作無人值守的運維響應。
以AI智能為武器,實作“真自動化”運維
近些年,運維更關注使用者體驗,重視響應時間、可用率等性能名額,在對基礎設施、資料庫、中間件、存儲、物聯網等裝置進行運維監控時,需求更具擴充能力、子產品化、可分布式部署的産品與解決方案,在故障發生時第一時間定位問題,快速進行根因分析。
北京智和信通自動化運維解決方案以萬物場景為基礎,以建構持續發展、萬物感覺的智能安全運維為目标,将網絡拓撲、監控、安管、資産、資料分析、可視化展示、日志分析、工單、流量監測等核心産品以“積木式”的開發方式進行結合,在實際應用中根據使用者的需求場景靈活組合,實作“真自動化”運維。
萬物管控的基礎監控采集能力
以提供全方位網絡監控功能,全面管理聯網裝置為目标,深入使用者需求,實作個性化網絡監控解決方案。實作全棧不同類型、不同品牌、不同型号的IT設施統一監控。可無限新增裝置監測名額。從應用系統、網絡裝置、存儲、資料庫、中間件到應用、動環,全面監管。
複雜網絡直覺展示的拓撲可視能力
自動生成拓撲圖,支援實體網絡拓撲和邏輯網絡拓撲,通過平面或立體的展示方式,直覺展示網絡中各裝置、接口間連接配接關系。整體網絡結構透明可視。
網絡全流量資料分析展示
基于網絡流量分析技術,采集、分析、存儲所有網絡流量,通過回溯分析資料包特征、異常網絡行為,以多元資料分析和深度挖掘為手段,實作資料包層面的流量追蹤,發現潛伏于網絡中的未知攻擊。
平台級可視化運維編排能力
提供可視化編排工具,支援以拖拽的方式快速簡單地完成作業流程的配置,将複雜的運維工作和任務轉變為一緻的,可複用的、可度量和有效的工作流,實作自動化運維。
故障實時預警,快速自愈
以網絡故障監控、裝置性能監測為基礎,結合網絡流量偵測功能,動态發現網絡故障。智能判斷告警類型及級别,自動觸發預設的故障解決流程,複雜告警指派工單專人處理,正常告警觸發安全政策全自動處理。
規範化、自動化安全編排
以安全裝置分析和異常告警安全事件為輸入,通過編排和執行安全作業流程的方式,将裝置安全事件的處理及内部事件管理流程進行結合,完成原來需要多人多系統多界面線上協同才能處置的安全事件,降低人員依賴,保障應急處置品質。
周期性作業排程自動執行
将周期性、重複性的批處理作業,如巡檢、應用部署等,固化為自動化作業流程,通過配置時間規則,在指定時間進行排程。進而實作周期性工作的自動化,僅需關注相應的作業執行過程、執行成功與否以及執行結果,規範大多數周期性運維操作。
深入裝置底層的控制和調配能力
深入裝置、資源、協定層面實作深度管控,基于多種協定進行統一安全管控、裝置控制規範配置。支援周期性、批量裝置控制政策執行,将繁複的裝置運維工作轉化為自動執行的管理政策,全面解放人力。
海量異構資料聚合分析呈現能力
提供可視化資料分析能力,對網絡海量資料進行圖形化分析展示。通過直覺的圖表和圖形化手段清晰有效地将運維資料分析結果進行傳達,幫助使用者由宏觀到微觀更快地了解網絡運維現狀,做出更具時效性的決策。
運維工單高效協同流轉
結合使用者需求實作定制化運維工單,通過自動觸發與使用者報修等方式快速響應運維事件,解決突發故障和請求,實作整個運維流程規範化、标準化,運維協同高效透明,運維結果可查可控。
資産全生命周期監管
通過資産實物與運維資料庫的一一對應,為使用者提供更加便捷高效資産生命周期管理,資産跟蹤、維護和統計分析。動态監測已納入監控的資産運作狀态,并對資産運作情況進行分析,通過狀态資料采集分析,預估資産将面臨的風險,驅動資産維護保養。
以二次開發平台為基座,支撐差異化靈活部署
基于子產品化的搭建形式,充分利用軟體已有功能,提供多種開發模式和可拓展的架構子產品供使用者選擇。在通用功能的基礎上,開發人員選擇API或代碼的開發形式,以便在最短的時間内滿足使用者各種定制需求,提高研發效率。
平台内置6種開發模式,超50種開發元件,真正做到代碼級開放,滿足各類運維場景的差異化需求。
結語
縱觀運維的發展,企業和使用者都希望運維工作高自動化起、智能化,實作基礎資源合理利用,業務環節高效監控,異常自動分析處置,減少人的重複勞動,降低知識傳遞和儲存的成本,運維傳遞更加高效、更加安全。