天天看點

某營運商省公司資料中心智能運維解決方案

作者:豪越科技有限公司

随着營運商業務發展,業務支撐網絡和業務系統越來越複雜。網絡線路、網絡裝置、雲資源等基礎設施的不斷增加,使得整個網絡結構變得非常龐大且複雜;同時随着業務系統的增加,業務場景越來越多,業務複雜度也越來越高。 在傳統運維管理手段下,對于多段網絡、多層架構的應用,在問題發生時,分析定位、排障的速度相對較慢。表現如下:

  • 業務系統衆多、網絡結構複雜,發生問題時定位困難,無法快速排查故障所在。無法實作實時監控、集中監控、集中維護以及集中管理。
  • 運維監控産品能力參差不齊、運維資料分散,分析問題故障時無法形成有效關聯。
  • 運維部門多、運維工作細化、KPI考核細緻,導緻部門之間壁壘明顯。
  • 日常運維通過人工形式巡檢,手工運維和零散工具導緻工具量居高不下,缺乏靈活定制和使用的能力,對運維人員經驗依賴較重,且營運維護成本極高。
某營運商省公司資料中心智能運維解決方案

核心需求

某營運商需要定制一套集中的智能運維管理系統,對業務系統中的所有設施進行統一監控和管理,包括網絡裝置、伺服器、資料庫、中間件、分流裝置、交換機、存儲、應用等,且保證資訊傳輸的安全及保密性。該客戶了解到豪越科技有限公司在大規模資料中心運維管理方面具備很強的實戰經驗,曾為國務院參事室、國資委等政府機關機關提供一體化智能運維平台及IT內建服務,對豪越科技的技術實力十分認可。具體需求如下:

統一監控。所有的伺服器、網絡裝置、軟體系統在同一界面中統一監控。

集中管理。需要管理的裝置分散在各省公司的機房中,網管伺服器無法直接通路各省裝置,總部資料中心機房要監控到其他機房的裝置運作情況。

自動巡檢,故障預警。可檢視裝置的運作狀态,實時告警轉發,對告警提示進行鍊路分析,排除故障,符合營運商要求的格式。

識别裝置。系統需實作不同裝置類型的自動搜尋及發現,檢視裝置的資源資訊,生成傳輸網絡裝置的拓撲結構。

多級分權限管理,提供對于管理者/作業系統通路的安全措施,不同級别的管理者有不同的權限。

資料管理。應支援傳輸綜合網管性能資料的采集,生成報表,曆史性能資料的管理。

解決方案

豪越科技智能運維解決方案按照統一、靈活和智能的運維思路,通過對網絡、基礎設施、中間件、存儲、應用等性能資料及日志的彙聚治理,結合業務名額體系,智能分析、名額異常檢測、日志追蹤等技術,充分發揮一體化平台在資料整合、治理、分析方面的優勢,從業務、元件、資源、網絡、日志等層面對使用者體驗劣化、問題故障等進行實時分析、快速分析,提升整體運維效率,保障業務連續性。針對營運商運維管理的需求,豪越科技提出以下解決方案:

01資料彙聚

豪越智能運維大資料管理平台通過标準化通訊協定、采集及API等多種手段,對營運商運維監控的相關對象的監控資料、名額資料和配置資料等進行彙聚,有效解決運維資料離散問題。

02智能分析

通過智能分析引擎中的資料分析、資料模組化、模式識别等人工智能技術,基于曆史運維大資料進行資料分析、模型訓練,進而滿足對實時線上運維資料的關聯分析、定位分析等。

03故障管理

具備自動的故障監控功能,能從衆多的事件和狀态中,系統将零散的狀态資訊,總結成為目前工作狀态,并産生告警,可以用聲音、郵件、短信及時提醒運維管理人員。

04名額管理

通過營運商基礎設施、網絡、中間件、應用等性能資料進行梳理分析,對運維名額進行分層,形成有效的IT監控名額分層管理體系。

05統一管理

智能運維平台采用裝置統一模型,可以統一管理伺服器、資料庫、分流裝置、交換機等各種裝置類型。

06分級權限管理

系統通過定義個人通路權限的方式,提供對于管理者/作業系統通路的安全措施,不同級别的管理者有不同的權限。接口應有通路權限控制,保證廠商運維系統與傳輸綜合網管之間的管理資訊不被無權限地通路。

07運維支撐

實作從業務角度出發,分析各類監控名額情況,通過事件中心提供包含故障定位、故障解決方案維護、操作定義、故障一鍵恢複等核心功能;告警中心包含告警等級定義、告警通知、告警政策、告警更新、事件管理等重要功能,實作一站式的異常發現、定位及跟蹤。

08統計報表

具有強大的報表管理功能,能夠生成實時的基于任意起止時間段的曆史報表,報表包括實時性能/故障報表、趨勢報表、統計報表等多種類型,以及曲線圖、柱狀圖、面積圖、餅圖等多種表現形式。對于統計的圖表均支援導出和列印功能以便備份和對比檢視。

方案價值

某營運商省公司資料中心智能運維解決方案

// 有效整合營運商業務、應用、元件、網絡、基礎資源等多方運維資料,打造運維資料服務化能力。

// 通過人工智能技術,對告警進行智能壓縮合并,有效避免無效告警資訊,提升運維排障效率。

// 智能故障根因定位,快速響應,大大縮短排障時間,提升問題處理效率,保障業務連續性。

// 提供分層級管理視圖,IT資源和網絡線路的統計分析資料,上司可以從全局對IT資源使用進行把控。

// 資料關聯分析,打造場景化運維能力,靈活擴充運維場景,減少人員經驗依賴,降低運維人力成本。

// 提供标準運維服務能力,在助力内部業務系統運維支撐的同時,通過靈活定制,賦能外部服務對象。

繼續閱讀