天天看點

CIO:雲計算資料中心運維管理要點

雲計算運維管理的要點雲計算在運維管理中其所涵蓋的範圍非常廣泛,其中主要包括了對環境管理、網絡管理、軟體管理、裝置管理、日常操作管理、使用者密碼管理以及員工管理等多個方面。要良好實作以上的管理目标,則應着重從雲計算運維管理中的運作監控、安全性管理和自動化處理這三個要點出發。

運作監控

雲計算的運維管理應從資料中心的日常監控人手,對日常維護管理、事件管理、變更管理以及應急預案管理等進行全方位的日常監控,以提前發現問題并消除隐患。通過對雲計算良好的運作監控,進而實作對各個系統服務的統一管理,以及對各服務作業系統應用程式資訊的統一收集,并實作對各層面資訊的綜合分析、歸納和總結。而且通過有效的運作監控,在系統出現問題時能及時的向系統管理者預警,進而提前解決問題,有效避免了因系統故障而導緻企業蒙受經濟和信譽上的損失。

it規範化

主要是指通過對企業it的規範化,進而有效實作對企業it資産的管理,包括了對企業重要檔案資料的跟蹤與審計、對可能出現洩密或病毒蔓延的媒體與裝置進行有效控制、對用戶端安全分級管理、恢複性操作以及非法軟體的禁用等等。通過實作it規範化,有效解決了因雲服務所引發的安全問題,并且強化了服務中營運管理與安全技術保障,增強了企業和使用者對使用雲服務的信心。

自動化處理

随着目前it建設的不斷深入,以及雲計算能力和規模的擴大,雲計算運維管理的難度與複雜度也日益增加,如果隻是依靠人工的運維管理将無法滿足目前企業的發展需求。這些新特性都對it管理的自動化能力提出了更高的要求,企業需要更高程度自動化處理來以此實作運維管理的專業化、流程化與标準化。自動化管理已然成為了目前雲計算運維管理的一個必然發展趨勢。

為促進目前雲計算運維管理的優化與改進,應從打造一體化的的運維管理模式,并将業務導向放在首位,進而有效實作完善、成熟的it運維服務體系的建構。

一體化的管理模式

一體化是指雲計算的資料中心運維管理,是資料中心生命周期中最後一個也是曆時最長的一個階段,從前期應用架構設計、軟硬體資源配置評估、應用服務性能瓶頸評估到安全防護和系統優化等工作,都需運維人員全程參與。是以在對雲計算運維管理的改進中,應從日常監控、周期巡檢、服務受理、故障處理、平台維護、配置管理、安全管理等方面着手,利用自動化運維工具,實作對實體資源、虛拟資源的統一管理,提供資源管理、統計、監控、排程、服務管控等端到端的綜合管理能力,進而實作對雲資料中心統一、便捷、高效、智能的一體化運維管理。

将業務導向放在首位

運作維護服務能力的四個關鍵要素分别是:人員、資源、技術和過程。每個要素通過關鍵名額反映運作維護服務的條件和能力。将業務導向放在首位,就是對人員、資源、技術和過程這四個關鍵要素的提升。進而有效實作雲計算運維管理的改進。首先,應通過現代化與自動化的運維工具完成系統預備、配置管理以及監控報警等功能,降低故障發生率,提升故障發生後的響應處理效率,實作企業業務的快速恢複;其次,應做好在運維管理中新業務的快速部署、系統容量的平滑擴容以及資源配置設定等各個方面的業務項目,進而保證服務達到相應的等級标準,并能根據業務目标形成iri‘服務的管理目标;最後,還應當通過改進運作維護服務能力與管理過程中的不足,以持續提升運作維護服務能力。

理清雲計算資料中心的運維對象

資料中心的運維管理指的是與資料中心資訊服務相關的管理工作的總稱。雲計算資料中心運維對象一般可分成5大類:

①機房環境基礎設施

②資料中心所應用的各種裝置

③系統與資料

④管理工具

⑤人員管理

定義各運維對象的運維内容

雲計算資料中心資源管理所涵蓋的範圍很廣,包括環境管理、網絡管理、裝置管理、軟體管理、存儲媒體管理、防病毒管理、應用管理、日常操作管理、使用者密碼管理和員工管理等。這就需要對每一個管理對象的日常維護工作内容有一個明确的定義,定義操作内容、維護頻度、對應的責任人,要做到有章可循,責任人可追蹤。實作對整個系統全生命周期地追蹤管理。

資訊化的運維管理平台系統和it服務管理系統

雲計算資料中心的運維管理應從資料中心的日常監控入手,事件管理、變更管理、應急預案管理和日常維護管理等方面全方位地進行資料中心的日常監控。實作提前發現問題、消除隐患,首先要有完整的、全方位實時有效的監控系統,并着重監控資料的記錄和技術分析。

資料中心的業務可以概括為:通過運作系統來向客戶提供服務。沒有資訊系統的支撐來運作it系統就如超市裡仍然采用手工結賬一樣不能讓顧客滿意。資訊化的資料中心運維管理平台系統包括如下方面:

①機房環境基礎設施監控管理系統;

②it系統監控管理系統;

③it服務管理系統。

定制化管理

靈活性、個性化是雲服務的顯着特征,使用者對應用系統有着千差萬别的個性化需求,雲服務提供商在保證共性需求的基礎上,還要滿足使用者個性化的定制需求,向使用者提供靈活和個性化配置的雲服務系統。雲服務提供商要提供按需變化的服務,就要有反應靈活的人員、流程和工具,來适應業務變化的需要。雲服務下的運維需要更多的靈活性和可伸縮性,可以根據客戶與合作夥伴的需要,快速調整資源、服務和基礎設施。

自動化管理

it服務根據負載變化的情況可以自動調整所需的資源,以求在及時響應和節約成本上取得平衡。同時,還考慮到計算能力和規模會越來越大,人工管理資源也會越來越複雜。這些新特性對it管理自動化能力提出了更高的要求。企業往往希望在不失靈活性的前提下,可以得到更高程度的自動化。為此,雲計算資料中心需要部署自動化管理平台,集中管理虛拟化和雲計算平台,并提供自定義規則,以定制功能的自動化解決方案,使用者通過使用事件觸發、資料監控觸發等方式來自動化管理,不但節約了人力,同時也提高了響應速度。

安全性管理

由于提供服務的系統和資料有可能被轉移到使用者可掌控的範圍之外,雲服務的資料安全、隐私保護就成為了使用者對雲服務最為擔憂的方面。雲服務引發的安全問題除了包括傳統網絡與資訊安全問題(如系統防護、資料加密、使用者通路控制、dos攻擊等)問題外,還包括由集中服務模式所引發的安全問題以及雲計算技術引入的安全問題。例如防虛機隔離、多租戶資料隔離、殘餘資料擦除以及多saas(softwareasaservice)應用統一身份認證等問題。要解決雲服務引發的安全問題,雲服務提供商需要提升使用者安全認知、強化服務營運管理和加強安全技術保障等。需要加強使用者對不同重要性資料遷移的認知,并在服務合同中強化使用者自身的服務帳号保密意識,這可以提升使用者對安全的認知。在服務管理方面,要嚴格設定關鍵系統的分級分權管理權限并輔之以相應規章制度,同時加強對合作供應商的資格審查與保密教育。加強安全技術保障,以充分利用網絡安全、資料加密、身份認證等技術,消除使用者對雲服務使用的安全擔憂,增強使用者使用雲服務的信心。

流程管理

流程是資料中心運維管理品質的保證。作為客戶服務的實體載體,資料中心存在的目的就是要保證服務可以按質、按量地提供符合使用者要求的服務。為確定最終提供給使用者的服務是符合服務合同的要求,資料中心需要把現在的管理工作抽象成不同的管理流程,并把流程之間的關系、流程的角色、流程的觸發點和流程的輸入與輸出等進行詳細定義。通過這種流程的建立,一方面可以使資料中心的人員能夠對工作有一個統一的認識,更重要的是通過這些服務工作的流程化,使得整個服務提供過程可被監控和管理,以形成真正意義上的“it”。服務資料中心建立的管理流程,除應滿足資料中心自身特點外,還應能兼顧使用者、管理者和服務商與審計機構的需求。由于每個資料中心的實際運維情況與管理目标存在差異,資料中心需要建立的流程也會有所不同。

應急預案管理

應急預案是為確定發生故障事件後,盡快消除緊急事件的不良影響,恢複業務的持續營運而制定的應急處理措施。應急預案的注意事項:

①根據業務影響分析的結果及故障場景的特點編寫應急預案,以確定當緊急事件發生後可維持業務繼續運作,在重要業務流程中斷或發生故障後,在規定時間内,要及時恢複業務運作。

②應急預案除包括特定場景出現後,各部門和第三方的責任與職責外,還應評估複原可接受的總時間。

③應急預案必須經過演練,使相關責任人熟悉應急預案的内容。應急預案應是一個閉環管理系統。從預案的建立、演練、評估到修訂應是一個全過程的管理,絕不能為了應付某個演練工作,制定後就束之高閣了。而是應該在實際演練和問題發生時不斷地總結和完善。

隻有運維管理好一個資料中心,才能充分發揮資料中心的作用,使之能更好地為雲計算提供強大的支援能力。通過有效實施雲計算資料中心運維管理,減少人員工作量的同時,還要提高運維人員的工作素質和效率,保障業務人員的工作效率,提高業務系統運作狀況,進而提高企業整體的管理效益,同時也提高了使用者的滿意度,才能實作雲計算資料中心的價值最大化。

====================================分割線================================

本文轉自d1net(轉載)

繼續閱讀