天天看點

IT體系結構和IT業務的技術發展是運維發展的原動力和推手

  IT體系結構和IT業務的技術發展是運維發展的原動力和推手,所IT業務的開發總是比IT技術的發展戰略落後。在IT領域,SDN、雲計算、大資料等技術不斷湧現IT資源體系結構日益複雜,IT資源規模日益增大,運作的複雜性和難度日益增大,IT可維護性越來越受到人們的關注,而首輪施工後IT可運維性問題也逐漸成為IT管理人員不斷關注的焦點。

IT體系結構和IT業務的技術發展是運維發展的原動力和推手

  從早到晚的純手工運維,到後來依賴于網管工具報告工具化運維為主的工具化運維,與工具相關聯或融合的平台運維,以及目前流行的智能和自動化運維系統,使運維領域在技術上不斷發生變化。開發新工具并不意味着完全消除舊工具,而是使用不同的工具來解決實際的運維問題。新工具進一步解放了運作運維的效率。

  雲計算時代,如何選擇合适的運維模式,選擇合适的運維工具,建立合理的組織結構和管理體系,這些都是IT管理者們必須重新思考的問題。

企業如何進行自我定位

  說到運維和維護,人們往往隻考慮技術本身,而忽視場景的差異,簡單地追求技術領先和上層建築,往往事半功倍,不容易達到預期的效果。其實不同的運維場景在實際運維上差别很大,一味求新、求快,并不一定能取得好的運維效果。通過多年對運維領域的了解,我總結了影響運維工具選擇的行業屬性、成熟度屬性、規模屬性和位置屬性等以下屬性.

IT體系結構和IT業務的技術發展是運維發展的原動力和推手

行業

  先說行業屬性,不同行業由于業務特征不同,其所關注的内容和運作模式也大相徑庭。就拿網際網路來說,網際網路的釋出速度快,更新快,伺服器數量多,研究開發能力強,通常一周内會有數個甚至數十個新業務釋出,同時也會有數十個新的釋出。在ITIL基礎上開發的變更與釋出流程雖然考慮周全、過程嚴謹,但節奏緩慢、周期長。在網際網路業務快速更疊的行業背景下,傳統的變更釋出流程已使網際網路企業失去了産品的市場機會視窗,是以網際網路運應會選擇諸如自動化和自我維護等高效的運維模式,要做自動化就必須建立精确的CMDB,為了提高效率必須追求靈活開發,DevOps、灰色版本和開源模式。那麼網際網路運維模式主要關注的是運維效率

運維成熟度數

  各個行業受各自業務特點的影響,其運維模式、關注點和工具選擇各不相同,同時影響運維工具選擇的是運維成熟度。運維成熟度也是制約企業運維發展的關鍵因素。ITIL的核心方法是PDCA,這一方法向我們闡明了運作的一個簡單原則是逐漸、螺旋上升的模式。運維成熟度的高低,決定着運維所處的不同階段,也決定了不同時期使用者應關注的内容。在運維過程中選擇脫離實際情況的激進做法往往隻能起到拔苗助長的作用,最後又推倒重來,反而得不償失。許多使用者以前都沒有注意這一客觀規律,在沒有做好監測的情況下,就同時建構了運作流程,進而導緻運維過程與監控脫節,流程對運維管理者的幫助非常有限,淪為走單工具。另外一種常犯的錯誤是在CMDB的建構中過分追求完美,沒有與現有的監控功能相結合,由于沒有采用自動化方法來簡化CMDB的維護工作,相反,過度追求CMDB設計中的精細化,以緻CMDB的維護費用很高,甚至超過了實際使用價值,導緻CMDB項目最終走向破産。

IT體系結構和IT業務的技術發展是運維發展的原動力和推手

  運維的另一成熟度是指人員成熟度模型。其中包括運維人員的技術成熟度、組織過程成熟度和開發能力成熟度。技術成熟度包括運維人員對網絡、計算、存儲、虛拟化和業務的熟悉程度和問題處理能力。技術成熟度越高,對問題的處理和反應速度就越快,相反,對管理能力較差的管理者将延長故障恢複時間。是以如何讓運維人員減少對個人技能和知識的依賴也是對運維工具的一個重要考慮。以往建立在知識庫基礎上的系統,實際運作效果不甚理想。要從根本上解決這一問題,一方面要建立起精确的CMDB配置資訊庫,另一方面要把專家的經驗同時固化為運維工具,那麼運維專家系統将成為未來運維工具發展的又一趨勢

  如今,開放源碼軟體的數量和成熟度日益增加,如果能充分利用開源軟體進行自我開發,不管從業務層面還是運維層面,都是很好的選擇,但同時也提高了對運作人員開發能力的要求。成熟度,展現了運維人員在需求分析、架構設計、代碼編寫、開放源碼軟體熟悉程度、商業背景知識以及對軟體開發過程的了解。DevOps在運維界的流行表明了開發和運作維護的逐漸融合,這無疑也是未來運維發展的趨勢之一,但是,如果不能充分開發人力,又缺乏靈活流程儲備,如果貿然選擇DevOps(開發及運維)模式,有可能面臨巨大的風險?

  是以企業要看清楚自己所處的運維階段、運維人員成熟度,選擇更務實的運維政策,尋求逐漸改善、水到渠成的方法

運維規模

  還有一點要注意尺寸屬性,這一尺度包括哪些内容(伺服器和網絡)、業務規模和管理人員的數量。一個使用者的50個伺服器還是200個伺服器在運維方面,1000台伺服器或者成千上萬台伺服器之間的差異非常明顯。在裝置數量較少的情況下,許多時間都可以進行人工管理,但随着受管理裝置數目的增加,運作工作量将直線上升,此時運維難度實際上呈指數級上升,再依賴人工運維幾乎成為不可能完成的任務。大規模的運維必須依靠自動?監?測測測測工具、自動配置工具、自動部署工具和自動過程工具來輔助實施。随着運作規模的進一步擴大,傳統的運作将向大容量運作演化。大容量運作不僅僅是運維工具的改變,大容量運維帶來了技術價值的改變,技術手段的改變,以及運維意識的改變,這些都影響到深度運維方法的變革。

大量運作運維指南

  影響運維的另一個因素是運維人員規模,如果運維人員在8人以下,則要慎重考慮是否要進行複雜的運維流程建設。過程設定解決了運維事件閉環跟蹤、責任确認、規範管理等問題,但若企業的運維人數較少,建立複雜流程反而會降低運維效率,增加運維成本。但若企業運維人員的數量超20世紀末,對運維流程進行規範管理,同時在運維人員績效管理方面也需要對運維流程進行輔助,此時運維流程的重要性就凸顯出來。但随着時代的發展,自動化和智能化技術逐漸普及,運維流程的發展趨勢越來越輕量化,ITIL流程體系的建設将在将來越來越少

IT體系結構和IT業務的技術發展是運維發展的原動力和推手

運維定位屬性

  最終探讨了運維的定位屬性,這裡的位置包括了網絡位置和邏輯位置。運維目标所處的網絡位置大緻可以分為接入網絡、廣域網和資料中心。因為三個系統所處的地理位置不同,其運維差率很高。上一節讨論的大部分内容都是關于資料中心的運作維護,下面主要講接入網的運維。接入網絡運維涉及終端(類型、系統)、接入者(無線嗎),在身份認證等方面,由于終端類型複雜,接入人員水準參差不齊,接入網運作的複雜性也較高,運維人員不僅要具備多方面的運維知識,還要有足夠的耐心,要有豐富的運維經驗,還要有足夠的耐心。

  雲呐統一運維管理平台,通過對網絡裝置管理、資産管理、伺服器管理、儲存設備管理、業務應用管理、無線管理、日志分析、辦公裝置/聯網裝置、動環系統等本地和異地網絡的實時監控、自動巡檢,精準采集、分析故障資訊,判斷重要資料性能名額,實作大規模資料中心的集中統一管理。

繼續閱讀