天天看點

實際運維中處理的事故問題

在IT運維中會遇到的問題

      1、缺乏有效的知識積累和共享,造成操作維護效率低下,類似的故障和問題仍然在不斷發生,不斷解決着,同時一旦某些掌握關鍵資訊和技能的人發生意外狀況(如生病,離職等),整個日常維護可能面臨嚴峻的考驗。

      2、工程師的維護職責不是很清楚,每個人都大概知道自己該做什麼,但是某個具體事情到底該誰負責,卻沒有明細定位。       3、工程師大多沒有養成記錄習慣,每個月彙總報告時,對自己的工作量、所維護系統的整體情況還是一頭霧水。而且紙質的故障處理報告資訊要素不全,統計和查詢都是頭痛的問題。   4、運維人員幾乎很少能準時下班,處理突發技術故障的事情也時有發生。運維人員往往像“救火隊員”一樣去處理故障。 在“救火式”的IT管理維護模式下,很難有效地進行服務管理,無法保證IT服務的有效性和一緻性,IT管理往往處于無序狀态。   5、對于運維工程師的工作績效缺乏客觀考核依據。他們到底做了哪些事情?哪些事情還沒有做?工作完成的時效性怎麼樣?解決問題的品質怎麼樣?這些問題,隻能憑印象得出一個個模糊的答案。     如何解決以上問題?     如何解決以上提到的問題是目前許多使用者需要解決的問題,但首要關注的問題應是如何建立專業化分工的IT運維體系。   (1)細化使用者角色,力求提高運維效率   運維人力分工管理包含人員、崗位、角色等資訊,如果這些資訊沒有統一規劃,就無法進行統一配置。網絡管理中的角色是根據ITIL标準進行劃分的,是把IT運維各種事情(包括人員、資源、突發事故)分成不同級别和不同運維操作,以便有效的配置運維人力資源。是以,對于企業而言,IT運維的專業化分工本質上是對IT運維人力資源配置的優化。例如,明确運維事件分級處理流程,明确運維人員的職責、權限、義務和績效考核标準。事實上許多實踐也證明,明确每種運維事件的專業化分工處理流程,可以大大減少IT運維操作的随意性和混亂性,并能大大提高運維中的人力資源效率。   (2) 設立IT運維服務台,規範IT流程   在網管軟體中,一般提供自助服務和運維服務台,自助服務台的作用是,給使用者報故障,評價IT人員解決問題是否負責等。運維服務台是為了确定運維等級和引入優先處理原則。運維服務台主要承擔:運作值班、故障監控、接受請求、工單派發及問題解決過程中的監測等工作内容。服務台就像是傳統産業生産工廠中的房間的排程配置設定員,它會不斷的根據事件的等級進行比對分工和排程。例如發生任何一個突發運維事件時,服務台會先檢查并進行分類流轉處理。運維人員可分為一線普通維護、二線技術專家和三線廠商專家。一線人員作為第一級問題處理人員,主要解決正常的運維問題;在一線人員不能解決的情況下,二線技術專家将迅速介入問題解決過程;三線技術專家來自産品供應商,由二線技術專家申請三線廠商專家的介入,使問題解決時間能夠大大縮短。   (3)FAQ和知識庫,最大限度節省人力成本   提供FAQ和知識庫兩種方式,知識庫是指對IT運維中的典型故障事件和常見問題解答的自助式處理流程。當出現故障時,使用者先在自助式知識庫尋找解決方法。如果問題沒有得到解決,則使用者利用服務台申請維護,使用者申請将會移交給相應的負責人,負責人第一時間建立服務檔案并一直實時監控,直到問題得到圓滿的解決。是以,自助式知識庫能幫助運維人員節省大量的時間,進而節省人力成本支出。

轉載于:https://blog.51cto.com/2767807/1150440