現在的資料中心少則幾百個機櫃,多則成百上千,甚至上萬個機櫃。面對如此大規模的資料中心,如何利用現有的裝置和技術手段,在向客戶提供滿意的服務品質的同時,将資料中心自身的運維成本降至最低,乃至實作自身營運的利潤最大化。正所謂“三分技術,七分管理”,評判一個資料中心的優劣,不僅僅在于其采用了先進技術水準,亦或是聘用了多少行業的技術專家,更多的在于其整體的管理水準,合理地配置企業資源和人力資源。
資料中心在投入營運之前,首先需要解決的是基礎設施的運維工作,而人又是機房運維管理的核心力量,是以本節重點介紹機房運維人員的管理制度。?
(一)運維團隊管理
機房運維人員是最接近生産裝置的技術人員,在裝置運作故障時,要求其沉着冷靜地第一時間趕赴現場檢視故障資訊,并分析故障原因,做到及時向上司彙報,是以一線運維人員必須經過嚴格的制度教育訓練和技術教育訓練,考核合格後方可上崗。另外,涉及裝置操作動作,如電氣裝置,必須持低壓電工和高壓電工作業證等,做到有證上崗,并且不得單獨承擔值班工作和相關的獨立操作行為。在日常值班過程中,為了保證機房運維管理的工作品質和運維團隊的管理水準,需要針對不同的運維工作開展專項運維教育訓練,以及相關的應急演練,培養一支技術紮實、具備實際操作能力的運維團隊。
?
?
(二)值班管理
機房運維過程中,要求值班人員具有認真、負責的工作态度和積極樂觀向上的工作激情,嚴格按照值班手冊執行、堅守崗位職責:加強機房巡視、對裝置運作狀态(機房溫、濕度,電力運作)了然于胸,以及監視裝置監控系統的運作狀态,并按規定及時上報,并在交接班時主動向接班人員口頭交接值班過程中遺留問題和注意事項。另外,值班人員必須認真、如實、詳細地填寫機房裝置巡視記錄、裝置監控系統運作狀态和值班過程中的交接表制作,并及時上傳工作原地,友善其他運維人員查閱。
?
?
(三)日常運維工作安排
值班期間,每個班組根據自身的運維内容制定運維計劃以及組内成員責任劃分,中老年品牌如接班前主動詢問上個班組有無遺留問題、并檢視交接班表中的注意事項、機房巡視安排等等。另外,值班人員根據自己負責的運維裝置,需制定月度或季度乃至年度計劃安排。如,柴油發電機作為資料中心的後備電源,除了正常每月的健康檢查外,還需要額外增加兩次帶載演練(注:演練時間除了滿足避開業務高峰期外,還需要避開用電高峰期的夏季和冬季,以免因為帶載過重發電機故障而此時市電出現波動等突發事件),以保證在市電不可用時,發電機能夠保證資料中心的正常營運。當然,運維人員日常運維過程中,所有的裝置操作必須滿足雙人操作,并形成詳細地操作步驟,以文檔形式記錄下來。裝置運作期間難免會出現故障,故障在第一時間得到解決後,也應該及時做好故障裝置清單、備件以及故障原因和解決方案的記錄,提高整個運維團隊的後期運維經驗。
最後,運維主管應該定期或不定期的抽查運維人員對中心運維制度執行和技術熟悉程度,并納入運維人員季度和年度的績效考核,提高整個運維團隊的運維水準。除此之外,運維主管應該根據日常運維資料報表,做到橫向和縱向的分析比對,如根據月度裝置故障率,對重點裝置着重關注,将潛在的故障風險消除在搖籃中,另一方面重點提高運維人員在該方面的故障解決能力,提高運維工作效率,嚴格把控運維工作品質。
資料免費送(點選連結下載下傳)
史上最全,資料中心機房标準及規範彙總(下載下傳)
資料中心運維管理 | 資料彙總(2017.7.2版本)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
加入運維管理VIP群(點選連結檢視)
《資料中心運維管理》VIP技術交流群會員招募說明
加入學習群掃描以下二維碼或者添加微信:
wang2017bj
文章來源:https://blog.csdn.net/j6UL6lQ4vA97XlM/article/details/80562048