天天看點

做好災備,為你的資料中心留條後路

很多企業都在考慮一個問題,就是如何建立一個靈活的、有彈性的資料中心。這其中包括確定計算機系統和其他重要裝置的有序恢複,保證所有供電系統的正常運轉等等。為實作這一目标,我們需要一個完善的災難恢複規劃。

做好災備,為你的資料中心留條後路

假設你希望資料中心的恢複規劃良好,你必須将資料中心看做業務流程,其中有大量互相依賴且變化的部分。并且,由于其中有大量互相關聯的部分,當意外發生時,所有要做的事情必須預先用流程的形式寫在文檔上。如果資料中心管理者對災備毫無概念,這将是非常危險的事情。當所有事情都出了問題後,每個人都會将矛頭直指該資料中心管理者。

一整套體系架構和相關應用程式的流程首先是必須的。每個部件,或每個部件組通常有支援的體系架構,并且通常來講,都有一個或一組人對其負責。是以伺服器會分到伺服器組中,或虛拟組中,也有可能兩個都是。所有這些通常在一個體系架構組或一個營運組下面,然而當遇到重大事故時,這些都會呈現星狀圖拓展開來,和各容災管理者直接對應。誰負責,誰決策,需要做什麼,以及所做的順序,這類管理模型必須清晰地記錄下來。

在整個容災規劃中,每個功能子產品必須明确其角色,負責範圍,以及時間點和所需執行的流程步驟。在資料中心中,所有的資源被完全保護并具備備援。到一定程度後我們會驚奇地發現絕大多數資料中心中充斥着單點故障,這是我們必須考慮解決的。

另外,電源ups風險也要充分考慮到。當然,還有一部分風險在于不間斷電源是否可以支撐到發電機啟動并接受所有這些麻煩。而且,讓供應商參與到實際測試中還是十分必要的。也可以通過電力公司參與測試。不過對于不間斷電源這種孤立的裝置,是非常重要的……但你要從端到端考慮。不僅是不間斷電源,還有不間斷電源的不間斷電源,以及發電機,導線和電源配置設定器,并且按步驟從不論是變電站或發電機擷取電量。很多事可以,也應該作為預防維護事件進行。每年或每半年你應該進行負載測試;你應該做預防性的監測;你應該進行紅外線測試來檢測電線是否老化……所有這些都是一個整體。

總之,在進行資料中心容災規劃時要考慮到從主體裝置到輔助硬體的方方面面。任何一個層面出了問題都可能影響業務連續性運作。

作者:何妍 

來源:51cto

繼續閱讀