容災 (Disaster Tolerance):就是在上述的災難發生時,在保證生産系統的資料盡量少丢失的情況下,保持生存系統的業務不間斷地運作。
容錯 (Fault Tolerance):指在計算機系統的軟體、硬體發生故障時,保證計算機系統中仍能工作的能力。
差別 :容錯可以通過硬體備援、錯誤檢查和熱交換 再加上特殊的軟體來實作,而容災必須通過系統備援、災難檢測和系統遷移等技術來實作。當裝置故障不能通過容錯機制解決而導緻系統當機時,這種故障的解決就屬于容災的範疇。
什麼是災難恢複 (Disaster Recovery):指的是在災難發生後,将系統恢複到正常運作的能力。
差別 :容災強調的是在災難發生時,保證系統業務持續不 間斷地運作的能力,而災難恢複強調的災難之後,系統的恢複能力。現在的容災系統都包含着災難恢複的功能,是以本文的讨論除了包括容災方面的内容,還包括了 災難恢複的部分内容。
容災系統在企業中給與資料安全系數相當高的保障,但是容災系統倒是是什麼,他們是什麼意思?恐怕連正在使用容災備份的網絡管理人員都不能解釋。本文用最淺顯的語言給大家解釋容災備份到底是什麼。
1.容災和備份的目的不同
容災系統的目的在于保證系統資料和服務的“線上性”,即當系統發生故障時,仍然能夠正常地向網絡系統提供資料和服務,以使系統不緻停頓。
而容災備份技術的目的與此并不相同,備份是“将線上資料轉移成離線資料的過程”,其目的在于應付系統資料中的邏輯錯誤和曆史資料儲存。
是以,在各種容錯技術非常豐富的今天,備份系統仍然是不可替代的。
2.備份是基石
備份是指為防止系統出現操作失誤或系統故障導緻資料丢失,而将全系統或部分資料集合從應用主機的硬碟或陣列複制到其它的存儲媒體的過程。
備份是資料高可用的最後一道防線,其目的是為了系統資料崩潰時能夠恢複資料。
3.容災不可少
那麼建設了備份系統,是否就不需要容災備份系統?這還要看業務部門對RTO(恢複所需的時間名額)/RPO(能夠恢複到的最新狀态)名額的 期望值,如果允許1TB的資料庫RTO=8小時,RPO=1天,那備份系統就能滿足要求。同時,備份的目的在于應付系統資料中的邏輯錯誤和曆史資料儲存。隻能夠滿足資料丢失、資料破壞時的資料恢複目的,而不能提供實時的業務接管功能。
是以容災系統對于某些關鍵業務而言也是必不可少的。人們談及容災備份往往是針對當生産系統,不能正常工作時,其業務可由容災系統接替這些業務,繼續進行正常的工作。
能夠提供很好的RTO和RPO名額。同時遠端容災系統具備應付各種災難,特别是區域性與毀滅性災難的能力,具備較為完善的資料保護與災難恢複功能,保證災難降臨時資料的完整性及業務的連續性,并在最短時間内恢複業務系統的正常運作,将損失降到最小。
4.容災不能替換備份
容災系統會完整地把生産系統的任何變化複制到容災端去,包括不想讓它複制的工作,比如不小心把計費系統内的使用者資訊表删除了,同時容災端的 使用者資訊表也會被完整地删除。如果是同步容災,那容災端同時就删除了;如果是異步容災,那容災端在資料異步複制的間隔内就會被删除。這時就需要從備份系統 中取出最新備份,來恢複被錯誤删除的資訊。是以容災系統的建設不能替代備份系統的建設。
5.規劃企業安全保障體系考慮的因素
對于企業而言到底應該如何建設自己的災備系統,是隻建裝置份系統、還是隻建設容災系統、還是需要二者同時建設、或者是分步驟的建設,誰先誰後等問題,主要根據業務的需求而定:
(1)需要防範的災難類型:
企業資訊系統可能遇到的災難類型及其發生的比例如下:
對于“人為錯誤”、“軟體損壞和程式錯誤”加上“病毒”等這些都稱為邏輯錯誤,占總故障的 56%,這些錯誤隻能通過備份系統才能防範;
對于“硬體和系統故障”以及“自然災難”等故障可以通過在容災系統(或者異地備份)來防範,占總故障率的44%。
(2)允許的RTO和RPO名額
從技術上看,衡量容災系統有兩個主要名額:RPO(Recovery Point Object)和RTO(Recovery Time Object),其中RPO代表了當災難發生時允許丢失的資料量;而RTO則代表了系統恢複的時間。
一般而言:容災系統能夠提供較好的RTO和RPO名額。
(3)系統投資
總的說來,建裝置份系統的投資遠比建設标準意義的容災系統的投資小得多:
備份系統的投資規模一般在幾百萬;而最節省的一套容災系統投資都将上千萬;災難恢複與投資關系:
6.常用的災備組合方式
基于以上原因,業界在災備系統的建設上一般按照以下幾種方式:
- 建設機房内的本地備份系統
- 建設異地的備份系統
該方式可以備份系統的價格滿足備份和異地容災功能,能夠避免主生産中心由于地震、火災或其他災害造成的資料丢失。
- 備份系統+異地容災系統
這是一個較為理想化的容災系統一體化解決方案,能夠在很大程度上避免各種可能的錯誤。
7.容災恢複等級
8.災難恢複層次
,
9.災備技術層次
1.1 磁盤陣列災備技術
同步方式
半同步方式
異步方式
1.2 智能交換機技術
2.1 卷管理軟體災備技術
2.2 資料庫日志複制技術
2.3 資料庫災備技術
3.1 應用災備技術
10.容災體系結構規劃
系統正常運作
生産中心單台主機當機
生産中心所有主機當機
生産中心回切