天天看點

[雲計算]HCIE-Cloud 雲計算災備 - 災備通識

目錄

一、災備的定義

1.1 什麼是災備?

1.2 備份和容災的概念

1.2.1 備份

1.2.2 容災

1.2.3 兩者差別

1.2.4 兩者關系

1.3 災備提供的保護

二、災備的作用

2.1 存在的問題

2.1.1 資料中心存在的問題

2.1.2 沒有災備會怎麼樣?

2.2 備份的作用

2.2.1 存儲層面

2.2.2 雲計算層面

2.2.3 複制類型

2.3 容災的作用

2.3.1 容災的應用場景

2.3.2 容災解決方案全景圖

2.3.3 本地高可用方案

2.3.4 主備容災方案

2.3.5 雙活資料中心容災方案

2.3.6 兩地三中心方案(級聯/并行)

三、災備的衡量

3.1 備份類型

3.1.1 完全備份

3.1.2 累計增量式備份

3.1.3 差異增量式備份

3.1.4 備份政策原則

3.2 災備的名額

3.2.1 恢複點目标(RPO)

3.2.2 恢複時間目标(RTO)

3.2.3 綜合标準

四、災備的實作

4.1 備份的方式

4.1.1 LAN-Base

4.1.2 LAN-Free

4.1.3 Server-Free

4.2 備份媒體

4.3 備份設計原則

4.4 容災的方式

4.5 容災技術

4.5.1 主機層資料複制

4.5.2 網絡層資料複制

4.5.3 存儲層資料複制

災備指的是用現有的科學技術手段和方法,提前建立起可靠的應急方式,來應對突發事件的發生。

災備包括容災系統和備份系統。

備份:保障資料的安全性,備份指的是将全部或部分資料集合從生産主機硬碟或陣列中儲存到其他的存儲媒體的過程。

容災:保障業務的連續性,容災指的是在較遠的異地建立兩套或者多套相同的、包含完整基礎設施(計算、網絡、存儲、電力制冷等)的IT系統,通過網絡的方式實作資料的傳輸,當主資料中心發生故障,可以利用備資料中心快速恢複業務。

保護對象:備份保護的是資料,容災保護的是業務連續性。

實作方式:備份采用備份軟體技術實作,而容災通過複制或者鏡像軟體實作。

時間周期:資料保護的周期不一緻,複制或者鏡像的時間周期更短。

補充:歸檔使用的是備份。

隻有備份:

如果隻有備份,業務無法快速恢複,資料恢複需要時間,這段時間對某些行業帶來的損失是無法估量的。另外,備份一般是周期性執行的,一旦發生資料丢失,從恢複複時間到上次備份時間之間的資料就會丢失。

隻有容災:

如果隻有容災,業務可以快速恢複,資料也可以被保護,但是生産段有錯誤的操作,或者系統更新失敗之類的,也會被同步到容災端,進而造成業務的中斷。

[雲計算]HCIE-Cloud 雲計算災備 - 災備通識

病毒、作業系統漏洞

人為的誤操作

恐怖襲擊

電力故障

硬體故障

自然災害(地震、洪水、台風)

業務中斷

資料丢失

客戶投訴

業務下滑

經濟賠償

公司倒閉

(資料是無價的,丢了的話問題很大哇!)

配置備份的五大部分:

備份子用戶端

備份任務執行載體

存儲政策

備份媒體

重删政策

保留政策

寫IO數

備份内容

所需備份的内容

過濾不需備份的内容

備份政策

備份類型

備份計劃

性能優化

用戶端對資料的讀流數

雲伺服器備份服務(CSBS):Cloud Server Backup Service,為雲伺服器提供整機備份功能,支援基于多雲硬碟一緻性快照技術的本地備份,以及對備份資料的遠端複制,并支援利用備份資料恢複雲伺服器資料,最大限度保障使用者資料的安全性和正确性,確定業務安全。

雲硬碟備份服務(VBS):Volume Backup Service,基于雲硬碟的備份服務。使用者可為雲硬碟建立備份,利用備份資料復原雲硬碟,以最大限度保證使用者資料正确性和安全性。

[雲計算]HCIE-Cloud 雲計算災備 - 災備通識

同步複制:實時同步進行複制。

異步複制:異步複制資料,資料一緻性有待商榷。

本地高可用容災(HA)

主備容災(AS)

雙活資料中心(AA)

兩地三中心(3DC)

[雲計算]HCIE-Cloud 雲計算災備 - 災備通識

本地生産中心:

本地高可用解決方案

同城容災方案(<100km):

雙活資料中心解決方案

主備容災解決方案

異地容災方案(>100km):

兩地三中心容災解決方案

[雲計算]HCIE-Cloud 雲計算災備 - 災備通識

優點:

業務0中斷

資料0丢失

業務級高可靠。

本地高可用:本地高可用通常為近距離的同一個機房内,使用實時鏡像和同步複制的方案,由于帶寬和距離很近,通常要求RPO=0。

[雲計算]HCIE-Cloud 雲計算災備 - 災備通識

RPO≈0

TCO低,存儲高中低端互通,異構、利舊。

全局拓撲、集中告警

自動化,一鍵式容災演練、恢複

關鍵技術:HyperReplication

[雲計算]HCIE-Cloud 雲計算災備 - 災備通識

6層雙活架構。

業務0中斷,資料0丢失。

關鍵技術:HyperMetro

[雲計算]HCIE-Cloud 雲計算災備 - 災備通識

組網類型

優勢

不足

級聯組網

對生産中心性能影響小。

當發生區域性災難時,如果同城災備中心完全受損,系統RPO将較大(因為異步複制)。

并聯組網

當發生區域性災難時,能有效避免級聯組網的不足。

對生産中心的性能要求較高。

[雲計算]HCIE-Cloud 雲計算災備 - 災備通識

補充:

備份視窗:它指使用者正常使用業務系統不受影響的情況下,能夠對業務系統中的業務資料進行資料備份的時間間隔,或者說是用于備份的時間段。

完全備份:又叫全量備份,對某一時間點上的所有資料的一個完全拷貝。備份發起後變更的資料将在下一次進行備份,又稱為全量備份。

優點:能夠基于上一次的完全備份恢複資料,恢複視窗小。

缺點:占用空間大,備份時間長,備份視窗大。

累積增量式備份:以上一次完全備份為基準進行備份,若之前從未進行過備份,則備份所有資料。

優點:相對完全備份來說,可以節約一個完全備份的存儲空間,備份視窗較小,恢複視窗較小。

缺點:恢複時必須依賴上一次完全備份和本次的累計增量式備份才能完全恢複資料,回複時間較差異增量式備份較短。

差異增量式備份:以上一次備份為基準進行備份,若之前從未進行過備份,則備份所有檔案。

優點:能夠最大限度地節省存儲空間,備份視窗小。

缺點:資料恢複時必須以來上一次完全備份和每一次的差異增量式備份才能對資料進行完整恢複,恢複時資料重構較慢,恢複時間較長。

結合完全備份使用,但不要在同一個政策中結合使用累計增量式備份和差異增量式備份。

通常應用環境對備份空間和備份視窗的要求較高,是以更多的結合使用完全備份和差異增量式備份。

[雲計算]HCIE-Cloud 雲計算災備 - 災備通識

恢複點目标(RPO):當業務發生故障時,可以容忍資料丢失的數量,機關為時間。

舉例:8點進行備份,9點丢資料,RPO=1小時,丢了一個小時的資料。

恢複時間目标(RTO):當業務發生故障時,可以容忍業務中斷的時間,機關為時間。

舉例:比如災難發生後半天内需要恢複資料,那麼RTO就是12小時。

災難恢複能力等級

RTO(恢複時間目标)

RPO(恢複點目标)

1

2天以上

1天至7天

2

24小時以内

3

12小時以上

數小時至1天

4

數小時至2天

5

數分鐘至兩天

0至30分鐘

6

數分鐘

RTO/RPO 與災難恢複能力等級關系(GB/T 20988-2007)

這個在備份組網那一塊再詳細補充...

這裡參考:圖解三種備份方式(LAN,LAN free,Server free)_star&storage的技術部落格_51CTO部落格

[雲計算]HCIE-Cloud 雲計算災備 - 災備通識

LAN-Base,這種方式很簡單,直接在生産伺服器上安裝備份代理,部署一台備份伺服器,這樣即可完成備份,不過這種方式不适合資料量非常大的環境。因為如果備份資料量非常大,會占用以太網的帶寬,雖然說備份操作一般在晚上進行。但是這種方式還是不适合大資料量的情況。是以有了LAN-Free備份。

[雲計算]HCIE-Cloud 雲計算災備 - 災備通識

LAN-Free,顧名思義,即釋放了LAN的壓力。如上圖所示,資料流直接從File server經過FC switch備份到Tape,而不經過Lan,這樣就不會占用主網絡的帶寬。但是資料仍然會通過檔案伺服器的本地磁盤--記憶體—FC switch這步,是以仍然會消耗File server的資源。是以有了下面的Server Free備份來盡可能的減少生産伺服器的壓力。

[雲計算]HCIE-Cloud 雲計算災備 - 災備通識

Server-Free,即備份時資料不流經伺服器的總線和記憶體,如上圖,檔案伺服器使用SAN的File Server Storage空間,現在需要備份檔案伺服器,則隻需将File Server Storage的資料直接備份到Tape。此時檔案伺服器隻需要發出SCSI擴充複制指令,剩下的事情就是File Server Storage和Tape之間的事情了,這樣就減輕了檔案伺服器的很多壓力,使它可以專注于對外提供檔案服務,而不需要再消耗大量CPU、記憶體、IO在備份的事情上了。

或者還有一種方式即NDMP,Network Data Management Protocol,網絡資料管理協定。它是一種支援智能資料儲存設備、錄音帶庫裝置及備份應用程式之間互相通信以完成備份過程的通信協定。伺服器隻要向支援NDMP協定的儲存設備發送NDMP指令,即可讓儲存設備将其自己的資料直接發送到其他裝置上,而不需要流經伺服器主機。

磁盤陣列

錄音帶庫

虛拟帶庫

CD光牒塔、CD光牒庫

雲存儲

一體機(将主伺服器、媒體伺服器、備份媒體內建到一個實體裝置上。例如華為的HDP3500E)

客戶需求(需要備份的資料類型、資料量、備份的對象)

備份政策(資料備份的周期、資料備份的時間點)

網絡規劃(帶寬的大小、網絡的規劃、組網類型)

存儲規劃(備份資料量、未來資料增長量)

[雲計算]HCIE-Cloud 雲計算災備 - 災備通識
[雲計算]HCIE-Cloud 雲計算災備 - 災備通識

主機層資料複制:在生産中心和災備中心的伺服器上安裝專用的資料複制軟體,如卷複制軟體,以實作遠端複制功能。兩中心間必須有網絡連接配接作為資料通道。可以在伺服器層增加應用遠端切換功能軟體,進而構成完整的應用級容災方案。這種資料複制方式相對投入較少,主要是軟體的采購成本;相容性較好,可以相容不同品牌的伺服器和儲存設備,較适合硬體組成複雜的使用者。但這種方式要在伺服器上通過軟體來實作同步操作,占用主機資源和網絡資源非常大。

網絡層資料複制:在生産中心和災備中心的伺服器上安裝專用的資料複制軟體,如卷複制軟體,以實作遠端複制功能。兩中心間必須有網絡連接配接作為資料通道。可以在伺服器層增加應用遠端切換功能軟體,進而構成完整的應用級容災方案。這種資料複制方式相對投入較少,主要是軟體的采購成本;相容性較好,可以相容不同品牌的伺服器和儲存設備,較适合硬體組成複雜的使用者。但這種方式要在伺服器上通過軟體來實作同步操作,占用主機資源和網絡資源非常大。

存儲層資料複制:要實作資料的複制需要在生産中心和災備中心都部署一套這樣的存儲系統,資料複制功能由存儲系統實作。如果距離比較近(幾十公裡之内),之間的鍊路可由兩中心的存儲交換機通過光纖直接連接配接;如果距離在200公裡内,可通過增加DWDM等裝置直接進行光纖連接配接;超過200公裡,則可增加存儲路由器進行協定轉換途徑WAN或Internet實作連接配接。是以,從理論上可實作無限制連接配接。在存儲層實作資料複制功能是很成熟的技術,而且對應用伺服器的性能基本沒有影響。目前,這種容災方案穩定性高、對伺服器性能基本無影響,是容災方案的主流選擇。

繼續閱讀