天天看點

【幹貨】一起學習什麼是災備技術?以及他們的差別在哪裡?

作者:西域金豬俠

從事IDC項目的朋友,我們經常會聽到一些詞:容災系統、備份資料(全量備份、增量備份)、災備一體機等,今天這篇文章将更詳細地為大家介紹災備技術及其差別以及相關名詞解釋。

1、什麼是災備?

災備是容災和備份的簡稱, 災備方案=容災方案+備份方案。

【幹貨】一起學習什麼是災備技術?以及他們的差別在哪裡?
  • 容災: 将一套系統部署在不同的可用區:同城或者異地,互相之間可以進行健康狀态監視和高可用切換,當一個可用區出現異常停止工作時,整個應用系統可以切換到另一處,不影響功能的正常使用。側重于資料同步和系統持續可用。
  • 備份:指将應用系統産生的重要資料制作一份或多份拷貝檔案,增加資料的安全。側重資料的備份和儲存。

2、衡量災備的兩個關鍵技術名額:

  • RTO(Recovery Time Objective):即恢複時間目标,主要指的是所能容忍的業務停止服務的最長時間,也就是從災難發生到業務系統恢複服務功能所需要的最短時間周期。RTO越低說明系統的恢複能力越高,相對的成本也要更大。
【幹貨】一起學習什麼是災備技術?以及他們的差別在哪裡?

RTO是反映業務恢複的及時性名額,表示業務從中斷到恢複正常所需的時間,RTO數值越小,代表容災系統的資料恢複能力越強,可以部署很多容災系統,來擷取最小的RTO,但這意味着投入大量資金。提升RTO的常用技術有:錄音帶恢複、人工遷移、應用系統遠端切換,這幾種技術的RTO的表現如表1所示:

【幹貨】一起學習什麼是災備技術?以及他們的差別在哪裡?
  • RPO(Recovery Point Objective):即資料恢複點目标,主要指的是業務系統所能容忍的資料丢失量。反映資料丢失量,RPO越小說明企業允許丢失的資料越少。比如 “RPO = 1 天” 意味着恢複時使用一天前的資料,那麼一天之内的資料就丢失了。
【幹貨】一起學習什麼是災備技術?以及他們的差別在哪裡?

RPO是反映恢複資料完整性的名額。在同步資料複制方式下,RPO等于資料傳輸時延的時間,在異步資料複制方式下,RPO基本為異步傳輸資料排隊的時間。提升RPO的常用技術有:錄音帶備份、定期資料複制、異步資料複制、同步資料複制等,這幾種技術的RPO的表現如表2所示:

【幹貨】一起學習什麼是災備技術?以及他們的差別在哪裡?
  • 二者差別:RPO針對的是資料丢失,而RTO針對的是服務丢失,二者沒有必然的關聯性。RTO和RPO的确定必須在進行風險分析和業務影響分析後根據不同的業務需求确定。對于不同企業的同一種業務,RTO和RPO的需求也會有所不同。RTO和RPO名額并不是孤立的,而是從不同角度來反映的容災能力。我們用下面的圖說明下RTO和RPO兩個名額在故障處理過程中的關系:
【幹貨】一起學習什麼是災備技術?以及他們的差別在哪裡?

從上圖可以看出,RPO名額來自于故障發生前,而RTO名額來自故障發生後,兩者的數值越小,就能有效縮短業務正常到業務過渡期的時間間隔,單一地提升RTO或RPO名額也可以縮減業務故障到過渡期的時間,具體從哪個名額上來改善,就要結合的實際情況分析,提升那個名額代價最小,效果更明顯。當然完美的方案當然是RTO和RPO都為零,這表示當故障發生後,系統立即恢複,而且完全沒有資料丢失,要達到這樣的目标系統設計是及其複雜的,而且造價也是非常昂貴的,也不一定有這個必要。

3、容災和備份的差別是?

  • 容災系統的目的:在于保證系統資料和服務的“線上性”,即當系統發生故障時,仍然能夠正常地向網絡系統提供資料和服務,以使系統不緻停頓。“容災”是為了通過一些技術手段的部署,達到出現“意外”的時候,業務不會中斷或者中斷後會自動恢複(注意要自動,而且恢複時間很短)。例如伺服器、網絡、存儲哪一點出現問題,都會中斷服務,是以這個時候每個點都需通過技術手段做保護,這就是容災要考慮的事情。
  • 備份的目的:在于應付系統資料中的邏輯錯誤和曆史資料儲存,是“将線上資料轉移成離線資料的過程”。“備份”隻是将資料COPY一份,在其他媒體儲存,當資料丢失了,有“備份”可以用于恢複,無論手動還是自動,而有副本就相當于完成“備份”了,至于恢複不恢複,恢複完了沒有,與“備份”是沒有關系的,那屬于“容災”的範疇了。如我們日常将東西考到U盤,CD光牒,移動硬碟也就是備份。
  • 容災不能替換備份:容災系統會完整地把生産系統的任何變化複制到容災端去,包括不想讓它複制的工作,如不小心把計費系統内的使用者資訊表删除了,同時容災端的 使用者資訊表也會被完整地删除。如果是同步容災,那容災端同時就删除了;如果是異步容災,那容災端在資料異步複制的間隔内就會被删除。這時就需要從備份系統 中取出最新備份,來恢複被錯誤删除的資訊。是以容災系統的建設不能替代備份系統的建設。

4、備份的分類

  • 備份内容包括作業系統備份、資料備份。
  • 資料備份分為:全量備份、增量備份、差異備份。其中全量備份:備份所有資料;增量備份:根據上一次備份所作的增量備份(在上一次備份的基礎上備份);差異備份:根據上一次全量備份所作的差異備份(差異備份隻對比上一次全量)。
  • 備份的形式分為實體備份和邏輯備份。實體備份:備份真實資料;邏輯備份:備份操作記錄。
  • 根據備份時是否需要停服務分為:冷備份和熱備份。冷備份:将資料以隔離的方式進行儲存,不受原資料影響,資料恢複慢,解決人為誤操作。 熱備份:搭建備援環境,恢複速度快,不能解決人為誤操作。

5、高可用(HA)

  • Active/Passive HA:叢集隻包括兩個節點簡稱主備。在這種配置下,系統采用主和備用機器來提供服務,系統隻在主裝置上提供服務。在主裝置故障時,備裝置上的服務被啟動來替代主裝置提供的服務。典型地,可以采用 CRM 軟體比如 Pacemaker 來控制主備裝置之間的切換,并提供一個虛機 IP 來提供服務。
  • Active/Active HA:叢集隻包括兩個節點時簡稱雙主,包括多節點時稱為多主(Multi-master)。在這種配置下,系統在叢集内所有伺服器上運作同樣的負載。以資料庫為例,對一個執行個體的更新,會被同步到所有執行個體上。這種配置下往往采用負載均衡軟體比如 HAProxy 來提供服務的虛拟 IP。

6、容災恢複等級

真正的容災必須滿足三個要素:

首先,系統中的部件、資料都具有備援性,即一個系統發生故障,另一個系統能夠保持資料傳送的順暢;其次,具有長距離性,因為災害總是在一定範圍内發生,因而充分長的距離才能夠保證資料不會被一個災害全部破壞;最後,容災系統要追求全方位的資料複制,也稱為容災的"3R"(Redundance、Remote、Replication)。

而國際标準SHARE 78 對容災系統的定義有七個層次:從最簡單的僅在本地進行錄音帶備份,到将備份的錄音帶存儲在異地,再到建立應用系統實時切換的異地備份系統,恢複時間也可以從幾天到小時級到分鐘級、秒級或零資料丢失等。

【幹貨】一起學習什麼是災備技術?以及他們的差別在哪裡?

國際标準SHARE 78的定義

7、常用的災備種類

【幹貨】一起學習什麼是災備技術?以及他們的差別在哪裡?
  • 第1種:僅本地備份

      這一級容災備份隻在本地進行資料備份,并且備份的資料隻在本地儲存,并沒有在異地建立災備中心,是以實際上沒有災難恢複能力。

  • 第2種:異地熱備

      在異地建立一個熱備份點,通過網絡進行資料備份。也就是通過網絡以同步或異步方式,把主站點的資料備份到備份站點,備份站點一般隻備份資料,不承擔業務。當出現災難時,備份站點接替主站點的業務,進而維護業務運作的連續性。

  • 第3種:異地互備

      在不同的地理位置分别建立兩個資料中心,在工作狀态下進行互相資料備份。這樣,當某個資料中心發生災難時,另一個資料中心可以直接接替其工作任務。這種級别 的備份根據實際要求和投入資金的多少,又可分為兩種:①兩個資料中心之間隻限于關鍵資料的互相備份;②兩個資料中心之間互為鏡像,即零資料丢失等。零資料 丢失是目前要求最高的一種容災備份方式,它要求不管什麼災難發生,系統都能保證資料的安全。是以,它需要配置複雜的管理軟體和專用的硬體裝置,需要投資相 對而言是最大的,但恢複速度也是最快的。

  • 第4種:雲備份

      雲備份,就是個人或企業把資料, 如:通訊錄、短信、圖檔等資料通過雲存儲的方式備份在公有雲或私有雲。雲備份已經成為雲計算最重要的落地表現形式之一,加上在成本上的巨大優勢,已經在企 業市場中獲得了快速的發展。百度雲盤、騰訊微雲等都可以認為是雲備份的一種,另一種則是以代表的SaaS應用。

本篇文章如覺得對您有用請大家點贊、收藏、分享!如有更多了解,歡迎大家交流評論!