天天看點

持續資料保護(CDP)适合檔案資料備份嗎?

作者:數字羅塞塔計劃

關注我們 - 數字羅塞塔計劃 -

幾個月前筆者寫過兩篇針對檔案長期儲存庫備份(或者說是檔案數字資源長期儲存政策)的文章,《電子檔案備份相對于資料備份的特别之處》、《備份政策從“3-2-1”到“4-3-2-1”》,但是很多讀者依然覺得不解渴,因為目前絕大部分檔案部門正在建設和使用的是管理庫,而不是長期儲存庫。很多機關對于長期儲存庫的建設尚處于規劃設計階段,現階段首先應該考慮的是檔案管理庫資料的備份問題,我們今天就來聊聊這個話題。

持續資料保護(CDP)适合檔案資料備份嗎?

檔案管理庫資料的備份問題

按照正常的檔案“四庫架構”,詳細參見本公衆号文章《檔案資訊化建設到底需不需要“四庫分離”?》,上圖紅圈所示的管理庫處于核心和中樞的位置,數字檔案館(室)應用系統主要也都是和管理庫進行資料互動。管理庫中存儲的資料主體是檔案目錄資料和電子全文資料,前者一般存儲在關系型資料庫中,後者一般存儲在檔案系統中,兩者之間通過一定的邏輯關系映射。當然管理庫中的資料比較複雜,除了檔案目錄資料和電子全文資料之外,可能還會有各種管理類資料、日志檔案、程式處理需要的臨時或者備援資料,當然還包括作業系統、資料庫、中間件等系統軟體本身的資料檔案以及應用程式檔案。

檔案管理庫的實體架構也比較複雜,很多立檔機關為了管理友善,都會把管理庫放在本機關資訊部門統一建構的私有雲上,這種情況下就采用資訊部門統一管理的存儲備份政策即可,本文不對這種情況進行讨論。而檔案館則一般會建設獨立的計算機機房,對檔案資料進行單獨管理,而不是将管理庫建構在統一的政務雲平台上。檔辦函[2020]55号《關于檔案部門使用政務雲平台過程中加強檔案資訊安全管理的意見》中也明确指出:“”。

為了實作管理庫的長期穩定運作并確定資料安全,需要對管理庫采取切實可行的備份措施。那麼,對于實體獨立的管理庫中的資料應該如何進行備份呢?現階段,管理庫主流的存儲備份架構如下圖所示:

持續資料保護(CDP)适合檔案資料備份嗎?

即主要用磁盤陣列存儲資料,用錄音帶庫進行資料備份,用備份軟體管理整個備份過程并執行備份政策。典型的備份政策示例如下(各機關由于資料量、資料類型、備份要求的不同會有差異,僅供參考):

常見的備份方式包括以下三種:

持續資料保護(CDP)适合檔案資料備份嗎?

※ 全備份(Full Backup,F):對要備份的内容做無條件的全部備份;

※ 差分備份(Differential Backup,D):從前一個全備份以後,對變更過或新增的資料進行備份;

※ 增量備份(Incremental Backup,I):對從上次任意形式的備份以後變更過或新增的所有資料進行備份。

正常的資料備份可以采用以上三種備份方式相結合的政策,如下所示:

持續資料保護(CDP)适合檔案資料備份嗎?

即以一個月(或者四周)為周期,每個月做一次全備份(F),每周做一次差分備份(D),每天做一次增量備份(I),約定每天晚上12點鐘開始執行備份政策,以此往複循環。

以上備份政策充分運用了全備份、增量備份、差分備份各自的特點,盡可能減少每次備份的資料量以提高備份效率,并且盡可能降低資料恢複時所需的備份檔案,同時保證了最大資料損失就是一天的變化資料。

持續資料保護

但不管怎麼說,以上備份政策畢竟還是會造成一天的變化資料損失,這在很多實時性要求很高的應用系統中是不被允許的,于是,持續資料保護(Continuous Data Protection,CDP)應運而生。

持續資料保護(CDP)适合檔案資料備份嗎?

持續資料保護(CDP)也被稱作持續備份(Continuous Backup),是一種在不影響主要資料運作的前提下,可以實作持續捕捉或跟蹤目标資料所發生的任何改變,并且能夠恢複到此前任意時間點的方法。CDP系統能夠提供塊級、檔案級和應用級的備份,以及恢複目标至任意可變的恢複點。

應該說CDP技術是對傳統資料備份技術的一次革命性的重大突破。傳統的資料備份解決方案專注在對資料的周期性備份上,是以一直伴随有備份視窗、資料一緻性以及對生産系統的影響等問題。而CDP系統為使用者提供了新的資料保護手段,系統管理者無須關注資料的備份過程(因為CDP系統會不斷監測關鍵資料的變化,進而不斷地自動實作資料的保護),而且當災難發生後,簡單地選擇需要恢複到的時間點即可實作資料的快速恢複。

從原理上來看,CDP技術通過在作業系統核心層中植入檔案過濾驅動程式,來實時捕獲所有檔案通路操作。對于需要CDP連續備份保護的檔案,當CDP管理子產品經由檔案過濾驅動攔截到其改寫(新增、删除、修改)操作時,則預先将檔案資料變化部分連同目前的系統時間戳(System Time Stamp)一起自動備份到儲存設備。從理論上說,任何一次的檔案資料變化都會被自動記錄,因而稱之為持續資料保護。有一個形象的比喻:傳統備份軟體就像是照相機,隻在按快門的時候産生照片;CDP軟體則是錄影機,打開就不停工作,任何時間點的圖像都不會錯過。

全球網絡存儲工業協會(Storage Networking Industry Association,SNIA)關于CDP的描述如下圖所示:

持續資料保護(CDP)适合檔案資料備份嗎?

CDP技術用于檔案管理庫的備份

如果将CDP技術用于檔案管理庫的備份,存儲備份架構如下圖所示:

持續資料保護(CDP)适合檔案資料備份嗎?

在需要監控的伺服器上安裝CDP用戶端(如果伺服器進行了虛拟化處理,也可以在雲平台中嵌入CDP引擎插件),采用CDP備份一體機進行持續備份,為了提升備份和恢複的速度,備份資料的存儲載體以磁盤為主。

SNIA關于CDP的優勢已經說的很明白:

1)零資料丢失、零備份視窗;

2)任意時間點的資料恢複;

3)資料恢複操作便捷;

4)全天候的資料保護。

這樣看來,CDP似乎可以完全取代傳統的資料備份方式了,但事實并非如此,CDP技術也存在一些劣勢:

1)真正的CDP技術需要解決資料持續不間斷監控和記錄的技術難題,目前還存在資源消耗大、計算效率低、重複資料多的問題;

2)真正的CDP技術持續備份時産生的大量資料,遠大于其他備份方式産生的資料量,對存儲系統形成較大壓力;

3)真正的CDP解決方案實施費用相對較高,是傳統備份方式的幾倍,但大部分客戶的資料保護需求并沒有這麼高。

是以,從成本效益上來評判資料備份解決方案的優劣,是否采用CDP技術就不一定了。一般而言,CDP技術方案更加适合于系統實時性要求非常高、對資料變化高度敏感的應用,比如銀行交易系統、訂票網站、生産管理系統等,相對而言檔案管理系統的資料實時性要求并沒有這麼高,采用傳統的備份方案,一天的變化資料丢失也不是說完全不能接受,畢竟檔案資料還有多套備份,還有長期儲存庫托底。大不了在災難發生時,資料恢複到前一天之後再人工錄入當天的資料,也不會産生多少工作量。在這種情況下,筆者認為,對于檔案管理庫中的資料,傳統的備份方案實際上也已經夠用了。當然在經費允許的情況下,CDP解決方案也可以嘗試,畢竟這代表了備份技術的發展方向。

數字羅塞塔計劃公衆号緻力于作為中立的第三方客觀公正地表達自己對于檔案資訊化領域的看法和觀點。真理越辯越明,我們也衷心歡迎越來越多的人投身到檔案數字資源管理和儲存這一領域的研究中來并發表真知灼見,共同為人類文明的傳承而努力奮鬥!

關注我們 - 數字羅塞塔計劃 -

繼續閱讀