天天看點

【伺服器資料恢複】raid5熱備盤同步失敗崩潰的資料恢複案例

作者:北亞資料恢複中心

伺服器資料恢複環境:

華為OceanStor某型号存儲,十幾塊FC硬碟組建一組RAID5磁盤陣列,配備了一塊熱備盤;上層使用EXT3檔案系統,配置了oracle資料庫。

伺服器故障:

該存儲RAID5中的一塊硬碟未知原因離線,熱備盤上線開始同步資料,同步未完成時候又有一塊磁盤未知原因離線,資料同步失敗,raid5癱瘓,上層lun不可用。

伺服器資料恢複過程:

1、将故障存儲中所有磁盤編号後取出進行實體故障檢測,檢測後發現為先掉線的磁盤存在實體故障,其他磁盤包括後掉線的那塊磁盤均無實體故障。

2、将所有磁盤以隻讀方式做全盤鏡像,後續的資料分析和資料恢複操作都基于鏡像檔案進行,避免對原始磁盤資料造成二次影響。

3、基于鏡像檔案分析raid5中的所有磁盤底層資料,找出熱備盤。raid是條帶化的,陣列中的資料是按照一定的規律進行存儲的。資料恢複工程師分析raid中的資料庫頁在每一個實體磁盤中的分布情況,計算出raid5的磁盤順序、資料走向、條帶大小等RAID相關資訊。

4、根據分析出來的RAID相關資訊,使用北亞企安自主開發的RAID重構程式将原始RAID虛拟重構出來。但由于原始RAID5中掉線了2塊盤且有1塊盤的資料被同步破壞,分析每一塊硬碟中的資料後發現有一塊硬碟在同一個條帶上的資料和其他硬碟明顯不一緻,初步判斷此盤是被同步破壞的硬碟。通過北亞企安自主開發的RAID校驗程式校驗這個條帶,最終确定被同步損壞的磁盤。

5、分析lun在raid5中的配置設定狀态和lun配置設定的資料塊,根據資料MAP導出LUN的資料。

6、由于使用了熱備盤虛拟重構RAID,EXT3檔案系統無法正常挂載。

7、提取oracle資料庫檔案,使用北亞企安自主開發的檔案系統解析程式對其進行檔案系統解析,然後導出oracle資料庫檔案。

8、将導出的資料庫檔案移交給資料庫工程師進行校驗和驗證。使用Oracle資料庫檔案檢測工具檢測每個資料庫檔案的完整性。如果發現錯誤,使用北亞企安自主研發的Oracle資料庫檢測工具進行二次檢測。檢測後發現部分資料庫檔案和日志檔案錯誤,system和sysaux表空間都存在壞塊,控制檔案全部損壞;eschoolspace表空間的幾個檔案存在的壞塊更多;undotbs02丢失;資料庫資料恢複工程師對這些檔案進行修複。

【伺服器資料恢複】raid5熱備盤同步失敗崩潰的資料恢複案例

北亞企安資料恢複——OceanStor存儲資料恢複

【伺服器資料恢複】raid5熱備盤同步失敗崩潰的資料恢複案例

北亞企安資料恢複——OceanStor存儲資料恢複

【伺服器資料恢複】raid5熱備盤同步失敗崩潰的資料恢複案例

北亞企安資料恢複——OceanStor存儲資料恢複

9、修複完成後,由使用者方配合,啟動Oracle資料庫。在本地虛拟機安裝OA用戶端,通過OA用戶端對資料記錄進行驗證。使用者方安排不同部門人員進行遠端驗證,經過反複驗證,确認資料完整有效。本次資料恢複工作完成。

繼續閱讀