天天看點

【伺服器資料恢複】磁盤壞道導緻RAID崩潰伺服器不可用的資料恢複

作者:北亞資料恢複中心

伺服器資料恢複環境:

某機關一台某品牌DS系列伺服器連接配接4個擴充櫃;

50塊磁盤組建兩組RAID5,其中一組由27塊磁盤組建的RAID5存放的是Oracle資料庫檔案;

上層一共劃分11個卷。

【伺服器資料恢複】磁盤壞道導緻RAID崩潰伺服器不可用的資料恢複

北亞資料恢複——伺服器RAID5資料恢複

伺服器故障:

磁盤故障導緻存放Oracle資料庫檔案的RAID5崩潰,伺服器不可用。

伺服器資料恢複過程:

硬體工程師先對故障伺服器的27塊磁盤進行硬體故障檢測,發現其中的2塊磁盤存在壞道,SMART錯誤備援級别已經超過門檻值。對另外的25塊無硬體故障的磁盤做全盤鏡像,對2塊有壞道的磁盤進行恢複并生成鏡像檔案。

收集故障伺服器的日志資訊并進行分析,查明兩塊存在壞道的磁盤掉線先後順序,用後掉線的磁盤進行資料恢複。

【伺服器資料恢複】磁盤壞道導緻RAID崩潰伺服器不可用的資料恢複

北亞資料恢複——伺服器RAID5資料恢複

經過北亞資料恢複工程師團隊會診最終敲定兩套資料恢複方案:

方案一:把故障伺服器所有硬碟都備份後通過該品牌自帶存儲管理軟體強制上線。

方案二:通過分析硬碟底層擷取raid相關資訊,利用擷取到的資訊重組RAID,提取資料并重新加載oracle資料庫,調試上層應用。

執行第一套方案,先在模拟器上測試,測試完成後通過該品牌自帶的存儲管理軟體進行強制上線。強制上線後發現raid處于降級狀态,這時設定好熱備盤上線并開始同步資料,同步完之後發現上層的卷已經可以直接使用,所有資料可見,上層應用可正常使用。

雖然上層的卷可以使用,資料也都可見,但是出于安全考慮,北亞資料恢複工程師将卷裡的檔案都拷貝出來移交給使用者,經過使用者反複測試後确認恢複資料完整可用。

Tips:

1、伺服器發生故障後,切忌對伺服器進行操作;也不要随意取出硬碟,以免弄亂盤序。

2、如果需要取出硬碟,标記好硬碟的順序之後再取出。

3、伺服器陣列癱瘓後應該立即斷電,不要做同步或強制上線操作,防止資料進一步破壞。

【伺服器資料恢複】磁盤壞道導緻RAID崩潰伺服器不可用的資料恢複

北亞資料恢複——伺服器RAID5資料恢複

繼續閱讀