天天看點

【伺服器資料恢複】HP-Unix小機Oracle資料庫資料恢複案例

伺服器資料恢複環境:

一台伺服器中有一組由數塊SAS硬碟組建的RAID5陣列,陣列中有1塊熱備盤,上層部署OA以及Oracle資料庫。

伺服器故障:

該磁盤陣列中有2塊硬碟出現故障先後離線,RAID5陣列癱瘓,上層LUN無法正常使用。經過檢測發現硬碟無實體故障,無壞道。

伺服器資料恢複過程:

1、将故障伺服器中所有磁盤編号後取出,以隻讀方式做全盤鏡像,備份完成後将磁盤按照編号還原到原伺服器中。後續的資料分析和資料恢複操作都基于鏡像檔案進行,避免對原始磁盤資料造成二次破壞。

【伺服器資料恢複】HP-Unix小機Oracle資料庫資料恢複案例

北亞企安資料恢複——vxfs資料恢複

2、基于鏡像檔案分析底層資料擷取RAID條帶大小、磁盤順序及資料走向等RAID相關資訊,根據擷取到RAID資訊重組RAID5。

3、分析LUN在RAID中的配置設定情況和LUN配置設定的資料塊MAP。提取每一個LUN的資料塊分布MAP,北亞企安資料恢複工程師編寫程式解析所有LUN的資料MAP,根據資料MAP導出所有LUN的資料。

【伺服器資料恢複】HP-Unix小機Oracle資料庫資料恢複案例

北亞企安資料恢複——vxfs資料恢複

4、對導出的LUN的資料進行分析,發現所有LUN中均包含HP-Unix的LVM資訊。通過解析每個LUN中的LVM資訊,發現共有三套LVM:一個LVM劃分了一個LV來存放OA伺服器端的資料;第二個LVM中也劃分了一個LV來存放臨時備份資料;剩下的4個LUN組建了一個LVM,劃分了一個LV來存放Oracle資料庫檔案。

5、北亞企安資料恢複工程師編寫程式解釋每套LVM中的LV卷,但在解釋的過程中程式報錯。經過分析發現報錯原因是raid5癱瘓導緻LVM資訊損壞。人工修複損壞區域後,同步修改解釋程式後成功解釋LVM邏輯卷。

6、搭建HP-Unix環境,将解釋出來的LV卷映射到HP-Unix并嘗試挂載檔案系統。但是挂載檔案系統時出錯,嘗試使用“fsck –F vxfs” 指令修複vxfs檔案系統,但修複完成後還是無法挂載。

7、分析解釋出來的LV,根據VXFS檔案系統的底層結構校驗此檔案系統的完整性。經過分析發現VXFS檔案系統果然有問題,出現問題的原因是:當raid5癱瘓時VXFS檔案系統正在執行IO操作,導緻部分檔案系統元檔案沒有更新以及損壞。手工修複這些損壞的元檔案直至能夠正常解析VXFS檔案系統。

8、将修複好的LV卷挂載到HP-Unix小機上,嘗試Mount檔案系統,這次沒有報錯,成功挂載。

9、在HP-Unix小機上成功mount檔案系統後,将所有使用者資料均備份至指定的磁盤空間。部分檔案目錄截圖如下:

【伺服器資料恢複】HP-Unix小機Oracle資料庫資料恢複案例

北亞企安資料恢複——vxfs資料恢複

10、使用Oracle資料庫檔案檢測工具檢測資料庫檔案的完整性,檢測無誤後使用北亞企安自主研發的Oracle資料庫檢測工具進行檢測,經過檢測發現部分資料庫檔案和日志檔案校驗不一緻。資料庫工程師對這部分檔案進行修複後并再次校驗,直至所有資料庫檔案均通過校驗。

11、将恢複出來的Oracle資料庫附加到原始生産環境中,嘗試啟動Oracle資料庫,啟動成功。

【伺服器資料恢複】HP-Unix小機Oracle資料庫資料恢複案例

北亞企安資料恢複——vxfs資料恢複

【伺服器資料恢複】HP-Unix小機Oracle資料庫資料恢複案例

北亞企安資料恢複

資料驗證:

在使用者方的配合下啟動Oracle資料庫和OA服務端。在本地電腦上安裝OA用戶端,通過OA用戶端驗證新舊資料記錄,安排不同部門人員進行遠端驗證。經過反複驗證确認資料完整無誤。本次資料恢複工作完成。