一、故障描述
成都某客戶,存儲損壞,資料庫崩潰。重組存儲,恢複資料庫檔案,發現有四個ndf檔案大小變為0 kb。資料庫大小約80tb。資料庫中有1223個檔案,資料庫每10天生成一個ndf檔案,每個ndf大約500gb,資料庫包含兩個ldf檔案。
二、故障分析
存儲損壞,ndf檔案大小變為0 kb,根據ndf檔案在磁盤上可能存在。可以通過編寫資料庫掃描碎片程式,掃描資料庫碎片、拼接碎片恢複ndf檔案,然後修複資料庫。

三、恢複過程
1 磁盤掃描,掃描資料庫碎片
2 拼接碎片
根據ndf檔案的頁面特征,按照檔案号,頁号拼接碎片,重組生成出這些0kb的ndf檔案。
3 檢測資料庫檔案
使用北亞mssql檔案檢測工具對所有資料檔案進行檢測,結果:拼接出的4個ndf檔案有少量的空頁,其他檔案正常。
4 進一步對損壞lun進行分析,發現這些資料頁在存儲層面已經不存存在了。不能恢複這些資料頁,即這4個檔案不能完全恢複
5嘗試附加資料庫,報錯 “處理資料庫的日志時出錯,如果可能請從備份還原。如果沒有可用的備份,可能需要重新生成日志”。
6、無日志附加資料庫
修改系統表,從系統表剔除掉最後添加的ldf檔案,計算并修改校驗。進行無日志附加資料庫。報錯:資料庫存在一緻性錯誤,
如下圖一:
7 修改系統表中這4個損壞的ndf檔案的塊數量,使其和恢複出來的檔案的塊數量一緻
修改系統表,将系統表記錄這4個ndf的塊數量的值改為和掃描出來的ndf檔案塊數量一緻,同時更改這4個ndf檔案首頁,使得資料庫中記錄的檔案的塊數量和拼接出來的ndf的塊數量一緻,計算并修改校驗值。
8 無日志附加資料庫,報錯資料庫存在一緻性錯誤,
如下圖二:
9 逐個修改系統表中這4個損壞的ndf檔案的塊數量,使其值等于報錯塊前一頁
分析報錯,由于空頁都出現在這4個ndf後面十幾個塊中,截斷檔案對資料完整性影響不大。重新修改系統表和ndf檔案,将資料庫中記錄ndf塊數量的值改至報錯的前一頁,計算并修改校驗。
10 、重新進行無日志附加資料庫,報錯“由于資料庫沒有完全關閉,無法重新生成日志”
如下圖三:
11、修改mdf檔案中的資料庫的狀态值,讓資料庫認為是完全關閉的
12、重新附加資料庫,附加成功
如下圖四:
四、結果
資料庫檔案成功附加後,客戶通過資料庫中的對象進行初步查詢、驗證,表中資訊基本完整,資料得到恢複。資料驗證完畢,客戶對恢複結果表示滿