天天看点

6块300G SCSI RAID5,两块硬盘损坏后的数据恢复过程

【用户单位】

xxxx网站

【数据恢复故障描述】

dell poweredge 2850服务器,内置6块300g scsi硬盘 ,组成raid5,安装linux redhat 4操作系统,存储大量照片,文件系统采用ext3。据后期推断,早先已有一块硬盘离线,但机房内并未发现,直至另一块硬盘掉线后系统瘫痪才知道。dell工程师建议将其中一块硬盘强制上线,但同时指出操作具有风险。用户将某盘强制上线后,发现操作系统启动时异常,感觉不妙,于是关掉服务器,寻求专业数据恢复机构服务。

【数据恢复故障分析】

此类故障非常普遍,raid5仅支持唯一一块硬盘掉线的冗余保护,当两块硬盘先后离线后,raid即无法通过运算提供完整数据块,raid便会下线。同时,控制器为了稳定起见,只要有硬盘下线,便不会自动上线,这样不通过人为干预,raid但会进入瘫痪状态。通常情况下,因raid控制器的敏感性,掉线的硬盘多数不会有严重的物理问题,许多甚至于硬盘完好(掉线是因为信号受阻,电源波动或控制器bug等随机原因),所以数据恢复的可靠性较高。强制上线具有较大的风险,如果上线错误,会导致控制器自动做某些不可逆的操作,如果再进入操作系统,因文件系统不一致,会导致修复,继而导致全部硬盘数据不一致。本例即是如此。

【数据恢复过程】

1、完整备份所有硬盘,发现有多块硬盘已经存在坏道,只是raid没有读到,暂时无下线。

2、在备份中分析原来raid的组成结构,构建虚拟raid环境。

3、验证raid结构正确,修正部分后期破坏的结构后将数据导出到另一中间存储。

4、重新用完好硬盘搭建dell 2950上的新raid5。

5、将数据迁移至新raid。

【数据恢复结论】

历时2天,数据库100%恢复成功。上千万图片文件中抽样检测,有极少数出现问题(概率及理论推断,不超过万分之一)

6块300G SCSI RAID5,两块硬盘损坏后的数据恢复过程

【数据恢复服务承诺】

1 .免费检测

与客户签订保密协议(非定制免费),对客户的数据严格保密

数据恢复不成功不收费

专业工程师提供服务,同时由其他工程师审核、会诊数据恢复方案及流程

数据恢复前报价,客户确认后工程师开始数据修复

整个恢复过程不会对客户的原盘有任何的写操作,以确保原盘的数据完全