一台infortrend ESDS-S12F-G1440存儲,内接12塊2TB硬盤組成RAID6,整個RAID6的所有空間劃分給一個LUN,映射到WINDOWS系統上。在WINDOWS系統上,劃分了一個GPT分區,大小為18.2TB,原已用空間約16.5TB。
在使用一段時間後發現存儲無法訪問,管理人員查看存儲發現3塊硬盤離線,之後通過一些非常規手段促使存儲上線,并開始rebuild。但通過主機訪問時發現,分區打不開,所有數據均無法訪問。咨詢專業機構後得知此狀況表明數據已存在破壞,為避免狀态的進一步惡化,中止rebuild,關機後尋求北亞數據恢複機構幫助。
RAID6是支持兩塊硬盤同時掉線的一種存儲冗餘模式,但當兩塊以上的磁盤下線後,RAID6便無法正常工作了。通常情況下,RAID6離線的3塊盤是間隔一段時間内先後出現故障的,所以,在這種情況下,如果将早掉線的盤(陳舊的數據)上線,便會與在線的盤(新鮮的數據)進行RAID6算法同步,導緻數據不倫不類,無法正常讀取數據。
本例中應為上述分析,但因rebuild時間較短(約幾分鐘),在幾分鐘内,大約可以同步幾十GB數據,本例用戶數據文件數據非常多,同時做為素材庫,文件系統最前部存儲老數據的可能性最大,另因文件數量多,所以一些較新的文件的目錄及節點索引應該都位于磁盤後部,所以同步操作可能對存儲的影響不大,推斷破壞有限。
[數據恢複思路分析]
1、為避免故障擴大,首先對故障硬盤做完全扇區級克隆。如部分硬盤有物理故障,交由硬件恢複組解決硬件故障。
2、分析存儲使用的的RAID6算法,再按此算法對12塊硬盤做C(12,2)共66種可能的缺2盤的情況組合。人工或通過程序判定最正确的缺盤可能。
3、通過北亞RAID數據恢複軟件或第三方數據恢複軟件搭建虛拟RAID平台,按分析出的缺盤狀态、盤序、塊大小、校驗方向、RAID6算法構建進行附加。
4、對虛拟RAID,進行GPT分區結構解釋,然後進行文件系統解釋,确定算法是否正确。如不正确,調整算法,直到最佳結構。
5、按文件或扇區方式遷移數據到另一存儲,完成恢複工作。
[應急建議]
故障發生後,應在關機狀态下插拔硬盤,同時對硬盤原位置進行标注。在硬盤離開存儲後,不要再對存儲加電。确保所有操作盡可能可回溯。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!