服務器存儲數據恢複環境:
HP StorageWorks系列服存儲;
VMWARE ESX虛拟主機平台,VMFS文件系統;
8塊硬盤組成RAID5,1塊熱備盤。
服務器存儲故障:
服務器在正常運行中兩塊硬盤指示燈顯示黃色,經服務器管理員檢測發現這2塊硬盤表現為:無法讀取序列号,在SAS擴展卡上無法識别,需要對raid進行數據恢複。管理員聯系我們數據恢複中心進行服務器raid數據恢複。
服務器存儲數據恢複過程:
1、硬盤物理故障修複。
首先需要确定該組raid的磁盤掉線原因。硬件工程師在接到故障服務器後将2塊故障盤連接到外部的SAS擴展卡上加電檢測,發現磁頭不尋道。硬件工程師将PCB分離後檢查硬盤HDA組件,發現有部分氧化,對氧化部位進行清潔後再次加電檢測發現磁頭仍然不尋道。于是硬件工程師隻能對故障硬盤進行開盤修複。
硬件工程師将正常的熱備盤開盤拆取PCB替換掉故障盤的PCB,再将故障盤PCB上的ROM芯片拆取安裝到新PCB上進行修複。故障硬盤硬件修複完成後再次進行檢測可以正常起轉,磁頭尋道聲音正常,但是敲盤聲音明顯。硬件工程師另找磁頭進行更換,硬盤可以正常識别,故障盤數據鏡像成功。
2、重組RAID5。
使用工具打開7塊磁盤發現所有硬盤的0扇區都有“55 AA”标志,0x01C2H處表示該分區的類型,這裡顯示“05”,代表這是一個擴展分區。因此從0扇區看這是一個不正常的MBR分區結構。按照這一方法繼續查找,分别在7号盤和8号盤找到了“55 AA”的标志。8号盤查詢結果如下圖。這是一個正常的MBR分區,其0x01C6處數值代表指向的下一個扇區為GPT的頭部。
北亞數據恢複——RAID5數據恢複
7号盤查詢結果如下圖。其0x01C6處數值代表指向下一個扇區。但是下一個扇區很明顯不是GPT的頭部。
北亞數據恢複——RAID5數據恢複
由此可以初步判斷8号盤是第一塊盤,7号盤可能是最後一塊盤。GPT分區所在扇區起始于172032扇區,因此初步确定LUN的起始扇區是172032扇區。
raid小知識:條帶也就是raid陣列塊,它是RAID處理數據的基本單元。不同的RAID陣列的條帶大小也各不相同。RAID5的1個條帶組中有1個校驗區,根據這個規律可以對該raid5進行分析。我們可以通過比較法确定條帶大小:如某一條帶組中的校驗區跟這一條帶組中的非校驗區可能相差得很明顯,通過工具查看并做對比就可以找到條帶大小。
服務器數據恢複工程師對該服務器raid進行分析搞清楚條帶大小為1024個扇區。按照1024扇區分割,使一個記錄為一個條帶的大小,如下圖所示,7塊盤跳到同一記錄283123。
北亞數據恢複——RAID5數據恢複
當7塊盤都定位到同一位置時,通過對比可以判斷校驗區的走向,繼而判斷整個RAID5的走向。之前已經判斷出8号盤是第一塊盤,把8号盤放在第一個位置,确定RAID5為左走向,盤序為8,2,3,4,1,7,5。
北亞數據恢複——RAID5數據恢複
服務器數據恢複工程師初步确定LUN的起始扇區是172032扇區,使用數據恢複工具跳到172032扇區對硬盤的使用情況進行檢查,正常情況下這個扇區所屬條帶中的5号盤應該是校驗區,但實際上卻顯示校驗區為8号盤。根據該raid左走向的規律,5号盤的校驗區應該在172032-1024=171008扇區,即上一個條帶。跳轉到171008扇區,北亞服務器數據恢複工程師發現校驗區為5号盤。因此可以确定LUN的起始扇區為171008扇區。
使用raid重組工具按照确定的盤序重組raid添加進去,如下圖所示。選擇RAID5,Stripe size 512KB,左異步。
北亞數據恢複——RAID5數據恢複
點擊Build進行重組。組好RAID後,由于數據從1024*8=8192個扇區開始。如果工具沒有跳轉到此扇區的功能,那麼剛組好的RAID必須和一個文件再進行一次Build重組操作。RAID的起始扇區(Start sectors)選擇8192,這個文件可以任意選擇起始扇區和大小(Count sectors),下圖為重組後的raid5。
北亞數據恢複——RAID5數據恢複
服務器存儲數據恢複結果驗證:RAID5磁盤陣列重建完成後經由服務器管理員親自驗證,驗證通過,服務器數據恢複完成。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!