服務器存儲raid數據恢複環境:
華為OceanStor某型号存儲,16塊FC硬盤(包含一塊熱備盤)組成RAID5。
服務器存儲raid故障:
該存儲RAID5中的一塊硬盤由于未知原因離線,熱備盤上線同步數據,同步完成一半左右時另外一塊硬盤未知原因離線,數據同步失敗,raid5崩潰,上層的lun失效。管理員聯系我們數據恢複中心對該存儲中的raid5進行數據恢複。
服務器存儲raid數據恢複過程:
1、檢測raid5中所有磁盤:
北亞硬件工程師首先對故障raid中所有磁盤進行物理故障檢測,檢測結果為第一塊掉線硬盤存在物理故障,其他的包括後面掉線的硬盤均無物理故障。
2、備份raid5中所有磁盤:
将raid5中所有磁盤都鏡像備份,後續的數據恢複操作都在鏡像文件中進行,避免可能對原始數據造成的二次破壞。
3、分析raid5結構:
數據恢複工程師對故障raid中的所有磁盤進行分析,找出熱備盤(熱備盤與其他數據盤有明顯區别)。由于raid是條帶化的,raid中的數據是按照一定規律存儲,通過分析raid中的數據庫頁在每一個物理磁盤中的分布情況,北亞數據恢複工程師計算出raid的磁盤順序、數據走向、條帶大小等基本信息。
4、找出raid5中被同步的壞盤:
根據分析獲取到的RAID信息,嘗試通過北亞自主開發的RAID虛拟重組程序将原始RAID虛拟重組出來。故障RAID中掉線兩塊盤并且有一塊硬盤中的數據由于同步失敗損壞,數據恢複工程師仔細分析每一塊硬盤中的數據,發現有一塊硬盤在同一個條帶上的數據和其他硬盤明顯不一樣,因此初步判斷此硬盤是被同步損壞的硬盤。通過北亞自主開發的RAID校驗程序對這個條帶進行校驗,最終确定那塊被同步損壞的硬盤。
5、分析raid中的lun信息:
分析lun在故障raid中的分配狀态和lun分配的數據塊,然後根據數據MAP導出LUN的數據。
6、解析EXT3文件系統:
由于是使用熱備盤虛拟重組的RAID,EXT3文件系統無法正常挂載,隻能提取出oracle數據庫文件。利用北亞自主開發的文件系統解析程序對其進行文件系統解析并導出oracle數據庫文件,然後把數據庫文件移交給數據庫恢複工程師進行校驗和驗證。
7、修複數據庫,檢測數據文件完整性:
使用Oracle數據庫文件檢測工具檢測每個數據庫文件的完整性但是發現錯誤。于是使用北亞自主研發的Oracle數據庫檢測工具進行檢測,發現部分數據庫文件和日志文件錯誤, system和sysaux表空間存在許多壞塊,控制文件全部損壞,eschoolspace表空間的文件的壞塊更多,undotbs02丢失;北亞數據庫數據恢複工程師對這些文件進行手工修複。
北亞數據恢複——OceanStor存儲數據恢複
北亞數據恢複——OceanStor存儲數據恢複
北亞數據庫數據恢複工程師創建控制文件、undo表空間,啟動數據庫到mount。由于system數據文件存在壞塊,數據庫不能open,各種隐含參數也不能繞過system的壞塊。搭建數據庫環境并使用dmp文件還原數據庫,最終導入10G左右的數據。
北亞數據恢複——OceanStor存儲數據恢複
數據驗證:
由用戶方配合啟動Oracle數據庫,在本地虛拟機安裝OA客戶端,通過OA客戶端對數據記錄進行驗證,并且讓用戶安排不同部門人員進行遠程驗證。驗證通過,數據恢複成功。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!