近日鴻萌接到一個HP P2000 G3 MSA惠普磁盤陣列系統業務案例,該設備由10塊900G SAS機械硬盤組成RAID 6陣列,其中有三塊硬盤報警,設備癱瘓,導緻數據丢失。
今天,鴻萌借助這個案例,針對RAID 6的陣列進行一下分析。
RAID 6是一個由獨立硬盤組成的陣列,配備了兩個獨立的分布式校驗和方案。一般來說,RAID 6類似于RAID 5,但有更大的冗餘度,因為有兩個校驗碼被計算并寫入陣列成員盤。第一個奇偶校驗函數(P)與RAID 5的情況相同(獨占或或XOR),而第二個函數(Q)則複雜得多(通常是Reed-Solomon ① 函數)。
除了RAID 5典型的參數,如磁盤數量、磁盤順序、塊大小、起始偏移量、P函數的奇偶校驗模式之外,RAID6還有一些額外的參數。
RAID 6參數
RAID 6布局利用兩種不同的奇偶校驗功能,這有助于RAID 6陣列在雙磁盤故障下不影響工作。盡管RAID6被認為比RAID5更可靠,但控制器故障的概率是一樣的。因此,如果您的RAID6出現故障,這很可能是由于控制器故障造成的。為了從控制器故障中恢複RAID6,我們需要知道或恢複以下參數:
u 陣列中硬盤的數量
u 磁盤順序以及哪個磁盤是陣列中的第一個磁盤
u 塊大小
u 成員盤的起始偏移量。
u 每個奇偶函數的位置。
u 奇偶函數的旋轉。
u 用于計算第二個奇偶校驗函數的算法。
u 奇偶校驗函數的模式。
我們應該知道以上所有這些參數,才可以成功重建RAID 6。
RAID 6變化
RAID 6比RAID 5複雜得多。第一個奇偶校驗函數(XOR,在圖中表示為P)自然來自RAID5。然而,第二個奇偶校驗函數(Q)沒有被廣泛接受的标準。通常情況下,使用Reed-Solomon碼或其一些變體。Reed-Solomon碼取決于輸入的順序。這又産生了四種變化:從左到右或從右到左,以及如果P或Q先計算。
有幾種布局的變化,可容納兩個奇偶函數。
當我們通過硬盤底層代碼将上述參數分析出來以後,就可以通過數據恢複專用工具,将陣列在軟件中虛拟出來,使丢失的數據瞬間可以重現。後續的任務就是将數據慢慢導出到好的硬盤上了。
注釋:
① .Reed-Solomon RS編碼,又稱裡所碼,即Reed-solomon codes,是一種前向糾錯的信道編碼,對由校正過采樣數據所産生的多項式有效。當接收器正确的收到足夠的點後,它就可以恢複原來的多項式,即使接收到的多項式上有很多點被噪聲幹擾失真。裡德-所羅門碼被廣泛的應用于各種商業用途,最顯著的是在CD、DVD和藍光光盤上的使用;在數據傳輸中,它也被用于DSL和WiMAX;廣播系統中DVB和ATSC也閃現着它的身影;在電腦科學裡,它是第六層标準RAID的重要成員。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!