這里說的RAID-6故障,是指RAID-6邏輯盤丟失或不可訪問。導(dǎo)致RAID-6故障的原 因主要有以下幾種:
1. RAID控制器出現(xiàn)物理故障
RAID控制器如果出現(xiàn)物理故障,將不能被計(jì)算機(jī)識別,也就無法完成對RAID-6中各 個(gè)物理成員盤的控制,在這種情況下,通過RAID控制器虛擬出來的邏輯盤自然就不存在了。
2. RAID信息出錯
RAID控制器將物理盤配置為RAID-6后,會生成一些參數(shù),包括該RAID-6的盤序、 條帶大小、RAID在每塊物理盤中的起始地址、校驗(yàn)的排列方式等,還會記錄該RAID-6的 相關(guān)信息,包括組成該RAID-6的物理盤數(shù)目、物理盤的容量大小等,所有這些信息和參 數(shù)就被稱為RAID信息,也稱為RAID元數(shù)據(jù),它們會被保存到RAID控制器中,有時(shí)候 也會保存到RAID-6的成員盤中。
RAID信息出錯就是指該RAID-6的配置信息和參數(shù)出現(xiàn)錯誤,導(dǎo)致RAID程序不能正 確地組織管理RAID-6中的成員盤,從而導(dǎo)致RAID-6邏輯盤丟失或不能訪問。
3. RAID-6成員盤出現(xiàn)物理故障
RAID-6 可以允許其中兩塊成員盤離線而不影響數(shù)據(jù)的完整性,如果RAID-6中的某兩 塊成員盤相繼出現(xiàn)物理故障,剩下的成員盤可以利用校驗(yàn)值計(jì)算出離線成員盤中的數(shù)據(jù), 所以RAID-6還不會崩潰。
如果系統(tǒng)管理員沒有及時(shí)替換出現(xiàn)故障的成員盤,當(dāng)?shù)谌龎K成員盤再出現(xiàn)故障離線后, RAID-6將徹底崩潰。
4. 人為誤操作
如果誤將RAID-6中三塊以上成員盤同時(shí)拔出,或者給RAID-6除塵時(shí)將成員盤拔出后 忘了原來的順序,以及不小心刪除RAID-6的配置信息等,都會造成RAID-6崩潰。
5. RAID控制器的穩(wěn)定性
RAID-6的數(shù)據(jù)分布結(jié)構(gòu)中有兩個(gè)校驗(yàn)值存在,當(dāng)RAID-6中有成員盤離線時(shí),尤其是 當(dāng)兩塊成員盤離線后,算法將變得非常復(fù)雜,RAID控制器將會工作在很吃力的狀態(tài)。而 RAID控制器的負(fù)載太重便會極大地增加數(shù)據(jù)讀寫時(shí)出現(xiàn)I/O滯留的可能性,從而導(dǎo)致更多 成員盤離線,或者導(dǎo)致RAID信息出錯。
本文系轉(zhuǎn)載,如有侵犯版權(quán)問題,請通知。我們立即刪除。
轉(zhuǎn)載請注明:成都千喜數(shù)據(jù)恢復(fù)中心 » 服務(wù)器RAID-6故障原因及分析