這里說的RAID-5故障,是指RAID-5邏輯盤丟失或不可訪問。服務(wù)器RAID-5出現(xiàn)故障后在數(shù)據(jù)沒有完全備份的情況下切記不可對離線硬盤就是強(qiáng)制上線或重建等操作,這會對服務(wù)器數(shù)據(jù)恢復(fù)是不可逆的,導(dǎo)致RAID-5故障的原因主要有以下幾種:
1.RAID控制器出現(xiàn)物理故障
RAID控制器如果出現(xiàn)物理故障,將不能被計(jì)算機(jī)識別,也就無法完成對RAID-5中各 個(gè)物理成員盤的控制,在這種情況下,通過RAID控制器虛擬出來的邏輯盤自然就不存在了。
2.RAID信息出錯(cuò)
RAID控制器將物理盤配置為RAID-5后,會生成一些參數(shù),包括該RAID-5的盤序、 條帶大小、左右結(jié)構(gòu)情況、同步異步情況、RAID-5在每塊物理盤中的起始地址等,還會記錄有關(guān)該RA1D-5的相關(guān)信息,包括組成該RAID-5的物理盤數(shù)目、物理盤的容量大小等, 所有這些信息和參數(shù)就被稱為RAID信息,也稱為RAID元數(shù)據(jù),它們會被保存到RAID 控制器中,有時(shí)候也會保存到RAID-5的成員盤中。
RAID信息出錯(cuò)就是指該RAID-5的配置信息和參數(shù)出現(xiàn)錯(cuò)誤,導(dǎo)致RAID程序不能正 確地組織管理RAID-5中的成員盤,從而導(dǎo)致RA1D-5邏輯盤丟失或不能訪問。
3.RAID-5成員盤出現(xiàn)物理故障
RA1D-5可以允許其中一塊成員盤離線而不影響數(shù)據(jù)的完整性,如果RAID-5中的某一 塊成員盤出現(xiàn)物理故障,比如電路損壞、磁頭損壞、固件損壞、出現(xiàn)壞扇區(qū)等,該成員盤 就不能正常使用,但剩下的成員盤可以利用異或運(yùn)算計(jì)算出離線成員盤中的數(shù)據(jù),所以 RAID-5還不會崩潰。
如果系統(tǒng)管理員沒有及時(shí)替換出現(xiàn)故障的成員盤,當(dāng)再有一塊成員盤出現(xiàn)故障離線后, RAID-5將徹底崩潰。
4.人為誤操作
如果誤將RAID-5中兩塊以上成員盤同時(shí)拔出,或者給RAID-5除塵時(shí)將成員盤拔出后 忘了原來的順序,以及不小心刪除了 RAID-5的配置信息等,都會造成RAID-5崩潰。
5.RAID控制器的穩(wěn)定性
RAID-5的數(shù)據(jù)分布結(jié)構(gòu)中有校驗(yàn)塊的存在,當(dāng)RAID-5中有成員盤離線時(shí),算法將變 得更加復(fù)雜,RAID控制器將會工作在一個(gè)比較吃力的狀態(tài)。而RAID控制器的負(fù)載太重便 會極大地增加數(shù)據(jù)讀寫時(shí)出現(xiàn)I/O滯留的可能性,從而導(dǎo)致更多成員盤離線,或者導(dǎo)致 RAID信息出錯(cuò)。
本文系轉(zhuǎn)載,如有侵犯版權(quán)問題,請通知。我們立即刪除。
轉(zhuǎn)載請注明:成都千喜數(shù)據(jù)恢復(fù)中心 » 服務(wù)器RAID-5的故障原因及分析