這里說的RAID-5EE故障,是指RAID-5EE邏輯盤丟失或不可訪問。導致RAID-5EE 故障的原因主要有以下幾種:
1. RAID控制器出現(xiàn)物理故障
RAID控制器如果出現(xiàn)物理故障,將不能被計算機識別,也就無法完成對RAID-5EE 中各個物理成員盤的控制,在這種情況下,通過RAID控制器虛擬出來的邏輯盤自然就不存在了。
2. RAID信息出錯
RAID控制器將物理盤配置為RA1D-5EE后,會生成一些參數(shù),包括該RAID-5EE的 盤序、條帶大小、左右結(jié)構(gòu)情況、同步異步情況、RAID-5EE在每塊物理盤中的起始地址 等,還會記錄有關(guān)該RAID-5EE的相關(guān)信息,包括組成該RAID-5EE的物理盤數(shù)目、物理 盤的容量大小等,所有這些信息和參數(shù)就被稱為RAID信息,也稱為RAID元數(shù)據(jù),它們 會被保存到RAID控制器中,有時候也會保存到RAID-5EE的成員盤中。
RAID信息出錯就是指該RAID-5EE的配置信息和參數(shù)出現(xiàn)錯誤,導致RAID程序不 能正確地組織管理RAID-5EE中的成員盤,從而導致RAID-5EE邏輯盤丟失或不能訪問。
3. RAID-5EE成員盤出現(xiàn)物理故障
RAID-5EE中一塊成員盤離線后,剩下的成員盤會計算生成離線成員盤的數(shù)據(jù)并寫入熱備空間內(nèi),如果在這個過程還沒有完成的情況下又有一塊成員盤離線,RAID-5EE就會 崩潰。
4.人為誤操作
如果誤將RAID-5EE中兩塊以上成員盤同時拔出,或者給RAID-5EE除塵時將成員盤 拔出后忘了原來的順序,以及不小心刪除了 RAID-5EE的配置信息等,都會造成RAID-5EE 崩潰。
5. RAID控制器的穩(wěn)定性
RAID-5EE的數(shù)據(jù)分布結(jié)構(gòu)中有校驗塊和熱備塊的存在,當RAID-5EE中有成員盤離 線時,算法將變得非常復雜,RAID控制器將會工作在一個比較吃力的狀態(tài)。而RAID控制器的負載太重便會極大地增加數(shù)據(jù)讀寫時出現(xiàn)I/O滯留的可能性,從而導致更多成員盤離線,或者導致RAID信息出錯。
轉(zhuǎn)載請注明:成都千喜數(shù)據(jù)恢復中心 » 服務(wù)器RAID-5EE的故障原因及分析