這里說的HP雙循環(huán)故障,是指HP雙循環(huán)邏輯盤丟失或不可訪問。導(dǎo)致HP雙循環(huán)故 障的原因主要有以下幾種:
1. RAID控制器出現(xiàn)物理故陣
RAID控制器如果出現(xiàn)物理故障,將不能被計算機識別,也就無法完成對HP雙循環(huán)中 各個物理成員盤的控制,在這種情況下,通過RAID控制器虛擬出來的邏輯盤自然就不存在了。
2. RAID信息出錯
RAID控制器將物理盤配置為HP雙循環(huán)后,會生成一些參數(shù),包括該HP雙循環(huán)的盤 序、條帶大小、RAID在每塊物理盤中的起始地址等,還會記錄有關(guān)該HP雙循環(huán)的相關(guān)信 息,包括組成該HP雙循環(huán)的物理盤數(shù)目、物理盤的容量大小等,所有這些信息和參數(shù)就被稱為RAID信息,也稱為RAID元數(shù)據(jù),它們會被保存到RAID控制器中,有時候也會 保存到HP雙循環(huán)的成員盤中。
RAID信息出錯就是指該HP雙循環(huán)的配置信息和參數(shù)出現(xiàn)錯誤,導(dǎo)致RAID程序不能 正確地組織管理HP雙循環(huán)中的成員盤,從而導(dǎo)致HP雙循環(huán)邏輯盤丟失或不能訪問。
3. HP雙循環(huán)成員盤出現(xiàn)物理故障
HP雙循環(huán)可以允許其中一塊成員盤離線而不影響數(shù)據(jù)的完整性,如果HP雙循環(huán)中的 某一塊成員盤出現(xiàn)物理故障,比如電路損壞、磁頭損壞、固件損壞、出現(xiàn)壞扇區(qū)等,該成 員盤就不能正常使用,但剩下的成員盤可以利用異或運算計算出離線成員盤中的數(shù)據(jù),所 以HP雙循環(huán)還不會崩潰。
如果系統(tǒng)管理員沒有及時替換出現(xiàn)故障的成員盤,當(dāng)再有一塊成員盤出現(xiàn)故障離線后, HP雙循環(huán)將徹底崩潰。
4. 人為誤操作
如果誤將HP雙循環(huán)中兩塊以上成員盤同時拔出,或者給HP雙循環(huán)除塵時將成員盤拔 出后忘了原來的順序,以及不小心刪除了 HP雙循環(huán)的配置信息等,都會造成HP雙循環(huán) 崩潰。
5. RAID控制器的穩(wěn)定性
HP雙循環(huán)的數(shù)據(jù)分布結(jié)構(gòu)中有校驗塊的存在,當(dāng)HP雙循環(huán)中有成員盤離線時,算法 將變得更加復(fù)雜,RAID控制器將會工作在一個比較吃力的狀態(tài)。而RAID控制器的負載太 重便會極大地增加數(shù)據(jù)讀寫時出現(xiàn)I/O滯留的可能性,從而導(dǎo)致更多成員盤離線,或者導(dǎo) 致RAID信息出錯。
轉(zhuǎn)載請注明:成都千喜數(shù)據(jù)恢復(fù)中心 » HP服務(wù)器雙循環(huán)的故障原因及分析