一、raid5常見故障介紹
1. 服務器硬件出現故障或者RAID陣列卡故障;
2. 服務器意外斷電導致磁盤陣列故障;
3. 服務器陣列上的磁盤出現物理故障,如:電路板壞、磁頭損壞、盤面壞、壞扇區、固件壞等;
4. 管理員在維護服務器過程中由于誤操作導致硬盤盤序出現錯誤;
5. raid在同步數據或者重建過程中,同組raid陣列中有其他硬盤掉線導致同步失敗;
6. 配置raid陣列信息出錯等誤操作導致數據丟失。
二、RAID5磁盤陣列故障后需要注意哪些問題
1. RAID5磁盤陣列出現故障或者數據丟失后建議不要盲目進行rebuild操作。
Rebuild操作就是利用陣列的校驗功能,根據陣列內其他正常硬盤內的數據,將損壞硬盤的數據進行計算生成并同步到熱備盤中。這種操作適合陣列中有1塊硬盤掉線的情況,一旦陣列中有2塊硬盤出現故障掉線了,則通常掉線順序有先有后,如果在第一塊硬盤掉線后服務器已經進行過寫入操作的話,此時第一塊掉線的硬盤數據已經久不更新,rebuild只能對先掉線的磁盤做Rebuild,如果對后掉線的磁盤進行重建操作,部分陣列雖然能正常工作,但數據錯亂,一些文件不能打開,給用戶帶來不可挽回的損失。
2. 如果有硬盤掉線不建議盲目進行強制上線操作。
在北亞數據恢復中心恢復的raid5數據恢復案例中,有部分raid陣列數據丟失原因是因為陣列中有一塊硬盤離線以后沒有及時更換硬盤,此后服務器出現故障或者正常重啟,原本離線的硬盤重新上線,而原本在線的硬盤反而故障離線,數據不能正常使用。
用戶對后離線的硬盤進行強制上線操作,磁盤陣列進行自動同步,導致數據新舊混亂,服務器數據丟失。因為原來離線的盤又自動上線,大多數陣列卡會檢驗校驗信息,一旦發現校驗信息不正確,會重新計算校驗信息,致使不能缺盤恢復數據,將會數據恢復失敗。
3. 千萬不要進行初始化操作。
初始化是一種類似于低級格式化的操作,一旦對陣列進行初始化操作,那么這個陣列內所有硬盤的底層數據將全部被清零,此時將導致陣列數據無法恢復。
4. 重新配置磁盤陣列信息時要保證與原始配置信息一致。
如果需要重新配置磁盤陣列信息時,一定要注意與原始配置信息保持一致,一旦重新配置的參數與原始信息不一致,將導致陣列內多數文件無法打開,造成數據丟失。并且多數服務器都有重新配置陣列信息后自動初始化的功能,這將導致數據無法恢復。
5. 在進行數據恢復嘗試前請務必對服務器內的所有硬盤進行扇區級的鏡像備份,避免破壞原始數據,如果有條件,可以聯系數據恢復中心獲取技術指導。
三、RAID5故障數據恢復方案
1. 鏡像服務器內所有數據。
按照一定的順序將服務器內的所有硬盤進行排序編號,然后將每塊硬盤進行鏡像備份,也可以將服務器攜帶至北亞數據恢復中心,由數據恢復工程師進行鏡像操作。
2. 將鏡像文件交給數據恢復中心進行底層數據分析,重組raid陣列,導出用戶數據。
3. 對導出的所有數據進行驗證,確認無誤后重新搭建服務器環境,將恢復的數據遷移回服務器內即可。
原文地址:https://blog.51cto.com/sun510/3392339