服務器數(shù)據(jù)恢復環(huán)境:
華為s系列服務器;
24塊硬盤組成一組raid5磁盤陣列,其中包含1塊熱備盤。
服務器故障&檢測:
服務器工作狀態(tài)下raid5中有一塊硬盤離線,熱備盤激活替換離線硬盤并開始進行數(shù)據(jù)同步,在同步的過程中該raid5陣列內的另一塊硬盤由于未知原因離線,上層應用崩潰,服務器內的數(shù)據(jù)丟失。
拿到故障服務器內的所有硬盤后,硬件工程師對所有硬盤進行物理故障檢測,發(fā)現(xiàn)除了其中的一塊硬盤外,其他硬盤均可以正常讀取無物理故障。
服務器數(shù)據(jù)恢復過程:
1、將故障服務器內所有硬盤以只讀方式做完整的鏡像備份,后續(xù)數(shù)據(jù)分析和數(shù)據(jù)恢復操作都基于鏡像文件進行,避免對原始數(shù)據(jù)造成二次破壞。
2、由于華為s系列服務器的控制器的磁盤檢測策略非常嚴格。對于沒有物理故障但性能不穩(wěn)定的硬盤,控制器會將其視作壞盤踢出陣列。之前檢測到只有一塊硬盤存在物理故障,因此故障服務器中掉線的兩塊盤中另外一塊是因為讀寫不穩(wěn)定被視作壞盤踢出而掉線。
3、對每一塊硬盤底層進行分析,獲取到raid陣列的條帶大小、數(shù)據(jù)走向、硬盤順序、熱備盤、數(shù)據(jù)庫的分布規(guī)律等raid相關信息。根據(jù)分析獲取到的raid陣列信息重組raid。
4、根據(jù)分析獲取到的陣列相關信息,使用北亞企安自主研發(fā)的工具重組原始raid5陣列。
5、在重組過程中發(fā)現(xiàn)有一塊硬盤內的數(shù)據(jù)在同步時候被破壞。由于在數(shù)據(jù)恢復過程中需要將數(shù)據(jù)被損壞的硬盤排除,于是數(shù)據(jù)恢復工程師對所有硬盤進行了底層數(shù)據(jù)結構的對比。對比發(fā)現(xiàn)其中一塊硬盤在相同條帶上的數(shù)據(jù)與其他硬盤明顯不同。
6、使用北亞自主研發(fā)的raid校驗程序對該硬盤進行條帶校驗,確認該硬盤數(shù)據(jù)已經(jīng)在同步的時候被破壞。排除這塊硬盤后重組raid5磁盤陣列。
7、完成raid陣列重組后,分析lun在raid中的分配情況及數(shù)據(jù)塊map。只要能將map完整提取出來,就可以進行解析并提取lun數(shù)據(jù)。
8、北亞企安數(shù)據(jù)恢復工程師編寫文件系統(tǒng)解析程序對陣列內文件系統(tǒng)進行解析并導出數(shù)據(jù)庫文件。
9、由數(shù)據(jù)庫工程師對提取的數(shù)據(jù)庫文件進行校驗和修復。數(shù)據(jù)庫工程師對數(shù)據(jù)庫文件進行驗證后發(fā)現(xiàn)部分數(shù)據(jù)庫文件及日志文件異常,表空間內存在大量壞塊、所有控制文件被破壞,undotbs02丟失,數(shù)據(jù)庫工程師對數(shù)據(jù)庫文件進行了修復。
修復過程:
北亞企安數(shù)據(jù)恢復——oracle數(shù)據(jù)庫數(shù)據(jù)恢復
北亞企安數(shù)據(jù)恢復——oracle數(shù)據(jù)庫數(shù)據(jù)恢復
數(shù)據(jù)驗證:
經(jīng)過數(shù)據(jù)庫工程師對數(shù)據(jù)庫文件的修復和驗證,最終恢復出所有的數(shù)據(jù)庫文件。服務器數(shù)據(jù)恢復工程師將修復成功的數(shù)據(jù)庫數(shù)據(jù)導入到準備好的環(huán)境中進行驗證,所有數(shù)據(jù)正常。聯(lián)系用戶親自對數(shù)據(jù)進行驗證均無異常。本次數(shù)據(jù)恢復工作完成。
審核編輯:湯梓紅
-
服務器
+關注
關注
13文章
9730瀏覽量
87462 -
數(shù)據(jù)恢復
+關注
關注
10文章
642瀏覽量
18063 -
RAID5
+關注
關注
0文章
131瀏覽量
12992
發(fā)布評論請先 登錄
服務器數(shù)據(jù)恢復—raid5陣列多塊硬盤離線導致EMC存儲不可用的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—RAID5陣列兩塊硬盤離線崩潰,數(shù)據(jù)如何起死回生?

服務器數(shù)據(jù)恢復—RAID5陣列熱備盤同步數(shù)據(jù)失敗的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—raid5陣列崩潰導致上層lun無法正常使用的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—華為OceanStor存儲中RAID5陣列數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—用5盤RAID5陣列中的4塊盤重建RAID5陣列后如何恢復原始數(shù)據(jù)?
服務器數(shù)據(jù)恢復—RAID5陣列硬盤離線但熱備盤未激活的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—Raid5陣列兩塊硬盤指示燈亮黃色的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—raid5陣列熱備盤上線同步失敗的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—raid5陣列熱備盤未全部成功啟用的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—raid5陣列熱備盤同步失敗的數(shù)據(jù)恢復案例

評論