0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

服務器數(shù)據(jù)恢復—熱備盤未成功激活導致陣列崩潰的RAID5數(shù)據(jù)恢復案例

Frombyte ? 來源:Frombyte ? 作者:Frombyte ? 2024-11-19 14:21 ? 次閱讀

服務器數(shù)據(jù)恢復環(huán)境:
品牌X3850服務器中有一組由數(shù)塊SAS硬盤組建的RAID5陣列,該陣列中有一塊盤是熱備盤。操作系統(tǒng)linux redhat,上面跑著一個基于oracle數(shù)據(jù)庫的oa。

服務器故障:
服務器raid5陣列中有一塊硬盤離線,但是熱備盤沒有成功激活,之后另外一塊硬盤離線,RAID崩潰。

服務器數(shù)據(jù)恢復過程:
1、將故障服務器中所有硬盤標記后取出,硬件工程師檢測后沒有發(fā)現(xiàn)存在硬件故障的硬盤。將所有硬盤以只讀方式進行扇區(qū)級全盤鏡像,鏡像過程中發(fā)現(xiàn)較后掉線的那塊盤上存在少量壞扇區(qū),其余磁盤均沒有發(fā)現(xiàn)無壞道。
2、基于鏡像文件分析所有磁盤底層數(shù)據(jù),找到重組raid所需要的相關信息。

poYBAGNQ12mAff2GAAJOfi8KFfE484.png

北亞企安數(shù)據(jù)恢復—raid5數(shù)據(jù)恢復



3、根據(jù)上述獲取到的raid結構相關信息(RAID級別,條帶規(guī)則,條帶大小,校驗方向,META區(qū)域等)重組raid,重組完成后進行數(shù)據(jù)驗證,發(fā)現(xiàn)200M以上的最新壓縮包解壓正常,判斷該raid結構信息沒有問題。
4、按照該結構生成RAID到一塊單硬盤上,打開文件系統(tǒng)無明顯報錯。
5、在確定備份沒有問題后,經(jīng)用戶方授權,對原盤重建RAID。重建時已經(jīng)用全新硬盤更換發(fā)現(xiàn)壞道的后掉線的那塊盤。
6、將恢復好的單盤接入故障服務器,用linux SystemRescueCd啟動故障服務器并通過dd命令進行全盤回寫。
7、回寫完成后啟動操作系統(tǒng),無法進入操作系統(tǒng)并且報錯,報錯信息為:/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied,懷疑該文件權限有問題。用SystemRescueCd重啟后檢查,發(fā)現(xiàn)此文件時間,權限,大小均有明顯錯誤,顯然節(jié)點損壞。
8、分析重組數(shù)據(jù)中的根分區(qū),定位出錯的/sbin/pidof,發(fā)現(xiàn)問題是由于后掉線硬盤上的壞道導致的。
9、使用其他幾塊完好的硬盤針對后離線磁盤的損壞區(qū)域進行xor補齊。補齊后重新校驗文件系統(tǒng),依然有錯誤。再次檢查inode表,發(fā)現(xiàn)這塊盤損壞區(qū)域有部分節(jié)點表現(xiàn)異常。

poYBAGNQ13CAesqlAAN3uAwZ2_Q280.png

北亞企安數(shù)據(jù)恢復—raid5數(shù)據(jù)恢復



雖然節(jié)點中描述的uid還正常存在,但屬性、大小、最初的分配塊全部錯誤。按照所有可能性進行分析后,確定無法找回此損壞節(jié)點。只能希望能夠修復此節(jié)點,或復制一個相同的文件過來。
10、針對所有可能有錯的文件,北亞企安數(shù)據(jù)恢復工程師通過日志確定原節(jié)點塊的節(jié)點信息,然后做修正。
11、修正后重新dd根分區(qū),執(zhí)行fsck -fn /dev/sda5進行檢測,依然報錯。

pYYBAGNQ13WAI9OOAANVx3oVBEk972.png

北亞企安數(shù)據(jù)恢復—raid5數(shù)據(jù)恢復



根據(jù)提示檢查發(fā)現(xiàn)在系統(tǒng)中發(fā)現(xiàn)有多個節(jié)點共用同樣的數(shù)據(jù)塊。按此提示分析底層,發(fā)現(xiàn)因為有一塊盤很早掉線,所以存在節(jié)點信息的新舊交集。
12、按照節(jié)點所屬的文件進行區(qū)別,清除錯誤節(jié)點后,再次執(zhí)行fsck -fn /dev/sda5,依然有報錯信息,但已經(jīng)很少。根據(jù)提示,發(fā)現(xiàn)這些節(jié)點多位于doc目錄下,不影響系統(tǒng)啟動,于是執(zhí)行fsck -fy /dev/sda5強行修復。
13、修復后,重啟系統(tǒng),成功進入桌面。啟動數(shù)據(jù)庫服務,啟動應用軟件,一切正常,無報錯。用戶方檢測后,認可數(shù)據(jù)恢復結果。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 服務器
    +關注

    關注

    12

    文章

    9231

    瀏覽量

    85625
  • 數(shù)據(jù)恢復

    關注

    10

    文章

    580

    瀏覽量

    17522
  • RAID5
    +關注

    關注

    0

    文章

    121

    瀏覽量

    12738
收藏 人收藏

    評論

    相關推薦

    服務器數(shù)據(jù)恢復RAID5陣列兩塊硬盤離線崩潰,數(shù)據(jù)如何起死回生?

    服務器數(shù)據(jù)恢復環(huán)境: 兩組分別由4塊SAS接口硬盤組建的raid5陣列,兩組raid5
    的頭像 發(fā)表于 12-11 13:17 ?296次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b>兩塊硬盤離線<b class='flag-5'>崩潰</b>,<b class='flag-5'>數(shù)據(jù)</b>如何起死回生?

    服務器數(shù)據(jù)恢復RAID5陣列同步數(shù)據(jù)失敗的數(shù)據(jù)恢復案例

    服務器存儲數(shù)據(jù)恢復環(huán)境: 華為S5300存儲中有12塊FC硬盤,其中11塊硬盤作為數(shù)據(jù)組建了一組RA
    的頭像 發(fā)表于 12-04 16:02 ?267次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b><b class='flag-5'>熱</b><b class='flag-5'>備</b><b class='flag-5'>盤</b>同步<b class='flag-5'>數(shù)據(jù)</b>失敗的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>案例

    服務器數(shù)據(jù)恢復raid5陣列崩潰導致上層lun無法正常使用的數(shù)據(jù)恢復案例

    服務器存儲數(shù)據(jù)恢復環(huán)境: 某品牌MSA2000FC存儲中有一組由7塊組建的RAID5陣列,另
    的頭像 發(fā)表于 11-25 14:04 ?136次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>崩潰</b><b class='flag-5'>導致</b>上層lun無法正常使用的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>案例

    RAID5數(shù)據(jù)恢復—如何重組RAID5陣列?

    RAID5數(shù)據(jù)恢復環(huán)境: 一臺存儲上有一組由12塊SCSI硬盤(11塊數(shù)據(jù)+1塊
    的頭像 發(fā)表于 10-22 15:48 ?298次閱讀
    <b class='flag-5'>RAID5</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>—如何重組<b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b>?

    服務器數(shù)據(jù)恢復RAID5陣列硬盤離線但激活數(shù)據(jù)恢復案例

    。 服務器故障: 這組raid5陣列中一塊磁盤離線,但是并沒有自動
    的頭像 發(fā)表于 10-15 10:33 ?306次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b>硬盤離線但<b class='flag-5'>熱</b><b class='flag-5'>備</b><b class='flag-5'>盤</b>未<b class='flag-5'>激活</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>案例

    服務器數(shù)據(jù)恢復raid5陣列盤上線同步失敗的數(shù)據(jù)恢復案例

    服務器磁盤陣列數(shù)據(jù)恢復環(huán)境: 服務器中有兩組分別由4塊SAS硬盤組建的raid5磁盤
    的頭像 發(fā)表于 09-19 11:01 ?298次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>熱</b><b class='flag-5'>備</b>盤上線同步失敗的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>案例

    服務器數(shù)據(jù)恢復raid5陣列未全部成功啟用的數(shù)據(jù)恢復案例

    服務器存儲數(shù)據(jù)恢復環(huán)境: 一臺EMC某型號存儲中有一組RAID5磁盤陣列。該raid5
    的頭像 發(fā)表于 08-14 11:27 ?404次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>熱</b><b class='flag-5'>備</b><b class='flag-5'>盤</b>未全部<b class='flag-5'>成功</b>啟用的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>案例

    服務器數(shù)據(jù)恢復raid5陣列同步失敗的數(shù)據(jù)恢復案例

    服務器存儲數(shù)據(jù)恢復環(huán)境: 華為S5300存儲中有一組由16塊FC硬盤組建的RAID5磁盤陣列(包含一塊
    的頭像 發(fā)表于 07-15 11:38 ?538次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>熱</b><b class='flag-5'>備</b><b class='flag-5'>盤</b>同步失敗的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>案例

    服務器數(shù)據(jù)恢復raid5陣列未完全激活導致陣列崩潰數(shù)據(jù)恢復案例

    服務器存儲數(shù)據(jù)恢復環(huán)境: 北京某企業(yè)一臺EMC FCAX-4存儲上搭建一組由12塊成員raid5磁盤
    的頭像 發(fā)表于 07-12 10:58 ?342次閱讀

    服務器數(shù)據(jù)恢復—EMC存儲中raid5陣列多塊硬盤離線的數(shù)據(jù)恢復案例

    突然崩潰。管理員檢查發(fā)現(xiàn)存儲中的raid5陣列有兩塊硬盤離線,該陣列中的兩塊
    的頭像 發(fā)表于 07-09 11:58 ?239次閱讀

    服務器數(shù)據(jù)恢復raid5陣列硬盤壞道導致raid崩潰數(shù)據(jù)恢復案例

    服務器存儲數(shù)據(jù)恢復環(huán)境: 某單位一臺某品牌DS5300存儲,1個機頭+4個擴展柜,50塊硬盤組建2組RAID5磁盤陣列(一組
    的頭像 發(fā)表于 07-05 12:00 ?570次閱讀

    服務器數(shù)據(jù)恢復—磁盤不穩(wěn)定被踢導致raid5陣列崩潰數(shù)據(jù)恢復案例

    服務器存儲數(shù)據(jù)恢復環(huán)境: 某品牌MSA2000服務器存儲中有一組由8塊SAS硬盤組建的raid5磁盤
    的頭像 發(fā)表于 06-12 11:30 ?325次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>—磁盤不穩(wěn)定被踢<b class='flag-5'>導致</b><b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>崩潰</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>案例

    服務器數(shù)據(jù)恢復raid5陣列硬盤離線且激活數(shù)據(jù)恢復案例

    raid5陣列中兩塊硬盤由于未知故障離線,服務器數(shù)據(jù)丟失。北亞企安數(shù)據(jù)恢復中心安排
    的頭像 發(fā)表于 06-06 17:07 ?417次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b>硬盤離線且<b class='flag-5'>熱</b><b class='flag-5'>備</b><b class='flag-5'>盤</b>未<b class='flag-5'>激活</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>案例

    服務器數(shù)據(jù)恢復RAID5多塊磁盤掉線導致崩潰數(shù)據(jù)恢復案例

    某公司的一臺服務器中的raid5磁盤陣列有兩塊磁盤先后掉線,服務器崩潰。故障服務器的操作系統(tǒng)為l
    的頭像 發(fā)表于 05-21 11:43 ?806次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>—<b class='flag-5'>RAID5</b>多塊磁盤掉線<b class='flag-5'>導致</b><b class='flag-5'>崩潰</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>案例

    服務器數(shù)據(jù)恢復—華為OceanStor存儲raid5數(shù)據(jù)恢復案例

    服務器數(shù)據(jù)恢復環(huán)境: 華為OceanStor某型號存儲,存儲內有一組由24塊硬盤組建的raid5陣列,配置1塊
    的頭像 發(fā)表于 01-18 11:58 ?462次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>—華為OceanStor存儲<b class='flag-5'>raid5</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復</b>案例