0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

服務(wù)器數(shù)據(jù)恢復(fù)—raid5熱備盤未激活導(dǎo)致陣列崩潰的數(shù)據(jù)恢復(fù)案例

Frombyte ? 來源:Frombyte ? 作者:Frombyte ? 2023-12-12 13:58 ? 次閱讀

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
品牌X系列服務(wù)器,4塊SAS硬盤組建了一組RAID5陣列,還有1塊磁盤作為熱備盤使用。服務(wù)器上層安裝的linux操作系統(tǒng),操作系統(tǒng)上部署了一個基于oracle數(shù)據(jù)庫的OA(oracle已經(jīng)不再為該OA系統(tǒng)提供后續(xù)服務(wù)支持)。

服務(wù)器故障:
raid5中一塊磁盤離線,熱備盤未自動激活rebuild(原因不明)。服務(wù)器在運行一段時間后,另一塊磁盤離線,RAID5陣列崩潰。用戶方要求盡可能恢復(fù)服務(wù)器操作系統(tǒng)和服務(wù)器中的數(shù)據(jù)。
將故障服務(wù)器中所有磁盤編號后取出,硬件工程師檢測后沒有發(fā)現(xiàn)有磁盤(包括離線的2塊磁盤和熱備盤)存在明顯的物理故障。熱備盤完全沒有啟用,無明顯同步表現(xiàn)。

服務(wù)器數(shù)據(jù)恢復(fù)方案:
1、將所有磁盤以只讀方式進行扇區(qū)級的全盤鏡像,鏡像完成后將所有磁盤按照編號還原到原服務(wù)器中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進行,避免對原始磁盤數(shù)據(jù)造成二次破壞。
2、基于鏡像文件分析RAID5結(jié)構(gòu),獲取到RAID5條帶規(guī)則、條帶大小、校驗方向、META區(qū)域等raid結(jié)構(gòu)相關(guān)信息。
3、根據(jù)獲取到的RAID結(jié)構(gòu)信息虛擬重構(gòu)RAID5。
4、解釋虛擬磁盤及文件系統(tǒng)。
5、檢測重構(gòu)的raid5結(jié)構(gòu)是否正確,如不正確,重復(fù)2-4過程。
6、檢測raid5結(jié)構(gòu)沒有問題以及數(shù)據(jù)無誤后,按用戶要求回遷數(shù)據(jù)。

服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、在對故障服務(wù)器中磁盤做鏡像時,發(fā)現(xiàn)后離線的那塊磁盤有十幾個壞扇區(qū),其余磁盤沒有發(fā)現(xiàn)有壞道。
2、基于鏡像文件分析獲取raid5結(jié)構(gòu)相關(guān)信息。

wKgaomV39jiAeMN1AAGExaAn2SE040.png

北亞企安數(shù)據(jù)恢復(fù)——Raid5數(shù)據(jù)恢復(fù)



3、根據(jù)獲取到的raid結(jié)構(gòu)信息虛擬重組raid5,重組完成后驗證數(shù)據(jù),發(fā)現(xiàn)200M以上的壓縮包解壓沒有報錯,由此可以確定分析出來的raid5結(jié)構(gòu)正確。
4、按照該raid5結(jié)構(gòu)生成虛擬RAID到一塊單硬盤上,打開文件系統(tǒng)沒有出現(xiàn)報錯。
5、確定備份包沒有問題和經(jīng)過用戶方的同意后,用新硬盤更換存在壞扇區(qū)的那塊磁盤,然后對原盤重建RAID。
6、將恢復(fù)好的單盤用USB方式接入故障服務(wù)器,用linux SystemRescueCd啟動故障服務(wù)器,然后使用dd命令進行全盤回寫。
7、dd所有數(shù)據(jù)后,啟動操作系統(tǒng),無法進入操作系統(tǒng)桌面并出現(xiàn)報錯,報錯信息為:“/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied”,北亞企安數(shù)據(jù)恢復(fù)工程師初步判斷此文件權(quán)限有問題。用SystemRescueCd重啟后檢查,發(fā)現(xiàn)此文件時間、權(quán)限、大小均有明顯錯誤,很顯然節(jié)點損壞。
8、重新分析重組數(shù)據(jù)中的根分區(qū),定位出錯的/sbin/pidof/,發(fā)現(xiàn)出錯是由磁盤壞道導(dǎo)致的。
9、北亞企安數(shù)據(jù)恢復(fù)工程師使用3塊完好的磁盤對后離線、存在壞道的那塊磁盤的損壞區(qū)域進行xor補齊。補齊后重新校驗文件系統(tǒng)依然有錯誤。再次檢查inode表,發(fā)現(xiàn)后離線、存在壞道的磁盤的損壞區(qū)域有部分節(jié)點表現(xiàn)為(55 55 55部分):

wKgZomV39kyAEakTAAKt78AzHa8556.png

北亞企安數(shù)據(jù)恢復(fù)——Raid5數(shù)據(jù)恢復(fù)



很明顯,雖然節(jié)點中描述的uid正常存在,但屬性、大小、最初的分配塊全部是錯誤的。北亞企安數(shù)據(jù)恢復(fù)工程師按照所有可能性進行分析,確定無法找回此損壞節(jié)點。只能修復(fù)此節(jié)點或者復(fù)制一個相同的文件過來。
10、針對所有可能有錯的文件,通過日志確定原節(jié)點塊的節(jié)點信息,再做修正。
11、修正后重新dd根分區(qū),執(zhí)行fsck -fn /dev/sda5/進行檢測,依然報錯。

wKgZomV39lSAXxusAALvw0Jzfd0783.png

北亞企安數(shù)據(jù)恢復(fù)——Raid5數(shù)據(jù)恢復(fù)



12、根據(jù)報錯提示,在系統(tǒng)中發(fā)現(xiàn)有多個節(jié)點共用同樣的數(shù)據(jù)塊。按照提示分析底層,發(fā)現(xiàn)存在節(jié)點信息的新舊交集。
13、按節(jié)點所屬的文件進行區(qū)別,清除錯誤節(jié)點后,再次執(zhí)行fsck -fn /dev/sda5進行檢測,依然有極少量的報錯信息。根據(jù)報錯提示,發(fā)現(xiàn)這些節(jié)點多位于doc目錄下,不影響系統(tǒng)啟動。直接執(zhí)行fsck -fy /dev/sda5/強行修復(fù)。
14、修復(fù)完成后重啟系統(tǒng),成功進入操作系統(tǒng)桌面。
15、啟動oracle數(shù)據(jù)庫服務(wù),啟動應(yīng)用軟件,一切正常,無報錯。
16、用戶方對操作系統(tǒng),oracle數(shù)據(jù)庫以及OA數(shù)據(jù)進行檢測,經(jīng)過多部門的反復(fù)檢測,確認恢復(fù)數(shù)據(jù)完整可用。本次數(shù)據(jù)恢復(fù)工作完成。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9255

    瀏覽量

    85754
  • 數(shù)據(jù)恢復(fù)

    關(guān)注

    10

    文章

    583

    瀏覽量

    17550
  • RAID5
    +關(guān)注

    關(guān)注

    0

    文章

    122

    瀏覽量

    12746
收藏 人收藏

    評論

    相關(guān)推薦

    服務(wù)器數(shù)據(jù)恢復(fù)RAID5陣列兩塊硬盤離線崩潰,數(shù)據(jù)如何起死回生?

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 兩組分別由4塊SAS接口硬盤組建的raid5陣列,兩組raid5
    的頭像 發(fā)表于 12-11 13:17 ?330次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b>兩塊硬盤離線<b class='flag-5'>崩潰</b>,<b class='flag-5'>數(shù)據(jù)</b>如何起死回生?

    服務(wù)器數(shù)據(jù)恢復(fù)RAID5陣列同步數(shù)據(jù)失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: 華為S5300存儲中有12塊FC硬盤,其中11塊硬盤作為數(shù)據(jù)組建了一組RA
    的頭像 發(fā)表于 12-04 16:02 ?318次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b><b class='flag-5'>熱</b><b class='flag-5'>備</b><b class='flag-5'>盤</b>同步<b class='flag-5'>數(shù)據(jù)</b>失敗的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列崩潰導(dǎo)致上層lun無法正常使用的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: 某品牌MSA2000FC存儲中有一組由7塊組建的RAID5陣列,另
    的頭像 發(fā)表于 11-25 14:04 ?150次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>崩潰</b><b class='flag-5'>導(dǎo)致</b>上層lun無法正常使用的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    RAID5數(shù)據(jù)恢復(fù)—如何重組RAID5陣列?

    RAID5數(shù)據(jù)恢復(fù)環(huán)境: 一臺存儲上有一組由12塊SCSI硬盤(11塊數(shù)據(jù)+1塊
    的頭像 發(fā)表于 10-22 15:48 ?311次閱讀
    <b class='flag-5'>RAID5</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—如何重組<b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b>?

    服務(wù)器數(shù)據(jù)恢復(fù)RAID5陣列硬盤離線但未激活數(shù)據(jù)恢復(fù)案例

    。 服務(wù)器故障: 這組raid5陣列中一塊磁盤離線,但是并沒有自動
    的頭像 發(fā)表于 10-15 10:33 ?322次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b>硬盤離線但<b class='flag-5'>熱</b><b class='flag-5'>備</b><b class='flag-5'>盤</b><b class='flag-5'>未激活</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列盤上線同步失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器磁盤陣列數(shù)據(jù)恢復(fù)環(huán)境: 服務(wù)器中有兩組分別由4塊SAS硬盤組建的raid5磁盤
    的頭像 發(fā)表于 09-19 11:01 ?312次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>熱</b><b class='flag-5'>備</b>盤上線同步失敗的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列未全部成功啟用的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: 一臺EMC某型號存儲中有一組RAID5磁盤陣列。該raid5
    的頭像 發(fā)表于 08-14 11:27 ?415次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>熱</b><b class='flag-5'>備</b><b class='flag-5'>盤</b>未全部成功啟用的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列同步失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: 華為S5300存儲中有一組由16塊FC硬盤組建的RAID5磁盤陣列(包含一塊
    的頭像 發(fā)表于 07-15 11:38 ?547次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>熱</b><b class='flag-5'>備</b><b class='flag-5'>盤</b>同步失敗的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列未完全激活導(dǎo)致陣列崩潰數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: 北京某企業(yè)一臺EMC FCAX-4存儲上搭建一組由12塊成員raid5磁盤
    的頭像 發(fā)表于 07-12 10:58 ?348次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲中raid5陣列多塊硬盤離線的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: 一臺EMC存儲中有一組raid5磁盤陣列,劃分1個lun供小型機使用,上層采用ZFS文件系統(tǒng)。
    的頭像 發(fā)表于 07-09 11:58 ?249次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列硬盤壞道導(dǎo)致raid崩潰數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: 某單位一臺某品牌DS5300存儲,1個機頭+4個擴展柜,50塊硬盤組建2組RAID5磁盤陣列(一組
    的頭像 發(fā)表于 07-05 12:00 ?582次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—磁盤不穩(wěn)定被踢導(dǎo)致raid5陣列崩潰數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: 某品牌MSA2000服務(wù)器存儲中有一組由8塊SAS硬盤組建的raid5磁盤
    的頭像 發(fā)表于 06-12 11:30 ?337次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—磁盤不穩(wěn)定被踢<b class='flag-5'>導(dǎo)致</b><b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>崩潰</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列硬盤離線且未激活數(shù)據(jù)恢復(fù)案例

    raid5陣列中兩塊硬盤由于未知故障離線,服務(wù)器數(shù)據(jù)丟失。北亞企安數(shù)據(jù)恢復(fù)中心安排
    的頭像 發(fā)表于 06-06 17:07 ?430次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b>硬盤離線且<b class='flag-5'>熱</b><b class='flag-5'>備</b><b class='flag-5'>盤</b><b class='flag-5'>未激活</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)RAID5多塊磁盤掉線導(dǎo)致崩潰數(shù)據(jù)恢復(fù)案例

    某公司的一臺服務(wù)器中的raid5磁盤陣列有兩塊磁盤先后掉線,服務(wù)器崩潰。故障服務(wù)器的操作系統(tǒng)為l
    的頭像 發(fā)表于 05-21 11:43 ?820次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>RAID5</b>多塊磁盤掉線<b class='flag-5'>導(dǎo)致</b><b class='flag-5'>崩潰</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲raid5數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 華為OceanStor某型號存儲,存儲內(nèi)有一組由24塊硬盤組建的raid5陣列,配置1塊
    的頭像 發(fā)表于 01-18 11:58 ?468次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—華為OceanStor存儲<b class='flag-5'>raid5</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例