VSAN簡(jiǎn)介:
VSAN是以vSphere內(nèi)核為基礎(chǔ)進(jìn)行開(kāi)發(fā)、可擴(kuò)展的分布式存儲(chǔ)架構(gòu)。VSAN存儲(chǔ)層由VSAN控制和管理,VSAN存儲(chǔ)層是通過(guò)vSphere集群主機(jī)中閃存和硬盤(pán)的存儲(chǔ)空間構(gòu)建的,供vSphere集群使用的統(tǒng)一共享存儲(chǔ)層。
VSAN存儲(chǔ)是一個(gè)對(duì)象存儲(chǔ),以文件系統(tǒng)的形式呈現(xiàn)給vSphere主機(jī)。這個(gè)對(duì)象存儲(chǔ)服務(wù)會(huì)從啟用VSAN集群中的每臺(tái)主機(jī)上加載卷,呈現(xiàn)為單一的、在所有節(jié)點(diǎn)上均可見(jiàn)的分布式共享數(shù)據(jù)存儲(chǔ)。在VSAN架構(gòu)中,針對(duì)虛擬機(jī)來(lái)說(shuō)只有一個(gè)數(shù)據(jù)存儲(chǔ),這個(gè)分布式數(shù)據(jù)存儲(chǔ)來(lái)自VSAN集群中每一臺(tái)vSphere主機(jī)上的存儲(chǔ)空間,通過(guò)磁盤(pán)組進(jìn)行配置,在單獨(dú)的存儲(chǔ)實(shí)體中存放所有虛擬機(jī)文件。雖然這種數(shù)據(jù)存儲(chǔ)的方式相對(duì)來(lái)說(shuō)比較安全,但是如果一個(gè)節(jié)點(diǎn)服務(wù)器上的閃存盤(pán)或者容量盤(pán)出現(xiàn)故障的時(shí)候,數(shù)據(jù)會(huì)往其他節(jié)點(diǎn)服務(wù)器遷移,在數(shù)據(jù)轉(zhuǎn)移的過(guò)程中可能會(huì)出現(xiàn)故障。下面我們要介紹的一個(gè)表現(xiàn)為VSAN存儲(chǔ)崩潰,虛擬機(jī)無(wú)法訪問(wèn)的故障。
北亞企安數(shù)據(jù)恢復(fù)——VSAN數(shù)據(jù)恢復(fù)
VSAN數(shù)據(jù)恢復(fù)環(huán)境:
由四臺(tái)某品牌服務(wù)器組建的VSAN集群,每臺(tái)節(jié)點(diǎn)服務(wù)器上有兩個(gè)磁盤(pán)組。每個(gè)磁盤(pán)組中有1塊SSD硬盤(pán)+5塊SAS硬盤(pán),SSD作為閃存,SAS硬盤(pán)作為容量盤(pán)。
VSAN故障:
VSAN集群中一個(gè)節(jié)點(diǎn)服務(wù)器上其中一個(gè)磁盤(pán)組中的容量盤(pán)出現(xiàn)故障離線,VSAN開(kāi)始數(shù)據(jù)的重構(gòu)遷移,數(shù)據(jù)遷移還沒(méi)有完成的時(shí)候機(jī)房停電導(dǎo)致數(shù)據(jù)遷移中斷。來(lái)電后啟動(dòng)所有設(shè)備后,管理員發(fā)現(xiàn)另一個(gè)磁盤(pán)組中的兩塊容量盤(pán)出現(xiàn)故障離線,VSAN數(shù)據(jù)存儲(chǔ)出現(xiàn)問(wèn)題。VSAN管理控制臺(tái)可以登錄,但是所有虛擬機(jī)都無(wú)法訪問(wèn)。
北亞企安數(shù)據(jù)恢復(fù)——VSAN數(shù)據(jù)恢復(fù)
VSAN數(shù)據(jù)恢復(fù)過(guò)程:
1、將VSAN集群中四個(gè)節(jié)點(diǎn)服務(wù)器所有硬盤(pán)編號(hào)后取出,經(jīng)過(guò)硬件工程師檢測(cè)后沒(méi)有發(fā)現(xiàn)有硬盤(pán)存在明顯硬件故障,都可以正常讀取。以只讀的方式將所有硬盤(pán)(SSD閃存盤(pán)和SAS容量盤(pán),包括3塊出現(xiàn)故障離線的硬盤(pán))做全盤(pán)鏡像。鏡像完成之后,將所有硬盤(pán)按照編號(hào)還原到原服務(wù)器上。后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤(pán)數(shù)據(jù)造成二次破壞。
2、基于鏡像文件分析底層數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu),確認(rèn)虛擬機(jī)相關(guān)數(shù)據(jù)在硬盤(pán)上的分布信息,北亞企安數(shù)據(jù)恢復(fù)工程師根據(jù)分析出來(lái)的底層數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)開(kāi)發(fā)相應(yīng)程序,測(cè)試數(shù)據(jù)分布信息的準(zhǔn)確性。
3、單獨(dú)分析每臺(tái)節(jié)點(diǎn)服務(wù)器上的兩個(gè)磁盤(pán)組,分析磁盤(pán)組內(nèi)的閃存盤(pán)和容量盤(pán)之間的對(duì)應(yīng)關(guān)系。每塊硬盤(pán)都有一個(gè)單獨(dú)標(biāo)識(shí)進(jìn)行磁盤(pán)間的對(duì)應(yīng),可以根據(jù)每塊硬盤(pán)的ID信息判讀磁盤(pán)組中的硬盤(pán)ID信息。
4、獲取每塊硬盤(pán)上磁盤(pán)的UUID和磁盤(pán)組的UUID。
5、根據(jù)每個(gè)磁盤(pán)組中的容量盤(pán)的組件信息獲取此容量盤(pán)的組件信息。
6、根據(jù)組件信息中記錄的組件的MAP位置提取組件位圖。
7、根據(jù)組件位圖提取組件數(shù)據(jù)和緩存數(shù)據(jù)。
8、根據(jù)組件的描述信息獲取組件所屬對(duì)象及組件順序,將組件合并成對(duì)象,根據(jù)對(duì)象提取數(shù)據(jù)。
9、提取完數(shù)據(jù)后對(duì)恢復(fù)出來(lái)的數(shù)據(jù)進(jìn)行檢測(cè),經(jīng)過(guò)檢測(cè)虛擬機(jī)都可以正常啟動(dòng),用戶方經(jīng)過(guò)認(rèn)證檢測(cè)后,確認(rèn)VSAN集群中數(shù)據(jù)都完整恢復(fù),認(rèn)可數(shù)據(jù)恢復(fù)結(jié)果。
VSAN數(shù)據(jù)恢復(fù)總結(jié):
可以將VSAN對(duì)象看作一個(gè)卷,VSAN數(shù)據(jù)存儲(chǔ)上的每個(gè)對(duì)象都是由多個(gè)組件構(gòu)成,這些組件分布于VSAN集群主機(jī)上的磁盤(pán)組中,恢復(fù)VSAN存儲(chǔ)數(shù)據(jù)的關(guān)鍵是組件信息的提取。
審核編輯 黃宇
-
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4314瀏覽量
85854 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9165瀏覽量
85437 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
573瀏覽量
17460
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論