大多數(shù)企業(yè)都同時擁有多種類型的數(shù)據(jù),每種數(shù)據(jù)在容量和應(yīng)用程序訪問性能等方面的需求優(yōu)先級各不相同。由于需要服務(wù)于不同的數(shù)據(jù)存儲需求,大多數(shù)大型數(shù)據(jù)中心都會同時使用多種類型的存儲設(shè)施。鑒于成本問題,很少有企業(yè)能夠(不計成本地)將全部數(shù)據(jù)都放在市場上能買到的最快但也最昂貴的閃存存儲中,因此混合使用閃存和硬盤驅(qū)動器的混合陣列將是許多數(shù)據(jù)中心的主要存儲構(gòu)成。
混合存儲陣列整合了多種類型的存儲元素,能在滿足對應(yīng)多種數(shù)據(jù)優(yōu)先級需求的同時實現(xiàn)成本控制。隨著混合存儲的不斷發(fā)展,能整合的存儲類型范圍已經(jīng)不僅限于閃存和硬盤,還擴大到包括多層閃存、多層硬盤、磁帶、對象和基于云的存儲,這些存儲都被鏈接到單一和透明的虛擬存儲基礎(chǔ)架構(gòu)中,整套架構(gòu)可以針對每種類型的數(shù)據(jù)和應(yīng)用程序優(yōu)先級自動提供最佳的性能。
本篇文章提供的使用場景剖析可幫助您更好地了解混合存儲陣列的優(yōu)勢,以及最適合混合存儲的各種數(shù)據(jù)類型。這些信息可以讓您更好地設(shè)定使用場景,從而明確采購選型需求。
混合存儲陣列適合那些數(shù)據(jù)類型?
實時的事務(wù)處理大數(shù)據(jù)。實時數(shù)據(jù)通常具備活躍和持久的特性;當(dāng)用戶執(zhí)行搜索、銷售分析或其它動作時,數(shù)據(jù)庫或其他使用實時數(shù)據(jù)的應(yīng)用程序也會同時驅(qū)動數(shù)據(jù)流轉(zhuǎn)。自動化分層軟件通常會盡量將所有活躍數(shù)據(jù)保留在盡可能高的層,但是管理員可能希望單獨指定一些數(shù)據(jù)庫、分區(qū)或數(shù)據(jù)卷,讓這些數(shù)據(jù)集中保存在一個特定的層,以確保某些應(yīng)用獲得低延遲。如果某些數(shù)據(jù)在一段時間內(nèi)不再活躍,這些數(shù)據(jù)將向較低級的存儲層遷移。
對于大數(shù)據(jù)、數(shù)據(jù)湖或其他大型數(shù)據(jù)集,將數(shù)據(jù)保存在云中的舉措值得嘗試,分層體系就可根據(jù)需要在熱、溫、冷云存儲之間移動數(shù)據(jù)。
典型的文件服務(wù)器數(shù)據(jù)。存儲在文件服務(wù)器上的常見數(shù)據(jù)類型,包括文本、文字處理數(shù)據(jù)、電子表格和演示幻燈片,這些數(shù)據(jù)很少需要閃存的速度。文檔或文件被加載到用戶終端后,用戶輸入數(shù)據(jù)的帶寬通常只是每秒幾個字符的數(shù)量級別,根本不需要亞微秒的響應(yīng)時間。即使正在渲染的特效或光線追蹤圖形、或正在編譯的大型程序的性能都受到CPU或圖形處理能力的限制,數(shù)據(jù)訪問的速度并不是瓶頸。例外情況即使存在也不會太多,完全可以由管理員單獨處理。
數(shù)據(jù)流。數(shù)據(jù)流的關(guān)鍵定義是:可預(yù)測和連續(xù)性,因此數(shù)據(jù)流不需要閃存的低延遲和隨機存取能力。即使是被大量用戶同時訪問的流式傳輸數(shù)據(jù)也非常容易對付,無需使用大量Flash就能獲得最優(yōu)化的性能。另外,數(shù)據(jù)流通常意味著文件尺寸和數(shù)量都很大,因此數(shù)據(jù)流會大量占用和消耗存儲空間,并成為低層存儲的理想負(fù)載類型。
虛擬系統(tǒng)數(shù)據(jù)。與流式數(shù)據(jù)相比,閃存存儲的最適合的負(fù)載應(yīng)該是虛擬服務(wù)器和虛擬桌面基礎(chǔ)架構(gòu)(VDI)。這些數(shù)據(jù)類型可以充分利用閃存的低延遲特性,并提供重復(fù)數(shù)據(jù)刪除功能,因為許多虛擬機(VM)與其他虛擬機之間具備極高的數(shù)據(jù)重復(fù)比例。例如,一個擁有100個Windows虛擬機的VDI系統(tǒng)中,每個客戶機可能和其它虛擬機有99%的相同數(shù)據(jù),可實現(xiàn)的重復(fù)數(shù)據(jù)刪除率接近100:1,因此100個虛擬機只需占用比1個虛擬機略多一點的存儲空間。閃存存儲速度足以支持重復(fù)數(shù)據(jù)刪除并輕松處理典型的VDI部署的峰值負(fù)載,例如,用戶在上午8點登錄,在中午注銷午餐,下午1點重新登錄,并在下午5點重新登錄。
在不同層之間遷移數(shù)據(jù)
自動分層軟件對用戶和管理員來說是透明的。出現(xiàn)在同一目錄中的兩個文件實際上可能位于存儲系統(tǒng)的不同層,甚至可能位于不同的系存儲統(tǒng)或數(shù)據(jù)中心。存儲虛擬化軟件能識別很少使用的文件并將其移動到速度較慢、較便宜的存儲設(shè)備上,同時保留占位符以告知系統(tǒng)文件保存的位置。如果用戶打開該文件,則系統(tǒng)會自動從較慢的存儲中提取文件,并將其移回更快的層。
一些最早的自動化分層系統(tǒng)完全基于數(shù)據(jù)的活躍程度執(zhí)行分層動作。例如,在設(shè)定的時間區(qū)間內(nèi),如果文件未被打開或更改,則該文件被移動到較低層;如果用戶在此期間打開過該文件,則該文件被移動到較高層。如今有些存儲系統(tǒng)仍在以這種方式工作。有些系統(tǒng)會增加預(yù)測算法來遷移關(guān)聯(lián)數(shù)據(jù),例如,打開文件夾中的一個文件的用戶很可能會需要獲取同一目錄中的其余數(shù)據(jù)。還有些系統(tǒng)在數(shù)據(jù)塊層級而不是文件級移動數(shù)據(jù),這種方式適合常見的對大文件執(zhí)行少部分操作的場景,在數(shù)據(jù)塊級執(zhí)行分層處理可以使文件不需要讀寫的部分繼續(xù)保存在較慢的存儲空間中。只有修改頻繁的塊才會保留在更快的層上。
許多指標(biāo)可以被用于確定數(shù)據(jù)應(yīng)該存放的數(shù)據(jù)層,包括服務(wù)等級協(xié)議、僅在本季度末搜索的數(shù)據(jù)、應(yīng)具有最大冗余的關(guān)鍵數(shù)據(jù)以及需要極高吞吐量的數(shù)據(jù)。自動分層軟件可能無法正確處理這些數(shù)據(jù),因此可以考慮手動指派特定的層。
無論是通過閃存陣列自帶的功能,還是單獨購買的軟件來實現(xiàn),存儲管理軟件適應(yīng)復(fù)雜場景的能力決定了管理員處理各類特殊分層要求的操作方式。一些混合存儲陣列可以讓管理員設(shè)定針對特定文件或目錄樹的響應(yīng)時間、吞吐量和延遲的最低限制,并自動確保分層處理滿足這些最低要求,其他系統(tǒng)則無法提供這種承諾。同樣,某些系統(tǒng)可以按特定的時間間隔遷移數(shù)據(jù),以便在季末結(jié)算工作開展之前先將數(shù)據(jù)遷移到更高層,或者將某些文件或目錄永久保存在指定的層。
混合存儲陣列能同時提供閃存的速度和低延遲,以及HDD,磁帶或云的經(jīng)濟性。它們必然比全閃存或全HDD系統(tǒng)復(fù)雜,但靈活性和低成本的優(yōu)勢使其值得納入選型評估。從起價低于1000美元的NAS盒子到100萬美元的企業(yè)級系統(tǒng),大多數(shù)供應(yīng)商都開始提供某種形式的混合存儲。管理員應(yīng)該熟悉這些系統(tǒng)的工作方式,選擇有潛力的技術(shù)為IT組織節(jié)省大量資金。
分層軟件是如何運作的
分層軟件是混合存儲系統(tǒng)的核心,它可以自動將最常訪問的數(shù)據(jù)放在最快的層,甚至包含更復(fù)雜的系統(tǒng)邏輯,這些系統(tǒng)可以主動預(yù)判和抓取相關(guān)數(shù)據(jù),并根據(jù)需要將數(shù)據(jù)在不同層之間移動。雖然也可以用手動操作的方式將數(shù)據(jù)分層到不同類型存儲的容器,但是移動數(shù)據(jù)會占用管理員的大量工作時間,從長遠(yuǎn)來看,人力成本的耗費可能會超出分層軟件的價錢。
管理員也可以單獨購買分層軟件創(chuàng)建自己的混合存儲系統(tǒng)。但是,考慮到管理員學(xué)習(xí)軟件和部署組合軟件和硬件的時間,購買散件自己組裝仍然不具備成本優(yōu)勢。除非已經(jīng)擁有了可用于某些分層的存儲設(shè)施,這種情況下利用現(xiàn)有資源搭建分層存儲就是更經(jīng)濟有效的選擇。
除了最常見的具有一層閃存和一層硬盤存儲的兩層系統(tǒng)之外,管理員可能還要考慮更多分層。例如,即使在閃存的范圍內(nèi),也存在存儲器總線閃存,非易失性存儲器快速閃存(NVMe),寫入優(yōu)化的閃存和讀取優(yōu)化的閃存,以上每種閃存都比前一種閃存更便宜,但性能也更有限。還有多層HDD存儲——不僅包括15,000 RPM、10,000 RPM和7,200 RPM驅(qū)動器,還可以選擇在不使用驅(qū)動器的時候關(guān)閉驅(qū)動器,甚至在HDD上運行對象存儲。不要忘記更下游還有磁帶和云存儲,每GB的成本更低,當(dāng)然響應(yīng)時間也更慢。
雖然實際的統(tǒng)計數(shù)據(jù)可能會有所不同,但是80/20規(guī)則對于考慮層級是很有效的:寫入存儲系統(tǒng)的新數(shù)據(jù)中的80%大約有30天的活躍周期,然后就很少被訪問。活躍數(shù)據(jù)中的20%會長期保持活躍,應(yīng)該固定在最快的存儲空間上,其余的可以在30天后遷移到較便宜的存儲空間,在必要時才存回更快速的存儲層。
-
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4785瀏覽量
72152 -
混合存儲
+關(guān)注
關(guān)注
0文章
5瀏覽量
50447
原文標(biāo)題:混合存儲陣列整合多層存儲降低成本
文章出處:【微信號:cunchujie,微信公眾號:存儲界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論