同樣用來(lái)“存數(shù)據(jù)”為什么數(shù)據(jù)縮減率差別這么大?
這個(gè)問(wèn)題,相信很多企業(yè)級(jí)的小伙伴和我有一樣的疑問(wèn)。
相對(duì)于備份存儲(chǔ)動(dòng)輒達(dá)到50:1、65:1的數(shù)據(jù)縮減比例,而主存儲(chǔ)往往只有“可憐”的3:1,4:1。難道是備份存儲(chǔ)所使用的數(shù)據(jù)重刪、壓縮算法更先進(jìn),更高效?
如果是算法導(dǎo)致,為什么不用在主存儲(chǔ)上?這對(duì)于寸金寸“容量”的存儲(chǔ)設(shè)備來(lái)說(shuō),所帶來(lái)的經(jīng)濟(jì)效益實(shí)在太誘人了。
而要回答這個(gè)問(wèn)題,我們得先知道什么是重復(fù)數(shù)據(jù)刪除技術(shù)和數(shù)據(jù)壓縮技術(shù)(IT老司機(jī)可略過(guò)這部分)。
重復(fù)數(shù)據(jù)刪除技術(shù)是指僅在存儲(chǔ)介質(zhì)上保留數(shù)據(jù)的一個(gè)唯一實(shí)例,冗余數(shù)據(jù)被替換為指向唯一數(shù)據(jù)副本的一個(gè)指針。當(dāng)兩個(gè)或多個(gè)文件具有相同的內(nèi)容時(shí),重復(fù)數(shù)據(jù)刪除會(huì)將文件分成多個(gè)段,僅存儲(chǔ)每個(gè)唯一文件段的一個(gè)副本。
而數(shù)據(jù)壓縮技術(shù)是指在不丟失有用信息的前提下,縮減數(shù)據(jù)量以減少存儲(chǔ)空間,從而提高其傳輸、存儲(chǔ)和處理效率,或按照一定的算法對(duì)數(shù)據(jù)進(jìn)行重新組織,減少數(shù)據(jù)的冗余和存儲(chǔ)的空間的一種技術(shù)方法。
▼一圖看懂?dāng)?shù)據(jù)重刪和壓縮▼
影響數(shù)據(jù)縮減率的因素有哪些?
答案是雖然主存儲(chǔ)和備份存儲(chǔ)都以存儲(chǔ)數(shù)據(jù)為目的,但兩者對(duì)于數(shù)據(jù)縮減技術(shù)有著完全不同的考量。
首先,數(shù)據(jù)縮減是備份設(shè)備的核心功能,提供更高的數(shù)據(jù)縮減率,是這類(lèi)產(chǎn)品的主要訴求。
而對(duì)主存儲(chǔ)來(lái)說(shuō),數(shù)據(jù)縮減只是附加功能之一,而為了避免數(shù)據(jù)縮減產(chǎn)生大量的計(jì)算資源占用,影響到業(yè)務(wù)應(yīng)用的讀寫(xiě),因此在數(shù)據(jù)縮減的使用上,往往有許多顧慮與限制。
另一方面,備份設(shè)備也因?yàn)樽陨淼母弑嚷蕯?shù)據(jù)縮減功能,使其也被局限在備份、歸檔這類(lèi)靜態(tài)的存儲(chǔ)應(yīng)用,而不適合需要頻繁讀取與寫(xiě)入的一般業(yè)務(wù)應(yīng)用。原因有以下兩點(diǎn):
第一,高比例的數(shù)據(jù)縮減會(huì)占用大量的計(jì)算資源,從而影響其他業(yè)務(wù)應(yīng)用,因此很難在運(yùn)行數(shù)據(jù)縮減的同時(shí),還能正常提供一般的讀寫(xiě)服務(wù)。
其次,經(jīng)過(guò)重復(fù)數(shù)據(jù)刪除或數(shù)據(jù)壓縮技術(shù)處理過(guò)的數(shù)據(jù),必須先還原成原始數(shù)據(jù),才能供前端主機(jī)讀取與使用,而主存儲(chǔ)中的數(shù)據(jù),往往是那些需要頻繁讀取的活躍數(shù)據(jù)。
因此,以占用系統(tǒng)資源的方式頻繁地縮減與還原數(shù)據(jù),是無(wú)意義的,也是資源的浪費(fèi)。
此外,影響數(shù)據(jù)縮減率的另一個(gè)因素是,它取決于你有多少相同或相似類(lèi)型的數(shù)據(jù):
●數(shù)據(jù)保存期設(shè)置:數(shù)據(jù)保存的時(shí)間越長(zhǎng),重復(fù)數(shù)據(jù)刪除引擎發(fā)現(xiàn)重復(fù)數(shù)據(jù)的可能性也越大。
●數(shù)據(jù)類(lèi)型:一些數(shù)據(jù)天生比較容易出現(xiàn)重復(fù)。如果網(wǎng)絡(luò)里存在大量的Windows服務(wù)器,或者VMware虛擬機(jī),就有希望得到更高的數(shù)據(jù)縮減率。
●變化速率:數(shù)據(jù)變化的速率越低,發(fā)現(xiàn)重復(fù)的機(jī)會(huì)也就越高。
●數(shù)據(jù)備份策略:全備份(相對(duì)于增量備份和差異備份)的頻率越高,數(shù)據(jù)縮減的潛力也就越大,因?yàn)槊刻斓臄?shù)據(jù)有大量的重復(fù)。
可以看到,由于歸檔和備份系統(tǒng)的數(shù)據(jù),大部分都是冗余數(shù)據(jù),因此天生就可以實(shí)現(xiàn)更高的數(shù)據(jù)縮減率。
最后,是技術(shù)問(wèn)題
比如戴爾PowerProtect DD備份存儲(chǔ)擁有高達(dá)65:1的數(shù)據(jù)縮減率,放眼業(yè)界同類(lèi)產(chǎn)品都是頂尖的存在,這就源于其獨(dú)有的數(shù)據(jù)縮減專(zhuān)利技術(shù)。
而戴爾PowerStore雖然“只有”4:1的數(shù)據(jù)縮減率,但其數(shù)據(jù)縮減功能是“始終可用”。意味著PowerStore在數(shù)據(jù)縮減時(shí)不會(huì)額外占用控制器的CPU資源,幾乎對(duì)性能不會(huì)產(chǎn)生影響。
這也讓企業(yè)用戶不再陷入性能下降與節(jié)省成本的兩難,而讓數(shù)據(jù)縮減在主存儲(chǔ)真正發(fā)揮了用武之地。
*戴爾PowerStore采用英特爾至強(qiáng)可擴(kuò)展處理器,該處理器可以優(yōu)化工作負(fù)載,可靠性強(qiáng),還有高計(jì)算力、高穩(wěn)定性和高效敏捷性,不僅幫助PowerStore輕松滿足既定工作負(fù)載,也可以為數(shù)字化變革做好準(zhǔn)備。
最后,總結(jié)一下。為什么備份存儲(chǔ)與主存儲(chǔ)的數(shù)據(jù)縮減率差別巨大?
答案是兩種產(chǎn)品的設(shè)計(jì)思路不同,存儲(chǔ)數(shù)據(jù)的類(lèi)型不同,因而不能直接進(jìn)行數(shù)據(jù)縮減率的比較。
審核編輯 :李倩
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7030瀏覽量
89038 -
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4314瀏覽量
85851
原文標(biāo)題:你問(wèn)我答|主存儲(chǔ)和備份存儲(chǔ),數(shù)據(jù)縮減率為什么相差這么大
文章出處:【微信號(hào):戴爾企業(yè)級(jí)解決方案,微信公眾號(hào):戴爾企業(yè)級(jí)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論