數(shù)據(jù)存儲作為大數(shù)據(jù)的核心環(huán)節(jié)之一,可以理解為方便對既定數(shù)據(jù)內(nèi)容進行歸檔、整理和共享的過程。自磁盤系統(tǒng)問世以來,數(shù)據(jù)存儲已經(jīng)走過了近百年的歷程。
對于存儲,計算機就像我們的大腦一樣,兩者都可以擁有短期記憶和長期記憶,例如大腦是通過前額葉皮層來處理短期記憶,而計算機則利用RAM(隨機存取存儲器)來處理短期記憶。大腦和計算機都需要在清醒的狀態(tài)下處理并記住事務(wù),并在工作一段時間后會感到疲倦。
大腦在睡眠時會將工作記憶轉(zhuǎn)換為長期記憶,而計算機則在睡眠時將活動記憶轉(zhuǎn)換為存儲卷。計算機還會按類型來分配數(shù)據(jù),就像大腦按語義、空間、情感或規(guī)程來分配記憶一樣。
而在大數(shù)據(jù)時代,由于從多渠道獲得的數(shù)據(jù)通常缺乏一致性,數(shù)據(jù)結(jié)構(gòu)混雜,且數(shù)據(jù)不斷增長,更何況任何機器都會有物理上的限制:內(nèi)存容量、硬盤容量、處理器速度等。
這就導(dǎo)致對于單機系統(tǒng)來說,即使及時不斷提升硬件配置也很難跟上數(shù)據(jù)增長的速度,我們需要在硬件限制和性能之間做取舍。
因此對于那些希望從比存儲和使用成本更高的數(shù)據(jù)中獲得價值的企業(yè)和組織來講,有效的數(shù)據(jù)存儲和管理變得比以往任何時候都更加重要。
大數(shù)據(jù)存儲與管理的技術(shù)對整個大數(shù)據(jù)系統(tǒng)都至關(guān)重要,數(shù)據(jù)存儲與管理的好壞直接影響了整個大數(shù)據(jù)系統(tǒng)的性能表現(xiàn)。
數(shù)據(jù)存儲和管理如今并不止被定義為接收、存儲、組織和維護組織創(chuàng)建的數(shù)據(jù),更多時候它還意味著更多內(nèi)容,包括但不限于:
對數(shù)據(jù)進行分類; 聚合、收集和解析數(shù)據(jù)的元數(shù)據(jù); 保護數(shù)據(jù)和元數(shù)據(jù)不受自然和人為中斷的影響; 在內(nèi)部部署和地理上移動數(shù)據(jù),以進行共享、歸檔、復(fù)制、數(shù)據(jù)保護、存儲系統(tǒng)技術(shù)更新和遷移,并訪問所需的分析引擎,從而對該數(shù)據(jù)進行更深入的研究; 在進行一次或多次移動后,保持用戶和應(yīng)用程序?qū)?shù)據(jù)的透明訪問; 提供用戶可定義的策略,這些策略可自動移動、復(fù)制和刪除數(shù)據(jù); 部署人工智能和機器學(xué)習(xí)以優(yōu)化和自動化大多數(shù)數(shù)據(jù)管理功能; 搜索數(shù)據(jù)并提供可行的信息和見解; 使數(shù)據(jù)符合個人識別信息法律和法規(guī); 將數(shù)據(jù)管理擴展到數(shù)百PB甚至EB的快速擴展數(shù)據(jù)。
根據(jù)數(shù)據(jù)存儲和管理的內(nèi)容范圍,我們可以大致理解大數(shù)據(jù)存儲及管理技術(shù)需要重點研究如何解決大數(shù)據(jù)的可存儲、可表示、可處理、可靠性及有效傳輸?shù)葞讉€關(guān)鍵問題。
具體來講需要解決的往往是以下幾類問題:海量文件的存儲與管理,海量小文件的傳輸、索引和管理,海量大文件的分塊與存儲,系統(tǒng)可擴展性與可靠性。
伴隨著重點研究問題,在大數(shù)據(jù)存儲和管理發(fā)展過程中,出現(xiàn)了幾種較為有效的存儲和管理大數(shù)據(jù)的方式:
1.不斷加密
對于任何一個企業(yè)來說,任何類型的數(shù)據(jù)都可能是至關(guān)重要且私有的,只有能在自己掌控的范圍內(nèi)才可以說是安全的。然而,很多行業(yè)巨頭容易成為黑客攻擊的首要目標,許多公司會對此有危機感。
隨著企業(yè)為保護資產(chǎn)而全面開展對于黑客的反擊,加密技術(shù)成為了打擊網(wǎng)絡(luò)威脅的可行途徑:
通過將所有內(nèi)容轉(zhuǎn)換為代碼,使用加密信息,只有收件人可以解碼。如果沒有其他的要求,則加密保護數(shù)據(jù)傳輸,增強在數(shù)字傳輸中有效地到達正確人群的機會。
2. 倉庫存儲
有人說,大數(shù)據(jù)似乎就像一個永無休止的數(shù)據(jù)漩渦,極其難被管理。
因此,可以考慮將信息精簡后統(tǒng)一集中到一個指定位置——數(shù)據(jù)倉庫。
通過對數(shù)據(jù)的存儲、校準、整合及輸出,對數(shù)據(jù)進行集中分層次管理,在保證數(shù)據(jù)時效性、生態(tài)性的同時,還能夠?qū)?shù)據(jù)完成不同程度的處理。
3. 備份服務(wù) - 云端
設(shè)想一下,假如數(shù)據(jù)存儲技術(shù)在物理層面就停滯不前,而大數(shù)據(jù)卻依舊以現(xiàn)在的速度持續(xù)增長,遲早有一天我們會面臨數(shù)據(jù)無處存儲的窘境,所幸大數(shù)據(jù)存儲和管理正在迅速脫離物理機器的范疇,并迅速進入數(shù)字領(lǐng)域。
由于云存儲服務(wù)推動了數(shù)字化轉(zhuǎn)型,使得云計算的應(yīng)用越來越繁榮。數(shù)據(jù)可以隨時隨地進行訪問,并在云存儲服務(wù)上進行備份,這也意味著如果出現(xiàn)網(wǎng)絡(luò)攻擊,云端將數(shù)據(jù)從A遷移到B甚至到C的方式來確保數(shù)據(jù)安全。
數(shù)字經(jīng)濟時代,大數(shù)據(jù)管理不僅僅是數(shù)據(jù)存儲架構(gòu)的變革,更是大數(shù)據(jù)思維方式的轉(zhuǎn)變升級。用好數(shù)據(jù)是企業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵。
責(zé)任編輯:PSY
-
存儲
+關(guān)注
關(guān)注
13文章
4314瀏覽量
85851 -
關(guān)鍵技術(shù)
+關(guān)注
關(guān)注
0文章
20瀏覽量
12366 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8889瀏覽量
137445
發(fā)布評論請先 登錄
相關(guān)推薦
評論