我們自身還是有很多潛力尚未發(fā)掘的
在數(shù)據(jù)科技領域也是一樣
很多寶貴的數(shù)據(jù)都在孤島中無法得到有效利用
蘋果花了兩億美元收購一家專門挖“暗數(shù)據(jù)”的人工智能小公司LATTICE DATA。別看這公司小,這公司的創(chuàng)始人卻大有來頭。一個創(chuàng)始人是著名的數(shù)據(jù)庫系統(tǒng)領域?qū)<襇ike Cafarella,另一個是曾構(gòu)建機器學習系統(tǒng)DeepDive的Christoper Re。為什么蘋果突然對這個數(shù)據(jù)公司感興趣呢?這葫蘆里到底賣的什么藥?
下面就讓數(shù)據(jù)管理專家慷小沃帶領大家來一探究竟,看這葫蘆里到底賣啥藥!
行業(yè)研究顯示,全球每天創(chuàng)造2.5萬億字節(jié)的數(shù)據(jù)。2.5萬億?!簡直就是天文數(shù)字!但是,在過去的兩年中,這些數(shù)據(jù)中的90%都來自每天從不同渠道中產(chǎn)生的數(shù)據(jù)。換句話說,這相當于575 億臺32 GB內(nèi)存的iPhone手機總存儲量!但這些海量數(shù)據(jù)中的絕大部分都處于黑暗狀態(tài)。
可別小看這些處在黑暗中的數(shù)據(jù),若這些數(shù)據(jù)中的重要內(nèi)容得不到正確的存儲,則很有可能給企業(yè)帶來風險呢!
什么是暗數(shù)據(jù)?
Gartner對暗數(shù)據(jù)(Dark data)的定義是, “企業(yè)在開展正常業(yè)務活動期間采集、處理和存儲,但通常無法用于其它目的(如分析、商業(yè)關系和直接獲利)的信息?!?從本質(zhì)上講,這些數(shù)據(jù)是企業(yè)指定用來進行相應的存儲、保護和管理的內(nèi)容,而非用于提高整體工作效率或生產(chǎn)率。
沒關系,結(jié)合多年的行業(yè)經(jīng)驗,企業(yè)數(shù)據(jù)保護及信息管理全球領導者Commvault將有效幫助企業(yè)點亮“暗數(shù)據(jù)”,讓你的商業(yè)價值無限釋放!
為何要保留這些數(shù)據(jù)?
按合規(guī)、治理和監(jiān)管部門的法律顧問預計,公司儲存69%的數(shù)據(jù)對企業(yè)毫無價值。面對這么多我們用不著的數(shù)據(jù),我們難免會問:“我要這數(shù)據(jù)有何用?”
以前我們只需處理少量的MB級或GB級業(yè)務數(shù)據(jù),但現(xiàn)在,“保留全部信息”的數(shù)據(jù)管理原則已經(jīng)不可行哦。因此,如何龐大數(shù)據(jù)量的管理對企業(yè)來說至關重要。
然而,一切都沒有說的那樣簡單哦~為了改進流程,基礎架構(gòu)管理者/管理員需要采用基于內(nèi)容的保留策略,使其僅保留最重要的相關數(shù)據(jù)以便于訪問。這些策略還要考慮最新的政府立法,從而確保整個企業(yè)實現(xiàn)最佳實踐。
那么其他數(shù)據(jù)呢?企業(yè)的其他數(shù)據(jù)必須采取高效的歸檔方式,以保證系統(tǒng)平穩(wěn)運行。企業(yè)對各種技術,如使用文件名、類型、用戶/群、關鍵字、Exchange分類、標簽等用戶自定義策略需求日益增長。通過采用這些方法,企業(yè)在歸檔流程中可增加前所未有的智能處理層級,從而提高效率并保證整體數(shù)據(jù)的安全性。
何時“刪除”數(shù)據(jù)?
不可否認,有效的數(shù)據(jù)管理模式始終是企業(yè)的首要之選。但數(shù)據(jù)增長的事實同樣不容忽視。相信沒有人能負擔起大量無用的存儲內(nèi)容吧~ 因此,我們必須對數(shù)據(jù)從生成到處理的整個生命周期進行評估。
保留每個數(shù)據(jù)為未來的商業(yè)決策獻計獻策顯然是不切實際的,但事實上,企業(yè)必須認真考慮其數(shù)據(jù)的最終目的或目標以制定數(shù)據(jù)刪除的治理策略。減少暗數(shù)據(jù)有助于提高未來分析的透明度以及系統(tǒng)性能,增強系統(tǒng)整體的可靠性!
說的很有道理,你是不是已經(jīng)準備開始手動刪除了~其實未必需要手動來完成啦。基礎設施管理人員可以通過對信息使用分類、整理、保留和刪除的自動化策略,來優(yōu)化整個信息管理生命周期。除了減少手動刪除數(shù)據(jù)的工作外,數(shù)據(jù)自動化處理技術還幫助企業(yè)更好地面對合規(guī)審計和訴訟,使之成為當今各種企業(yè)的必備“利器”呢。
而LATTICE DATA這個初創(chuàng)公司的主要業(yè)務就是處理“暗數(shù)據(jù)”,從暗數(shù)據(jù)中挖掘有價值的信息,并通過機器學習的方法處理暗數(shù)據(jù),轉(zhuǎn)化成結(jié)構(gòu)化、標簽化和分類化的信息,提供給其他公司用在人工智能、醫(yī)學研究等方面。
數(shù)據(jù)是每個企業(yè)的命脈,因此,對企業(yè)來說如何科學有效地進行數(shù)據(jù)管理十分重要!數(shù)據(jù)量和數(shù)據(jù)源的日益增長,數(shù)據(jù)管理業(yè)務也不斷變得更為復雜。但是,任何公司都不需要在不知所措的“黑暗”中開展工作。
事實上,基礎設施管理與其流程及系統(tǒng)的管理一樣簡單。隨著數(shù)據(jù)的不斷增長,必須向基礎設施管理人員提供相應的工具,幫助其篩選數(shù)據(jù),從而有效管理、保護和利用數(shù)據(jù)。自動化流程將成為提供高水平數(shù)據(jù)管控的關鍵,并最終有助于推動企業(yè)智能、高效發(fā)展,同時改善合規(guī)性,并降低數(shù)據(jù)丟失和管理不當所帶來的風險。
如何點亮“暗數(shù)據(jù)”,釋放更大商業(yè)價值?企業(yè)可利用Commvault 數(shù)據(jù)管理平臺更好地搜索、了解和管理企業(yè)存儲的海量非結(jié)構(gòu)化數(shù)據(jù)(如電子郵件等),智能地利用已存儲內(nèi)容,在數(shù)據(jù)的生命周期內(nèi)對其進行管理,告別“暗數(shù)據(jù)”時代。
-
數(shù)據(jù)管理
+關注
關注
1文章
299瀏覽量
19636 -
自動化
+關注
關注
29文章
5600瀏覽量
79464 -
人工智能
+關注
關注
1792文章
47483瀏覽量
239162
發(fā)布評論請先 登錄
相關推薦
評論