未來(lái)數(shù)據(jù)到底有多重要?IBM(微博)新任CEO羅睿蘭(Ginni Rometty)的觀點(diǎn)讓人印象深刻 。她說(shuō),數(shù)據(jù)將是下一個(gè)大的自然資源,將會(huì)區(qū)分每個(gè)行業(yè)的勝者與輸家。
大數(shù)據(jù)走紅
關(guān)于什么是“大數(shù)據(jù)”,現(xiàn)在還沒(méi)有標(biāo)準(zhǔn)的定義。維基百科上有人對(duì)大數(shù)據(jù)作了如下描述:數(shù)據(jù)增長(zhǎng)如此之快,以至于難以使用現(xiàn)有的數(shù)據(jù)庫(kù)管理工具來(lái)駕馭,困難存在于數(shù)據(jù)的獲取,存儲(chǔ),搜索,共享,分析和可視化等方面。
“通俗地說(shuō),大數(shù)據(jù)其實(shí)是一種在互聯(lián)網(wǎng)時(shí)代或信息時(shí)代的企業(yè)現(xiàn)象。”中國(guó)軟件網(wǎng)、海比研究總經(jīng)理曹開(kāi)彬告訴新浪科技,在這樣的時(shí)代,任何一個(gè)企業(yè),尤其是大型企業(yè)和互聯(lián)網(wǎng)企業(yè),會(huì)在經(jīng)營(yíng)過(guò)程中產(chǎn)生大量的、各種各樣的數(shù)據(jù)。它有幾個(gè)典型特征:數(shù)據(jù)量大、數(shù)據(jù)類型復(fù)雜、處理速度要快。
所謂數(shù)據(jù)量大,是指數(shù)據(jù)不再以幾個(gè)GB和幾個(gè)TB為單位來(lái)衡量,而是以PB(1000個(gè)T)、EB(一百萬(wàn)個(gè)T)或ZB(10億個(gè)T)為計(jì)量單位;數(shù)量類型復(fù)雜,是因?yàn)樗膩?lái)源復(fù)雜,從結(jié)構(gòu)化數(shù)據(jù)到非結(jié)構(gòu)化數(shù)據(jù);處理速度要快,則是指數(shù)據(jù)的分析和使用需要在極短的時(shí)間內(nèi)完成,甚至實(shí)時(shí)使用。
曹開(kāi)彬說(shuō),這導(dǎo)致現(xiàn)有的數(shù)據(jù)倉(cāng)庫(kù)和商業(yè)智能等數(shù)據(jù)處理和分析技術(shù)無(wú)法應(yīng)對(duì)這種情況,但是企業(yè)要對(duì)它進(jìn)行快速處理與分析的需求又很大,因此,大數(shù)據(jù)才會(huì)變得這樣火。
資深I(lǐng)T人士謝文對(duì)于大數(shù)據(jù)有另外的看法。在他看來(lái),大數(shù)據(jù)并不是新概念,而是在物理學(xué),生物學(xué)等科學(xué)領(lǐng)域早已存在的理論,只不過(guò)此前沒(méi)有有效的手段獲取大數(shù)據(jù)。
他認(rèn)為,Web2.0時(shí)代,大數(shù)據(jù)應(yīng)該是以人為核心,以人的關(guān)系為基礎(chǔ)作信息生產(chǎn)、交換,從而產(chǎn)生的巨大信息爆炸。同時(shí),大數(shù)據(jù)將產(chǎn)生比現(xiàn)在更有價(jià)值的商業(yè)模式,是不能用現(xiàn)有技術(shù)進(jìn)行處理的。
背后價(jià)值
那么,大數(shù)據(jù)到底能給企業(yè)帶來(lái)什么價(jià)值呢?本質(zhì)上說(shuō),大數(shù)據(jù)本身沒(méi)有太多價(jià)值,基于大數(shù)據(jù)的處理和分析才能為企業(yè)帶來(lái)的巨大的增值價(jià)值。
曹開(kāi)彬認(rèn)為,大數(shù)據(jù)里面包含企業(yè)運(yùn)營(yíng)的各種信息,如果能對(duì)它們進(jìn)行及時(shí)有效充分地整理和分析,才可以很好地、迅速地幫助企業(yè)進(jìn)行業(yè)務(wù)決策,響應(yīng)客戶需求,提升競(jìng)爭(zhēng)力。
兩個(gè)月前,剛剛以大數(shù)據(jù)概念在納斯達(dá)克(微博)上市的美國(guó)公司Splunk可以讓我們很容易的理解這一點(diǎn)。
Splunk提供一款可運(yùn)行于各種平臺(tái)的IT數(shù)據(jù)、日志分析軟件,可以讓IT運(yùn)維人員以類似谷歌搜索關(guān)鍵詞的方式,快速搜索并查看任何IT設(shè)備運(yùn)行過(guò)程中產(chǎn)生的信息。
一個(gè)簡(jiǎn)單的場(chǎng)景是,當(dāng)IT設(shè)備出現(xiàn)異常時(shí),IT運(yùn)維人員只需要搜索關(guān)鍵詞“Error”,系統(tǒng)便會(huì)列出包含“Error”的機(jī)器運(yùn)行日志,并以非常好的圖形化方式展現(xiàn)出來(lái)。IT運(yùn)維人員可以據(jù)此判斷出是異常出現(xiàn)的具體時(shí)間,具體設(shè)備,并分析故障原因。
顯然,與以前憑借經(jīng)驗(yàn)進(jìn)行故障判斷相比,數(shù)據(jù)分析提供了更精準(zhǔn)的信息,而這便是大數(shù)據(jù)的魅力所在。那么,企業(yè)該如何抓住大數(shù)據(jù)帶來(lái)的機(jī)遇呢?
Teradata大中華區(qū)首席執(zhí)行官辛兒倫對(duì)新浪科技表示,隨著大數(shù)據(jù)時(shí)代的到來(lái),企業(yè)應(yīng)該在內(nèi)部培養(yǎng)三種能力。第一,整合企業(yè)數(shù)據(jù)的能力;第二,探索數(shù)據(jù)背后價(jià)值和制定精確行動(dòng)綱領(lǐng)的能力;第三,進(jìn)行精確快速實(shí)時(shí)行動(dòng)的能力。
“如果企業(yè)在信息治理上培養(yǎng)出這三種能力,對(duì)未來(lái)大數(shù)據(jù)時(shí)代的駕馭能力會(huì)增強(qiáng),對(duì)面臨到的挑戰(zhàn)會(huì)降到最低。”辛兒倫表示。
廠商布局
辛兒倫所在的Teradata公司是一家智能分析解決方案廠商,主要為企業(yè)和政府機(jī)構(gòu)做數(shù)據(jù)整合,分析,探索、挖掘數(shù)據(jù)背后的價(jià)值。最近兩年,Teradata通過(guò)收購(gòu)將業(yè)務(wù)從結(jié)構(gòu)化數(shù)據(jù)延伸到非結(jié)構(gòu)化、大數(shù)據(jù)領(lǐng)域。
2011年,Teradata先后收購(gòu)了云計(jì)算軟件公司Aprimo及高級(jí)分析和管理各種非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域的Aster Data公司。今年5月8日,Aprimo收購(gòu)了基于云的數(shù)字營(yíng)銷歐洲領(lǐng)導(dǎo)廠商eCircle,進(jìn)一步加強(qiáng)并拓展了Teradata大數(shù)據(jù)市場(chǎng)的業(yè)務(wù)。
與Teradata一樣看好的大數(shù)據(jù)的還有IBM、甲骨文、惠普(微博)、EMC、微軟等傳統(tǒng)IT廠商,他們也在通過(guò)自主研發(fā)或者收購(gòu)的方式進(jìn)入大數(shù)據(jù)領(lǐng)域。
IBM在過(guò)去五年里,已經(jīng)斥資超過(guò)140億美元進(jìn)行了20多筆與數(shù)據(jù)分析相關(guān)的收購(gòu)交易。甲骨文這家以結(jié)構(gòu)化數(shù)據(jù)庫(kù)起家的IT公司,推出了大數(shù)據(jù)機(jī)及智能分析解決方案。
去年8月,惠普以100億美元收購(gòu)英國(guó)軟件公司Autonomy,其實(shí)也是為了擴(kuò)大商業(yè)分析軟件的市場(chǎng)份額。Autonomy通過(guò)獨(dú)有的算法可以提取出非結(jié)構(gòu)化信息中的含義。
在美國(guó)硅谷,Splunk只是大數(shù)據(jù)領(lǐng)域的一家企業(yè)而已,仍有多家創(chuàng)業(yè)公司已經(jīng)聚焦在大數(shù)據(jù)領(lǐng)域,并且獲得風(fēng)險(xiǎn)投資的注資。
評(píng)論
查看更多