0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

有意義的機(jī)器學(xué)習(xí)來(lái)自于不同的數(shù)據(jù)

5RJg_mcuworld ? 來(lái)源:YXQ ? 2019-04-22 15:35 ? 次閱讀

人工智能的三大發(fā)展要素已經(jīng)是老生常談了。算法、算力和數(shù)據(jù)對(duì)機(jī)器學(xué)習(xí)的重要性和聲望不亞于“謙哥”的喝酒、燙頭和抽煙。

那些熱衷競(jìng)爭(zhēng)實(shí)施機(jī)器學(xué)習(xí)的公司現(xiàn)在驚訝地發(fā)現(xiàn),其實(shí),實(shí)施一些算法使機(jī)器變得對(duì)某一數(shù)據(jù)或問(wèn)題更加智能并不困難。畢竟,這年頭“即插即用”又很穩(wěn)健的算法編程解決方案簡(jiǎn)直“爛大街了”。例如,從開(kāi)源機(jī)器學(xué)習(xí)框架谷歌TensorFlow,到微軟Azure Machine Learning以及亞馬遜SageMaker,應(yīng)有盡有。

所以,數(shù)據(jù)已逐漸成為了機(jī)器學(xué)習(xí)競(jìng)爭(zhēng)中最關(guān)鍵的區(qū)分點(diǎn)。一個(gè)原因是高質(zhì)量數(shù)據(jù)并不常見(jiàn);另一原因是數(shù)據(jù)尚未商品化,公司企業(yè)之間存在著信息不對(duì)稱(chēng)。

希望借助AI一臂之力的企業(yè)需要尋求外部數(shù)據(jù)源,甚至這樣的數(shù)據(jù)甚至可能需要他們自己創(chuàng)建。

有用的數(shù)據(jù):有價(jià)值、又很稀少

數(shù)據(jù)逐漸變成競(jìng)爭(zhēng)中的區(qū)分點(diǎn)是因?yàn)樵S多公司根本沒(méi)有他們需要的數(shù)據(jù)。盡管幾十年來(lái),公司都在使用通用的會(huì)計(jì)準(zhǔn)則這樣的系統(tǒng)化方法來(lái)評(píng)估自己,但是這種評(píng)估方法一直關(guān)注于實(shí)體資產(chǎn)與金融資產(chǎn),也就是實(shí)物和錢(qián)。2013年甚至給資產(chǎn)定價(jià)理論頒了一個(gè)諾貝爾獎(jiǎng),強(qiáng)化了已有的對(duì)實(shí)體或金融資產(chǎn)重要性的認(rèn)知。

但是,今天最有價(jià)值的那些公司貿(mào)易對(duì)象是軟件或網(wǎng)絡(luò),而不僅僅是實(shí)體或金融資產(chǎn)。在過(guò)去的40年內(nèi),資產(chǎn)類(lèi)型的重心有了很大的變化:1975年,83%的有形資產(chǎn)占整個(gè)市場(chǎng)絕大部分份額;而2015年時(shí)市場(chǎng)中84%的資產(chǎn)是無(wú)形資產(chǎn)。今天的公司巨頭們不再生產(chǎn)咖啡壺也不再售賣(mài)洗衣機(jī),他們轉(zhuǎn)而提供應(yīng)用程序,軟件等等。這樣的轉(zhuǎn)變?cè)斐闪藭?huì)計(jì)記賬的對(duì)象和實(shí)際產(chǎn)生價(jià)值的對(duì)象極其不匹配。

結(jié)果就是有用數(shù)據(jù)的缺少已經(jīng)成為了一個(gè)問(wèn)題。市面價(jià)值與賬面價(jià)值的差別越來(lái)越大。公司們正在試圖利用機(jī)器學(xué)習(xí)輔助重要的商業(yè)決策來(lái)改善這一差別。有時(shí),機(jī)器學(xué)習(xí)甚至?xí)〈恍┌嘿F的咨詢(xún)顧問(wèn)們,而最后他們經(jīng)常會(huì)意識(shí)到算法所需的數(shù)據(jù)壓根不存在。所以實(shí)際上,那些閃瞎人眼的先進(jìn)AI系統(tǒng)最后依舊只是在同樣老舊的數(shù)據(jù)上試圖實(shí)施新技術(shù)。

和人類(lèi)一樣,除非有人教,機(jī)器學(xué)習(xí)系統(tǒng)并不會(huì)精通任何領(lǐng)域。不過(guò)比起人類(lèi),機(jī)器會(huì)需要更多的信息來(lái)進(jìn)行學(xué)習(xí),并且它們確實(shí)比人類(lèi)讀取數(shù)據(jù)的速度更快。因此,表面上公司間會(huì)互相競(jìng)爭(zhēng)誰(shuí)擁有更好的機(jī)器學(xué)習(xí)程序員以及誰(shuí)先啟動(dòng)AI項(xiàng)目,在幕后其實(shí)是對(duì)于數(shù)據(jù)新穎度和廣泛度的競(jìng)爭(zhēng)。

比如說(shuō)在金融領(lǐng)域,可供選擇的數(shù)據(jù)來(lái)源遠(yuǎn)遠(yuǎn)超過(guò)了傳統(tǒng)證券交易報(bào)告以及投資者展示等。數(shù)據(jù)還可以來(lái)源于社交網(wǎng)絡(luò)情感分析或者獲批專(zhuān)利數(shù)量等。

這些數(shù)據(jù)源的重要性主要基于兩點(diǎn)原因。首先,傳統(tǒng)數(shù)據(jù)局限于傳統(tǒng)資產(chǎn),在當(dāng)今無(wú)形資產(chǎn)當(dāng)?shù)赖臅r(shí)代,覆蓋面上遠(yuǎn)遠(yuǎn)不夠。第二,并沒(méi)有任何必要在市場(chǎng)上所有人都在分析的數(shù)據(jù)上使用機(jī)器學(xué)習(xí)方法。所有對(duì)此感興趣的人都早已經(jīng)嘗試過(guò)分析產(chǎn)業(yè)趨勢(shì)、利潤(rùn)率、增長(zhǎng)率、息稅前利潤(rùn)、資產(chǎn)周轉(zhuǎn)率以及資產(chǎn)回報(bào)率和其它上千個(gè)常見(jiàn)的變量與股東回報(bào)率之間的相關(guān)性。

在所有人都在分析的數(shù)據(jù)上試圖發(fā)現(xiàn)相關(guān)性并不會(huì)幫助公司取勝。相反,希望使用AI取勝的公司需要尋找新數(shù)據(jù)集之間的聯(lián)系,因此他們可能必須自己創(chuàng)建那些新數(shù)據(jù)集來(lái)評(píng)估無(wú)形資產(chǎn)。

謹(jǐn)慎思考:你想知道什么?

創(chuàng)建數(shù)據(jù)比僅僅把銷(xiāo)售點(diǎn)與顧客信息兩個(gè)表聚合到一起然后丟進(jìn)數(shù)據(jù)庫(kù)復(fù)雜得多。大多數(shù)企業(yè)錯(cuò)誤地相信通過(guò)這樣一種權(quán)宜的方法能夠預(yù)測(cè)或區(qū)分出他們關(guān)心的信息:把所有能找到的數(shù)據(jù)都大費(fèi)周章地聚合到一起然后指望能夠找到一絲希望之光。

盡管機(jī)器學(xué)習(xí)有時(shí)會(huì)突然發(fā)現(xiàn)某些從未有人意識(shí)到的事物從而使所有人都大吃一驚,但它并不能夠持續(xù)穩(wěn)定提供這樣的洞察。這并不意味著這項(xiàng)工具很垃圾,這意味著我們需要更明智地使用它。但說(shuō)起來(lái)容易做起來(lái)難:比如,在我們研究外部數(shù)據(jù)市場(chǎng)時(shí),我們發(fā)現(xiàn)大多數(shù)新數(shù)據(jù)提供者依舊在關(guān)注實(shí)體與金融資產(chǎn)。

許多企業(yè)遺漏的一步是提出一項(xiàng)真正重要的假設(shè)。機(jī)器學(xué)習(xí)真正體現(xiàn)優(yōu)越性之處在于,它們能夠通過(guò)采用人類(lèi)已經(jīng)擁有的見(jiàn)解,這可以來(lái)自于經(jīng)驗(yàn)法則、廣泛認(rèn)知或者幾乎完全不被理解的相關(guān)性,來(lái)建設(shè)一種速度更快、更易于理解、更易于擴(kuò)展且更低錯(cuò)誤率的方法。

為了這樣使用機(jī)器學(xué)習(xí)方法,不應(yīng)向系統(tǒng)塞進(jìn)任何你能找到的數(shù)據(jù)。你僅僅輸入被謹(jǐn)慎思考過(guò)的一組信息,希望它能夠?qū)W習(xí)并拓展,得到比人類(lèi)掌握的更多的信息。

有意義的機(jī)器學(xué)習(xí)來(lái)自于不同的數(shù)據(jù)

以下是為希望搭建有影響力、有價(jià)值的機(jī)器學(xué)習(xí)應(yīng)用的公司提出的三點(diǎn)建議:

1.成功的AI在于與眾不同的數(shù)據(jù)。在你的競(jìng)爭(zhēng)對(duì)手都已經(jīng)掌握的數(shù)據(jù)上你是得不出什么新穎信息的。審視企業(yè)內(nèi)部,找出只有你們知道并理解的信息并以此創(chuàng)建一個(gè)獨(dú)特的數(shù)據(jù)集。機(jī)器學(xué)習(xí)算法確實(shí)需要大量的數(shù)據(jù)支持,但這并不意味著模型需要考慮大量變量。你應(yīng)當(dāng)把關(guān)注點(diǎn)放在企業(yè)已經(jīng)具有獨(dú)特之處的數(shù)據(jù)上。

2.有意義的數(shù)據(jù)比全面的數(shù)據(jù)好。你可能就某問(wèn)題上擁有大量詳盡數(shù)據(jù),但它們可能壓根沒(méi)什么用。如果你的公司根本不會(huì)在決策過(guò)程中隨時(shí)使用這些信息,那這樣的數(shù)據(jù)八成對(duì)機(jī)器學(xué)習(xí)也沒(méi)有什么價(jià)值。專(zhuān)業(yè)的機(jī)器學(xué)習(xí)工程師會(huì)詢(xún)問(wèn)許多困難的問(wèn)題來(lái)找出什么才是真正重要的領(lǐng)域,以及那些領(lǐng)域?qū)⑷绾螌?duì)該應(yīng)用程序輸出結(jié)果產(chǎn)生影響。如果這些問(wèn)題對(duì)你太難了,那么你并沒(méi)有為得到實(shí)際價(jià)值而仔細(xì)思考。

3.應(yīng)當(dāng)從你已知的信息出發(fā)。最善于利用機(jī)器學(xué)習(xí)的公司會(huì)從一個(gè)獨(dú)特的視角出發(fā),來(lái)找到與他們重要決策最為相關(guān)的因素。這將會(huì)指導(dǎo)他們?nèi)ナ占畏N數(shù)據(jù)以及使用何種技術(shù)。就基于你們團(tuán)隊(duì)已經(jīng)擁有的一部分知識(shí)之上進(jìn)行拓展這個(gè)問(wèn)題來(lái)著手是比較簡(jiǎn)單的,這也將為你企業(yè)創(chuàng)造更多價(jià)值。

很明顯這個(gè)時(shí)代已經(jīng)是“軟件吃掉了整個(gè)世界”了(這個(gè)形容來(lái)源于軟件工程師Marc Andreessen)。但它們依然很饑餓!軟件們需要一份包含嶄新數(shù)據(jù)與科技的食譜來(lái)持續(xù)創(chuàng)造價(jià)值。

沒(méi)有人希望落后于這樣的洞察、機(jī)器與外部數(shù)據(jù)的轉(zhuǎn)變。那么,請(qǐng)從內(nèi)部審視企業(yè)開(kāi)始,去發(fā)掘你獨(dú)特的見(jiàn)解以及你可以而且應(yīng)該得到的有價(jià)值的外部數(shù)據(jù)來(lái)源。通過(guò)這些步驟,你才能夠發(fā)現(xiàn)保持企業(yè)競(jìng)爭(zhēng)力的相關(guān)洞見(jiàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:機(jī)器學(xué)習(xí)競(jìng)爭(zhēng)其實(shí)是一場(chǎng)數(shù)據(jù)上的競(jìng)爭(zhēng)

文章出處:【微信號(hào):mcuworld,微信公眾號(hào):嵌入式資訊精選】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    安防監(jiān)控NTP校時(shí)服務(wù)器:讓視頻數(shù)據(jù)有意義

    安防監(jiān)控NTP校時(shí)服務(wù)器:讓視頻數(shù)據(jù)有意義
    的頭像 發(fā)表于 12-16 10:59 ?169次閱讀
    安防監(jiān)控NTP校時(shí)服務(wù)器:讓視頻<b class='flag-5'>數(shù)據(jù)</b>更<b class='flag-5'>有意義</b>

    ads8568的gain drift不是一般來(lái)自于ref的溫漂嗎?為啥還會(huì)有額外的溫漂呢?如何降低這個(gè)溫漂值呢?

    ? ADC的gain drift不是一般來(lái)自于ref的溫漂嗎?為啥還會(huì)有額外的溫漂呢? 另外,如何降低這個(gè)溫漂值呢?我打算采用一個(gè)低溫漂的ADR4525D作為外部參考,它的溫漂是0.8ppm,這樣可以減少ADS8568的溫漂嗎?
    發(fā)表于 11-29 08:06

    示波器ADC分辨率再高,沒(méi)有優(yōu)質(zhì)探頭也是沒(méi)有意義

    在示波器測(cè)量領(lǐng)域,存在一種常見(jiàn)的錯(cuò)誤認(rèn)知:人們往往以為示波器測(cè)量的準(zhǔn)確性?xún)H僅取決儀器本身的規(guī)格,例如屏幕上顯示的波形數(shù)量。然而,實(shí)際情況遠(yuǎn)非如此簡(jiǎn)單,測(cè)量準(zhǔn)確性是一個(gè)復(fù)雜的概念,它與測(cè)量設(shè)置緊密
    的頭像 發(fā)表于 11-22 11:23 ?162次閱讀
    示波器ADC分辨率再高,沒(méi)有優(yōu)質(zhì)探頭也是沒(méi)<b class='flag-5'>有意義</b>的

    什么是機(jī)器學(xué)習(xí)?通過(guò)機(jī)器學(xué)習(xí)方法能解決哪些問(wèn)題?

    計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對(duì)數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智
    的頭像 發(fā)表于 11-16 01:07 ?440次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過(guò)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問(wèn)題?

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 了解時(shí)間序列

    收到《時(shí)間序列與機(jī)器學(xué)習(xí)》一書(shū),彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供了一個(gè)讓我學(xué)習(xí)時(shí)間序列及應(yīng)用的機(jī)會(huì)! 前言第一段描述了編寫(xiě)背景: 由此可知,這是一本關(guān)于時(shí)間序列進(jìn)行大
    發(fā)表于 08-11 17:55

    雙電源無(wú)擾動(dòng)快切裝置的小型化設(shè)計(jì)是否有意義?

    快切裝置的小型化設(shè)計(jì)對(duì)于安裝空間有限的改造場(chǎng)景是非常有意義的,DCM635系列是目前業(yè)內(nèi)體積最小的快切裝置,前面板長(zhǎng)266mm,寬146mm,裝置深210.5mm,安裝與進(jìn)線柜或母聯(lián)柜上層二次控制室面板上,小型化設(shè)計(jì)節(jié)省安裝空間,尤其適用于改造項(xiàng)目中,開(kāi)關(guān)柜前面板開(kāi)孔尺寸有限的場(chǎng)景。
    的頭像 發(fā)表于 07-19 11:30 ?395次閱讀
    雙電源無(wú)擾動(dòng)快切裝置的小型化設(shè)計(jì)是否<b class='flag-5'>有意義</b>?

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)分割方法

    機(jī)器學(xué)習(xí)中,數(shù)據(jù)分割是一項(xiàng)至關(guān)重要的任務(wù),它直接影響到模型的訓(xùn)練效果、泛化能力以及最終的性能評(píng)估。本文將從多個(gè)方面詳細(xì)探討機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-10 16:10 ?1881次閱讀

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)預(yù)處理與特征工程

    機(jī)器學(xué)習(xí)的整個(gè)流程中,數(shù)據(jù)預(yù)處理與特征工程是兩個(gè)至關(guān)重要的步驟。它們直接決定了模型的輸入質(zhì)量,進(jìn)而影響模型的訓(xùn)練效果和泛化能力。本文將從數(shù)據(jù)預(yù)處理和特征工程的基本概念出發(fā),詳細(xì)探討這
    的頭像 發(fā)表于 07-09 15:57 ?461次閱讀

    機(jī)器學(xué)習(xí)數(shù)據(jù)分析中的應(yīng)用

    隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)量的爆炸性增長(zhǎng)對(duì)數(shù)據(jù)分析提出了更高的要求。機(jī)器學(xué)習(xí)作為一種強(qiáng)大的工具,通過(guò)訓(xùn)練模型從
    的頭像 發(fā)表于 07-02 11:22 ?650次閱讀

    通過(guò)強(qiáng)化學(xué)習(xí)策略進(jìn)行特征選擇

    更快更好地學(xué)習(xí)。我們的想法是找到最優(yōu)數(shù)量的特征和最有意義的特征。在本文中,我們將介紹并實(shí)現(xiàn)一種新的通過(guò)強(qiáng)化學(xué)習(xí)策略的特征選擇。我們先討論強(qiáng)化學(xué)習(xí),尤其是馬爾可夫決策
    的頭像 發(fā)表于 06-05 08:27 ?373次閱讀
    通過(guò)強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>策略進(jìn)行特征選擇

    TLF35584處待機(jī)狀態(tài)時(shí),能否通過(guò)SPI命令獲取其狀態(tài)?

    35584 處于待機(jī)狀態(tài)時(shí),能否通過(guò) SPI 命令獲取其狀態(tài)? 或者 DEVSTAT.STATE = 0x04(待機(jī))是否有意義?
    發(fā)表于 05-30 08:10

    機(jī)器學(xué)習(xí)入門(mén):基本概念介紹

    機(jī)器學(xué)習(xí)(GraphMachineLearning,簡(jiǎn)稱(chēng)GraphML)是機(jī)器學(xué)習(xí)的一個(gè)分支,專(zhuān)注利用圖形結(jié)構(gòu)的
    的頭像 發(fā)表于 05-16 08:27 ?521次閱讀
    圖<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>入門(mén):基本概念介紹

    Perplexity將Yelp數(shù)據(jù)引入其聊天機(jī)器

    Perplexity首席執(zhí)行官Aravind Srinivas告訴The Verge,許多人正在使用像常規(guī)搜索引擎一樣的聊天機(jī)器人 —— 直接從源頭提供他們想要的東西的信息是有意義的,比如選擇餐館。
    的頭像 發(fā)表于 03-19 17:36 ?705次閱讀
    Perplexity將Yelp<b class='flag-5'>數(shù)據(jù)</b>引入其聊天<b class='flag-5'>機(jī)器</b>人

    數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域,并舉例說(shuō)明

    數(shù)據(jù)挖掘(Data Mining)是一種從大量數(shù)據(jù)中提取出有意義的信息和模式的技術(shù)。它結(jié)合了數(shù)據(jù)庫(kù)、統(tǒng)計(jì)學(xué)、機(jī)器
    的頭像 發(fā)表于 02-03 14:19 ?3147次閱讀

    干貨!收藏!一文講清楚數(shù)據(jù)治理到底是什么?

    是指對(duì)客觀事件進(jìn)行記錄并可以鑒別的符號(hào),是對(duì)客觀事物的性質(zhì)、狀態(tài)以及相互關(guān)系等進(jìn)行記載的物理符號(hào)或這些物理符號(hào)的組合。 數(shù)據(jù)可以分為兩個(gè)部分,一是數(shù)字,二是文字。數(shù)字是沒(méi)有意義的抽象符號(hào),數(shù)據(jù)
    的頭像 發(fā)表于 02-01 10:40 ?483次閱讀
    干貨!收藏!一文講清楚<b class='flag-5'>數(shù)據(jù)</b>治理到底是什么?