隨著移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的快速普及,全球數(shù)據(jù)總量呈指數(shù)級(jí)增長(zhǎng)。據(jù)雷鋒網(wǎng)統(tǒng)計(jì),我們每天創(chuàng)造約2.3萬億GB數(shù)據(jù)。
過去,人們對(duì)海量數(shù)據(jù)無從下手。隨著大數(shù)據(jù)與人工智能、云計(jì)算、物聯(lián)網(wǎng)、區(qū)塊鏈等前沿技術(shù)的緊密融合以及硬件基礎(chǔ)設(shè)施的快速發(fā)展,這些新興技術(shù)為數(shù)據(jù)增值提供了強(qiáng)有力保障,由此帶來了巨大商業(yè)應(yīng)用價(jià)值,并逐漸成為各國(guó)搶占下一步發(fā)展機(jī)遇的戰(zhàn)略性技術(shù)。
最近,美國(guó)政府啟動(dòng)了大數(shù)據(jù)研究計(jì)劃,致力于提升大數(shù)據(jù)分析算法和系統(tǒng)的效率;同時(shí),日本對(duì)信息產(chǎn)業(yè)提出新的戰(zhàn)略規(guī)劃,將大數(shù)據(jù)作為重點(diǎn)發(fā)展的科技領(lǐng)域,著重強(qiáng)調(diào)數(shù)據(jù)采集與分析;近年來,我國(guó)大數(shù)據(jù)產(chǎn)業(yè)蓬勃發(fā)展。中國(guó)信通院在2018年發(fā)布的《大數(shù)據(jù)白皮書》進(jìn)一步調(diào)動(dòng)了全國(guó)各地發(fā)展大數(shù)據(jù)的積極性,各行各業(yè)開始利用大數(shù)據(jù)進(jìn)行智能升級(jí)轉(zhuǎn)型。
在大數(shù)據(jù)技術(shù)中,數(shù)據(jù)分析逐漸成為其核心技術(shù),包括對(duì)數(shù)據(jù)處理的實(shí)時(shí)性成為工業(yè)界的主要需求。當(dāng)前,各種數(shù)據(jù)分析技術(shù)層出不窮。其中,最為引人關(guān)注的當(dāng)屬深度學(xué)習(xí)技術(shù)。
一、深度學(xué)習(xí)是最好的方法之一
深度學(xué)習(xí)仍是目前大數(shù)據(jù)處理與分析的最好方法之一。
深度學(xué)習(xí)擅于發(fā)掘多維數(shù)據(jù)中錯(cuò)綜復(fù)雜的關(guān)系。基于大數(shù)據(jù)的深度學(xué)習(xí)算法在計(jì)算機(jī)視覺、自然語言處理以及信息檢索等多個(gè)領(lǐng)域不斷刷新著記錄。
在這個(gè)數(shù)據(jù)為王的時(shí)代,深度學(xué)習(xí)中的監(jiān)督/半監(jiān)督學(xué)習(xí)與數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量等有很大關(guān)系,因此數(shù)據(jù)標(biāo)注是在現(xiàn)實(shí)場(chǎng)景中提升模型性能的最直接有效的方法。
但由于傳統(tǒng)的數(shù)據(jù)集數(shù)量/質(zhì)量有限,在解決新的問題或是想要獲得更好的效果時(shí),往往需要進(jìn)行額外的數(shù)據(jù)標(biāo)注。因此,對(duì)于數(shù)據(jù)要求不那么高的半監(jiān)督/弱監(jiān)督學(xué)習(xí)一直是視覺大數(shù)據(jù)處理中的熱點(diǎn)問題。同時(shí),當(dāng)使用某數(shù)據(jù)集訓(xùn)練了一個(gè)很好的模型,但在實(shí)際應(yīng)用時(shí),往往由于“領(lǐng)域鴻溝”(domain gap)的存在,模型性能大幅度下降,遷移學(xué)習(xí)是這一問題的常用解決思路。
此外,由于移動(dòng)設(shè)備或物聯(lián)網(wǎng)設(shè)備的存儲(chǔ)和計(jì)算資源有限,無法像服務(wù)器一樣輕松地運(yùn)行訓(xùn)練好的模型,限制了深度學(xué)習(xí)技術(shù)在大數(shù)據(jù)領(lǐng)域的應(yīng)用落地,針對(duì)此問題,目前有效的解決方案包括模型壓縮、計(jì)算加速。
生成對(duì)抗網(wǎng)絡(luò)Generative Adversarial Networks (GANs)的提出,為神經(jīng)網(wǎng)絡(luò)添加了一個(gè)新的分支。該網(wǎng)絡(luò)結(jié)構(gòu)能極大提高圖像生成的質(zhì)量,進(jìn)一步推動(dòng)了計(jì)算機(jī)視覺領(lǐng)域的發(fā)展。
近幾年,計(jì)算機(jī)視覺正在向視頻理解領(lǐng)域延伸,而視頻比圖像多了一維時(shí)序信息,如何有效建模并利用這一時(shí)序信息是處理這類問題的關(guān)鍵。
深度強(qiáng)化學(xué)習(xí)是大數(shù)據(jù)時(shí)代的另一研究熱點(diǎn),強(qiáng)化學(xué)習(xí)是主體通過與外部環(huán)境交互來進(jìn)行學(xué)習(xí)的過程。目前已經(jīng)取得了實(shí)質(zhì)性的突破,2017年DeepMind公司的提出的AlphaGo Zero通過自我博弈的強(qiáng)化深度學(xué)習(xí)算法進(jìn)行訓(xùn)練,經(jīng)過3天的學(xué)習(xí),以100:0的成績(jī)超越了AlphaGo Lee的實(shí)力(以4:1戰(zhàn)勝李世石的版本),21天后達(dá)到了AlphaGo Master的水平,并在40天內(nèi)超過了所有之前的版本。
自2017年以來,AutoML(Automated machine learning)迅速興起,AutoML試圖將特征提取、模型優(yōu)化、參數(shù)調(diào)節(jié)等重要步驟進(jìn)行自動(dòng)化地學(xué)習(xí),使得機(jī)器學(xué)習(xí)模型無需人工干預(yù)即可被應(yīng)用。但目前其在搜索效率、實(shí)際應(yīng)用等方面有待進(jìn)一步探索。
二、計(jì)算機(jī)視覺
計(jì)算機(jī)視覺是人工智能領(lǐng)域最為成熟的技術(shù)之一,其主旨在于利用計(jì)算機(jī)模擬人類視覺,是人工智能中的‘看’,進(jìn)而為后續(xù)的應(yīng)用目標(biāo)提供判別信息。計(jì)算機(jī)視覺研究和應(yīng)用非常廣泛,近幾年取得了快速的發(fā)展,其應(yīng)用已經(jīng)在政府、金融、互聯(lián)網(wǎng)等行業(yè)市場(chǎng)率先落地。
此外,利用大數(shù)據(jù)可以對(duì)實(shí)體經(jīng)濟(jì)行業(yè)進(jìn)行市場(chǎng)需求分析,優(yōu)化生產(chǎn)流程、供應(yīng)鏈與物流能源管理,以及提供智能客戶服務(wù)等。雖然大數(shù)據(jù)已經(jīng)服務(wù)于眾多行業(yè),但是在實(shí)際應(yīng)用中還有很多局限,仍舊有很多問題沒有解決。
近年來,國(guó)家對(duì)人工智能行業(yè)的大力支持為計(jì)算機(jī)視覺的發(fā)展提供了有利環(huán)境,極大促進(jìn)了計(jì)算機(jī)視覺的商業(yè)化落地。目前我國(guó)共有100余家計(jì)算機(jī)視覺企業(yè),涉獵身份認(rèn)證、安防影像、醫(yī)療影像等眾多領(lǐng)域。
目前CV公司比較集中的技術(shù)賽道有:人臉識(shí)別、自動(dòng)駕駛、醫(yī)療圖像等,目前商業(yè)化落地最快的仍是人臉識(shí)別及其業(yè)務(wù)相關(guān)的一些技術(shù)。
縱觀計(jì)算機(jī)視覺發(fā)展,可以看到中國(guó)與西方國(guó)家的演進(jìn)路線的不同。國(guó)際上前沿的技術(shù)主要集中在深度學(xué)習(xí)的基礎(chǔ)研究層面,而中國(guó)的計(jì)算機(jī)視覺技術(shù)更傾向于產(chǎn)業(yè)落地。經(jīng)過多年的沉淀,中國(guó)已經(jīng)在人才、數(shù)據(jù)、場(chǎng)景和政策層面做了比較多的儲(chǔ)備,為中國(guó)計(jì)算機(jī)視覺技術(shù)的發(fā)展提供了豐沃的土壤。
尤其是在應(yīng)用方面。計(jì)算機(jī)視覺領(lǐng)域一定要通過落地應(yīng)用才能更好推動(dòng)學(xué)術(shù)的發(fā)展,而中國(guó)在這方面具有巨大的優(yōu)勢(shì)。
-
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8889瀏覽量
137444 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5503瀏覽量
121169
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論