劍橋2019年度《AI全景報告》出爐,全方位總結(jié)過去一年來AI領(lǐng)域的研究成果與突破、人才形勢、產(chǎn)業(yè)動態(tài)、政府政策,并作出未來預(yù)測。今年的報告額外關(guān)注中國,專門新設(shè)一章,介紹中國的AI技術(shù)、企業(yè)和應(yīng)用的迅猛發(fā)展。
2019年即將過去一半,劍橋大學(xué)的兩位研究人員近日推出了本年度的State AI 2019全景報告。
本報告基本沿襲去年的大體框架,從產(chǎn)業(yè)、人才、政策、預(yù)測等方面對過去一年來AI領(lǐng)域的技術(shù)的新進(jìn)步、產(chǎn)業(yè)格局的新變化、政府政策的新特點(diǎn)等方面進(jìn)行了總結(jié),并作出關(guān)于未來的預(yù)測。
報告地址:
https://www.slideshare.net/StateofAIReport/state-of-ai-report-2019-151804430
值得一提的是,與去年不同的是,2019年的報告為中國單列一章,介紹中國AI技術(shù)在日常消費(fèi)、機(jī)器人、半導(dǎo)體等領(lǐng)域的進(jìn)步。
本文重點(diǎn)對報告中的AI研究、AI人才以及中國三部分內(nèi)容作出介紹。
AI研究與技術(shù)突破:游戲、NLP、醫(yī)療全面開花
強(qiáng)化學(xué)習(xí)開疆?dāng)U土:在多項(xiàng)競技性游戲中擊敗人類
目前已經(jīng)被AI統(tǒng)治的游戲包括《蒙特祖瑪?shù)膹?fù)仇》、《星際爭霸2》、《雷神之錘3》,在DOTA2上游戲水平實(shí)現(xiàn)大幅進(jìn)步。未來的游戲AI可能讓人類更加遙不可及了。
未來,研究人員有望利用強(qiáng)化學(xué)習(xí)訓(xùn)練單個機(jī)器人來完成多個復(fù)雜任務(wù),無需針對每個任務(wù)進(jìn)行專門的再學(xué)習(xí)。
基于好奇心機(jī)制的探索:在獎勵稀疏或無獎勵機(jī)制的條件下,智能體可以依賴“好奇心”解決問題。
面向在線計劃學(xué)習(xí)動態(tài)模型:模型可從圖像中快速學(xué)習(xí)環(huán)境動態(tài)信息,準(zhǔn)確預(yù)測數(shù)個時間段后的獎勵。
研究成果逐步進(jìn)入實(shí)際生產(chǎn)環(huán)境:在眾多機(jī)器學(xué)習(xí)框架和工具的支持下,F(xiàn)acebook發(fā)布的開源端對端平臺Horizon,推進(jìn)大規(guī)模生產(chǎn)環(huán)境下的系統(tǒng)優(yōu)化,如信息聯(lián)想、視頻流質(zhì)量、通知服務(wù)優(yōu)化等。
生命科學(xué)中的新突破:AlphaFold精準(zhǔn)預(yù)測蛋白質(zhì)的折疊結(jié)構(gòu)
NLP大豐收:預(yù)訓(xùn)練語言模型大展身手
新的預(yù)訓(xùn)練模型不斷涌現(xiàn),各大數(shù)據(jù)集新紀(jì)錄??闯P?。Google AI的BERT, 、Transformer,艾倫研究所的ELMo、OpenAI的Transformer、 Ruder和Howard的 ULMFiT、微軟的MT-DNN等爭奇斗艷。
神經(jīng)機(jī)器翻譯:無需雙向文本
自然語言模型學(xué)會常識推理
對機(jī)器學(xué)習(xí)領(lǐng)域的數(shù)據(jù)隱私和保護(hù)越來越重視
醫(yī)學(xué)領(lǐng)域大展身手,診斷堪比人類專家
診斷眼疾
使用兩個階段機(jī)器學(xué)習(xí)方法,AI模型給出了專家級的眼疾診斷和治療參考建議
利用心電圖檢測心律不齊,達(dá)到人類醫(yī)生水平
超過60萬的X光片數(shù)據(jù)集已經(jīng)被分享出來,但遠(yuǎn)遠(yuǎn)不夠
用于成像診斷的深度學(xué)習(xí)模型可以很好地擬合數(shù)據(jù)集,但是它們難以推廣到新的數(shù)據(jù)分布。盡管改進(jìn)了這個新數(shù)據(jù)集的文檔,但標(biāo)簽定義很淺
使用醫(yī)生筆記中的NLP提取標(biāo)簽存在挑戰(zhàn):容易出錯且容易受到影響。放射學(xué)報告中包含的信息不足,大多數(shù)標(biāo)簽類別的錯誤率為5-15%
大量重復(fù)掃描,其中70%的掃描來自30%的患者。這減少了數(shù)據(jù)集的有效大小及其多樣性,影響訓(xùn)練模型的普適性
研究人員從聽覺皮層的神經(jīng)活動中重建語音
哥倫比亞大學(xué)的研究人員使用侵入性腦電圖來測量5名接受癲癇治療的患者在連續(xù)收聽語音時的神經(jīng)活動
反過來使研究人員能夠通過大腦活動的聲碼器合成語音。通過聲碼器測試單個數(shù)字“口語”時,系統(tǒng)的準(zhǔn)確度達(dá)到75%。與基線線性回歸方法相比,深度方法將語音的可懂度提高了65%
該研究表明,大腦計算機(jī)界面有可能恢復(fù)癱瘓患者的溝通
使用蒙特卡羅樹搜索神經(jīng)網(wǎng)絡(luò)通過訓(xùn)練1240萬個反應(yīng)來解決逆向合成
一個由三個NN(3N-MCTS)構(gòu)建的系統(tǒng):
通過提出有限數(shù)量的自動提取轉(zhuǎn)換來指導(dǎo)向有希望的方向搜索
預(yù)測擬議的反應(yīng)是否實(shí)際可行
估計位置值并迭代
這種方法比最先進(jìn)的計算機(jī)輔助綜合計劃快得多。實(shí)際上,3N-MCTS解決了超過80%的分子測試集,每個目標(biāo)分子的時間限制為5秒。
相比之下,一種稱為最佳第一搜索的方法,其中通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)函數(shù)可以解決40%的測試集。使用手動編碼啟發(fā)式功能設(shè)計的最佳首次搜索執(zhí)行最差:它在5秒內(nèi)解決了0%。
AutoML:神經(jīng)網(wǎng)絡(luò)架構(gòu)和超參數(shù)的進(jìn)化算法
共同優(yōu)化超參數(shù),最大化網(wǎng)絡(luò)性能,同時最小化復(fù)雜性和大小
之前的AutoML工作使用RL單獨(dú)優(yōu)化超參數(shù)或網(wǎng)絡(luò)架構(gòu)。遺憾的是,RL系統(tǒng)要求用戶事先為算法定義適當(dāng)?shù)乃阉骺臻g以用作起點(diǎn),可以針對每個層優(yōu)化的超參數(shù)的數(shù)量也是有限的
此外,計算非常繁重。為了生成最終的最佳網(wǎng)絡(luò),必須對數(shù)千個候選架構(gòu)進(jìn)行評估和訓(xùn)練,這需要大約100k GPU小時
另一種選擇(Learning Evolutionary AI Framework:LEAF)是使用進(jìn)化算法進(jìn)行超參數(shù)和網(wǎng)絡(luò)架構(gòu)優(yōu)化,最終產(chǎn)生更小,更有效的網(wǎng)絡(luò)
例如,LEAF與手工制作的數(shù)據(jù)集特定網(wǎng)絡(luò)(CheXNet)的性能相匹配,用于胸部X射線診斷分類,并且優(yōu)于Google的AutoML
AutoML:使用真實(shí)的設(shè)備性能反饋設(shè)計資源受限的網(wǎng)絡(luò)
基于CNN的自動化架構(gòu)搜索的步伐正在加快:Facebook與谷歌的競爭加劇
谷歌展示了一種基于RL的多目標(biāo)方法(MnasNet),可以在Google Pixel平臺上測量具有低實(shí)際推理延遲的高精度CNN模型。該系統(tǒng)在Pixel手機(jī)上達(dá)到74.0%的Top-1精度,延遲為76ms,比MobileNetV2快1.5倍
Facebook提出了一種可區(qū)分的神經(jīng)架構(gòu)搜索(DNAS)框架,該框架使用基于梯度的方法在分層搜索空間上優(yōu)化CNN架構(gòu)。FBNet-B實(shí)現(xiàn)了與MnasNet相同的Top-1精度,但延遲僅為23.1ms,搜索成本降低了420倍
GAN的最新技術(shù)水平在不斷發(fā)展:從顆粒到GANgsta
較大的模型和大批量訓(xùn)練進(jìn)一步提高了使用GAN生成的圖像的質(zhì)量
GAN中的最新技術(shù)水平在不斷發(fā)展:從面部到全身
通過將面部與口語相匹配(左),電影只需設(shè)置一次,即可以不同語言生成相同的視頻。下一步是從頭到腳生成整個身體,目前用于零售目的(右)
在圖像和視頻操作之后出現(xiàn)逼真的語音合成
從單個圖像中學(xué)習(xí)對象的3D形狀
模型輸出10個不同類別(如汽車、摩托車、行人、交通錐等)的3D邊界框,類特定屬性(如汽車是否正在行駛或停車)并提供當(dāng)前速度矢量。
AI人才:五大國雇傭了72% 專家,論文引用率只有中國增長
人才方面,以研究論文的產(chǎn)出衡量,谷歌是最具生產(chǎn)力的一個組織。上圖為在人工智能頂會NeurIPS 2018上,谷歌發(fā)表的論文最多,其次是MIT、斯坦福、CMU和加州大學(xué)伯克利分校。
在NeurIPS、ICML或ICLR上發(fā)表論文的4000名研究人員中,88%是男性。
另一方面,數(shù)據(jù)標(biāo)簽工作也有了巨大的增長,尤其是在中國。這類工作的最低工資可低至每小時10元人民幣。
神經(jīng)網(wǎng)絡(luò)的先驅(qū)、Yann LeCun、Geoffrey Hinton和YoshuaBengio獲得了圖靈獎,這是計算機(jī)科學(xué)的最高獎項(xiàng)。
歐洲發(fā)表的AI論文最多,但在平均引文率這個指標(biāo)上,只有中國是增長的。
該領(lǐng)域論文的數(shù)量整體是增長的,不同地區(qū)論文的平均被引量表明,只有來自中國的論文變得更有影響力了。美國作者發(fā)表的論文被引用的次數(shù)比全球平均水平高出83%。
MIT在計算與人工智能領(lǐng)域新增10億美元投資。在3.5億美元捐贈的支持下,MIT新的計算學(xué)院將把MIT重新定位為向所有研究領(lǐng)域注入AI教育,提供了50個新的教職,使MIT在該領(lǐng)域的學(xué)術(shù)能力翻了一番。
大學(xué)里人工智能相關(guān)課程的注冊人數(shù)也在增長,中國的增長尤其快。
與2012年相比,清華大學(xué)和斯坦福大學(xué)的人工智能課程注冊人數(shù)分別增加了近16倍和5倍。
但人工智能課程中教授和學(xué)生的性別多樣性仍遠(yuǎn)未達(dá)到平等。平均而言,80%教AI的教授是男性,75%的學(xué)AI的本科生是男生。
這造成的一個結(jié)果是,在美國,申請AI方面職位的人中71%是男性。
Element.AI 2019年進(jìn)行的一項(xiàng)AI人才調(diào)查顯示:
對22400名個人作者在21個機(jī)器學(xué)習(xí)會議上發(fā)表的論文進(jìn)行調(diào)查:只有19%的學(xué)術(shù)作者和16%的行業(yè)作者是女性。
44%的作者在美國獲得博士學(xué)位,11%來自中國,6%來自英國。
五大國家——美國、中國、英國、德國和加拿大——雇傭了72%的作者。圖上的圓圈表示每個國家在會議上發(fā)表論文的研究人員數(shù)量。
同樣是Element.AI,從AI人才流入和流出來看,加拿大、英國和瑞士都是“平臺國家”,既吸引外國人才,又輸出本土培養(yǎng)的人才。美國和中國的生態(tài)系統(tǒng)更為成熟——流入和流出都較低。
但雇傭AI研究人員進(jìn)入公司的趨勢似乎正在放緩。據(jù)稱,科技巨頭凍結(jié)或減少了對AI研究人才的招聘。這可能是一個跡象,表明企業(yè)現(xiàn)在需要人才來將應(yīng)用研究投入生產(chǎn)。
人工智能技術(shù)已經(jīng)滲入中國企業(yè)
人臉識別已經(jīng)成為日常消費(fèi)付款方式。
養(yǎng)雞業(yè):2016年,京東推出了一項(xiàng)“小雞快跑(running chicken)”計劃,幫助中國農(nóng)業(yè)地區(qū)減少貧困。根據(jù)該計劃,該公司將購買任何自由放養(yǎng)的雞肉,只要其步數(shù)超過100萬步,且價格是當(dāng)前市場價格的三倍?,F(xiàn)在,京東已經(jīng)擴(kuò)展了該項(xiàng)目,將人工智能工具整合到畜牧工作流程中。這包括自動喂食、澆水和清除廢物。人工智能系統(tǒng)還將監(jiān)測和識別雞的食物攝入量、排便情況和其他生理狀況,如發(fā)病情況。如果一只雞生病了,專家會在網(wǎng)上提供醫(yī)療服務(wù)和處方藥物。
養(yǎng)豬業(yè):在Dekon集團(tuán)、特區(qū)集團(tuán)和阿里巴巴云的合作中,計算機(jī)視覺和語音識別系統(tǒng)被用來通過紋在豬腹部的數(shù)字來識別個體豬,還可以監(jiān)測小豬發(fā)出的痛苦叫聲。到2020年,Dekon計劃每年飼養(yǎng)1000萬頭豬。
蟑螂養(yǎng)殖:好醫(yī)生集團(tuán)在四川省每年生產(chǎn)60萬只蟑螂。他們利用人工智能系統(tǒng)收集和分析多達(dá)80種蟑螂的特征,如濕度、溫度和食物需求,這些特征可以刺激蟑螂的生長和繁殖速度。
中國企業(yè)的研發(fā)支出增長迅速但顯著落后于市場份額。美國企業(yè)仍占全球科技支出的61%。
中國半導(dǎo)體貿(mào)易逆差正(緩慢)上升。下圖反映了中國半導(dǎo)體銷售和采購的趨勢。
在過去的三年里,一些中國的工業(yè)企業(yè)已經(jīng)自動化了40%的勞動力。這可能部分歸因于自2012年以來,中國每年的機(jī)器人安裝數(shù)量增長了500%(歐洲為112%)。然而,目前尚不清楚AI軟件在多大程度上在運(yùn)行這些已安裝的機(jī)器人或者是否有助于它們的發(fā)展。中國工業(yè)自動化水平不斷提高,就業(yè)崗位不斷流失。
京東上海配送中心每天使用自動化倉庫機(jī)器人組織、挑選和運(yùn)送20萬份訂單。這個設(shè)施由四名工人照管。京東的倉庫數(shù)量和表面積同比增長45%。
2018年,有33家中國企業(yè)在美國上市,同比增長2倍,接近2010年的歷史最高水平。
發(fā)明專利的審批過程充滿挑戰(zhàn),一旦獲得批準(zhǔn),將獲得20年的保護(hù)。實(shí)用新型和外觀設(shè)計專利都有10年的使用壽命,不需要經(jīng)過嚴(yán)格的審查,可以在不到1年內(nèi)授予。這種雙重專利制度使中國在專利方面領(lǐng)先于其他國家。中國企業(yè)擁有的專利最多,但2017年“發(fā)明專利”僅占23%。
91%的5年設(shè)計專利(左)和61%的5年實(shí)用新型專利(右)被放棄。相比之下,美國5年歷史專利的維護(hù)費(fèi)占85.6%。
中國目前出版的機(jī)器學(xué)習(xí)影響較大的學(xué)術(shù)研究現(xiàn)狀。
中國發(fā)表的ML研究已經(jīng)超過美國。艾倫研究所(Allen Institute)最近的一項(xiàng)分析顯示,中國在質(zhì)量方面的差距也在迅速縮小。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28573瀏覽量
207740 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1286瀏覽量
24378 -
nlp
+關(guān)注
關(guān)注
1文章
489瀏覽量
22065
原文標(biāo)題:劍橋2019年度《AI全景報告》聚焦中國,盤點(diǎn)全球AI大勢
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論