由斯坦福大學(xué)人工智能百年研究(AI100)推出的「人工智能指數(shù)」(AI Index)是一個追蹤 人工智能行業(yè)動態(tài)與發(fā)展的非營利性項目,其研究覆蓋了百年以來人工智能的總體情況, 目標(biāo)是基于數(shù)據(jù)來推動人工智能的廣泛交流和有效對話。2017 年,AI Index 推出了首份年度報告,從多個角度觀察和解讀了人工智能領(lǐng)域的動態(tài)和進展。
1.論文發(fā)表數(shù)量
下圖統(tǒng)計了 Scopus 學(xué)術(shù)論文庫中標(biāo)注關(guān)鍵詞「人工智能」的計算科學(xué)論文數(shù)量。
自 1996 年至今,每年發(fā)布的 人工智能論文數(shù)量增加了 9 倍多。
這里是各類學(xué)術(shù)論文年發(fā)表率與其 1996 年發(fā)表率的比較。圖表顯示了各領(lǐng)域論文、 計算機科學(xué)領(lǐng)域論文以及計算機領(lǐng)域內(nèi)人工智能論文年發(fā)表率的增速。
數(shù)據(jù)揭示了人工智能論文發(fā)表率的增長不僅僅是出于對更廣泛計算機科學(xué)領(lǐng)域興趣的 增長。具體來說,盡管自 1996 年以來整體計算機科學(xué)領(lǐng)域內(nèi)的論文數(shù)量已經(jīng)增長了 6 倍,同時期人工智能領(lǐng)域每年發(fā)表的論文數(shù)量已經(jīng)增長了 9 倍多。
2.課程選修人數(shù)
除了論文發(fā)表數(shù)以外,課程的參與人數(shù)也能體現(xiàn)這個領(lǐng)域的活力。以下展示的是斯坦 福大學(xué)每年選修人工智能與機器學(xué)習(xí)導(dǎo)論課程的學(xué)生數(shù)量。機器學(xué)習(xí)是人工智能的子領(lǐng)域。我們著重關(guān)注機器學(xué)習(xí)導(dǎo)論課程的參與度是因為目前人工 智能領(lǐng)域很多成果都基于機器學(xué)習(xí)的算法與理論。
自 1996 年以來,選修斯坦福大學(xué)人工智能導(dǎo)論課程的人數(shù)已經(jīng)增長了 11 倍。
注:斯坦福大學(xué) 2016 學(xué)年機器學(xué)習(xí)入學(xué)人數(shù)的下降是基于當(dāng)年的行政問題而非學(xué)生興趣。
本報告之所以著重突出斯坦福大學(xué)導(dǎo)論課程的選修人數(shù)是因為其數(shù)據(jù)最全面。不過如下所示,其它高校導(dǎo)論課程的選修趨勢也與斯坦福相似。
注:許多大學(xué)從上世紀(jì) 90 年代起開設(shè)人工智能課程。上圖展示的是可獲取數(shù)據(jù)的年份的情況。
注:許多大學(xué)從上世紀(jì) 90 年代起開設(shè)機器學(xué)習(xí)課程。上圖展示的是可獲取數(shù)據(jù)的年份的情況。
需要注意的是,這些圖表展示了高等教育領(lǐng)域中的一個側(cè)面,這些數(shù)據(jù)并不一定代表 學(xué)術(shù)機構(gòu)總體的發(fā)展趨勢。
3.學(xué)術(shù)會議出席情況
以下展示了人工智能領(lǐng)域有代表性的學(xué)術(shù)會議的參會情況,其中既有如 AAAI、IJCAI 和 ICML 這樣的大型綜合性會議 (按 2016 年參會人數(shù)超過 1000 人為標(biāo)準(zhǔn)),也有像 CVPR、ACL、ICRA 那樣專注于計算機視覺、自然語言處理和機器人的小型會議 (2016 年參 會人數(shù)不足 1000 人)。
注:大多數(shù)學(xué)術(shù)會議自 1980 年代起即開始舉辦,上圖展示的是參會人數(shù)有記錄的年份的情況。
研究重心轉(zhuǎn)移:上圖的參會人數(shù)同樣表明了研究重點已經(jīng)從符號推理轉(zhuǎn)向了機器學(xué)習(xí)與深 度學(xué)習(xí)。
下圖展示了參會人數(shù)少于 1000 人的小型學(xué)術(shù)會議的參會情況,其中需要注意的是 ICLR,該會議專注于深度學(xué)習(xí)領(lǐng)域,第一次會議于 2013 年由深度學(xué)習(xí)先驅(qū) Yann LeCun 及 Yoshua Bengio 主辦。
穩(wěn)步前進:盡管學(xué)術(shù)界研究重點近年來已轉(zhuǎn)移至機器學(xué)習(xí)及深度學(xué)習(xí),仍有一小部分 研究者繼續(xù)在符號推理方法上進行探索并取得進展。
產(chǎn)業(yè)領(lǐng)域
1.AI 領(lǐng)域創(chuàng)業(yè)公司
下圖展示了得到風(fēng)投資本支持并開發(fā)了人工智能系統(tǒng)的美國活躍創(chuàng)業(yè)公司的數(shù)量。
這一數(shù)量自 2000 年以來已增加了 14 倍。
2.AI 領(lǐng)域風(fēng)險投資
下圖為風(fēng)投資本對美國人工智能創(chuàng)業(yè)公司所有融資階段的年投資總額。
這一金額自 2000 年以來增加了 6 倍。
3.工作機會
下圖分別展示了需要人工智能技能的工作數(shù)量的增 長。我們通過標(biāo)題和工作描述的關(guān)鍵詞區(qū)分出需要人工智能技能的工作。
下圖是美國需要人工智能技能的工作數(shù)量的增長數(shù)據(jù)。漲幅是基于 美國要求人工智能技能的就業(yè)崗位所占份額的增長倍數(shù)。
自 2013 年以來,在美國需要人工智能技能的工作比重增長了 4.5 倍。
下圖為多個國家需要人工智能技能的工作比重的增長趨勢。
注:雖然在加拿大和英國 人工智能就業(yè)市場增長很快,但相對來說它們在 絕對規(guī)模上仍然只有美國 AI 就業(yè)市場的 5% 和 27%。
下圖為按照所需的特定技能劃分的一年內(nèi)人工智能工作機會總量。
注:一份與人工智能相關(guān)的工作可能出現(xiàn)被計算兩次的情況 (屬于不同的類別)。比如,一份工作可能尤其需要自然語言處理和計算機視覺兩種技能。
4.自動化及機器人應(yīng)用
工業(yè)機器人進口到北美和全球的數(shù)量。
工業(yè)機器人進口到北美和全球的數(shù)量增長趨勢。
開源生態(tài)
1.GitHub 項目統(tǒng)計
下圖展示了 GitHub 上 TensorFlow 和 Scikit-Learn 軟件包被收藏 (star) 的次數(shù)。二者都是深度學(xué)習(xí)和機器學(xué)習(xí)的常用軟件包。
軟件開發(fā)者在 GitHub 上收藏 (Star) 軟件項目以表示感興趣并希望快速導(dǎo)航至該項目。收藏 可以代表開發(fā)者對軟件和軟件使用的興趣。
下圖展示了 GitHub 上不同人工智能和機器學(xué)習(xí)軟件包被收藏的次數(shù)。
注:GitHub 庫的 fork 數(shù)量遵循幾乎同樣的趨勢 (盡管每個庫的 fork 量和 star 量不同)。
公眾認知及媒體報道
1.輿論傾向
下圖展示了包含關(guān)鍵詞「人工智能」的大眾媒體文章的百分比,文章根據(jù)其意見傾向性 被分為正面報道或負面報道。
技術(shù)性能
計算機視覺
1.物體檢測
下圖展示了 LSVRC 競賽 (Large Scale Visual Recognition Challenge) 中人工智能系統(tǒng)在物體檢 測任務(wù)上的性能表現(xiàn)。
圖像標(biāo)注的誤差率從 2010 年的 28.5% 降至低于 2.5%。
2.視覺問答
下圖展示了人工智能系統(tǒng)在針對圖像問題提供開放式回答任務(wù)上的表現(xiàn)。
注:VQA 1.0 數(shù)據(jù)集已經(jīng)被 VQA 2.0 數(shù)據(jù)集超越,目前尚不明確 VQA 1.0 數(shù)據(jù)集在未來會 獲得多少關(guān)注。
自然語言處理
1.解析
下圖展示了人工智能系統(tǒng)在確定句子句法結(jié)構(gòu)任務(wù)上的表現(xiàn)。
2.機器翻譯
下圖展示了人工智能系統(tǒng)在英德新聞互譯任務(wù)中的表現(xiàn)。
3.問答
下圖展示了人工智能系統(tǒng)在從文檔中找到問題答案任務(wù)上的表現(xiàn)。
4.語音識別
下圖展示了人工智能系統(tǒng)在語音識別上的表現(xiàn)。
定理證明
可處理度 (tractability) 是指自動定理證明器在大量定理的數(shù)據(jù)集上的平均可處理程度。它可 以被用來衡量部分最先進的自動定理證明器。
注:引進最先進的證明器雖然可以解決新問題,但由于其在處理其他證明器擅長解決的問題上表現(xiàn)糟糕,平均可處理度可能會下降。
SAT 求解
這里指的是 SAT 求解系統(tǒng)解決問題 (那些可應(yīng)用到產(chǎn)業(yè)實踐中的問題) 的百分比。
流行趨勢關(guān)系研究
通過研究不同流行趨勢之間的關(guān)系,我們可以從前述章節(jié)中的評估中獲得進一步的領(lǐng) 悟。本章展示了人工智能指數(shù)收集的數(shù)據(jù)可以如何被應(yīng)用到進一步的分析中,以及這些數(shù) 據(jù)如何推動了一個全新、精確的衡量指標(biāo)的發(fā)展。
由于這是一個案例研究板塊,我們會著眼于橫跨學(xué)術(shù)圈與產(chǎn)業(yè)界的流行趨勢去探究其 之間的動態(tài)關(guān)系。進一步,我們會將這些標(biāo)準(zhǔn)整合成一個聯(lián)合的人工智能活力指數(shù)。
學(xué)術(shù)界-產(chǎn)業(yè)界的動態(tài)關(guān)系
為了研究學(xué)術(shù)界與產(chǎn)業(yè)界人工智能相關(guān)活動的關(guān)系,我們首先從之前章節(jié)中選擇了部 分具有代表性的評估結(jié)果。特別地,我們考察了人工智能論文的發(fā)布情況與斯坦福大學(xué)人 工智能與機器學(xué)習(xí)導(dǎo)論課程的修讀情況,此外還考察了風(fēng)投資本對人工智能創(chuàng)業(yè)公司的投 資情況。
論文發(fā)表數(shù)、注冊學(xué)生數(shù)和投資金額這些數(shù)量指標(biāo)并不能直接比較。為了分析這些趨 勢之間的關(guān)系,我們首先以 2000 年為起始為每個測量指標(biāo)設(shè)定了時間標(biāo)準(zhǔn)。這使得我們 可以來比較這些指標(biāo)隨時間的增長情況變化,而不是僅僅從最后的絕對值入手分析。
注:注冊學(xué)生數(shù)在 2016 年有所下降,這反映了學(xué)校行政上的某些問題,并非沒有足夠的學(xué)生對課程感興趣。
數(shù)據(jù)顯示,首先,學(xué)術(shù)活動數(shù)量 (論文發(fā)表與注冊學(xué)生數(shù)) 在穩(wěn)步上升。在 2010 年 左右,投資者便開始注意到了這個領(lǐng)域,到 2013 年,投資者已經(jīng)成為了推進該領(lǐng)域發(fā)展 的核心驅(qū)動力。此后,學(xué)術(shù)界逐漸趕上了產(chǎn)業(yè)界的步伐。
人工智能活力指數(shù)
人工智能活力指數(shù)整合了來自學(xué)術(shù)界和產(chǎn)業(yè)界的各類數(shù)據(jù) (論文發(fā)表量、課程注冊學(xué) 生數(shù)、風(fēng)險資本投資) 來量化整個人工智能領(lǐng)域的活力。為了計算人工智能活力指數(shù),我 們按照時間對來自論文發(fā)表、學(xué)生課程注冊和投資領(lǐng)域的數(shù)據(jù)進行了歸一化平均處理。
-
斯坦福
+關(guān)注
關(guān)注
0文章
28瀏覽量
9246 -
人工智能
+關(guān)注
關(guān)注
1791文章
47352瀏覽量
238774
原文標(biāo)題:【中文版全文】斯坦福AI指數(shù)2017年度報告
文章出處:【微信號:industry4_0club,微信公眾號:工業(yè)4俱樂部】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論