研究人員很容易被人們忽略,但不可否認(rèn),他們才是所有AI生態(tài)系統(tǒng)的核心組成部分。
長期以來,中國和美國在人工智能方面的實力對比一直存在爭議,但相關(guān)的數(shù)據(jù)支撐較弱。
因此,根據(jù)專家認(rèn)可的頂級AI年度會議上發(fā)表的論文,保爾森研究所宏觀政策智庫研究員在Macarpolo創(chuàng)建了一個原始數(shù)據(jù)集,為評估中美AI科研人員的數(shù)量和質(zhì)量提供了一份充分的數(shù)據(jù)依據(jù)。
領(lǐng)先的AI研究都是相對開源的,因此人才也是其生態(tài)系統(tǒng)組成部分中最容易被直接量化的指標(biāo)之一。保爾森研究所搜集了已發(fā)表的研究數(shù)據(jù),試圖從人工智能研究員的分布,獲取各國人工智能研究發(fā)展情況。
神經(jīng)信息處理系統(tǒng)大會(原名Neural Information Processing Systems,NeurIPS)是人工智能和機器學(xué)習(xí)領(lǐng)域最重要的盛會。保爾森研究所對NeurIPS 2018論文進行了完整的分析,并從以下幾個方面得出了結(jié)論:
研究質(zhì)量 (基于頂級或高質(zhì)量的研究);
頂尖人才來自哪里(基于作者的原籍國);
人才的培養(yǎng)地(基于作者攻讀研究生的國家);
以及作者現(xiàn)在學(xué)習(xí)或工作的地方(基于作者目前的隸屬關(guān)系)。
以下是一些研究要點
1.在頂尖的AI研究中,中國的研究人員所占比例相對較小(約 9%),但高質(zhì)量的AI研究中所占比例較大(約25%)。
根據(jù)研究員Joy Dantong ma最近對在NeurIPS 2018上發(fā)表的演講中對頂級論文作者進行的數(shù)據(jù)分析,在113名作者中有10人是中國國籍。
尤其值得注意的是,他發(fā)現(xiàn),目前這十位中國國籍的精英論文作者都附屬于或即將加入美國研究機構(gòu)(大學(xué)或公司)。這與Jeffrey Ding先前對 2017年NeurIPS演講的作者的分析相呼應(yīng),該分析發(fā)現(xiàn),其中14%的作者來自中國,但目前只有1%在中國研究機構(gòu)工作。
在2018年,我們對高質(zhì)量(但非頂尖)出版物進行了相同的原籍國分析,發(fā)現(xiàn)在3824名作者中,約四分之一(955)是中國國籍。
這一發(fā)現(xiàn)表明,雖然中國國籍的研究人員還沒有完全攀登至AI研究金字塔的頂端,但他們在上層AI研究中占了相當(dāng)大的比例。
2.大多數(shù)中國國籍的研究人員都是在美國的研究機構(gòu)中進行AI研究的。
目前,在中國國籍的高級研究人員中,大多數(shù)(59%)隸屬于美國研究機構(gòu),33%隸屬于中國研究機構(gòu),約9%隸屬于加拿大、新加坡和日本等其他國家。
這表明,雖然大部分高級AI研究人員仍對美國研究機構(gòu)趨之若鶩,但在中國研究機構(gòu)中,這些研究人員中所占比例遠遠高于頂級研究人員。
3.大多數(shù)在中國國籍的高級研究人員就讀于美國的高校,其中大多數(shù)畢業(yè)后在美國工作(見附注5)。
將近60% 的中國國籍的高級研究人員在美國讀研究生,35%在中國讀研究生,而7%在其他國家(澳大利亞和英國)就讀。
在畢業(yè)于美國院校的中國國籍的作者中,絕大多數(shù)(78%)目前在美國研究機構(gòu)工作,僅有21%在中國研究機構(gòu)工作。
結(jié)論
這些趨勢—尤其是中國國籍的研究人員學(xué)習(xí)和工作的地方--也受到政策變化和中美科技生態(tài)系統(tǒng)之間整體形勢的影響較大。
中國科技行業(yè)經(jīng)過長達十年的崛起,已經(jīng)大幅改變了許多在硅谷工作的中國籍技術(shù)人員的想法,他們中的許多人已經(jīng)回國,到創(chuàng)業(yè)企業(yè)或中國科技巨頭公司工作。
美國近期對研究生簽證的限制經(jīng)常會造成對在美國的中國國籍科學(xué)家遭到不公正的起訴,并且宣揚所有中國學(xué)生都是間諜的政治言論,這已經(jīng)開始影響中國國籍AI科研人員的流動和滯留。有鑒于此,中國國籍并受過美國教育的研究人員將在何處工作的數(shù)據(jù)可能是一個滯后指標(biāo),在未來幾年可能會發(fā)生實質(zhì)性變化。
這些影響是積極的(保護美國在頂級研究中的相對優(yōu)勢)還是消極的(削弱美國吸引和留住人才的獨有能力),仍是一個不得而知的問題。這也是在本系列的后續(xù)文章中,我們將對這一問題構(gòu)建新的數(shù)據(jù)集并繼續(xù)進行研究。
注釋和研究方法
1.NeurIPS是最重要的AI會議之一——特別是在目前最熱門的深度學(xué)習(xí)領(lǐng)域——但它仍然只是會議之一,在衡量各國AI科研人員方面必然有所欠缺的。因此,需要根據(jù)論文引用數(shù)量、其他會議、機器學(xué)習(xí)競賽等對AI科研人員進行更全面的考量,以便更全面地了解AI科研人員。我們打算在今后的分析實踐中增加替代措施。
2.基于對在2018年 NeurIPS發(fā)表演講的113名作者進行的調(diào)查,得出了排名1%的最頂級人才的數(shù)據(jù)。排名前20%的人才是根據(jù)對有中國姓氏的1,087作者中的69人進行隨機抽樣的估算(置信區(qū)間為+/-7.8%,置信水平為0.95)。然后,我們對這個樣本中的每一位作者進行了研究,以找到他們的原籍國、研究生院所在地和目前的工作隸屬關(guān)系。
3.為了給每位作者匹配原籍國,我們使用了他們的本科院校所在地作為首選替代值。對于受過高中教育的作者,我們根據(jù)他們高中的所在地認(rèn)定其原籍國。
但這種替代法并不完美:對于在美國完成本科學(xué)業(yè)的中國國籍的研究人員,如果找不到關(guān)于他們高中所在地的信息,就會被視為美國國籍。這可能會導(dǎo)致中國作者的比例略微偏低。但由于缺乏本科教育的信息,某些擁有中國姓氏并在中國研究機構(gòu)工作的作家被排除在外,因此這一偏差可能會被部分抵消。
4.在為跨國研究機構(gòu)指定隸屬關(guān)系時,我們使用了公司或大學(xué)的總部所在地。例如,在北京為微軟亞洲研究院工作的中國國籍的研究員將被視為隸屬于一家美國研究機構(gòu),因為微軟的總部在美國??偛吭O(shè)在香港的研究機構(gòu)被視為中國機構(gòu)。
5.對于在美國讀研究生并留在美國研究機構(gòu)的中國研究人員的估算基于一個更少的作者樣本。他們具有如下特點:中國國籍,在美國就讀研究生, 目前在與研究生院不同的地方工作。在樣本中符合這些特征的14名作者中,目前有11人在美國研究機構(gòu)工作,3人在中國研究機構(gòu)工作。因此, 基于這些樣本的推斷的置信度較低(置信區(qū)間為+/-22%,置信度水平為0.95)。
-
AI
+關(guān)注
關(guān)注
87文章
31277瀏覽量
269637 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8428瀏覽量
132838
原文標(biāo)題:中國AI人才圖鑒:59%的中國籍研究員隸屬美國研究機構(gòu)
文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論