問
“ChatGPT,人工智能會如何發(fā)展?”
答
“人工智能的行業(yè)落地將繼續(xù)加速,今后會更加廣泛應(yīng)用于工業(yè)、消費、金融、醫(yī)療、交通、教育、政府等多個領(lǐng)域?!?/p>
今天,你和ChatGPT聊天了嗎?它僅僅開發(fā)13天就匆匆上線,卻在兩個月就獲得過億用戶。這一基于AI的產(chǎn)品持續(xù)火熱出圈,在社會各界引發(fā)越來越多的熱情。以此為契機,業(yè)界對于人工智能技術(shù)也展開新討論,特別是大模型的創(chuàng)建和學(xué)習(xí)能力成為關(guān)注的焦點。
一
目前,預(yù)訓(xùn)練技術(shù)(Pre-Trained Model)是人工智能研究的重要突破口。傳統(tǒng)的研究方法中,標(biāo)注成本一直是阻礙AI算法推向更大數(shù)據(jù)集合的障礙;預(yù)訓(xùn)練技術(shù)不依賴數(shù)據(jù)標(biāo)注,就可以訓(xùn)練出一個大規(guī)模深度學(xué)習(xí)模型。全球AI團隊選擇兒童電視節(jié)目《芝麻街》中的木偶人物來命名各種新預(yù)訓(xùn)練算法,比如Elmo、Bert、Ernie等。
在對預(yù)訓(xùn)練模型的各種不同的技術(shù)評測中,算法性能展示了一個規(guī)律:數(shù)據(jù)規(guī)模越大、預(yù)訓(xùn)練模型參數(shù)越多,算法輸出精度往往也越高。隨著技術(shù)的突破,模型規(guī)模的不斷增長,其展現(xiàn)出的能力潛力和豐富的應(yīng)用場景激發(fā)了更多的企業(yè)和研究機構(gòu)投身其中。超級模型除了可以消化更大規(guī)模的數(shù)據(jù),也需要消耗更高的算力。
OpenAI公司對人工智能算法訓(xùn)練所消耗的算力做了一個統(tǒng)計,結(jié)果發(fā)現(xiàn),從2012年到2020年,人工智能模型訓(xùn)練消耗的算力增長了三十萬倍,平均每3.4個月翻一番,這超過了摩爾定律的每18個月翻番的增長速率,人工智能技術(shù)成為推動IT技術(shù)發(fā)展的新的動力引擎。
二
全球AI技術(shù)發(fā)展格局:中美領(lǐng)跑
從2019年開始,AI大模型突然爆發(fā),參數(shù)規(guī)模以指數(shù)級的快速增長。從2014年到2018年,AI模型參數(shù)規(guī)模還在一億的數(shù)量級上下浮動。
2019年2月,OpenAI的GPT-2達到了15億參數(shù)規(guī)模
2020年6月,GPT-3達到了1750億參數(shù)的規(guī)模
2021年1月,谷歌大腦推出了1.6萬億參數(shù)規(guī)模超級模型,再次刷新規(guī)模記錄
中國本土技術(shù)團隊也加入到這一場人工智能技術(shù)競賽中。阿里巴巴達摩院在2020年初啟動中文多模態(tài)預(yù)訓(xùn)練模型M6項目,同年6月推出3億參數(shù)的基礎(chǔ)模型。2021年1月,模型參數(shù)規(guī)模到達百億,已經(jīng)成為世界上最大的中文多模態(tài)模型;2021年5月,具有萬億參數(shù)規(guī)模的模型正式投入使用,追上了谷歌的發(fā)展腳步;2020年10月,M6的參數(shù)規(guī)模擴展到10萬億,成為當(dāng)時全球最大的AI預(yù)訓(xùn)練模型[1]。
不少中國企業(yè)和研究機構(gòu)也積極研發(fā)投入中文預(yù)訓(xùn)練大模型項目。在人工智能超級大模型的這條數(shù)據(jù)、算法和算力三輪同時驅(qū)動的技術(shù)賽道上,中美兩國技術(shù)團隊已經(jīng)形成了“兩架馬車”的發(fā)展模式,不斷刷新人工智能能力規(guī)模上的邊界線。
基于AMiner科技情報系統(tǒng)的數(shù)據(jù)[2],根據(jù)AIGC領(lǐng)域知識圖譜(AIGC領(lǐng)域知識圖譜及關(guān)鍵詞參見附件1)進行檢索,利用文獻計量方法,我們對2012年到2021年期間全球發(fā)表的AIGC高質(zhì)量論文(論文引用量排名前1%)做比較,共計1,646篇論文入選。在AIGC高質(zhì)量論文領(lǐng)域,中國和美國數(shù)量幾乎持平,并大幅度領(lǐng)先其他國家。
數(shù)據(jù)來源:AMiner科技情報平臺
從發(fā)展趨勢上看,在AIGC領(lǐng)域,中國有后來者居上、超越美國的趨勢。
數(shù)據(jù)來源:AMiner科技情報平臺
在更大的數(shù)字技術(shù)領(lǐng)域,中國在高價值論文部分,同發(fā)達國家仍有不小差距[3],未來需要產(chǎn)、學(xué)、研一起努力,共同推動中國數(shù)字技術(shù)向價值鏈高端躍升。
說明:論文檢索時間范圍為2012年1月至2021年12月
數(shù)據(jù)來源:AMiner科技情報平臺
三
AI產(chǎn)業(yè)發(fā)展:資本與人才
深藍打敗了卡什帕羅夫、AlphaGo戰(zhàn)勝了李世石……對于業(yè)內(nèi)人士來說,這些曾經(jīng)轟動一時的現(xiàn)象級技術(shù)進步,僅僅是完成固定任務(wù)的弱人工智能。開發(fā)具有跨領(lǐng)域?qū)W習(xí)能力的強人工智能技術(shù)才是人類努力的終極目標(biāo)。常識學(xué)習(xí)、跨領(lǐng)域模型遷移、小樣本和零樣本學(xué)習(xí)……一個個技術(shù)的攔路虎擋在通往強人工智能的技術(shù)道路上,而人工智能超級模型給這條道路照亮了前方。
OpenAI為訓(xùn)練GPT-3超級模型投入了1200萬美元的成本。在人工智能超級模型的賽道上,賽手需要掌握海量的數(shù)據(jù)、超大規(guī)模的人工智能計算平臺以及掌握核心技術(shù)能力的算法團隊,三者缺一不可。這也許側(cè)面解釋了在追求人工智能技術(shù)最前沿的賽道上,目前只出現(xiàn)了美國和中國技術(shù)團隊的身影。中美兩國在人工智能技術(shù)領(lǐng)域形成了激烈的競爭格局。數(shù)據(jù)、算法和算力是這一輪人工智能技術(shù)浪潮的三輪驅(qū)動引擎。中國擁有全世界最大的互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)用戶規(guī)模,在數(shù)據(jù)領(lǐng)域讓我國具有毋庸置疑的領(lǐng)先地位,互聯(lián)網(wǎng)平臺企業(yè)也構(gòu)建出極具競爭力的算力平臺和算法團隊。
在斯坦福大學(xué)HAI研究所發(fā)布的2021 全球AI指數(shù)報告中[4],2020年全球盡管受新冠疫情拖累,在各方面的經(jīng)濟發(fā)展都受到極其負(fù)面的影響。人工智能領(lǐng)域的發(fā)展卻一枝獨秀,相關(guān)投資仍然在大幅增加,2020年私人資本在人工智能領(lǐng)域的投資比前一年增加了9.3%,遠(yuǎn)高于疫情前2019年5.7%的增長率。在資金方面,美國仍然是人工智能私人資本的最大目的地,2020年總投資超過230億美元,是中國相關(guān)資金99億美元的兩倍多。
圖表5 全球數(shù)字科技人才數(shù)量前 10 強機構(gòu)
數(shù)據(jù)來源:AMiner科技情報平臺。
近日發(fā)布的《2023全球數(shù)字科技發(fā)展研究——科技人才儲備實力研究報告》[5],對包括AI在內(nèi)的各國數(shù)字科技人才儲備情況做了全面比較。結(jié)果顯示,與美國相比,中國數(shù)字科技人才基數(shù)大,但存在高層次人才少、凈流出數(shù)量多以及人才集中在高校而不是企業(yè)等問題,中國在鞏固數(shù)字科技人才方面的工作任重道遠(yuǎn)。
四
ChatGPT的未來:腦力的解放
OpenAI公司應(yīng)該也沒有想到ChatGPT會一夜爆紅,這款對話機器人(chatbot)產(chǎn)品不僅開發(fā)時間短,模型也沒有構(gòu)建在OpenAI即將發(fā)布的最新一代GPT4模型之上,而是采用了上一代的GPT3的增強模型[6]。
不過,從生成式AI技術(shù)(Generative AI或AIGC)的發(fā)展趨勢來看,ChatGPT這一類現(xiàn)象級應(yīng)用的橫空出世與迅速爆紅卻并不意外。隨著AI大模型技術(shù)的不斷成熟,AIGC技術(shù)已經(jīng)走出實驗室,應(yīng)用場景也已經(jīng)從初始的文本生成發(fā)展到多模態(tài)領(lǐng)域:
谷歌旗下的Deepmind公司推出了自主編程應(yīng)用AlphaCode,在 Codeforces 舉辦的編程比賽中,超過了 45.7% 的人類參賽者[7]
OpenAI開發(fā)的另一款圖片生成應(yīng)用DALL·E-2,入選了時代雜志評選的2022年度最佳發(fā)明[8]
英偉達開發(fā)了一款3D模型生成工具Magic3D,用戶輸入文本描述就可以自動生成結(jié)構(gòu)極其復(fù)雜的3D模型[9]
阿里巴巴達摩院多模態(tài)大模型M6,利用文本輸入可以自動驅(qū)動人體3D模型的動作合成[10]
在圖文創(chuàng)作、代碼生成、3D模型設(shè)計、3D動畫制作等領(lǐng)域,生成式AI技術(shù)展示著深厚的潛力,其應(yīng)用邊界也將隨著技術(shù)的進步與成本的降低擴展到更多領(lǐng)域。
高科技投機機構(gòu)方舟投資(ARK Invest)發(fā)布的報告[11]預(yù)測,以AIGC為代表的新一代人工智能技術(shù)將輔助知識工作者(包括教師、律師、醫(yī)生、財務(wù)、程序員等白領(lǐng)職業(yè))提高工作效率。報告預(yù)測,到 2030 年,AI 將大幅提高知識工作者的工作效率,平均工作效率增加140%,新一代人工智能技術(shù)將有可能大幅度降低腦力勞動者的工作強度。如果這一切成為現(xiàn)實,或?qū)⑹抢^人類歷史上由于動力革命而擺脫繁重的體力勞動之后,人類社會發(fā)生的又一次偉大的技術(shù)革命。
附件1. AIGC領(lǐng)域知識圖譜及關(guān)鍵詞
審核編輯 :李倩
-
人工智能
+關(guān)注
關(guān)注
1793文章
47590瀏覽量
239472 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1288瀏覽量
24389 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1566瀏覽量
7907
原文標(biāo)題:?中國何時能有ChatGPT?“現(xiàn)象級”產(chǎn)品背后的AI技術(shù)發(fā)展與展望
文章出處:【微信號:IndustryIOT,微信公眾號:工業(yè)互聯(lián)網(wǎng)前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論