新舊之交,一個(gè)萬(wàn)能程序的幽靈在全球游蕩,這個(gè)幽靈便是OpenAI公司研發(fā)的ChatGPT。它橫空出世的時(shí)間如此之迅速,以至于尚未起好中文名字就已經(jīng)擁有了過(guò)億用戶。人工智能對(duì)話聊天機(jī)器人ChatGPT,英文縮寫Chat Generative Pre-Trained Transformer,學(xué)名聊天生成性預(yù)訓(xùn)練轉(zhuǎn)換模型,在互聯(lián)網(wǎng)世界中火爆出圈、迅速走紅,短短2個(gè)月時(shí)間,就完成了全球用戶數(shù)突破1個(gè)億的小目標(biāo),為了達(dá)到這個(gè)目標(biāo),電話用了75年,手機(jī)用了16年,網(wǎng)站用了7年,蘋果公司的應(yīng)用軟件iTunes和AppStore分別用了6.5年和2年,社交軟件Twitter、WhatsApp、Instagram、抖音分別用了5年、3.5年、2.5年和9個(gè)月。
ChatGPT之所以能在很短時(shí)間內(nèi)與1億用戶確認(rèn)過(guò)眼神,主要是源于其強(qiáng)大的交互能力。它既能創(chuàng)作詩(shī)詞歌賦,又能修改程序代碼,既可以求解某些數(shù)學(xué)問(wèn)題,也可以撰寫專業(yè)學(xué)術(shù)論文。尤其是針對(duì)論文撰寫,引發(fā)了很多爭(zhēng)議,據(jù)某些消息報(bào)道,美國(guó)89%的學(xué)生在使用ChatGPT撰寫論文、完成作業(yè),這也促使當(dāng)前全球很多高校禁止學(xué)生使用ChatGPT。
由此可見,相較于其他一些聊天機(jī)器人應(yīng)用,ChatGPT確實(shí)在交流精準(zhǔn)程度、知識(shí)涉獵廣度、上下語(yǔ)境理解、多輪對(duì)話交互、用戶意圖揣摩、主動(dòng)承認(rèn)錯(cuò)誤、質(zhì)疑用戶問(wèn)題等方面確實(shí)展現(xiàn)出了非同一般的功能升級(jí)與性能提升。有些場(chǎng)景下,與ChatGPT交互很像是人與人之間的真實(shí)互動(dòng),相互學(xué)習(xí)分享,表達(dá)觀點(diǎn)。
從理論研究、技術(shù)創(chuàng)新的角度分析,可以確定,ChatGPT所應(yīng)用的技術(shù)是當(dāng)前生成式人工智能技術(shù)(AIGC,AI Generated Content)浪潮中最明亮的星。生成式人工智能技術(shù)拓展決斷式人工智能應(yīng)用邊界,利用人工智能技術(shù)來(lái)生成內(nèi)容,突破了專業(yè)生成內(nèi)容(PGC)、用戶生成內(nèi)容(UGC)在寫作、繪畫、音樂(lè)、教育等領(lǐng)域進(jìn)行創(chuàng)造性工作的“壟斷”,就像運(yùn)用ChatGPT創(chuàng)作詩(shī)詞,撰寫文稿。
作為生成式人工智能技術(shù)領(lǐng)域的新貴,ChatGPT的核心是GPT模型(生成性預(yù)訓(xùn)練轉(zhuǎn)換模型),這是一種自然語(yǔ)言處理的模型,其設(shè)計(jì)思路簡(jiǎn)單來(lái)講,是通過(guò)特定算法預(yù)測(cè)下一個(gè)單詞的概率分布,通過(guò)在大型文本語(yǔ)料庫(kù)中訓(xùn)練模型學(xué)習(xí)語(yǔ)言模式,并基于此來(lái)生成自然語(yǔ)言文本。從2018年GPT-1模型問(wèn)世,到如今GPT-3模型的大熱,GPT模型的智能化程度持續(xù)提升,更大的語(yǔ)料庫(kù)和參數(shù)規(guī)模、更高的準(zhǔn)確性和適應(yīng)性、更強(qiáng)的計(jì)算能力與自我學(xué)習(xí)能力,以及更加通用的預(yù)訓(xùn)練鑄就了ChatGPT的功能升級(jí)與性能提升。
GPT-4模型預(yù)計(jì)將在2023年初發(fā)布,相較于GPT-3和3.5,GPT-4的性能將會(huì)跳躍式提升。當(dāng)然,ChatGPT最樸素的技術(shù)原理來(lái)源于概率統(tǒng)計(jì)。簡(jiǎn)單優(yōu)雅、深刻雋永的貝葉斯定理是其發(fā)展的基礎(chǔ),通過(guò)貝葉斯定理, ChatGPT 可以計(jì)算出在已知語(yǔ)言模式中生成某個(gè)句子的概率,以及面對(duì)已知信息和問(wèn)題做出相應(yīng)特定回答的概率,從而選擇最優(yōu)回復(fù),實(shí)現(xiàn)交互,這再次說(shuō)明了是數(shù)學(xué)在引領(lǐng)著人類世界前行,數(shù)字經(jīng)濟(jì)也是數(shù)學(xué)經(jīng)濟(jì)。
數(shù)字化時(shí)代,任何一個(gè)應(yīng)用的規(guī)?;占?,都需要技術(shù)與市場(chǎng)的雙輪驅(qū)動(dòng)。ChatGPT也不例外,這就不得不提ChatGPT的研發(fā)團(tuán)隊(duì)OpenAI。2015年,OpenAI由大名鼎鼎的企業(yè)家埃隆·馬斯克、阿爾特曼、彼得·蒂爾等人創(chuàng)立,是一家人工智能研究公司,擁有硅谷眾多重量級(jí)企業(yè)的資金支持。
近期微軟官方證實(shí),會(huì)繼續(xù)向OpenAI追加數(shù)十億美元投資,后續(xù)預(yù)計(jì)達(dá)100億美元,這必將成為人工智能領(lǐng)域的一段佳話。OpenAI建立初期是非盈利性的研究機(jī)構(gòu),但是現(xiàn)在最新版本ChatGPT也不再開源,正式啟動(dòng)了商業(yè)化運(yùn)作。由此不難看出,ChatGPT的背后依然隱藏著資本市場(chǎng)的激烈博弈。
微軟公司宣布將ChatGPT應(yīng)用于自己的搜索引擎Bing,谷歌公司在自然語(yǔ)言處理領(lǐng)域也進(jìn)行大量投入,研發(fā)BERT模型(雙向Transformer編碼器表達(dá),Bidirectional Encoder Representation from Transformers),并計(jì)劃推出聊天機(jī)器人“巴德”抗衡ChatGPT,這些事實(shí)也進(jìn)一步印證了互聯(lián)網(wǎng)大鱷運(yùn)用資本市場(chǎng)加速圈定技術(shù)創(chuàng)新高地的明爭(zhēng)暗斗。
△圖源“北京日?qǐng)?bào)”微信公眾號(hào)
ChatGPT在用戶體驗(yàn)層面展現(xiàn)出強(qiáng)大性能,也有一部分聲音又開始擔(dān)心個(gè)人或者行業(yè)被人工智能取代,包括OpenAI的幾位創(chuàng)始人也就相關(guān)的問(wèn)題進(jìn)行過(guò)討論,其中阿爾特曼表達(dá)過(guò):研發(fā)生成式人工智能技術(shù)的目的是為人類創(chuàng)造者提供工具、拓展能力,旨在增強(qiáng)、而非取代,而且所有深層生物學(xué)的東西無(wú)法被取代,包括與他人互動(dòng)、享受樂(lè)趣、創(chuàng)造新事物的動(dòng)力。
也有人通過(guò)實(shí)驗(yàn)向ChatGPT詢問(wèn)它會(huì)取代哪些職業(yè),得到的回答是包括四個(gè)方面:數(shù)據(jù)輸入和處理、服務(wù)和幫助客戶處理常見問(wèn)題、翻譯任務(wù)、撰寫報(bào)告和生成內(nèi)容。但是ChatGPT同時(shí)也展現(xiàn)出滿滿的“求生欲”補(bǔ)充道:“重要的是,請(qǐng)注意,雖然有些任務(wù)可能會(huì)實(shí)現(xiàn)自動(dòng)化,但像我這樣的技術(shù)也可以幫助和提升人類工作者,使他們?cè)诠ぷ髦懈佣喈a(chǎn)、高效?!?/p>
從另一個(gè)層面分析,ChatGPT在技術(shù)與成本等方面存在的問(wèn)題和弊端,也表明當(dāng)前其無(wú)法真正取代行業(yè)或者個(gè)人。ChatGPT在其未經(jīng)大量語(yǔ)料訓(xùn)練的領(lǐng)域缺乏“人類常識(shí)”和引申能力,導(dǎo)致會(huì)一本正經(jīng)地“胡說(shuō)八道”;無(wú)法處理復(fù)雜冗長(zhǎng)或者特別專業(yè)的語(yǔ)言結(jié)構(gòu),醫(yī)學(xué)、自然科學(xué)等等;處理接受在線新知識(shí)的能力不足。
同時(shí),它依然是黑盒模型,無(wú)法確保不產(chǎn)生攻擊性表達(dá),為了讓ChatGPT生成的內(nèi)容更符合人類習(xí)慣,OpenAI曾雇傭40多個(gè)人給生成的內(nèi)容打分,這40位老師只為有幫助的、真實(shí)的、無(wú)害的文本打高分,包含不良內(nèi)容的打低分,這也讓ChatGPT這位學(xué)生更溫和、更加充滿正能量。
ChatGPT同樣需要非常強(qiáng)大的算力成本支撐,從GPT-1到GPT-3,模型訓(xùn)練參數(shù)的數(shù)量從1.17億增長(zhǎng)到了1750億,GPT-3訓(xùn)練一次的費(fèi)用是460萬(wàn)美元,總訓(xùn)練成本高達(dá)1200萬(wàn)美元,這個(gè)數(shù)字已經(jīng)極為驚人,但是據(jù)某公司測(cè)算,該企業(yè)使用ChatGPT的成本每年約為1000億元,不禁讓人驚掉下巴。
基于以上分析,不難發(fā)現(xiàn)ChatGPT等聊天機(jī)器人并不真正具備分析、理解、判斷能力,它所能做的更像是人云亦云,或者加權(quán)后更加貼近真實(shí)場(chǎng)景的人云亦云,是更靠近上層應(yīng)用的AIGC框架,本質(zhì)上仍需要底層計(jì)算能力的支撐,是算智能最新的人工弱智能,未來(lái)還有許多值得期待的演進(jìn),比如,進(jìn)一步改進(jìn)算法使之與數(shù)據(jù)、算力更加匹配,在文本和圖像互相轉(zhuǎn)換基礎(chǔ)上進(jìn)一步加強(qiáng)模態(tài)的轉(zhuǎn)化,以及在使用過(guò)程中不斷自我優(yōu)化升級(jí)能力的提升。突破這些問(wèn)題將推進(jìn)科技革新向更為廣闊的應(yīng)用場(chǎng)景延伸,也推動(dòng)人工智能向感知智能、認(rèn)知智能持續(xù)邁進(jìn),從而更好地幫助人類創(chuàng)造新知識(shí),推動(dòng)社會(huì)進(jìn)步。
最后,無(wú)論將ChatGPT定義為生成式人工智能技術(shù)創(chuàng)新的里程碑,或是揭示其背后對(duì)于人工的依賴,及其引發(fā)的資本市場(chǎng)的無(wú)情博弈,一個(gè)不爭(zhēng)的事實(shí)是ChatGPT的橫空問(wèn)世貌似偶然,實(shí)則必然,OpenAI創(chuàng)立至今,經(jīng)歷了八年的磨礪,對(duì)于理想的長(zhǎng)久堅(jiān)持轉(zhuǎn)化成為了ChatGPT今日的成就,這值得我們對(duì)于中國(guó)的科技創(chuàng)新事業(yè)開啟更深層次的思考。
2021年中國(guó)人工智能領(lǐng)域的專利申請(qǐng)數(shù)量首次超過(guò)美國(guó),但在原創(chuàng)關(guān)鍵技術(shù)、核心算法等方面依然存在很大差距,比如ChatGPT背后的算法深度殘差網(wǎng)絡(luò)(ResNet)是由微軟提出的,論文是發(fā)表在頂級(jí)會(huì)議“計(jì)算機(jī)視覺(jué)與模式識(shí)別”(CVPR)的最佳論文;另一個(gè)基石算法Transformer,是由谷歌提出的,利用獨(dú)特的機(jī)制,可以一次性處理所有輸入的數(shù)據(jù)。
此外,某些高校、科研院所、科技企業(yè)中,依然存在急功近利的浮躁心態(tài),“長(zhǎng)期主義”是最近被ChatGPT帶熱互聯(lián)網(wǎng)熱詞,也許有些人覺(jué)得“長(zhǎng)期主義”只是社會(huì)和公司畫的大餅,但OpenAI和ChatGPT的出彩確實(shí)讓人看到了“長(zhǎng)期主義”的力量,所謂循序漸進(jìn)、穩(wěn)中有進(jìn)、日拱一卒、功不唐捐。
為此建議從需求、供給、政策環(huán)境和基礎(chǔ)設(shè)施方面構(gòu)建更加完整的創(chuàng)新生態(tài),深耕在基礎(chǔ)研究領(lǐng)域的科學(xué)家很有創(chuàng)造性想法,更多資金、平臺(tái)、人才和制度應(yīng)涌向基礎(chǔ)科學(xué),讓基礎(chǔ)研究工作者能夠永葆任憑風(fēng)浪起,穩(wěn)坐釣魚船的氣度,潛心鉆研、推陳出新,為中國(guó)科技創(chuàng)新自立自強(qiáng)創(chuàng)造更多“0到1”的突破。 ChatGPT只是人工智能時(shí)代的又一個(gè)開端,這個(gè)時(shí)代將會(huì)在很多基礎(chǔ)學(xué)科研究天才的手上帶來(lái)更多的驚喜,希望下一個(gè)天才就是你!
審核編輯 :李倩
-
人工智能
+關(guān)注
關(guān)注
1792文章
47514瀏覽量
239247 -
聊天機(jī)器人
+關(guān)注
關(guān)注
0文章
339瀏覽量
12339 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1564瀏覽量
7865
原文標(biāo)題:中國(guó)聯(lián)通張?jiān)朴聦I(yè)解讀chatGPT ,給了我們哪些啟示?
文章出處:【微信號(hào):txdoutiao,微信公眾號(hào):通信首條】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論