不僅“上知天文、下知地理”,似乎還能對答如流、出口成詩,甚至還能寫劇本、編音樂、寫代碼——最近,一款名叫ChatGPT的人工智能聊天機器人火爆全球。由此,一系列關(guān)于新一代技術(shù)變革、人工智能替代人力、巨頭企業(yè)扎堆入局AI的討論在互聯(lián)網(wǎng)上甚囂塵上,并引發(fā)資本市場跟進炒作。
然而,隨著越來越多的用戶實測結(jié)果不及預(yù)期,許多人也在重新審視ChatGPT是否真如想象中那么完美。熱鬧過后,也許是時候開始冷靜思考,ChatGPT的發(fā)展模式面臨哪些不可規(guī)避的問題和風(fēng)險?這對我國人工智能發(fā)展有何重要啟示?
ChatGPT頁面截圖
ChatGPT 的“無所不能”和“無能為力”
問:“ChatGPT和其他聊天機器人有什么不同?”
答:“ChatGPT是一種先進的語言模型,具有更強的語言能力和知識范圍,能夠與用戶進行更自然有效的對話?!?/p>
以上是人民網(wǎng)財經(jīng)和ChatGPT的一組對話截圖。
正如ChatGPT在回答人民網(wǎng)財經(jīng)提問時所言,相較于此前科技企業(yè)推出的聊天機器人,ChatGPT在智能化程度上大幅提升,給對話者的感覺也“更聰明”。
2022年11月底,ChatGPT由美國一家名為OpenAI的人工智能研究公司推出,可以實現(xiàn)與用戶之間的智能聊天對話,屬于偏任務(wù)型的多輪對話和問答系統(tǒng)。
“ChatGPT的出現(xiàn),是人工智能技術(shù)發(fā)展的一次飛躍。”傳播內(nèi)容認(rèn)知全國重點實驗室首席科學(xué)家張勇東表示,其在交互和創(chuàng)作方面展現(xiàn)的出色能力,標(biāo)志人工智能由決策式向生成式轉(zhuǎn)變。
中國信通院云計算與大數(shù)據(jù)研究所內(nèi)容科技部副主任石霖介紹,ChatGPT的技術(shù)基于OpenAI開發(fā)的GPT3.5系列模型。該模型參數(shù)規(guī)模據(jù)推測達十億級別,加之在訓(xùn)練過程中引入人類反饋機制技術(shù),使得ChatGPT在回答準(zhǔn)確率、道德表現(xiàn)上進一步得到提升。
近期,有研究發(fā)現(xiàn),ChatGPT的“聰明”程度足以通過美國行醫(yī)執(zhí)照、研究生入學(xué)等考試。清華大學(xué)計算機科學(xué)與技術(shù)系教授黃民烈表示,目前ChatGPT的對話能力已超出人類平均水準(zhǔn),未來其能達到的類人對話水平值得期待。
不過,看似“無所不能”的ChatGPT,也會存在“無能為力”的尷尬。
如,目前ChatGPT難以進行高級邏輯處理。在完成“多準(zhǔn)快全”的基本資料梳理和內(nèi)容整合后,ChatGPT尚不能提供綜合判斷、修改調(diào)整、邏輯完善等“畫龍點睛”之筆,而這恰恰是人類高級智慧的體現(xiàn)。
此外,用于ChatGPT語言模型訓(xùn)練的數(shù)據(jù)為2021年底前的數(shù)據(jù),因此在一些最新的數(shù)據(jù)和事件方面它可能會存在滯后。這在一定程度上造成了ChatGPT在內(nèi)容準(zhǔn)確性和知識性上的短板。不少用戶反映它經(jīng)?!耙槐菊?jīng)地胡說八道”。
ChatGPT在常識問題和算術(shù)題上出現(xiàn)錯誤,被網(wǎng)友戲稱“一本正經(jīng)地胡說八道”。
預(yù)訓(xùn)練“機器人” 潛藏侵權(quán)風(fēng)險和監(jiān)管隱憂
以ChatGPT為代表的預(yù)訓(xùn)練模型“機器人”,在預(yù)訓(xùn)練過程中需要“投喂”海量數(shù)據(jù),才能使得模型能夠成功理解人類語言并模擬出愈加真實的類人表達方式。
據(jù)OpenAI的相關(guān)論文透露,ChatGPT的訓(xùn)練集使用了總計約320TB的文字信息,涵蓋超4000億詞和約31億個網(wǎng)頁,其中包括來自新聞、博客、社交媒體的內(nèi)容。
但這種未經(jīng)授權(quán)獲取文本數(shù)據(jù)的預(yù)訓(xùn)練方式已引發(fā)爭議和不滿。推特(Twitter)現(xiàn)任首席執(zhí)行官埃隆·馬斯克就于近日宣布,叫停ChatGPT訪問Twitter數(shù)據(jù)庫來獲取培訓(xùn)數(shù)據(jù),聲稱“需要更多了解OpenAI的治理結(jié)構(gòu)和未來收入計劃”。
無獨有偶,近日,擁有國際性體育資源的蓋蒂圖片社對同為人工智能企業(yè)的Stability AI提起訴訟,指責(zé)其未經(jīng)許可從其數(shù)據(jù)庫中復(fù)制了1200多萬張圖片,用于建立競爭性業(yè)務(wù),并侵犯了該公司的版權(quán)和商標(biāo)保護權(quán)。
張勇東表示,類似ChatGPT這樣的預(yù)訓(xùn)練模型,其訓(xùn)練數(shù)據(jù)往往來源于書籍、網(wǎng)站等,而其用于訓(xùn)練的語料未經(jīng)授權(quán),存在版權(quán)風(fēng)險。且這種訓(xùn)練過程往往不對外公開,訓(xùn)練數(shù)據(jù)也不對外公布,因此版權(quán)擁有者并不知情。待模型完成后,生成的內(nèi)容往往是原始訓(xùn)練數(shù)據(jù)的某種組合,對外服務(wù)過程中就會存在侵犯原始版權(quán)的問題。
“這點與搜索引擎的服務(wù)機制不同。搜索引擎只是提供原始內(nèi)容的鏈接,但ChatGPT則是以自身生成內(nèi)容的形式提供服務(wù),甚至連模型自己都無法確認(rèn)是參考或綜合了哪些原始素材?!彼f。
正因如此,對于人工智能生成內(nèi)容不能全盤接收,要注意甄別風(fēng)險、加強監(jiān)管,正成為業(yè)界共識。
近日,OpenAI首席技術(shù)官米拉·穆拉蒂在接受媒體采訪時坦言,和其他聊天機器人一樣,ChatGPT可能會編造事實,也可能會被壞人利用,需要政府部門盡早介入進行監(jiān)管。
“從長遠(yuǎn)來看,社會各界應(yīng)該積極推動制定人工智能生成內(nèi)容(AIGC)的規(guī)范標(biāo)準(zhǔn)。世界各國應(yīng)該共同努力,基于海量數(shù)據(jù)研發(fā)生產(chǎn)出更加符合全人類道德價值標(biāo)準(zhǔn)的內(nèi)容。”張勇東說。
他建議,要強化數(shù)據(jù)源頭把控,尤其是對涉及隱私、倫理、道德、政治偏見和種族主義等內(nèi)容,要進行更嚴(yán)格的數(shù)據(jù)審查和清洗。
石霖建議,應(yīng)加快布局人工智能安全標(biāo)準(zhǔn)、倫理規(guī)則的研究,針對人工智能新技術(shù)可能帶來的版權(quán)風(fēng)險、內(nèi)容風(fēng)險等推動形成行業(yè)自律。同時,還應(yīng)做好AIGC技術(shù)應(yīng)用的科普工作,提升民眾的科學(xué)素養(yǎng)和風(fēng)險認(rèn)識。
炒作“啞火”后思考行業(yè)長遠(yuǎn)發(fā)展
ChatGPT的爆紅,讓OpenAI賺到了第一桶金,也讓各路資本爭相入局。
2023年1月,微軟再次宣布向 OpenAI 投資數(shù)十億美元。據(jù)了解,這是目前人工智能領(lǐng)域規(guī)模最大的一筆投資。投資機構(gòu)紅杉資本預(yù)測,未來AIGC有潛力產(chǎn)生數(shù)萬億美元的經(jīng)濟價值。
連日來,A股市場也經(jīng)歷了人工智能概念股大幅波動。但隨著監(jiān)管函的下達,炒作現(xiàn)象逐漸開始“啞火”,更多關(guān)于人工智能行業(yè)長遠(yuǎn)發(fā)展的思考和理性聲音正在出現(xiàn)。
針對人工智能將取代部分人類職業(yè)的網(wǎng)絡(luò)討論,張勇東直言,人工智能技術(shù)距離真正達到類人的程度還有很長一段路要走。目前以ChatGPT為代表的AIGC在邏輯性、可解釋性和可溯源性方面都有待完善。
“國際上先進的人工智能發(fā)展都不是一蹴而就的,而是有跡可循、不斷突破的?!比斯ぶ悄芷髽I(yè)智譜AI首席執(zhí)行官張鵬表示,“ChatGPT的出現(xiàn)是否意味著人工智能已經(jīng)‘踩’到了通用人工智能這一終極目標(biāo)的‘門檻’,還需冷靜看待。”
多位行業(yè)專家表示,可以預(yù)見的是,在“人機共生”的未來時代,人工智能確將解放人類、提高效率,但其身份是“助手”而非“主人”。
而針對ChatGPT爆火引發(fā)的對國內(nèi)人工智能產(chǎn)業(yè)的質(zhì)疑,也需要用更加全面的眼光來看待。
多年來,我國人工智能產(chǎn)業(yè)在生態(tài)完善、技術(shù)研發(fā)、應(yīng)用推廣、人才建設(shè)等方面不斷培育優(yōu)勢:過去十年間專利申請量位居世界第一,核心產(chǎn)業(yè)規(guī)模超過4000億元。國際市場分析機構(gòu)Gartner在研究報告中指出,阿里巴巴、百度、騰訊等科技企業(yè)在語言AI技術(shù)上的排名進入世界前十位……
“ChatGPT的成功再次給我們提了個醒,人工智能的發(fā)展需要在基礎(chǔ)研究和技術(shù)研發(fā)方面不懈堅持?!睆堸i表示,過去我國人工智能產(chǎn)業(yè)對基礎(chǔ)設(shè)施和技術(shù)的重視和投入不足。未來,如何發(fā)揮長處、補齊短板,真正實現(xiàn)我國人工智能領(lǐng)域的關(guān)鍵躍升,值得期待。
展望未來,石霖認(rèn)為,以ChatGPT為代表的AIGC技術(shù)應(yīng)用,將形成“智能底座+服務(wù)”的商業(yè)模式。AIGC技術(shù)應(yīng)用還將進一步發(fā)揮在數(shù)據(jù)、算力和算法上構(gòu)筑的技術(shù)壁壘優(yōu)勢,對人工智能的應(yīng)用推廣帶來深層次變革。
他指出,AIGC技術(shù)應(yīng)用正在軟件代碼編寫、工業(yè)設(shè)計、分子結(jié)構(gòu)預(yù)測、基因編輯等科研生產(chǎn)領(lǐng)域探索應(yīng)用場景,幫助縮短研發(fā)周期、降低試驗成本,也將改變軟件、工業(yè)、醫(yī)療、生物等行業(yè)運行模式。
張勇東表示,過去十年,人工智能領(lǐng)域主要圍繞更好的感知和理解來發(fā)展,比如自動駕駛、數(shù)字醫(yī)療。未來十年,人工智能領(lǐng)域深層技術(shù)有望不斷突破,將具備重塑數(shù)字化內(nèi)容生產(chǎn)和消費模式的強大潛力。
深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任、百度首席技術(shù)官王海峰認(rèn)為,融合大規(guī)模知識的深度學(xué)習(xí)是人工智能發(fā)展的重要方向。要聯(lián)合產(chǎn)學(xué)研各方力量,探索協(xié)同育人創(chuàng)新模式,建立全方位多層次的人工智能人才培養(yǎng)體系。
編輯:黃飛
?
評論
查看更多