電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)北京時(shí)間3月15日凌晨,人工智能研究公司OpenAI正式發(fā)布了其下一代大型語(yǔ)言模型GPT-4。目前,ChatGPT的Plus訂閱用戶已經(jīng)可以使用GPT-4,其他用戶需要排隊(duì)申請(qǐng)內(nèi)測(cè)。
對(duì)于GPT-4的性能,很多國(guó)外網(wǎng)友的描述都是“GPT-4,起飛!”
多模態(tài)大型語(yǔ)言模型GPT-4
GPT-4被定義為OpenAI發(fā)展的另一里程碑,其相較于上一代產(chǎn)品GPT-3.5所帶來(lái)的提升是巨大的。OpenAI工作人員表示,“我們還在為機(jī)器學(xué)習(xí)模型設(shè)計(jì)的傳統(tǒng)基準(zhǔn)上對(duì)GPT-4進(jìn)行了評(píng)估。GPT-4大大超過(guò)現(xiàn)有的大語(yǔ)言模型,與多數(shù)最先進(jìn)的(SOTA)模型并駕齊驅(qū)?!?br />
官方介紹稱,GPT-4作為一個(gè)多模態(tài)大模型(接受圖像和文本輸入,生成文本),主要在四個(gè)方面做了增強(qiáng)。
首先是可以更準(zhǔn)確地解決難題,具有更廣泛的常識(shí)和解決問(wèn)題的能力。在GPT-3.5時(shí)代,ChatGPT的精準(zhǔn)度時(shí)常被吐槽。GPT-3.5根據(jù)從互聯(lián)網(wǎng)上搜羅的大量文章、網(wǎng)站和社交媒體帖子以及用戶與OpenAI雇用的人工雇員的實(shí)時(shí)英文對(duì)話進(jìn)行訓(xùn)練的,因此在輸出結(jié)果時(shí),一些錯(cuò)誤的源數(shù)據(jù),也導(dǎo)致ChatGPT給出的答案看似合理,實(shí)際上有很大的漏洞。就以考試來(lái)衡量,上一代GPT-3.5在很多專業(yè)考試中的成績(jī)都是倒數(shù)10%,而GPT-4在已測(cè)試的考試中,基本都是高分通過(guò),超越了“人類的水平”。
GPT-4在多項(xiàng)考試中優(yōu)于GPT-3.5
其次是更具創(chuàng)造性和協(xié)作能力。在上一代基于GPT-3.5打造的ChatGPT中,很多問(wèn)題給出的回答都是很簡(jiǎn)短的,雖然具備一定的邏輯性,不過(guò)在專業(yè)人士看來(lái)還略顯“幼稚”。到了GPT-4,該模型能夠處理超過(guò)25000個(gè)(GPT-3.5是3000個(gè))單詞的文本,允許長(zhǎng)文內(nèi)容創(chuàng)建、擴(kuò)展對(duì)話以及文檔搜索和分析等用例。在顯示過(guò)程中,GPT-4可以完成總結(jié)文章、寫詩(shī)這樣的創(chuàng)造性任務(wù)。
第三點(diǎn)是GPT-4的高級(jí)推理能力更強(qiáng)。此前,基于GPT-3.5打造的ChatGPT,被很多使用者定義為“一本正經(jīng)的胡說(shuō)八道”,在計(jì)算方面的能力更是弱于十四五歲的孩子,約等于八九歲孩子。因此,很多人說(shuō)如果將ChatGPT比作是一個(gè)學(xué)生,他在數(shù)理化方面是嚴(yán)重偏科的。在GPT-4中,這方面的能力得到了顯著的增強(qiáng)。在專業(yè)測(cè)試和學(xué)術(shù)基準(zhǔn)測(cè)試中,GPT-4都表現(xiàn)出了不俗的實(shí)力。在官網(wǎng)上,OpenAI用會(huì)議預(yù)約展示了GPT-4的推理能力,GPT-4明顯更“擅長(zhǎng)”做這個(gè)。
最后一點(diǎn)是安全性。針對(duì)基于GPT-3.5打造的ChatGPT,曾有內(nèi)測(cè)人員通過(guò)引導(dǎo)的方式讓其表現(xiàn)出攻擊性。同時(shí),有很多報(bào)道都指出,上一代ChatGPT曾出現(xiàn)辱罵用戶、表白用戶、誘導(dǎo)用戶離婚、監(jiān)視開發(fā)人員等行為。有業(yè)內(nèi)人士在推特上表示,微軟需要關(guān)閉必應(yīng)中的類ChatGPT功能,因?yàn)橄到y(tǒng)有時(shí)表現(xiàn)得像精神病一樣,會(huì)給用戶錯(cuò)誤答案。特斯拉馬斯克也表示,上一代ChatGPT是“不安全的”。OpenAI花了6個(gè)月時(shí)間使GPT-4更安全、更具一致性。在內(nèi)部評(píng)估中,與GPT-3.5相比,GPT-4對(duì)不允許內(nèi)容做出回應(yīng)的可能性降低82%,給出事實(shí)性回應(yīng)的可能性高40% 。
當(dāng)然,GPT-4也還存在自己的局限性,尤其是在事實(shí)性、社會(huì)偏見(jiàn)、幻覺(jué)和對(duì)抗性等方面,需要得到持續(xù)的優(yōu)化。在內(nèi)部的對(duì)抗性事實(shí)性評(píng)估中,GPT-4的得分比GPT-3.5高40%,很顯然這還是不夠的。
在發(fā)布會(huì)當(dāng)晚,微軟表示GPT-4已在新必應(yīng)搜索引擎上運(yùn)行。
全行業(yè)追趕GPT-4
ChatGPT的火熱是有目共睹的,在去年11月30日發(fā)布后的5天時(shí)間里,收獲了100萬(wàn)用戶;推出僅僅2個(gè)月,月活躍用戶就成功過(guò)億,成為歷史上增長(zhǎng)最快的消費(fèi)者應(yīng)用程序。如今,GPT-4的發(fā)布進(jìn)一步延續(xù)了這股熱潮,甚至是讓火燒的更旺了。
為了不讓微軟或者是OpenAI在該領(lǐng)域一騎絕塵,也為了自己能夠在AIGC方面得到更大份額的蛋糕。目前,全球科技巨頭都在抓緊時(shí)間追趕GPT-4。
為了提升旗下類ChatGPT模型的優(yōu)化速度,谷歌在博文中宣布正式開放其PaLM大型語(yǔ)言模型API。谷歌表示,“我們看到新一輪的生成性人工智能應(yīng)用正在改變?nèi)藗兣c技術(shù)互動(dòng)的方式。在谷歌,我們希望通過(guò)提供易于使用的API和工具,使所有開發(fā)人員能夠開始用生成性人工智能構(gòu)建下一代應(yīng)用程序,從而繼續(xù)使人工智能變得容易使用?!惫雀栌?022年4月宣布PaLM,隨后一直在優(yōu)化。北京時(shí)間2月8日晚,谷歌正式發(fā)布類ChatGPT應(yīng)用Bard,不過(guò)由于演示中出現(xiàn)事實(shí)錯(cuò)誤,谷歌因此股價(jià)大跌,一天市值蒸發(fā)近千億美元。
目前,谷歌正在全力優(yōu)化PaLM。北京時(shí)間3月7日,谷歌和柏林工業(yè)大學(xué)的團(tuán)隊(duì)重磅推出了史上最大的視覺(jué)語(yǔ)言模型——PaLM-E,參數(shù)量高達(dá)5620億,是GPT-3(參數(shù)量為1750億)參數(shù)規(guī)模的數(shù)倍。
除了谷歌,目前國(guó)內(nèi)科技行業(yè)都在關(guān)注百度文心一言的發(fā)布。百度將于北京時(shí)間3月16日下午兩點(diǎn)發(fā)布自己的類ChatGPT應(yīng)用文心一言。根據(jù)此前的爆料消息,文心一言是百度基于文心大模型技術(shù)推出的生成式對(duì)話產(chǎn)品,被外界譽(yù)為“中國(guó)版ChatGPT”。2021年12月,百度與鵬城實(shí)驗(yàn)室聯(lián)合發(fā)布共同研發(fā)的全球首個(gè)知識(shí)增強(qiáng)千億大模型——文心,當(dāng)時(shí)百度首席技術(shù)官(CTO)王海峰表示,該模型參數(shù)規(guī)模達(dá)到2600億,是目前全球最大中文單體模型。這段時(shí)間,百度在加班加點(diǎn)地調(diào)教文心一言,可能綜合實(shí)力會(huì)比更新的ChatGPT有差距,不過(guò)在中文能力上估計(jì)會(huì)是全球獨(dú)一檔的存在。
針對(duì)國(guó)內(nèi)類ChatGPT應(yīng)用的發(fā)展,360周鴻祎表示,ChatGPT比造芯更容易,在國(guó)家鼓勵(lì)性政策的支持下,中國(guó)用兩三年就能追上美國(guó)的水平。不過(guò),在ChatGPT訓(xùn)練必需的通用算力GPU方面,國(guó)內(nèi)和英偉達(dá)的總體差距預(yù)計(jì)在10年左右。
總結(jié)
比爾蓋茨曾表示,以ChatGPT為代表的人工智能的進(jìn)步是目前“最重要的”創(chuàng)新,重要性不亞于互聯(lián)網(wǎng)的發(fā)明。目前,全球科技迷對(duì)GPT-4趨之若鶩,國(guó)內(nèi)馬上也要有自己的“中國(guó)版ChatGPT”——文心一言,AIGC掀起的顛覆浪潮已經(jīng)一浪高過(guò)一浪了。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論