0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPT-4發(fā)布!多領(lǐng)域超越“人類水平”,專家:國(guó)內(nèi)落后2-3年

Felix分析 ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:吳子鵬 ? 2023-03-16 01:58 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)北京時(shí)間3月15日凌晨,人工智能研究公司OpenAI正式發(fā)布了其下一代大型語(yǔ)言模型GPT-4。目前,ChatGPT的Plus訂閱用戶已經(jīng)可以使用GPT-4,其他用戶需要排隊(duì)申請(qǐng)內(nèi)測(cè)。

對(duì)于GPT-4的性能,很多國(guó)外網(wǎng)友的描述都是“GPT-4,起飛!”

多模態(tài)大型語(yǔ)言模型GPT-4

GPT-4被定義為OpenAI發(fā)展的另一里程碑,其相較于上一代產(chǎn)品GPT-3.5所帶來(lái)的提升是巨大的。OpenAI工作人員表示,“我們還在為機(jī)器學(xué)習(xí)模型設(shè)計(jì)的傳統(tǒng)基準(zhǔn)上對(duì)GPT-4進(jìn)行了評(píng)估。GPT-4大大超過(guò)現(xiàn)有的大語(yǔ)言模型,與多數(shù)最先進(jìn)的(SOTA)模型并駕齊驅(qū)?!?br />
官方介紹稱,GPT-4作為一個(gè)多模態(tài)大模型(接受圖像和文本輸入,生成文本),主要在四個(gè)方面做了增強(qiáng)。

首先是可以更準(zhǔn)確地解決難題,具有更廣泛的常識(shí)和解決問(wèn)題的能力。在GPT-3.5時(shí)代,ChatGPT的精準(zhǔn)度時(shí)常被吐槽。GPT-3.5根據(jù)從互聯(lián)網(wǎng)上搜羅的大量文章、網(wǎng)站和社交媒體帖子以及用戶與OpenAI雇用的人工雇員的實(shí)時(shí)英文對(duì)話進(jìn)行訓(xùn)練的,因此在輸出結(jié)果時(shí),一些錯(cuò)誤的源數(shù)據(jù),也導(dǎo)致ChatGPT給出的答案看似合理,實(shí)際上有很大的漏洞。就以考試來(lái)衡量,上一代GPT-3.5在很多專業(yè)考試中的成績(jī)都是倒數(shù)10%,而GPT-4在已測(cè)試的考試中,基本都是高分通過(guò),超越了“人類的水平”。

pYYBAGQRmH2AYkEYAAEG3t1SYV4745.jpg
GPT-4在多項(xiàng)考試中優(yōu)于GPT-3.5



其次是更具創(chuàng)造性和協(xié)作能力。在上一代基于GPT-3.5打造的ChatGPT中,很多問(wèn)題給出的回答都是很簡(jiǎn)短的,雖然具備一定的邏輯性,不過(guò)在專業(yè)人士看來(lái)還略顯“幼稚”。到了GPT-4,該模型能夠處理超過(guò)25000個(gè)(GPT-3.5是3000個(gè))單詞的文本,允許長(zhǎng)文內(nèi)容創(chuàng)建、擴(kuò)展對(duì)話以及文檔搜索和分析等用例。在顯示過(guò)程中,GPT-4可以完成總結(jié)文章、寫詩(shī)這樣的創(chuàng)造性任務(wù)。

pYYBAGQRmIuAFCE2AABzQOdkOT4460.png

第三點(diǎn)是GPT-4的高級(jí)推理能力更強(qiáng)。此前,基于GPT-3.5打造的ChatGPT,被很多使用者定義為“一本正經(jīng)的胡說(shuō)八道”,在計(jì)算方面的能力更是弱于十四五歲的孩子,約等于八九歲孩子。因此,很多人說(shuō)如果將ChatGPT比作是一個(gè)學(xué)生,他在數(shù)理化方面是嚴(yán)重偏科的。在GPT-4中,這方面的能力得到了顯著的增強(qiáng)。在專業(yè)測(cè)試和學(xué)術(shù)基準(zhǔn)測(cè)試中,GPT-4都表現(xiàn)出了不俗的實(shí)力。在官網(wǎng)上,OpenAI用會(huì)議預(yù)約展示了GPT-4的推理能力,GPT-4明顯更“擅長(zhǎng)”做這個(gè)。

poYBAGQRmJiAeoc9AALPt67zUvE470.png

最后一點(diǎn)是安全性。針對(duì)基于GPT-3.5打造的ChatGPT,曾有內(nèi)測(cè)人員通過(guò)引導(dǎo)的方式讓其表現(xiàn)出攻擊性。同時(shí),有很多報(bào)道都指出,上一代ChatGPT曾出現(xiàn)辱罵用戶、表白用戶、誘導(dǎo)用戶離婚、監(jiān)視開發(fā)人員等行為。有業(yè)內(nèi)人士在推特上表示,微軟需要關(guān)閉必應(yīng)中的類ChatGPT功能,因?yàn)橄到y(tǒng)有時(shí)表現(xiàn)得像精神病一樣,會(huì)給用戶錯(cuò)誤答案。特斯拉馬斯克也表示,上一代ChatGPT是“不安全的”。OpenAI花了6個(gè)月時(shí)間使GPT-4更安全、更具一致性。在內(nèi)部評(píng)估中,與GPT-3.5相比,GPT-4對(duì)不允許內(nèi)容做出回應(yīng)的可能性降低82%,給出事實(shí)性回應(yīng)的可能性高40% 。

當(dāng)然,GPT-4也還存在自己的局限性,尤其是在事實(shí)性、社會(huì)偏見(jiàn)、幻覺(jué)和對(duì)抗性等方面,需要得到持續(xù)的優(yōu)化。在內(nèi)部的對(duì)抗性事實(shí)性評(píng)估中,GPT-4的得分比GPT-3.5高40%,很顯然這還是不夠的。

在發(fā)布會(huì)當(dāng)晚,微軟表示GPT-4已在新必應(yīng)搜索引擎上運(yùn)行。

全行業(yè)追趕GPT-4

ChatGPT的火熱是有目共睹的,在去年11月30日發(fā)布后的5天時(shí)間里,收獲了100萬(wàn)用戶;推出僅僅2個(gè)月,月活躍用戶就成功過(guò)億,成為歷史上增長(zhǎng)最快的消費(fèi)者應(yīng)用程序。如今,GPT-4的發(fā)布進(jìn)一步延續(xù)了這股熱潮,甚至是讓火燒的更旺了。

為了不讓微軟或者是OpenAI在該領(lǐng)域一騎絕塵,也為了自己能夠在AIGC方面得到更大份額的蛋糕。目前,全球科技巨頭都在抓緊時(shí)間追趕GPT-4。

為了提升旗下類ChatGPT模型的優(yōu)化速度,谷歌在博文中宣布正式開放其PaLM大型語(yǔ)言模型API。谷歌表示,“我們看到新一輪的生成性人工智能應(yīng)用正在改變?nèi)藗兣c技術(shù)互動(dòng)的方式。在谷歌,我們希望通過(guò)提供易于使用的API和工具,使所有開發(fā)人員能夠開始用生成性人工智能構(gòu)建下一代應(yīng)用程序,從而繼續(xù)使人工智能變得容易使用?!惫雀栌?022年4月宣布PaLM,隨后一直在優(yōu)化。北京時(shí)間2月8日晚,谷歌正式發(fā)布類ChatGPT應(yīng)用Bard,不過(guò)由于演示中出現(xiàn)事實(shí)錯(cuò)誤,谷歌因此股價(jià)大跌,一天市值蒸發(fā)近千億美元。

目前,谷歌正在全力優(yōu)化PaLM。北京時(shí)間3月7日,谷歌和柏林工業(yè)大學(xué)的團(tuán)隊(duì)重磅推出了史上最大的視覺(jué)語(yǔ)言模型——PaLM-E,參數(shù)量高達(dá)5620億,是GPT-3(參數(shù)量為1750億)參數(shù)規(guī)模的數(shù)倍。

除了谷歌,目前國(guó)內(nèi)科技行業(yè)都在關(guān)注百度文心一言的發(fā)布。百度將于北京時(shí)間3月16日下午兩點(diǎn)發(fā)布自己的類ChatGPT應(yīng)用文心一言。根據(jù)此前的爆料消息,文心一言是百度基于文心大模型技術(shù)推出的生成式對(duì)話產(chǎn)品,被外界譽(yù)為“中國(guó)版ChatGPT”。2021年12月,百度與鵬城實(shí)驗(yàn)室聯(lián)合發(fā)布共同研發(fā)的全球首個(gè)知識(shí)增強(qiáng)千億大模型——文心,當(dāng)時(shí)百度首席技術(shù)官(CTO)王海峰表示,該模型參數(shù)規(guī)模達(dá)到2600億,是目前全球最大中文單體模型。這段時(shí)間,百度在加班加點(diǎn)地調(diào)教文心一言,可能綜合實(shí)力會(huì)比更新的ChatGPT有差距,不過(guò)在中文能力上估計(jì)會(huì)是全球獨(dú)一檔的存在。

針對(duì)國(guó)內(nèi)類ChatGPT應(yīng)用的發(fā)展,360周鴻祎表示,ChatGPT比造芯更容易,在國(guó)家鼓勵(lì)性政策的支持下,中國(guó)用兩三年就能追上美國(guó)的水平。不過(guò),在ChatGPT訓(xùn)練必需的通用算力GPU方面,國(guó)內(nèi)和英偉達(dá)的總體差距預(yù)計(jì)在10年左右。

總結(jié)

比爾蓋茨曾表示,以ChatGPT為代表的人工智能的進(jìn)步是目前“最重要的”創(chuàng)新,重要性不亞于互聯(lián)網(wǎng)的發(fā)明。目前,全球科技迷對(duì)GPT-4趨之若鶩,國(guó)內(nèi)馬上也要有自己的“中國(guó)版ChatGPT”——文心一言,AIGC掀起的顛覆浪潮已經(jīng)一浪高過(guò)一浪了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Llama 3GPT-4 比較

    隨著人工智能技術(shù)的飛速發(fā)展,我們見(jiàn)證了一代又一代的AI模型不斷突破界限,為各行各業(yè)帶來(lái)革命性的變化。在這場(chǎng)技術(shù)競(jìng)賽中,Llama 3GPT-4作為兩個(gè)備受矚目的模型,它們代表了當(dāng)前AI領(lǐng)域的最前
    的頭像 發(fā)表于 10-27 14:17 ?361次閱讀

    OpenAI推出新模型CriticGPT,用GPT-4自我糾錯(cuò)

    基于GPT-4的模型——CriticGPT,這款模型專為捕獲ChatGPT代碼輸出中的錯(cuò)誤而設(shè)計(jì),其獨(dú)特的作用在于,讓人們能夠用GPT-4來(lái)查找GPT-4的錯(cuò)誤。
    的頭像 發(fā)表于 06-29 09:55 ?549次閱讀

    國(guó)內(nèi)直聯(lián)使用ChatGPT 4.0 API Key使用和模態(tài)GPT4o API調(diào)用開發(fā)教程!

    1. 前言 ChatGPT-4o API 是 OpenAI 提供的強(qiáng)大工具,可用于自然語(yǔ)言處理和模態(tài)任務(wù)。在國(guó)內(nèi)直聯(lián)使用這些服務(wù)需要一些配置和技巧。本文將詳細(xì)介紹GPT-4o模型以及
    的頭像 發(fā)表于 06-08 00:33 ?4991次閱讀
    <b class='flag-5'>國(guó)內(nèi)</b>直聯(lián)使用ChatGPT 4.0 API Key使用和<b class='flag-5'>多</b>模態(tài)<b class='flag-5'>GPT4</b>o API調(diào)用開發(fā)教程!

    GPT-4人工智能模型預(yù)測(cè)公司未來(lái)盈利勝過(guò)人類分析師

    據(jù)悉,本次研究中,研究人員僅向GPT-4提供了匿名的財(cái)務(wù)數(shù)據(jù),包括資產(chǎn)負(fù)債表和損益表,并要求其預(yù)測(cè)未來(lái)盈利增長(zhǎng)。盡管未獲得其他信息,GPT-4仍能達(dá)到60%的準(zhǔn)確度,遠(yuǎn)超人類分析師的平均水平
    的頭像 發(fā)表于 05-27 16:41 ?597次閱讀

    OpenAI全新GPT-4o能力炸場(chǎng)!速度快/成本低,能讀懂人類情緒

    ”的意思。GPT-4o文本、推理、編碼能力達(dá)到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的兩倍,但成本僅為GPT-4
    的頭像 發(fā)表于 05-15 00:15 ?7833次閱讀

    阿里云正式發(fā)布通義千問(wèn)2.5,中文性能全面趕超GPT-4 Turbo

    在通義大模型發(fā)布一周之際,阿里云邁出了歷史性的一步。近日,阿里云正式發(fā)布通義千問(wèn)2.5版本,其性能全面超越GPT-4 Turbo,榮登中文
    的頭像 發(fā)表于 05-13 11:16 ?985次閱讀

    阿里云發(fā)布通義千問(wèn)2.5大模型,多項(xiàng)能力超越GPT-4

    阿里云隆重推出了通義千問(wèn) 2.5 版,宣稱其“技術(shù)進(jìn)步,全面超越GPT-4”,尤其是在中文環(huán)境中的多種任務(wù)(如文本理解、文本生成、知識(shí)問(wèn)答及生活建議、臨時(shí)聊天及對(duì)話以及安全風(fēng)險(xiǎn)評(píng)估)方面表現(xiàn)出色,超越
    的頭像 發(fā)表于 05-09 14:17 ?963次閱讀

    訊飛星火大模型V3.5春季升級(jí),領(lǐng)域知識(shí)問(wèn)答超越GPT-4 Turbo?

    劉慶峰指出,現(xiàn)如今,星火大模型在通用長(zhǎng)文本處理能力方面已相當(dāng)成熟,覆蓋長(zhǎng)文檔信息抽取、知識(shí)問(wèn)答、歸納總結(jié)、文本生成等諸多領(lǐng)域,整體表現(xiàn)已達(dá)GPT-4 Turbo今年4月最新版的97%水準(zhǔn);
    的頭像 發(fā)表于 04-26 14:26 ?1059次閱讀

    商湯科技發(fā)布5.0模態(tài)大模型,綜合能力全面對(duì)標(biāo)GPT-4 Turbo

    場(chǎng)景應(yīng)用需求;升級(jí)“日日新SenseNova 5.0”大模型體系,綜合能力全面對(duì)標(biāo)GPT-4 Turbo。 此外對(duì)于文生視頻徐立也表示商湯科技很快就會(huì)發(fā)布相關(guān)的平臺(tái)產(chǎn)品。 備受矚目的商湯科技“日日新SenseNova” 5.0
    的頭像 發(fā)表于 04-24 16:49 ?1114次閱讀

    科大訊飛星火大模型V4.0預(yù)計(jì)六月發(fā)布,逼近GPT-4水平

    在博鰲2024會(huì)上,科大訊飛副總裁、研究院院長(zhǎng)劉聰透露,公司正在積極訓(xùn)練對(duì)標(biāo)GPT-4能力的訊飛星火大模型V4.0,并預(yù)計(jì)將于今年6月正式發(fā)布
    的頭像 發(fā)表于 03-28 13:59 ?824次閱讀

    新火種AI|秒殺GPT-4,狙殺GPT-5,橫空出世的Claude 3振奮人心!

    2024第一季度才剛過(guò)半,AI領(lǐng)域就大動(dòng)作不斷,大家卯著勁的出新品,可謂卷出天際。 ? 34日,Anthropic發(fā)布了最新的Claud
    的頭像 發(fā)表于 03-06 22:22 ?650次閱讀
    新火種AI|秒殺<b class='flag-5'>GPT-4</b>,狙殺<b class='flag-5'>GPT</b>-5,橫空出世的Claude <b class='flag-5'>3</b>振奮人心!

    OpenAI推出ChatGPT新功能:朗讀,支持37種語(yǔ)言,兼容GPT-4GPT-3

    據(jù)悉,“朗讀”功能支持37種語(yǔ)言,且能夠自主識(shí)別文本類型并對(duì)應(yīng)相應(yīng)的發(fā)音。值得關(guān)注的是,該功能對(duì)GPT-4以及GPT-3.5版本的ChatGPT均適用。此舉彰顯了OpenAI致力于“模態(tài)交互”(multimodal capab
    的頭像 發(fā)表于 03-05 15:48 ?936次閱讀

    全球最強(qiáng)大模型易主,GPT-4超越

    近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic宣布推出全新的Claude 3系列模型,其中包括最強(qiáng)版Claude 3 Opus。據(jù)該公司稱,Claude 3系列在推理、數(shù)學(xué)、編碼、多語(yǔ)言理
    的頭像 發(fā)表于 03-05 09:58 ?662次閱讀

    Anthropic推出Claude 3系列模型,全面超越GPT-4,樹立AI新標(biāo)桿

    近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic震撼發(fā)布了全新的Claude 3系列模型,該系列模型在模態(tài)和語(yǔ)言能力等關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能,成
    的頭像 發(fā)表于 03-05 09:49 ?688次閱讀

    全球最強(qiáng)大模型易主:GPT-4超越,Claude 3系列嶄露頭角

    近日,人工智能領(lǐng)域迎來(lái)了一場(chǎng)革命性的突破。Anthropic公司發(fā)布了全新的Claude 3系列模型,該系列模型在模態(tài)和語(yǔ)言能力等關(guān)鍵指標(biāo)上展現(xiàn)出卓越性能,成功
    的頭像 發(fā)表于 03-05 09:42 ?659次閱讀