0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Claude-3力壓GPT-4榮膺最佳大語言模型

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-03-28 15:23 ? 次閱讀

近日,LMSYS Org發(fā)布最新的基準(zhǔn)測試報(bào)告,顯示Cordulas公司的Claude-3在平臺大語言模型中的得分略勝OpenAI的GPT-4。

值得注意的是,LMSYS Org是由加州大學(xué)伯克利分校、加州大學(xué)圣地亞哥分校以及卡內(nèi)基梅隆大學(xué)共同發(fā)起設(shè)立的研究組織。

日前,這家機(jī)構(gòu)推出了一項(xiàng)名為Chatbot Arena的服務(wù),這是針對大語言模型(LLM)進(jìn)行評估的基準(zhǔn)平臺,該平臺采用眾包形式對大型語言模型進(jìn)行匿名隨機(jī)競爭打分,參考源于競技比賽領(lǐng)域中廣泛應(yīng)用的Elo評分體系。

分?jǐn)?shù)評價結(jié)果主要取決于用戶的投票意向,每次由系統(tǒng)隨機(jī)挑選兩個不同的大語言模型參與與用戶的對話,同時,為保障客觀性,匿名選擇哪個版本的大模型表現(xiàn)優(yōu)秀至關(guān)重要。

自去年啟動以來,GPT-4一直占據(jù)評測榜單之首。然而,昨日,由Anthropos推出的Claude 3 Opus以微弱優(yōu)勢戰(zhàn)勝了GPT-4,將OpenAI的LLM擠出了首位。

考慮到細(xì)微差距及誤差風(fēng)險(xiǎn),委員會決定授予Claude 3與GPT-4并列第一的榮譽(yù),GPT-4的另外一個預(yù)設(shè)版也被列入并列第一的行列。此外,更引人注目的是,Claude 3 Haiku成功躋身前十名。Haiku是Anthropos針對本地規(guī)模的新型模型,功能類似谷歌的GeminiNano。

相較Opus參數(shù)高達(dá)幾萬億,Haiku體型更為緊湊,運(yùn)行速度更快。據(jù)LMSYS數(shù)據(jù)顯示,Haikn在評測成績中排名第七,與GPT-4表現(xiàn)不遑多讓。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6171

    瀏覽量

    105504
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    527

    瀏覽量

    10289
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    354

    瀏覽量

    15419
收藏 人收藏

    評論

    相關(guān)推薦

    Llama 3GPT-4 比較

    沿。 一、技術(shù)架構(gòu) Llama 3GPT-4都是基于深度學(xué)習(xí)的自然語言處理(NLP)模型,但它們的設(shè)計(jì)理念和技術(shù)細(xì)節(jié)有所不同。 Llama 3
    的頭像 發(fā)表于 10-27 14:17 ?381次閱讀

    OpenAI推出新模型CriticGPT,用GPT-4自我糾錯

    基于GPT-4模型——CriticGPT,這款模型專為捕獲ChatGPT代碼輸出中的錯誤而設(shè)計(jì),其獨(dú)特的作用在于,讓人們能夠用GPT-4來查找GP
    的頭像 發(fā)表于 06-29 09:55 ?554次閱讀

    Anthropic 發(fā)布Claude 3.5 Sonnet模型運(yùn)行速度是Claude 3 Opus的兩倍

    Anthropic 發(fā)布Claude 3.5 Sonnet最新模型模型在推理、知識和編碼能力評估方面超越了以前的版本和競爭對手GPT 4
    的頭像 發(fā)表于 06-21 15:43 ?836次閱讀
    Anthropic 發(fā)布<b class='flag-5'>Claude</b> 3.5 Sonnet<b class='flag-5'>模型</b>運(yùn)行速度是<b class='flag-5'>Claude</b> <b class='flag-5'>3</b> Opus的兩倍

    Anthropic Claude 3模型重磅來襲!微美全息(WIMI.US)全力沖刺加入GPT革命!

    在AI邏輯基準(zhǔn)測試中超過了ChatGPT-4Claude 3 Opus 超越 GPT-4 ? Anthropic聲稱,Claude
    的頭像 發(fā)表于 03-27 10:59 ?364次閱讀
    Anthropic <b class='flag-5'>Claude</b> <b class='flag-5'>3</b>大<b class='flag-5'>模型</b>重磅來襲!微美全息(WIMI.US)全力沖刺加入<b class='flag-5'>GPT</b>革命!

    微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

    起初,Copilot作為Bing Chat AI助手推出,初期采用GPT-3.5模型,隨后升級至GPT-4取得顯著進(jìn)步,如今再次更新至性能卓越的GPT-4 Turbo
    的頭像 發(fā)表于 03-13 13:42 ?745次閱讀

    Anthropic 發(fā)布 Claude 3 系列大模型和 AI 助手

    的表現(xiàn)超越了 GPT-4/3.5 和 Gemini 1.0 Ultra/Pro。 ? 目前Opus 和 Sonnet 已可通過 claude網(wǎng)站和 Claude API 使用,而 Haiku 將在未來幾周內(nèi)推出。
    的頭像 發(fā)表于 03-08 12:29 ?440次閱讀

    新火種AI|秒殺GPT-4,狙殺GPT-5,橫空出世的Claude 3振奮人心!

    GPT-4被拉下神壇, Claude 3很可能對GPT-4實(shí)現(xiàn)全方位的碾壓 。 Anthropic發(fā)布3
    的頭像 發(fā)表于 03-06 22:22 ?682次閱讀
    新火種AI|秒殺<b class='flag-5'>GPT-4</b>,狙殺<b class='flag-5'>GPT</b>-5,橫空出世的<b class='flag-5'>Claude</b> <b class='flag-5'>3</b>振奮人心!

    Anthropic發(fā)布Claude 3系列大語言模型,挑戰(zhàn)OpenAI領(lǐng)先地位

    人工智能領(lǐng)域的創(chuàng)業(yè)公司Anthropic推出了其備受矚目的Claude 3系列大型語言模型。該系列包括Claude
    的頭像 發(fā)表于 03-06 18:11 ?1291次閱讀

    全球最強(qiáng)大模型易主,Claude 3全面超越GPT-4

    由谷歌和亞馬遜支持的AI初創(chuàng)公司Anthropic近日發(fā)布了其全新的Claude 3模型家族,該家族包含三個重要成員:Claude 3 Op
    的頭像 發(fā)表于 03-06 10:44 ?771次閱讀

    OpenAI推出ChatGPT新功能:朗讀,支持37種語言,兼容GPT-4GPT-3

    據(jù)悉,“朗讀”功能支持37種語言,且能夠自主識別文本類型并對應(yīng)相應(yīng)的發(fā)音。值得關(guān)注的是,該功能對GPT-4以及GPT-3.5版本的ChatGPT均適用。此舉彰顯了OpenAI致力于“多模態(tài)交互”(multimodal capab
    的頭像 發(fā)表于 03-05 15:48 ?951次閱讀

    Anthropic推出Claude 3大型語言模型,在認(rèn)知任務(wù)性能上創(chuàng)新高

    據(jù)官方披露,Claude 3 旗艦 Opus 在大學(xué)生和研究生范疇的學(xué)術(shù)知識、復(fù)雜數(shù)理任務(wù)了解部分超越 OpenAI 的 GPT-4 以及谷歌的 Gemini 1.0 Ultra。
    的頭像 發(fā)表于 03-05 11:16 ?525次閱讀

    全球最強(qiáng)大模型易主,GPT-4被超越

    近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic宣布推出全新的Claude 3系列模型,其中包括最強(qiáng)版Claude 3 Opus。據(jù)該公司稱,
    的頭像 發(fā)表于 03-05 09:58 ?671次閱讀

    Anthropic推出Claude 3系列模型,全面超越GPT-4,樹立AI新標(biāo)桿

    近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic震撼發(fā)布了全新的Claude 3系列模型,該系列模型在多模態(tài)和語言能力等關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能,成
    的頭像 發(fā)表于 03-05 09:49 ?696次閱讀

    Anthropic發(fā)布Claude 3系列,超越GPT-4和Gemini Ultra

    人工智能領(lǐng)域的領(lǐng)軍企業(yè)Anthropic宣布推出全新的Claude 3系列模型,包括Claude 3 Opus、
    的頭像 發(fā)表于 03-05 09:43 ?676次閱讀

    全球最強(qiáng)大模型易主:GPT-4被超越,Claude 3系列嶄露頭角

    近日,人工智能領(lǐng)域迎來了一場革命性的突破。Anthropic公司發(fā)布了全新的Claude 3系列模型,該系列模型在多模態(tài)和語言能力等關(guān)鍵指標(biāo)
    的頭像 發(fā)表于 03-05 09:42 ?667次閱讀