0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開(kāi)源與閉源之爭(zhēng):最新的開(kāi)源模型到底還落后多少?

jf_23871869 ? 來(lái)源:jf_23871869 ? 作者:jf_23871869 ? 2024-11-15 11:16 ? 次閱讀

一,引言

隨著人工智能AI)技術(shù)的迅猛發(fā)展,大模型已經(jīng)成為推動(dòng)科技進(jìn)步的重要力量。然而,超大規(guī)模模型在帶來(lái)高性能的同時(shí),也面臨著資源消耗大、部署困難等問(wèn)題。本文將探討AI大模型未來(lái)的發(fā)展方向。

開(kāi)放性一直是人工智能研究領(lǐng)域的常態(tài),促進(jìn)了該領(lǐng)域的合作。然而,人工智能的快速發(fā)展引發(fā)了關(guān)于發(fā)布最強(qiáng)大模型可能帶來(lái)的后果的擔(dān)憂。此外,像ChatGPT這樣的模型的銷售企業(yè)有保持模型私有的商業(yè)動(dòng)機(jī)。

行業(yè)AI實(shí)驗(yàn)室以多種方式回應(yīng)了這些發(fā)展:

未發(fā)布模型:例如,谷歌DeepMind的Chinchilla模型尚未發(fā)布。

結(jié)構(gòu)化訪問(wèn)控制:像GPT-4這樣的模型有結(jié)構(gòu)化的訪問(wèn)控制,控制用戶如何與模型交互。

有限制的開(kāi)源模型:Meta的Llama模型的權(quán)重可以下載,但使用條款有限制。

二,開(kāi)源與閉源模型的對(duì)比

1,爭(zhēng)議

發(fā)布模型、代碼和數(shù)據(jù)集能夠促進(jìn)創(chuàng)新和外部審查,但這也是不可逆的,并且如果模型的安全措施被繞過(guò),就有被濫用的風(fēng)險(xiǎn)。關(guān)于這種權(quán)衡是否可接受或可避免,存在持續(xù)的爭(zhēng)論。開(kāi)源AI的支持者認(rèn)為,開(kāi)放性通過(guò)開(kāi)放社區(qū)開(kāi)發(fā)的創(chuàng)新和工具,對(duì)社會(huì)以及模型開(kāi)發(fā)者都有益。甚至有人認(rèn)為,更多的閉源AI開(kāi)發(fā)者已經(jīng)被開(kāi)源社區(qū)超越,保持封閉變得毫無(wú)意義。

wKgZomc2vO6AY1-9AAKqJNUwB60231.png

2,二者用戶基數(shù)對(duì)比

ChatGPT(封閉模型):每月大約有3.5億用戶。

Meta AI助手(開(kāi)放模型):每月有近5億用戶。

3,性能和訓(xùn)練計(jì)算方面的差距

為了系統(tǒng)地比較開(kāi)放和封閉AI模型隨時(shí)間的能力,我們收集了自2018年以來(lái)發(fā)布的數(shù)百個(gè)著名AI模型的權(quán)重和訓(xùn)練代碼的可訪問(wèn)性數(shù)據(jù)。以下是主要發(fā)現(xiàn):

基準(zhǔn)性能:

最好的開(kāi)源大型語(yǔ)言模型(LLMs)在多個(gè)基準(zhǔn)測(cè)試上落后于最好的閉源LLMs5到22個(gè)月。Meta的Llama 3.1 405B是最新的一個(gè)在多個(gè)基準(zhǔn)上縮小差距的開(kāi)源模型。即使不考慮Meta的Llama模型,結(jié)果也類似。

訓(xùn)練計(jì)算:

在訓(xùn)練計(jì)算方面,最大的開(kāi)源模型落后于最大的閉源模型大約15個(gè)月。

Llama 3.1 405B相對(duì)于GPT-4的發(fā)布,差距為16個(gè)月。由于我們尚未看到比GPT-4規(guī)模更大的閉源模型,Llama 3.1 405B已經(jīng)在縮小訓(xùn)練計(jì)算的差距。

wKgaoWc2vM2ACnpVAAEfqJGsG8k232.png

訓(xùn)練效率:

盡管開(kāi)源LLMs在達(dá)到與閉源LLMs相似的基準(zhǔn)性能后,通常使用較少的訓(xùn)練計(jì)算,但新模型通常更高效。因此,我們?nèi)狈ν瑯痈咝У男麻]源模型的數(shù)據(jù)。

訓(xùn)練數(shù)據(jù)污染和“為排行榜而學(xué)習(xí)”也可能導(dǎo)致更高的分?jǐn)?shù)。

wKgZoWc2vNyAD19cAAEcuaFiRTg664.png

三,總結(jié)

開(kāi)源與閉源AI模型之間的競(jìng)爭(zhēng)和差距反映了AI領(lǐng)域的多樣性和復(fù)雜性。盡管開(kāi)源模型在某些方面落后于閉源模型,但它們?cè)诖龠M(jìn)創(chuàng)新和安全性研究方面具有獨(dú)特的優(yōu)勢(shì)。未來(lái)的發(fā)展將是結(jié)合兩者的優(yōu)點(diǎn),開(kāi)發(fā)能力優(yōu)秀、規(guī)模適中、邊緣友好的AI模型,以滿足多樣化的應(yīng)用需求。當(dāng)然也取決于技術(shù)進(jìn)步、市場(chǎng)需求和政策監(jiān)管的綜合影響。

這兩種模型你更看好哪一個(gè)呢?歡迎評(píng)論留言討論。

更多精彩內(nèi)容請(qǐng)關(guān)注“算力魔方?”!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    3381

    瀏覽量

    42604
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3279

    瀏覽量

    48974
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    開(kāi)源模型在多個(gè)業(yè)務(wù)場(chǎng)景的應(yīng)用案例

    在人工智能發(fā)展浪潮中,大模型開(kāi)源之爭(zhēng)一直是業(yè)內(nèi)的熱點(diǎn)話題。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的日益豐富,如何降低大
    的頭像 發(fā)表于 12-30 10:16 ?204次閱讀

    云知聲山海大模型多項(xiàng)評(píng)測(cè)名列前茅

    近日,智研究院發(fā)布并解讀了國(guó)內(nèi)外100余個(gè)開(kāi)源和商業(yè)的語(yǔ)言、視覺(jué)語(yǔ)言、文生圖、文生視頻、語(yǔ)音語(yǔ)言大模型綜合及專項(xiàng)評(píng)測(cè)結(jié)果。
    的頭像 發(fā)表于 12-24 10:29 ?140次閱讀

    開(kāi)源AI模型庫(kù)是干嘛的

    開(kāi)源AI模型庫(kù)是指那些公開(kāi)源代碼、允許自由訪問(wèn)和使用的AI模型集合。這些模型通常經(jīng)過(guò)訓(xùn)練,能夠執(zhí)行特定的任務(wù)。以下,是對(duì)
    的頭像 發(fā)表于 12-14 10:33 ?223次閱讀

    Meta AI高管批評(píng)OpenAI模式

    Meta生成式AI工程副總裁Manohar Paluri近日對(duì)AI模式提出了尖銳批評(píng),他認(rèn)為要充分發(fā)揮AI的全部潛力,開(kāi)源是唯一的出路。 Paluri的這一觀點(diǎn),直指當(dāng)前生成式AI領(lǐng)域的先鋒
    的頭像 發(fā)表于 12-12 11:14 ?389次閱讀

    阿里通義千問(wèn)代碼模型全系列開(kāi)源

    近日,阿里云通義大模型團(tuán)隊(duì)宣布了一項(xiàng)重大決策:將通義千問(wèn)代碼模型全系列正式開(kāi)源。此次開(kāi)源模型系列共包含6款Qwen2.5-Coder
    的頭像 發(fā)表于 11-14 15:26 ?386次閱讀

    科技云報(bào)到:假開(kāi)源真噱頭?開(kāi)源模型和你想的不一樣!

    查看、修改、分發(fā)。開(kāi)源自此深刻影響了互聯(lián)網(wǎng)行業(yè)的每一個(gè)角落。 在大模型和GenAI崛起的當(dāng)下,開(kāi)源再次成為業(yè)界關(guān)注焦點(diǎn),對(duì)于開(kāi)源
    的頭像 發(fā)表于 11-03 10:46 ?253次閱讀

    Llama 3 與開(kāi)源AI模型的關(guān)系

    在人工智能(AI)的快速發(fā)展中,開(kāi)源AI模型扮演著越來(lái)越重要的角色。它們不僅推動(dòng)了技術(shù)的創(chuàng)新,促進(jìn)了全球開(kāi)發(fā)者社區(qū)的合作。Llama 3,作為一個(gè)新興的AI項(xiàng)目,與開(kāi)源AI
    的頭像 發(fā)表于 10-27 14:42 ?401次閱讀

    人民郵電報(bào):“開(kāi)源到底是什么?為啥熱度越來(lái)越高?

    ? ? ? 本文轉(zhuǎn)載自人民郵電報(bào) 這些年,“開(kāi)源”這個(gè)詞越來(lái)越火,開(kāi)源AI大模型、開(kāi)源數(shù)據(jù)庫(kù)、開(kāi)源框架、
    的頭像 發(fā)表于 10-17 14:21 ?544次閱讀
    人民郵電報(bào):“<b class='flag-5'>開(kāi)源</b>”<b class='flag-5'>到底</b>是什么?為啥熱度越來(lái)越高?

    浪潮信息重磅發(fā)布“2.0-M32”開(kāi)源模型

    浪潮信息近日發(fā)布了一款全新的開(kāi)源模型——“2.0-M32”。這款大模型在“2.0”系列大模型
    的頭像 發(fā)表于 06-05 14:50 ?811次閱讀

    浪潮信息發(fā)布2.0-M32開(kāi)源模型,模算效率大幅提升

    5月28日,浪潮信息發(fā)布“2.0-M32”開(kāi)源模型?!?b class='flag-5'>源2.0-M32”在基于”2.0”系列大模型
    的頭像 發(fā)表于 05-29 09:34 ?464次閱讀
    浪潮信息發(fā)布<b class='flag-5'>源</b>2.0-M32<b class='flag-5'>開(kāi)源</b>大<b class='flag-5'>模型</b>,模算效率大幅提升

    浪潮信息發(fā)布“2.0-M32”開(kāi)源模型

    浪潮信息近日推出了革命性的“2.0-M32”開(kāi)源模型。該模型2.0系列基礎(chǔ)上,引入了“基于注意力機(jī)制的門控網(wǎng)絡(luò)”技術(shù),構(gòu)建了一個(gè)包含
    的頭像 發(fā)表于 05-29 09:08 ?680次閱讀

    研究院揭曉大模型測(cè)評(píng)結(jié)果,豆包與百川智能大模型表現(xiàn)優(yōu)異

    在多模態(tài)理解圖文問(wèn)答任務(wù)中,開(kāi)源模型表現(xiàn)相當(dāng),而國(guó)產(chǎn)模型則表現(xiàn)出色。此外,在中文語(yǔ)境下的文生圖能力方面,國(guó)產(chǎn)多模態(tài)
    的頭像 發(fā)表于 05-20 09:26 ?792次閱讀

    李彥宏說(shuō)開(kāi)源模型會(huì)越來(lái)越落后,為什么很多人不認(rèn)同?

    上周,百度董事長(zhǎng)兼CEO李彥宏對(duì)于開(kāi)源模型的一番言論引發(fā)了爭(zhēng)議。
    的頭像 發(fā)表于 04-24 09:37 ?511次閱讀
    李彥宏說(shuō)<b class='flag-5'>開(kāi)源</b><b class='flag-5'>模型</b>會(huì)越來(lái)越<b class='flag-5'>落后</b>,為什么很多人不認(rèn)同?

    HDMI論壇出手,AMD開(kāi)源HDMI 2.1驅(qū)動(dòng)被拒

    喜愛(ài)的原因之一。然而,在高分辨率+高幀率的顯示器上,Linux卻在正式的開(kāi)源驅(qū)動(dòng)一直缺席,甚至連AMD也無(wú)能為力。 ? 開(kāi)源系統(tǒng)上的標(biāo)準(zhǔn) ? 對(duì)于Linux這個(gè)
    的頭像 發(fā)表于 03-05 00:10 ?2966次閱讀

    機(jī)器人基于開(kāi)源的多模態(tài)語(yǔ)言視覺(jué)大模型

    ByteDance Research 基于開(kāi)源的多模態(tài)語(yǔ)言視覺(jué)大模型 OpenFlamingo 開(kāi)發(fā)了開(kāi)源、易用的 RoboFlamingo 機(jī)器人操作模型,只用單機(jī)就可以訓(xùn)練。
    發(fā)表于 01-19 11:43 ?431次閱讀
    機(jī)器人基于<b class='flag-5'>開(kāi)源</b>的多模態(tài)語(yǔ)言視覺(jué)大<b class='flag-5'>模型</b>