0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Eleuther AI:已經(jīng)開源了復(fù)現(xiàn)版GPT-3的模型參數(shù)

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:夕小瑤的賣萌屋 ? 作者:小戲 ? 2021-03-31 17:46 ? 次閱讀

GPT3終于開源!不過,不是官方開的(別打我

Eleuther AI推出的名為GPT-Neo的開源項(xiàng)目,于晨4點(diǎn)于twitter正式宣布:已經(jīng)開源了復(fù)現(xiàn)版GPT-3的模型參數(shù)(1.3B和2.7B級(jí)別),并將其更新在Colab notebook之上。需要指出的是這次開源的模型里較大的那個(gè)版本也只是到了GPT-3商用版里最小模型的參數(shù)量,不過Eleuther AI表示未來(lái)會(huì)進(jìn)一步開源10B版本和原始大小版本的GPT3模型參數(shù)。

消息發(fā)布后,立刻被各個(gè)大v轉(zhuǎn)發(fā),10小時(shí)內(nèi)就已迅速收獲1.5K的點(diǎn)贊量,相應(yīng)的github鏈接也已收獲接近2k star。

▲Twitter原文

但關(guān)于復(fù)現(xiàn)模型的性能,目前只說“實(shí)驗(yàn)表現(xiàn)與原版GPT-3相當(dāng)”(they performed on par)。具體實(shí)驗(yàn)結(jié)果將于明天公布。

風(fēng)靡一時(shí)的擁有1750億超大參數(shù)量,一出道便被視作NLP領(lǐng)域最強(qiáng)AI模型的GPT-3,得益于其龐大的參數(shù)量,使得GPT-3擁有不用接受特定訓(xùn)練與微調(diào),就能在不同NLP領(lǐng)域達(dá)到領(lǐng)先水平的強(qiáng)大能力。去年七月,GPT-3被Open-AI以商業(yè)API的形式向公眾開放,并被人們探索出了形形色色的應(yīng)用,從基于問題的搜索,到文本樣式轉(zhuǎn)換,從UI界面設(shè)計(jì),再到自動(dòng)生成SQL代碼,GPT-3以其卓越的性能展現(xiàn)了其廣闊的應(yīng)用場(chǎng)景,深度學(xué)習(xí)之父Hinton甚至這樣評(píng)價(jià)道:

如果以GPT-3的出色性能推算未來(lái)、生命、宇宙和萬(wàn)物的答案也不過是4.398萬(wàn)億個(gè)參數(shù)

但是,由于目前GPT-3的使用模式仍然是付費(fèi)的商業(yè)API,因此并不是所有NLP的研究者都能使用GPT-3完成自己領(lǐng)域的任務(wù)與工作。而由Connor Leahy,Leo Gao和Sid Black三人聯(lián)合創(chuàng)立的Eleuther AI的團(tuán)隊(duì),于去年11月宣布推出GPT-Neo的開源項(xiàng)目,該項(xiàng)目基于GPT系列的設(shè)計(jì)原理,旨在復(fù)現(xiàn)GPT系列的各種項(xiàng)目,在該項(xiàng)目發(fā)布之初,其團(tuán)隊(duì)成員已經(jīng)預(yù)測(cè)可以完成GPT-3級(jí)別大小的語(yǔ)言模型。

毫無(wú)疑問,GPT-3的開源將會(huì)催生出一大批NLP技術(shù)的嶄新應(yīng)用,也會(huì)以更為低廉的成本釋放人們對(duì)NLP未來(lái)的想象力。

原文標(biāo)題:【GPT-3】千呼萬(wàn)喚始出來(lái)——GPT-3終于開源!

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30898

    瀏覽量

    269125
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3349

    瀏覽量

    42503
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    488

    瀏覽量

    22038

原文標(biāo)題:【GPT-3】千呼萬(wàn)喚始出來(lái)——GPT-3終于開源!

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    開源AI模型庫(kù)是干嘛的

    開源AI模型庫(kù)是指那些公開源代碼、允許自由訪問和使用的AI模型集合。這些
    的頭像 發(fā)表于 12-14 10:33 ?188次閱讀

    AI時(shí)代算力的重要性及現(xiàn)狀:平衡發(fā)展與優(yōu)化配置的挑戰(zhàn)

    瓦時(shí)的電力。訓(xùn)練一次擁有1746億參數(shù)GPT-3模型,所需的算力更是高達(dá)3640PFlops,耗資466萬(wàn)美元。
    的頭像 發(fā)表于 11-04 11:45 ?437次閱讀

    Llama 3開源AI模型的關(guān)系

    體現(xiàn)在多個(gè)層面。 1. 開源精神的體現(xiàn) Llama 3項(xiàng)目可能是一個(gè)開源項(xiàng)目,這意味著它的源代碼、算法和數(shù)據(jù)集對(duì)公眾開放。這種開放性是開源AI
    的頭像 發(fā)表于 10-27 14:42 ?372次閱讀

    Llama 3 模型與其他AI工具對(duì)比

    Llama 3模型與其他AI工具的對(duì)比可以從多個(gè)維度進(jìn)行,包括但不限于技術(shù)架構(gòu)、性能表現(xiàn)、應(yīng)用場(chǎng)景、定制化能力、開源與成本等方面。以下是對(duì)Llama
    的頭像 發(fā)表于 10-27 14:37 ?389次閱讀

    英偉達(dá)預(yù)測(cè)機(jī)器人領(lǐng)域或迎“GPT-3時(shí)刻”

    未來(lái)2-3年內(nèi),機(jī)器人基礎(chǔ)模型的研究將迎來(lái)重大突破,這一時(shí)刻被形象地比喻為機(jī)器人領(lǐng)域的“GPT-3時(shí)刻”。
    的頭像 發(fā)表于 09-20 17:05 ?798次閱讀

    Jim Fan展望:機(jī)器人領(lǐng)域即將迎來(lái)GPT-3式突破

    英偉達(dá)科學(xué)家9月19日,科技媒體The Decoder發(fā)布一則引人關(guān)注的報(bào)道,英偉達(dá)高級(jí)科學(xué)家Jim Fan在近期預(yù)測(cè),機(jī)器人技術(shù)將在未來(lái)兩到三年內(nèi)迎來(lái)類似GPT-3在語(yǔ)言處理領(lǐng)域的革命性突破,他稱之為機(jī)器人領(lǐng)域的“GPT-3
    的頭像 發(fā)表于 09-19 15:13 ?580次閱讀

    通義千問推出1100億參數(shù)開源模型

    通義千問近日震撼發(fā)布1100億參數(shù)開源模型Qwen1.5-110B,這一舉措標(biāo)志著通義千問在AI領(lǐng)域邁出了重大步伐。該模型成為通義千問全系
    的頭像 發(fā)表于 05-06 10:49 ?588次閱讀

    微軟發(fā)布phi-3AI模型,性能超越GPT-3.5

    微軟稱,帶有38億參數(shù)的phi-3-mini經(jīng)過3.3萬(wàn)億token的強(qiáng)化學(xué)習(xí),其基礎(chǔ)表現(xiàn)已經(jīng)超過Mixtral 8x7B及GPT-3.5;此外,該
    的頭像 發(fā)表于 04-23 14:32 ?546次閱讀

    Meta推出最強(qiáng)開源模型Llama 3 要挑戰(zhàn)GPT

    Meta推出最強(qiáng)開源模型Llama 3 要挑戰(zhàn)GPT Facebook母公司Meta Platforms(META.US)推出了開源
    的頭像 發(fā)表于 04-19 17:00 ?839次閱讀

    為什么GPU適用于AI?AI服務(wù)器產(chǎn)業(yè)鏈格局分析

    GPT模型對(duì)比BERT模型、T5模型參數(shù)量有明顯提升。GPT-3是目前最大的知名語(yǔ)言
    發(fā)表于 04-09 10:38 ?923次閱讀
    為什么GPU適用于<b class='flag-5'>AI</b>?<b class='flag-5'>AI</b>服務(wù)器產(chǎn)業(yè)鏈格局分析

    新火種AI|秒殺GPT-4,狙殺GPT-5,橫空出世的Claude 3振奮人心!

    2024年第一季度才剛過半,AI領(lǐng)域就大動(dòng)作不斷,大家卯著勁的出新品,可謂卷出天際。 ? 3月4日,Anthropic發(fā)布最新的Claude 3系列
    的頭像 發(fā)表于 03-06 22:22 ?650次閱讀
    新火種<b class='flag-5'>AI</b>|秒殺<b class='flag-5'>GPT</b>-4,狙殺<b class='flag-5'>GPT</b>-5,橫空出世的Claude <b class='flag-5'>3</b>振奮人心!

    全球最強(qiáng)大模型易主,GPT-4被超越

    近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic宣布推出全新的Claude 3系列模型,其中包括最強(qiáng)版Claude 3 Opus。據(jù)該公司稱,Claude
    的頭像 發(fā)表于 03-05 09:58 ?661次閱讀

    Anthropic推出Claude 3系列模型,全面超越GPT-4,樹立AI新標(biāo)桿

    近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic震撼發(fā)布全新的Claude 3系列模型,該系列模型在多模態(tài)和語(yǔ)言能力等關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能,成
    的頭像 發(fā)表于 03-05 09:49 ?688次閱讀

    高分工作!Uni3D:3D基礎(chǔ)大模型,刷新多個(gè)SOTA!

    我們主要探索3D視覺中scale up模型參數(shù)量和統(tǒng)一模型架構(gòu)的可能性。在NLP / 2D vision領(lǐng)域,scale up大
    的頭像 發(fā)表于 01-30 15:56 ?886次閱讀
    高分工作!Uni<b class='flag-5'>3</b>D:<b class='flag-5'>3</b>D基礎(chǔ)大<b class='flag-5'>模型</b>,刷新多個(gè)SOTA!

    Rambus HBM3內(nèi)存控制器IP速率達(dá)到9.6 Gbps

    在人工智能大模型浪潮的推動(dòng)下,AI訓(xùn)練數(shù)據(jù)集正極速擴(kuò)增。以ChatGPT為例,去年11月發(fā)布的GPT-3,使用1750億個(gè)參數(shù)構(gòu)建,今年3
    的頭像 發(fā)表于 01-23 11:19 ?987次閱讀
    Rambus HBM<b class='flag-5'>3</b>內(nèi)存控制器IP速率達(dá)到9.6 Gbps