0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Dolly 2.0發(fā)布,首個(gè)真正開放、可商用的指令調(diào)優(yōu)LLM

OSC開源社區(qū) ? 來(lái)源:OSC開源社區(qū) ? 2023-04-14 09:33 ? 次閱讀

Databricks 發(fā)布了 Dolly 2.0,這是該公司于兩周前發(fā)布的一種訓(xùn)練成本不到 30 美元,類似 ChatGPT 的大型語(yǔ)言模型 (LLM) Dolly 的改進(jìn)版本。公告稱,Dolly 2.0 是第一個(gè)開源的指令跟隨型語(yǔ)言模型,它在人類生成的指令數(shù)據(jù)集上進(jìn)行了微調(diào),可用于研究和商業(yè)用途。

根據(jù)介紹,Dolly 1.0 使用了斯坦福大學(xué) Alpaca 團(tuán)隊(duì)使用 OpenAI API 創(chuàng)建的數(shù)據(jù)集進(jìn)行訓(xùn)練;該數(shù)據(jù)集包含 ChatGPT 的輸出,而其服務(wù)條款試圖阻止任何人創(chuàng)建與 OpenAI 競(jìng)爭(zhēng)的模型。因此,Dolly 1.0 并不能用于商業(yè)用途。且據(jù)已知信息,目前所有現(xiàn)有的知名指令跟隨模型 (Alpaca, Koala, GPT4All, Vicuna) 都受到此限制,禁止商業(yè)使用。為了解決這個(gè)難題,Databricks 于是決定創(chuàng)建一個(gè)沒(méi)有商業(yè)用途限制的新數(shù)據(jù)集。

977c4384-d9e7-11ed-bfe3-dac502259ad0.png

Dolly 2.0 是一個(gè)基于 EleutherAI pythia 模型系列的 12B 參數(shù)語(yǔ)言模型,并在透明且免費(fèi)提供的數(shù)據(jù)集上進(jìn)行了微調(diào);該數(shù)據(jù)集稱為 databricks-dolly-15k,也已開源發(fā)布。Databricks 表示,他們正在開源整個(gè) Dolly 2.0,包括訓(xùn)練代碼、數(shù)據(jù)集和模型權(quán)重,所有這些都適合商業(yè)使用。這意味著任何組織都可以創(chuàng)建、擁有和定制強(qiáng)大的 LLM,這些 LLM 可以與人們交談,而無(wú)需支付 API 訪問(wèn)費(fèi)用或與第三方共享數(shù)據(jù)。

databricks-dolly-15k 包含來(lái)自數(shù)千名 Databricks 員工的 15,000 個(gè)高質(zhì)量的人工生成的提示 / 響應(yīng)對(duì),專為指令調(diào)優(yōu)大型語(yǔ)言模型而設(shè)計(jì)。且 databricks-dolly-15k 根據(jù)(Creative Commons Attribution-ShareAlike 3.0 Unported License)的許可條款,任何人都可以出于任何目的使用、修改或擴(kuò)展此數(shù)據(jù)集,包括商業(yè)應(yīng)用程序。

Databricks 稱這是 “第一個(gè)開源的、人工生成的指令語(yǔ)料庫(kù),專門設(shè)計(jì)用于讓大型語(yǔ)言能夠展示 ChatGPT 的神奇交互性”。并補(bǔ)充到,雖然 databricks-dolly-15k 比訓(xùn)練 Dolly 1.0 的數(shù)據(jù)集 Alpaca 小得多,但基于 EleutherAI 的 pythia-12b 生成的 Dolly 2.0 模型表現(xiàn)出高質(zhì)量的指令遵循行為。另一方面, databricks-dolly-15k 是由專業(yè)人士生成的、質(zhì)量很高,并且包含對(duì)大多數(shù)任務(wù)的長(zhǎng)篇答案。

Databricks 表示,他們并沒(méi)有期望 Dolly 在有效性方面達(dá)到最先進(jìn)水平。但確實(shí)希望 Dolly 和開源數(shù)據(jù)集將成為大量后續(xù)工作的種子,“這可能有助于引導(dǎo)出更強(qiáng)大的語(yǔ)言模型”。

“我們還認(rèn)為,偏見(jiàn)、問(wèn)責(zé)制和人工智能安全等重要問(wèn)題應(yīng)該由不同利益相關(guān)者組成的廣泛社區(qū)來(lái)解決,而不僅僅是少數(shù)大公司。開源數(shù)據(jù)集和模型鼓勵(lì)評(píng)論、研究和創(chuàng)新,這將有助于確保每個(gè)人都能從人工智能技術(shù)的進(jìn)步中受益?!?/p>

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47532

    瀏覽量

    239278
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    533

    瀏覽量

    10303
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1208

    瀏覽量

    24754
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    0

    文章

    297

    瀏覽量

    359

原文標(biāo)題:Dolly 2.0發(fā)布,首個(gè)真正開放、可商用的指令調(diào)優(yōu)LLM

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    MCF8316A調(diào)優(yōu)指南

    電子發(fā)燒友網(wǎng)站提供《MCF8316A調(diào)優(yōu)指南.pdf》資料免費(fèi)下載
    發(fā)表于 11-20 17:21 ?0次下載
    MCF8316A<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>指南

    MCT8316A調(diào)優(yōu)指南

    電子發(fā)燒友網(wǎng)站提供《MCT8316A調(diào)優(yōu)指南.pdf》資料免費(fèi)下載
    發(fā)表于 11-13 13:49 ?0次下載
    MCT8316A<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>指南

    MCT8315A調(diào)優(yōu)指南

    電子發(fā)燒友網(wǎng)站提供《MCT8315A調(diào)優(yōu)指南.pdf》資料免費(fèi)下載
    發(fā)表于 11-12 14:14 ?1次下載
    MCT8315A<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>指南

    谷歌計(jì)劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計(jì)劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因?yàn)楣雀柙谌斯ぶ悄茴I(lǐng)域一直保持著領(lǐng)先地位,而Gemini系列模型更是其重要的產(chǎn)品之一。
    的頭像 發(fā)表于 10-29 11:02 ?682次閱讀

    MMC DLL調(diào)優(yōu)

    電子發(fā)燒友網(wǎng)站提供《MMC DLL調(diào)優(yōu).pdf》資料免費(fèi)下載
    發(fā)表于 10-11 11:48 ?0次下載
    MMC DLL<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>

    TDA3xx ISS調(diào)優(yōu)和調(diào)試基礎(chǔ)設(shè)施

    電子發(fā)燒友網(wǎng)站提供《TDA3xx ISS調(diào)優(yōu)和調(diào)試基礎(chǔ)設(shè)施.pdf》資料免費(fèi)下載
    發(fā)表于 10-11 10:16 ?0次下載
    TDA3xx ISS<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>和調(diào)試基礎(chǔ)設(shè)施

    智能調(diào)優(yōu),使步進(jìn)電機(jī)安靜而高效地運(yùn)行

    電子發(fā)燒友網(wǎng)站提供《智能調(diào)優(yōu),使步進(jìn)電機(jī)安靜而高效地運(yùn)行.pdf》資料免費(fèi)下載
    發(fā)表于 09-24 11:08 ?1次下載
    智能<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>,使步進(jìn)電機(jī)安靜而高效地運(yùn)行

    MMC SW調(diào)優(yōu)算法

    電子發(fā)燒友網(wǎng)站提供《MMC SW調(diào)優(yōu)算法.pdf》資料免費(fèi)下載
    發(fā)表于 09-20 11:14 ?0次下載
    MMC SW<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>算法

    TAS58xx系列通用調(diào)優(yōu)指南

    電子發(fā)燒友網(wǎng)站提供《TAS58xx系列通用調(diào)優(yōu)指南.pdf》資料免費(fèi)下載
    發(fā)表于 09-14 10:49 ?0次下載
    TAS58xx系列通用<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>指南

    AM6xA ISP調(diào)優(yōu)指南

    電子發(fā)燒友網(wǎng)站提供《AM6xA ISP調(diào)優(yōu)指南.pdf》資料免費(fèi)下載
    發(fā)表于 09-07 09:52 ?0次下載
    AM6xA ISP<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>指南

    OpenAI新研究:指令層次結(jié)構(gòu)防御LLM攻擊策略

    為了解決這個(gè)問(wèn)題,這篇研究提出了一種指令層次結(jié)構(gòu)(instruction hierarchy)。它明確定義了不同指令的優(yōu)先級(jí),以及當(dāng)不同優(yōu)先級(jí)的指令發(fā)生沖突時(shí),LLM應(yīng)該如何表現(xiàn)。
    發(fā)表于 04-28 10:41 ?352次閱讀
    OpenAI新研究:<b class='flag-5'>指令</b>層次結(jié)構(gòu)防御<b class='flag-5'>LLM</b>攻擊策略

    深度解析JVM調(diào)優(yōu)實(shí)踐應(yīng)用

    Tomcat自身的調(diào)優(yōu)是針對(duì)conf/server.xml中的幾個(gè)參數(shù)的調(diào)優(yōu)設(shè)置。首先是對(duì)這幾個(gè)參數(shù)的含義要有深刻而清楚的理解。
    的頭像 發(fā)表于 04-01 10:24 ?499次閱讀
    深度解析JVM<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>實(shí)踐應(yīng)用

    鴻蒙開發(fā)實(shí)戰(zhàn):【性能調(diào)優(yōu)組件】

    性能調(diào)優(yōu)組件包含系統(tǒng)和應(yīng)用調(diào)優(yōu)框架,旨在為開發(fā)者提供一套性能調(diào)優(yōu)平臺(tái),可以用來(lái)分析內(nèi)存、性能等問(wèn)
    的頭像 發(fā)表于 03-13 15:12 ?476次閱讀
    鴻蒙開發(fā)實(shí)戰(zhàn):【性能<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>組件】

    QE for Motor V1.3.0發(fā)布說(shuō)明

    電子發(fā)燒友網(wǎng)站提供《QE for Motor V1.3.0發(fā)布說(shuō)明.pdf》資料免費(fèi)下載
    發(fā)表于 02-19 09:35 ?0次下載
    QE for Motor V1.3.0<b class='flag-5'>發(fā)布</b>說(shuō)明

    e2 studio 2024-01發(fā)布說(shuō)明

    電子發(fā)燒友網(wǎng)站提供《e2 studio 2024-01發(fā)布說(shuō)明.pdf》資料免費(fèi)下載
    發(fā)表于 01-30 09:47 ?1次下載
    e2 studio 2024-01<b class='flag-5'>發(fā)布</b>說(shuō)明