0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一套開源的大型語言模型(LLM)—— StableLM

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2023-04-24 10:07 ? 次閱讀

Stability AI 是 Stable Diffusion 圖像生成工具背后的公司,如今他們不再局限于開發(fā)圖像 / 視頻生成方面的 AI,于今天正式發(fā)布了一套開源的大型語言模型(LLM)—— StableLM,首次涉足目前由 OpenAI、Meta 和 Google 等科技公司主導(dǎo)的語言模型領(lǐng)域。

StableLM 跟 ChatGPT、Bard 這些一樣,被設(shè)計(jì)用來生成文本和代碼。它是通過使用開源數(shù)據(jù)集 the Pile 訓(xùn)練而來的,這個(gè)數(shù)據(jù)集包含的數(shù)據(jù)來源就有維基百科、Stack Exchange 和 PubMed。不過,Stability AI 在 the Pile 的基礎(chǔ)上進(jìn)行了擴(kuò)展,所使用的數(shù)據(jù)集大小是標(biāo)準(zhǔn) the Pile 的 3 倍。

Stability AI 現(xiàn)在已經(jīng)將這個(gè) StableLM 模型發(fā)布到了 GitHub 上,開發(fā)者可以使用或經(jīng)過調(diào)整后再使用。StableLM 模型還處于 Alpha 階段,它的參數(shù)也比較少,只有 30 億和 70 億個(gè)參數(shù),之后他們還會(huì)推出有 150 億到 650 億參數(shù)的模型。

e9cfbea8-df9c-11ed-bfe3-dac502259ad0.png

對(duì)于 AI 可能會(huì)產(chǎn)生的風(fēng)險(xiǎn),Stability AI 也給出了提醒:

對(duì)于任何沒有額外微調(diào)和強(qiáng)化學(xué)習(xí)的預(yù)訓(xùn)練大型語言模型來說,用戶得到的回應(yīng)質(zhì)量可能參差不齊,并且可能包括冒犯性的語言和觀點(diǎn)。這有望隨著規(guī)模、更好的數(shù)據(jù)、社區(qū)反饋和優(yōu)化而得到改善。

e9ff4f24-df9c-11ed-bfe3-dac502259ad0.jpg

除了將代碼托管在 GitHub 上,Stability AI 還在 Hugging Face 上發(fā)布了一個(gè)演示版本,經(jīng)過測(cè)試 StableLM 會(huì)說中文,但只會(huì)一點(diǎn)點(diǎn)(回復(fù)內(nèi)容對(duì)應(yīng)不上,語句也不通順)。

ea1836ba-df9c-11ed-bfe3-dac502259ad0.png

在 Stable Diffusion 發(fā)布后,Stability AI 遭到了很多藝術(shù)家的投訴和起訴,指控它通過使用網(wǎng)絡(luò)抓取的受版權(quán)保護(hù)的圖像開發(fā) AI 圖像生成工具,侵犯了藝術(shù)家們的權(quán)利。在之前的糾紛還沒解決的情況下,如今推出 StableLM 不知道是否還會(huì)引發(fā)更多的訴訟。

Stability AI 在去年 10 月融資了 1 億美元,公司估值也超過了 10 億美元。但 AI 是一個(gè)投入非常高,可能短期也很難產(chǎn)生收益的領(lǐng)域,也不知道這 1 億美金現(xiàn)在還剩多少,為了在這個(gè)領(lǐng)域持續(xù)發(fā)展,Stability AI 會(huì)不會(huì)繼續(xù)融資,亦或是投入某個(gè)大型公司的懷抱呢?

項(xiàng)目地址:https://github.com/Stability-AI/StableLM

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    524

    瀏覽量

    10277
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1208

    瀏覽量

    24703
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    471

    瀏覽量

    16448
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    0

    文章

    288

    瀏覽量

    338

原文標(biāo)題:AI作畫鼻祖Stability AI推出大型語言模型,會(huì)一點(diǎn)點(diǎn)中文

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    什么是LLM?LLM在自然語言處理中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,自然語言處理(NLP)領(lǐng)域迎來了革命性的進(jìn)步。其中,大型語言模型LLM)的出現(xiàn),標(biāo)志著我們對(duì)
    的頭像 發(fā)表于 11-19 15:32 ?584次閱讀

    如何訓(xùn)練自己的LLM模型

    訓(xùn)練自己的大型語言模型LLM)是個(gè)復(fù)雜且資源密集的過程,涉及到大量的數(shù)據(jù)、計(jì)算資源和專業(yè)知識(shí)。以下是訓(xùn)練
    的頭像 發(fā)表于 11-08 09:30 ?549次閱讀

    LLM模型推理加速的關(guān)鍵技術(shù)

    LLM大型語言模型)大模型推理加速是當(dāng)前人工智能領(lǐng)域的個(gè)研究熱點(diǎn),旨在提高
    的頭像 發(fā)表于 07-24 11:38 ?896次閱讀

    基于CPU的大型語言模型推理實(shí)驗(yàn)

    隨著計(jì)算和數(shù)據(jù)處理變得越來越分散和復(fù)雜,AI 的重點(diǎn)正在從初始訓(xùn)練轉(zhuǎn)向更高效的AI 推理。Meta 的 Llama3 是功能強(qiáng)大的公開可用的大型語言模型LLM)。本次測(cè)試采用
    的頭像 發(fā)表于 07-18 14:28 ?548次閱讀
    基于CPU的<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>推理實(shí)驗(yàn)

    富士通與Cohere合作,專注于開發(fā)和提供大型語言模型(LLM)

    富士通(Fujitsu)與總部位于多倫多與舊金山的頂尖安全及數(shù)據(jù)隱私人工智能企業(yè)Cohere Inc.攜手宣布建立深度戰(zhàn)略合作伙伴關(guān)系,共同致力于大型語言模型LLM)的創(chuàng)新與開發(fā),旨
    的頭像 發(fā)表于 07-16 16:55 ?493次閱讀

    llm模型本地部署有用嗎

    在當(dāng)今的人工智能領(lǐng)域,LLM(Large Language Model,大型語言模型)已經(jīng)成為了種非常受歡迎的技術(shù)。它們?cè)谧匀?/div>
    的頭像 發(fā)表于 07-09 10:14 ?495次閱讀

    llm模型訓(xùn)練般用什么系統(tǒng)

    LLM(Large Language Model,大型語言模型)是近年來在自然語言處理領(lǐng)域取得顯著成果的
    的頭像 發(fā)表于 07-09 10:02 ?413次閱讀

    llm模型有哪些格式

    LLM(Large Language Model,大型語言模型)是種深度學(xué)習(xí)模型,主要用于處理
    的頭像 發(fā)表于 07-09 09:59 ?625次閱讀

    llm模型和chatGPT的區(qū)別

    LLM(Large Language Model)是指大型語言模型,它們是類使用深度學(xué)習(xí)技術(shù)構(gòu)建的自然
    的頭像 發(fā)表于 07-09 09:55 ?1074次閱讀

    LLM模型的應(yīng)用領(lǐng)域

    在本文中,我們將深入探討LLM(Large Language Model,大型語言模型)的應(yīng)用領(lǐng)域。LLM
    的頭像 發(fā)表于 07-09 09:52 ?601次閱讀

    英偉達(dá)開源Nemotron-4 340B系列模型,助力大型語言模型訓(xùn)練

    近日,英偉達(dá)宣布開源款名為Nemotron-4 340B的大型模型,這壯舉為開發(fā)者們打開了通往高性能大型
    的頭像 發(fā)表于 06-17 14:53 ?568次閱讀

    語言模型(LLM)快速理解

    自2022年,ChatGPT發(fā)布之后,大語言模型(LargeLanguageModel),簡(jiǎn)稱LLM掀起了波狂潮。作為學(xué)習(xí)理解LLM的開始
    的頭像 發(fā)表于 06-04 08:27 ?983次閱讀
    大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>(<b class='flag-5'>LLM</b>)快速理解

    LLM之外的性價(jià)比之選,小語言模型

    。然而在些對(duì)實(shí)時(shí)性要求較高的應(yīng)用中,比如AI客服、實(shí)時(shí)數(shù)據(jù)分析等,大語言模型并沒有太大的優(yōu)勢(shì)。 ? 在動(dòng)輒萬億參數(shù)的LLM下,硬件需求已經(jīng)遭受了不小的挑戰(zhàn)。所以面對(duì)
    的頭像 發(fā)表于 06-03 05:15 ?2237次閱讀
    <b class='flag-5'>LLM</b>之外的性價(jià)比之選,小<b class='flag-5'>語言</b><b class='flag-5'>模型</b>

    了解大型語言模型 (LLM) 領(lǐng)域中的25個(gè)關(guān)鍵術(shù)語

    1.LLM(大語言模型大型語言模型(LLMs)是先進(jìn)的人工智能系統(tǒng),經(jīng)過大量文本數(shù)據(jù)集的訓(xùn)練,
    的頭像 發(fā)表于 05-10 08:27 ?1263次閱讀
    了解<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b> (<b class='flag-5'>LLM</b>) 領(lǐng)域中的25個(gè)關(guān)鍵術(shù)語

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM
    的頭像 發(fā)表于 04-28 10:36 ?567次閱讀