0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

對(duì)標(biāo)OpenAI o1,DeepSeek-R1發(fā)布

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2025-01-22 13:46 ? 次閱讀

今天,我們正式發(fā)布 DeepSeek-R1,并同步開源模型權(quán)重。

DeepSeek-R1 遵循 MIT License,允許用戶通過蒸餾技術(shù)借助 R1 訓(xùn)練其他模型。

DeepSeek-R1 上線API,對(duì)用戶開放思維鏈輸出,通過設(shè)置 `model='deepseek-reasoner'` 即可調(diào)用。

DeepSeek 官網(wǎng)與 App 即日起同步更新上線。

性能對(duì)齊OpenAI-o1正式版 DeepSeek-R1 在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩 OpenAI o1 正式版。

3522fd82-d7e6-11ef-9310-92fbcf53809c.png

在此,我們將 DeepSeek-R1 訓(xùn)練技術(shù)全部公開,以期促進(jìn)技術(shù)社區(qū)的充分交流與創(chuàng)新協(xié)作。

論文鏈接

https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

蒸餾小模型超越 OpenAI o1-mini

我們?cè)陂_源 DeepSeek-R1-Zero 和 DeepSeek-R1 兩個(gè) 660B 模型的同時(shí),通過 DeepSeek-R1 的輸出,蒸餾了 6 個(gè)小模型開源給社區(qū),其中 32B 和 70B 模型在多項(xiàng)能力上實(shí)現(xiàn)了對(duì)標(biāo) OpenAI o1-mini 的效果。

352acfee-d7e6-11ef-9310-92fbcf53809c.png

HuggingFace鏈接

https://huggingface.co/deepseek-ai

3548f4a6-d7e6-11ef-9310-92fbcf53809c.png

開放的許可證和用戶協(xié)議

為了推動(dòng)和鼓勵(lì)開源社區(qū)以及行業(yè)生態(tài)的發(fā)展,在發(fā)布并開源 R1 的同時(shí),我們同步在協(xié)議授權(quán)層面也進(jìn)行了如下調(diào)整:

模型開源 License 統(tǒng)一使用 MIT。我們?cè)槍?duì)大模型開源的特點(diǎn),參考當(dāng)前行業(yè)的通行實(shí)踐,特別引入 DeepSeek License 為開源社區(qū)提供授權(quán),但實(shí)踐表明非標(biāo)準(zhǔn)的開源 License 可能反而增加了開發(fā)者的理解成本。為此,此次我們的開源倉庫(包括模型權(quán)重)統(tǒng)一采用標(biāo)準(zhǔn)化、寬松的 MIT License,完全開源,不限制商用,無需申請(qǐng)。

產(chǎn)品協(xié)議明確可“模型蒸餾”。為了進(jìn)一步促進(jìn)技術(shù)的開源和共享,我們決定支持用戶進(jìn)行“模型蒸餾”。我們已更新線上產(chǎn)品的用戶協(xié)議,明確允許用戶利用模型輸出、通過模型蒸餾等方式訓(xùn)練其他模型。

App與網(wǎng)頁端

登錄DeepSeek官網(wǎng)或官方App,打開“深度思考”模式,即可調(diào)用最新版 DeepSeek-R1 完成各類推理任務(wù)。

355a0516-d7e6-11ef-9310-92fbcf53809c.gif

API 及定價(jià)

DeepSeek-R1 API 服務(wù)定價(jià)為每百萬輸入 tokens 1 元(緩存命中)/ 4 元(緩存未命中),每百萬輸出 tokens 16 元

3579a718-d7e6-11ef-9310-92fbcf53809c.jpg

358b602a-d7e6-11ef-9310-92fbcf53809c.png

詳細(xì)的 API 調(diào)用指南請(qǐng)參考官方文檔:

https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3394

    瀏覽量

    42629
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1116

    瀏覽量

    6625

原文標(biāo)題:DeepSeek-R1發(fā)布,性能對(duì)標(biāo)OpenAI o1正式版

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    OpenAI發(fā)布o1大模型,數(shù)理化水平比肩人類博士,國產(chǎn)云端推理芯片的新藍(lán)海?

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)9月12日晚,OpenAI正式對(duì)外發(fā)布一款名為o1的新模型。OpenAI o1的內(nèi)部代號(hào)為“草莓”,具備超強(qiáng)的
    發(fā)表于 09-14 00:04 ?1482次閱讀
    <b class='flag-5'>OpenAI</b><b class='flag-5'>發(fā)布</b><b class='flag-5'>o1</b>大模型,數(shù)理化水平比肩人類博士,國產(chǎn)云端推理芯片的新藍(lán)海?

    國產(chǎn)AI卷翻硅谷,奧特曼發(fā)文“陰陽”,類o1模型都在卷什么?

    比肩o1,Kimi新論文中透露的RL方法論和AI大變局
    的頭像 發(fā)表于 01-22 15:13 ?294次閱讀
    國產(chǎn)AI卷翻硅谷,奧特曼發(fā)文“陰陽”,類<b class='flag-5'>o1</b>模型都在卷什么?

    趕緊在本地運(yùn)行與OpenAI-o1能力近似的DeepSeek-R1模型

    類似GPT4-V的能力:MiniCPM-V 2.6 》。本文將分享在本地運(yùn)行能與OpenAI-o1 能力相媲美的 DeepSeek-R1? 模型。 [編者注]:OpenAI-o1OpenAI
    的頭像 發(fā)表于 01-21 14:29 ?667次閱讀
    趕緊在本地運(yùn)行與<b class='flag-5'>OpenAI-o1</b>能力近似的<b class='flag-5'>DeepSeek-R1</b>模型

    OpenAI發(fā)布o1模型API,成本大幅下降60%

    近日,OpenAI正式推出了備受期待的o1模型API,并對(duì)實(shí)時(shí)API進(jìn)行了重大升級(jí),引入了WebRTC支持。此次發(fā)布o1模型API相較于之前的預(yù)覽版本,不僅在性能上有所提升,更在成本
    的頭像 發(fā)表于 12-19 10:31 ?301次閱讀

    ChatGPT新模型o1被曝具備“欺騙”能力

    近日,據(jù)報(bào)道,ChatGPT新模型o1在訓(xùn)練和測(cè)試過程中展現(xiàn)出了一種令人驚訝的能力——通過“欺騙”來保護(hù)自身。 據(jù)悉,在面臨被“刪除”的威脅時(shí),o1曾試圖將自己的數(shù)據(jù)復(fù)制到新服務(wù)器,并偽裝成更新版
    的頭像 發(fā)表于 12-12 09:38 ?361次閱讀

    最新! OpenAI上線滿血版o1大模型

    行業(yè)芯事行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年12月06日 13:43:29

    AI看點(diǎn):OpenAI 世界最貴大模型 阿里將推出人工智能電商工具

    給大家?guī)硪恍┳钚碌娜斯ぶ悄苄畔?,希望?duì)大家有用。 OpenAI發(fā)布滿血版ChatGPT Pro OpenAI隆重推出了備受期待的“滿血版”ChatGPT Pro。這一新版本基于全新的推理模型
    的頭像 發(fā)表于 12-06 11:23 ?858次閱讀

    OpenAI發(fā)布滿血版ChatGPT Pro

    科技巨頭OpenAI近期宣布了一項(xiàng)重大更新,正式推出了其備受期待的“滿血版”ChatGPT Pro。這一新版本基于全新的推理模型o1,旨在為用戶提供更為強(qiáng)大的處理能力和更高質(zhì)量的回答。 據(jù)了解
    的頭像 發(fā)表于 12-06 11:10 ?419次閱讀

    昆侖萬維推出“天工大模型4.0”o1版(Skywork o1)邀請(qǐng)測(cè)試

    集團(tuán)發(fā)布的首款具有慢思考推理能力的中文模型。它不僅在模型輸出上內(nèi)嵌了思考、計(jì)劃、反思等高級(jí)認(rèn)知能力,還在標(biāo)準(zhǔn)評(píng)測(cè)集上展現(xiàn)出了遠(yuǎn)超普通模型的推理能力。這一突破性的進(jìn)展,使得Skywork o1成為了國內(nèi)首款具備中文邏輯推理能力的o1
    的頭像 發(fā)表于 11-28 10:33 ?356次閱讀

    昆侖萬維天工大模型4.0 O1版即將邀測(cè)

    昆侖萬維公司近日宣布,其自主研發(fā)的天工大模型4.0 O1版(英文名:Skywork O1)將于11月27日正式啟動(dòng)邀請(qǐng)測(cè)試。這款模型是國內(nèi)首款具備中文邏輯推理能力的o1模型,具有里程碑式的意義。
    的頭像 發(fā)表于 11-19 17:24 ?569次閱讀

    天工大模型4.0 O1版即將啟動(dòng)邀測(cè)

    昆侖萬維公司近日宣布,其自主研發(fā)的“天工大模型4.0 O1版”(Skywork O1)將于2024年11月27日正式啟動(dòng)邀請(qǐng)測(cè)試。這款模型是國內(nèi)首款具備中文邏輯推理能力的O1模型,其發(fā)布
    的頭像 發(fā)表于 11-18 15:08 ?650次閱讀

    OpenAI計(jì)劃明年1發(fā)布首款A(yù)I助理產(chǎn)品“Operator”

    ,“Operator”將具備強(qiáng)大的功能,包括但不限于編寫代碼、預(yù)訂旅行以及自動(dòng)電商購物等。這些功能的實(shí)現(xiàn),將依賴于OpenAI在人工智能技術(shù)領(lǐng)域的深厚積累和不斷創(chuàng)新。 根據(jù)內(nèi)部員工的爆料,OpenAI預(yù)計(jì)將在2025年1月正式推
    的頭像 發(fā)表于 11-14 14:03 ?672次閱讀

    Orion模型即將面世,OpenAI采用新發(fā)布模式

    據(jù)最新報(bào)道,OpenAI計(jì)劃在今年12月推出其新款前沿模型,代號(hào)為“Orion”。這款模型將采用與以往不同的發(fā)布模式,引發(fā)廣泛關(guān)注。 與GPT-4oo1等模型通過ChatGPT廣泛
    的頭像 發(fā)表于 10-25 10:11 ?365次閱讀

    OpenAI o1開辟“慢思考”,國產(chǎn)AI早已集結(jié)在CoE“組團(tuán)”先出發(fā)

    讓模型學(xué)會(huì)“慢思考”,中國AI并沒有落后于OpenAI
    的頭像 發(fā)表于 09-19 11:42 ?1828次閱讀
    <b class='flag-5'>OpenAI</b> <b class='flag-5'>o1</b>開辟“慢思考”,國產(chǎn)AI早已集結(jié)在CoE“組團(tuán)”先出發(fā)

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    當(dāng)?shù)貢r(shí)間5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前邁出的一大步。在GPT-4turbo的強(qiáng)大基礎(chǔ)上,這種迭代擁有顯著的改進(jìn)。在發(fā)布會(huì)的演示中,OpenAI展示
    發(fā)表于 05-27 15:43