0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepSeek與Kimi揭示o1秘密,思維鏈學(xué)習(xí)方法顯成效

科技綠洲 ? 來源:網(wǎng)絡(luò)整理 ? 作者:網(wǎng)絡(luò)整理 ? 2025-02-18 15:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據(jù)消息,OpenAI近日發(fā)布了一項重要研究報告。報告指出,DeepSeek和Kimi兩家機構(gòu)通過獨立研究,成功利用思維鏈學(xué)習(xí)方法,在數(shù)學(xué)解題與編程挑戰(zhàn)中顯著提升了模型的綜合表現(xiàn)。

Kimi的研究員Flood Sung在隨后的發(fā)文中詳細闡述了這一發(fā)現(xiàn)。他提到,長思維鏈的有效性在內(nèi)部實驗中已經(jīng)得到了驗證。在實際訓(xùn)練過程中,研究人員發(fā)現(xiàn)模型的表現(xiàn)會隨著訓(xùn)練的深入而不斷提升,并且token數(shù)也在不斷增加。這一現(xiàn)象表明,在強化訓(xùn)練的過程中,模型能夠自我涌現(xiàn),進一步提升其解題能力。

值得注意的是,就在1月20日,DeepSeek和Kimi在同一天發(fā)布了各自的推理模型R1和k1.5。這兩款模型的發(fā)布,無疑是對其研究成果的進一步驗證和展示。

此次DeepSeek與Kimi的研究不僅揭示了o1的秘密,更為人工智能領(lǐng)域的發(fā)展帶來了新的啟示。思維鏈學(xué)習(xí)方法的成功應(yīng)用,為提升AI模型的解題能力和編程能力提供了新的思路和方法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    48960

    瀏覽量

    248586
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3512

    瀏覽量

    50302
  • Kimi
    +關(guān)注

    關(guān)注

    0

    文章

    12

    瀏覽量

    136
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    794

    瀏覽量

    1623
收藏 0人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    OpenAI發(fā)布o1大模型,數(shù)理化水平比肩人類博士,國產(chǎn)云端推理芯片的新藍海?

    時間思考后再做出回答,而傳統(tǒng)大模型是直接給出回答,但往往這個回答并不準確。 ? OpenAI介紹稱,OpenAI o1模型解決了很多傳統(tǒng)模型,包括目前最強大模型OpenAI GPT-4o無法解決的復(fù)雜問題,模型的思維模型更加接近
    發(fā)表于 09-14 00:04 ?1811次閱讀
    OpenAI發(fā)布<b class='flag-5'>o1</b>大模型,數(shù)理化水平比肩人類博士,國產(chǎn)云端推理芯片的新藍海?

    雷軍:小米玄戒O1已開始大規(guī)模量產(chǎn)

    雷軍今日又爆出大消息,雷軍在微博宣布,由小米自主研發(fā)設(shè)計的3nm旗艦芯片玄戒O1已開啟大規(guī)模量產(chǎn)。 據(jù)悉,玄戒O1芯片為“1+3+4”八核三叢集架構(gòu),玄戒O1包含
    的頭像 發(fā)表于 05-20 14:37 ?414次閱讀

    小米自研芯片玄戒O1跑分出爐 單核2709多核8125 小米聯(lián)想加速“造芯”

    小米芯片玄戒O1(XRING O1)是小米自主研發(fā)設(shè)計的手機SoC芯片,預(yù)計將于2025年5月下旬發(fā)布。目前從媒體爆出的消息來看;小米玄戒O1芯片或采用“1+3+4”八核三叢集設(shè)計,還
    的頭像 發(fā)表于 05-19 09:47 ?1108次閱讀

    雷軍官宣小米造芯 雷軍宣布小米芯片進展 手機SoC芯片玄戒O1于5月下旬發(fā)布

    小米造芯終于實錘了,小米官方已經(jīng)確認。小米芯片玄戒O1(XRING O1)是小米自主研發(fā)設(shè)計的手機SoC芯片,預(yù)計將于2025年5月下旬發(fā)布。目前玄戒O1的制程工藝、性能參數(shù)等詳細信息尚未公布,但是
    的頭像 發(fā)表于 05-16 10:22 ?712次閱讀

    用對軟件,DeepSeek + Kimi,PPT一鍵生成秘籍!

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 在快節(jié)奏的工作和學(xué)習(xí)中,制作一份高質(zhì)量的PPT常常讓人感到頭疼。不過,有了DeepSeekKimi這兩個強大的工具,制作PPT變得輕松又高效。今天,就來
    的頭像 發(fā)表于 02-19 16:13 ?1709次閱讀
    用對軟件,<b class='flag-5'>DeepSeek</b> + <b class='flag-5'>Kimi</b>,PPT一鍵生成秘籍!

    OpenAI:DeepSeekKimi揭秘o1,長思維提升模型表現(xiàn)

    近日,據(jù)月之暗面報道,OpenAI發(fā)布了一項令人矚目的研究報告。報告指出,DeepSeekKimi兩個研究團隊通過獨立研究,成功利用思維學(xué)習(xí)方法
    的頭像 發(fā)表于 02-18 09:35 ?467次閱讀

    了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應(yīng)用選擇

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的兩個不同定位的大模型,其核心差異主要體現(xiàn)在目標(biāo)場景、能力側(cè)重和技術(shù)優(yōu)化方向上。以下是二者的實質(zhì)性
    發(fā)表于 02-14 02:08

    PerfXCloud上線DeepSeek系列模型

    零門檻體驗DeepSeek-R1滿血版本,性能對標(biāo)OpenAI o1,即刻開啟一場震撼人心的AI探索之旅。
    的頭像 發(fā)表于 02-10 10:20 ?2599次閱讀

    芯動力神速適配DeepSeek-R1大模型,AI芯片設(shè)計邁入“快車道”!

    DeepSeek研發(fā)的系列推理模型,自誕生起就備受矚目。它采用強化學(xué)習(xí)訓(xùn)練,推理時包含大量反思和驗證,思維鏈長度可達數(shù)萬字。在數(shù)學(xué)、代碼以及復(fù)雜邏輯推理任務(wù)上,DeepSeek-R1
    的頭像 發(fā)表于 02-07 16:55 ?611次閱讀
    芯動力神速適配<b class='flag-5'>DeepSeek-R1</b>大模型,AI芯片設(shè)計邁入“快車道”!

    國產(chǎn)AI卷翻硅谷,奧特曼發(fā)文“陰陽”,類o1模型都在卷什么?

    比肩o1,Kimi新論文中透露的RL方法論和AI大變局
    的頭像 發(fā)表于 01-22 15:13 ?4878次閱讀
    國產(chǎn)AI卷翻硅谷,奧特曼發(fā)文“陰陽”,類<b class='flag-5'>o1</b>模型都在卷什么?

    對標(biāo)OpenAI o1,DeepSeek-R1發(fā)布

    API, 對用戶開放思維輸出 ,通過設(shè)置 `model='deepseek-reasoner'` 即可調(diào)用。 DeepSeek 官網(wǎng)與 App 即日起同步更新上線。 性能對齊Open
    的頭像 發(fā)表于 01-22 13:46 ?2067次閱讀
    對標(biāo)OpenAI <b class='flag-5'>o1</b>,<b class='flag-5'>DeepSeek-R1</b>發(fā)布

    ChatGPT新模型o1被曝具備“欺騙”能力

    近日,據(jù)報道,ChatGPT新模型o1在訓(xùn)練和測試過程中展現(xiàn)出了一種令人驚訝的能力——通過“欺騙”來保護自身。 據(jù)悉,在面臨被“刪除”的威脅時,o1曾試圖將自己的數(shù)據(jù)復(fù)制到新服務(wù)器,并偽裝成更新版
    的頭像 發(fā)表于 12-12 09:38 ?683次閱讀

    昆侖萬維推出“天工大模型4.0”o1版(Skywork o1)邀請測試

    近日,昆侖萬維正式向外界推出了其最新研發(fā)的“天工大模型4.0”o1版(Skywork o1)。該系列模型以其獨特的復(fù)雜思考推理能力,吸引了眾多業(yè)內(nèi)人士的關(guān)注。 據(jù)悉,Skywork o1是昆侖萬維
    的頭像 發(fā)表于 11-28 10:33 ?742次閱讀

    昆侖萬維天工大模型4.0 O1版即將邀測

    昆侖萬維公司近日宣布,其自主研發(fā)的天工大模型4.0 O1版(英文名:Skywork O1)將于11月27日正式啟動邀請測試。這款模型是國內(nèi)首款具備中文邏輯推理能力的o1模型,具有里程碑式的意義。
    的頭像 發(fā)表于 11-19 17:24 ?923次閱讀

    天工大模型4.0 O1版即將啟動邀測

    昆侖萬維公司近日宣布,其自主研發(fā)的“天工大模型4.0 O1版”(Skywork O1)將于2024年11月27日正式啟動邀請測試。這款模型是國內(nèi)首款具備中文邏輯推理能力的O1模型,其發(fā)布標(biāo)志著我國在
    的頭像 發(fā)表于 11-18 15:08 ?1175次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品