0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

商湯科技推出“日日新”融合大模型

商湯科技SenseTime ? 來源:商湯科技SenseTime ? 2025-01-10 15:59 ? 次閱讀

今年大模型還要如何進化,還有怎樣的想象空間?

剛剛,商湯正式推出“日日新”融合大模型,領先實現(xiàn)原生融合模態(tài),深度推理能力與多模態(tài)信息處理能力均大幅提升,并在兩大權威評測榜單奪得第一,成為“雙冠王”。

國內權威大模型測評機構SuperCLUE最新發(fā)布的《中文大模型基準測評2024年度報告》:商湯“日日新”融合大模型以總分68.3的優(yōu)異成績,與 DeepSeek V3 一起并列國內榜首,成為年度第一。

在近期另一個權威綜合評測機構OpenCompass的多模態(tài)評測中,商湯以同一款模型同樣取得了榜單第一,分數(shù)大幅領先GPT-4o。

“一個模型、雙料冠軍”,意味著商湯科技率先在原生融合模態(tài)訓練取得實質性突破,這將引領業(yè)界從大語言模型和多模態(tài)大模型分立的普遍現(xiàn)狀,走向真正意義的模型一統(tǒng)。

商湯“日日新”突破了模態(tài)融合的技術,跨越了模態(tài)之間的鴻溝,就為深度推理能力和多模態(tài)信息的結合鋪平了道路。

文理兼修,能寫能看能推理

商湯“日日新”融合大模型性能上文理兼修,在SuperCLUE年度評測中,文科成績以81.8分位列全球第一,超越OpenAI的o1模型;理科成績奪得金牌,其中計算維度以78.2分位列國內第一。

實現(xiàn)原生模態(tài)融合后,“日日新”融合大模型不止能達到人類“看”和“想”的水平,還可以幫助你解決更多復雜問題,看不清的字體、數(shù)據圖表里的信息、文學創(chuàng)作與撰寫……這些都可以實現(xiàn)。

融合模態(tài)開拓應用新維度

在實際應用場景中,相較于傳統(tǒng)大語言模型僅支持單一文本輸入的模式,"日日新"融合大模型展現(xiàn)出顯著優(yōu)勢,尤其是在自動駕駛、視頻交互、辦公教育、金融、園區(qū)管理、工業(yè)制造等天然擁有豐富模態(tài)信息的場景中。

“日日新"融合大模型能夠有效滿足用戶對圖像、視頻、語音、文本等多源異構信息的綜合處理與識別需求。

例如,在辦公、金融領域,其行業(yè)屬性擁有很多復雜的富模態(tài)文檔:表格、文本、圖片、視頻,以及融合上述形式的豐富信息,基于“日日新”融合大模型的商湯應用——辦公小浣熊就可以高效地完成處理分析相關的復雜任務。

與此同時,基于融合大模型的優(yōu)勢,商湯“日日新”在視覺交互上也有豐富的應用場景,例如,在線上教育、語音客服等場景,均可以結合語音和自然語言來提升交互體驗。

去年年底開始,原生多模態(tài)大模型就逐漸成為業(yè)內探討的重要方向。然而由于數(shù)據和訓練方法的局限,業(yè)內很多機構的嘗試并不成功——多模態(tài)訓練過程往往會導致純語言任務尤其是指令跟隨和推理任務的性能嚴重下降。

得益于在計算機視覺領域十年深耕以及人工智能賦能場景的豐富經驗,商湯一直堅信多模態(tài)模型是 AI 2.0 進行場景落地的必由之路,對于多模態(tài)大模型的研發(fā)也有自己的獨特見解。在推動語言模型和多模態(tài)模型融合的過程中,發(fā)展出兩項關鍵的創(chuàng)新技術:融合模態(tài)數(shù)據合成與融合任務增強訓練,進而完成“日日新”融合大模型的訓練,推向市場。

在預訓練階段,商湯不僅采用了天然存在的海量圖文交錯數(shù)據,還通過逆渲染、基于混合語義的圖像生成等方法合成了大量融合模態(tài)數(shù)據,在圖文模態(tài)之間建立起大量交互橋梁,使得模型基座對于模態(tài)之間的豐富關系有更扎實的掌握,也為更好地完成跨模態(tài)任務打下堅實的基礎,從而實現(xiàn)整體性能的提升。

在后訓練階段,商湯基于對廣泛業(yè)務場景的認知,構建了大量的跨模態(tài)任務,包括視頻交互、多模態(tài)文檔分析、城市場景理解、車載場景理解等。通過把這些任務融入到增強訓練的過程,商湯的融合模態(tài)模型不僅被激發(fā)出強大的對多模態(tài)信息進行整合理解分析的能力,而且還形成了對業(yè)務場景有效的響應能力,走通了應用落地反哺基礎模型迭代的閉環(huán)。

實現(xiàn)多模態(tài)交互與深度融合、走向真正意義的模型一統(tǒng),是走向世界模型的必經之路,商湯科技已在該賽道實現(xiàn)領跑優(yōu)勢。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1804

    文章

    48677

    瀏覽量

    246276
  • 商湯科技
    +關注

    關注

    8

    文章

    552

    瀏覽量

    36641
  • 大模型
    +關注

    關注

    2

    文章

    3020

    瀏覽量

    3801

原文標題:商湯推出“日日新”融合大模型,勇奪“雙冠王”

文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦
    熱點推薦

    商湯科技日日新V6大模型斬獲“雙料第一” 一項國內榜首,一個全球第一

    衛(wèi)冕“雙冠”! 通用語言能力并列國內榜首、多模態(tài)能力全球最強,商湯日日新V6」近期斬獲“雙料第一”。 5月28日,權威大模型測評機構SuperCLUE《中文大模型基準測評2025年5
    的頭像 發(fā)表于 05-30 11:13 ?350次閱讀
    <b class='flag-5'>商湯</b>科技<b class='flag-5'>日日新</b>V6大<b class='flag-5'>模型</b>斬獲“雙料第一” 一項國內榜首,一個全球第一

    商湯科技日日新模型SenseNova上線聲網云市場

    日前,商湯科技日日新模型SenseNova即將正式上線聲網云市場,開發(fā)者和企業(yè)用戶可通過聲網的實時互動云服務進行調用,將商湯領先的模型能力
    的頭像 發(fā)表于 04-08 17:24 ?682次閱讀

    商湯日日新融合模型登頂大語言與多模態(tài)雙榜單

    據弗若斯特沙利文(Frost & Sullivan, 簡稱“沙利文”)聯(lián)合頭豹研究院發(fā)布的《2025年中國大模型年度評測》結果顯示:在語言和多模態(tài)核心能力測評中,商湯日日新融合
    的頭像 發(fā)表于 03-18 10:35 ?454次閱讀

    商湯日日新融合模型榮獲雙料冠軍

    近日,商湯科技正式推出了其創(chuàng)新力作——“日日新融合模型。該模型在技術上實現(xiàn)了原生
    的頭像 發(fā)表于 01-13 16:10 ?465次閱讀

    商湯日日新多模態(tài)大模型權威評測第一

    剛剛,商湯科技日日新SenseNova多模態(tài)大模型,在權威綜合評測權威平臺OpenCompass的多模態(tài)評測中取得榜單第一。
    的頭像 發(fā)表于 12-20 10:39 ?797次閱讀

    商湯Sensechat向香港用戶免費開放

    「Sensechat 」基于商湯今年5月推出的“商量多模態(tài)大模型粵語版”。依托商湯日日新”出色語言和多模態(tài)能力,以及對粵語及本地文化、熱點
    的頭像 發(fā)表于 09-18 15:53 ?964次閱讀

    商湯日日新模型中標上海電信訂單

    近日,中國電信上海公司公布《產數(shù)開發(fā)代碼助手》項目采購結果:憑借「日日新」大模型出色的代碼能力,商湯科技中標。由「商湯?小浣熊家族」系列產品團隊提供相關業(yè)務產品服務支持。
    的頭像 發(fā)表于 07-29 14:25 ?775次閱讀

    商湯AI大模型與中國國家籃球隊達成戰(zhàn)略合作

    商湯科技與中國國家籃球隊達成戰(zhàn)略合作,將基于商湯日日新SenseNova5.5”大模型技術共同打造AI大模型籃球產品,推動AI大
    的頭像 發(fā)表于 07-17 09:58 ?1069次閱讀

    商湯科技推出SenseFoundry-VL方舟多模態(tài)新智平臺

    WAIC 2024期間,基于 “日日新5.5”大模型體系能力,商湯“方舟城市開放平臺”進行全新產品架構升級, 推出首個“大模型+城市服務”的
    的頭像 發(fā)表于 07-12 14:15 ?940次閱讀
    <b class='flag-5'>商湯</b>科技<b class='flag-5'>推出</b>SenseFoundry-VL方舟多模態(tài)新智平臺

    商湯科技&quot;日日新SenseNova 5.5&quot;大模型閃耀WAIC,引領AI新紀元

    在近期舉辦的世界人工智能大會(WAIC)上,商湯科技攜其流式多模態(tài)交互大模型日日新SenseNova 5.5”震撼登場,不僅為大會帶來了前所未有的AI體驗,更通過多場主題論壇活動,深入探討了AI大
    的頭像 發(fā)表于 07-08 16:05 ?961次閱讀

    商湯日日新”大模型全面賦能2024 WAIC

    7月6日,WAIC 2024迎來第三天。 商湯科技全新升級的「日日新SenseNova 5.5」備受熱議,作為國內首個具備流式原生多模態(tài)交互能力的大模型,交互效果和多項核心指標實現(xiàn)對標GPT-4o?!八娂此谩钡?/div>
    的頭像 發(fā)表于 07-08 15:54 ?861次閱讀

    產研聯(lián)合破題,AI大模型下沉行業(yè)應用加速

    商湯科技流式多模態(tài)交互大模型日日新SenseNova 5.5」驚艷亮相,日日新模型全面賦能WAIC大會,帶來超燃AI體驗。
    的頭像 發(fā)表于 07-08 15:35 ?706次閱讀

    商湯流式多模態(tài)交互大模型日日新5.5發(fā)布

    日日新」大模型迎來“燈塔時刻”,它能見你所見,理解你所需,說出你心聲,與你智慧共振。
    的頭像 發(fā)表于 07-08 15:10 ?838次閱讀
    <b class='flag-5'>商湯</b>流式多模態(tài)交互大<b class='flag-5'>模型</b><b class='flag-5'>日日新</b>5.5發(fā)布

    商湯科技發(fā)布日日新5.5大模型體系

    商湯科技近日震撼發(fā)布其最新的日日新5.5大模型體系,標志著人工智能領域又邁出了堅實的一步。該體系以6000億參數(shù)的超大規(guī)?;A模型——日日新
    的頭像 發(fā)表于 07-08 15:05 ?829次閱讀

    商湯宣布將免費向粵語區(qū)用戶推出粵語大模型Web版及App版

    繼4月發(fā)布「日日新SenseNova 5.0」以來,商湯模型繼續(xù)日日精進,新技頻出!
    的頭像 發(fā)表于 05-31 10:51 ?1361次閱讀
    <b class='flag-5'>商湯</b>宣布將免費向粵語區(qū)用戶<b class='flag-5'>推出</b>粵語大<b class='flag-5'>模型</b>Web版及App版

    電子發(fā)燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品