0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

商湯日日新多模態(tài)大模型權(quán)威評測第一

商湯科技SenseTime ? 來源:商湯科技SenseTime ? 2024-12-20 10:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

剛剛,商湯科技日日新SenseNova多模態(tài)大模型,在權(quán)威綜合評測權(quán)威平臺OpenCompass的多模態(tài)評測中取得榜單第一。

商湯日日新平均得分達(dá)到77.4,領(lǐng)先GPT-4o、Claude 3.5 Sonnet以及國內(nèi)所有不同尺寸的開源和閉源模型,尤其在涵蓋算術(shù)、統(tǒng)計、代數(shù)、幾何、數(shù)值常識、科學(xué)和邏輯的權(quán)威數(shù)據(jù)集MathVista維度上,取得78.4分的最高分,展現(xiàn)了領(lǐng)先的“數(shù)理”能力。

OpenCompass 多模態(tài)評測包含八個核心數(shù)據(jù)集,從多種視角客觀量化多模態(tài)大模型的能力。此次評測中,商湯日日新在幾乎所有維度上都達(dá)到或超過GPT-4o水平,其中四個維度上(MMStar、MathVista、OCRBench、MMVet)排名全球第一。

OpenCompass大模型開放評測體系是上海人工智能實驗室推出的,擁有完整開源可復(fù)現(xiàn)的評測框架,定期發(fā)布對各類大模型的評測成績和排名。體系覆蓋了語言與理解、常識與邏輯推理、數(shù)學(xué)計算與應(yīng)用、多編程語言代碼能力、智能體、創(chuàng)作與對話等多個方面,是對大模型真實能力各個維度的全面診斷。

小試牛刀,商湯多模態(tài)進(jìn)階

作為計算機(jī)視覺領(lǐng)域的先行者和領(lǐng)軍企業(yè),早在幾年前,商湯就確定了多模態(tài)大模型的研究方向,并在研發(fā)中,融合積累的領(lǐng)先算法、豐富數(shù)據(jù)和場景認(rèn)知建立起核心優(yōu)勢。

2023年4月,商湯率先發(fā)布了行業(yè)領(lǐng)先的多模態(tài)大模型;

2024年2月,基于商湯日日新4.0的多模態(tài)大模型,在當(dāng)時權(quán)威評測基準(zhǔn)測試集MME Benchmark上位列第一,綜合得分達(dá)2199.5(超過GPT-4V的1926.57),并應(yīng)用到智能駕駛、智能車艙、電力行業(yè)等多個場景;

2024年7 月,商湯發(fā)布國內(nèi)首個交互體驗上對標(biāo)GPT-4o的大模型——日日新 5o,實現(xiàn)無延時的實時流式交互。

全新階段,跨模態(tài)深度融合

今年三季度以來,商湯已跨越初期探索,進(jìn)入了多模態(tài)大模型的研發(fā)新階段——實現(xiàn)跨模態(tài)深度融合。以此目標(biāo),商湯打造了全新原生多模態(tài)大模型——日日新SenseNova多模態(tài)大模型。

跨模態(tài)深度融合指能夠跨越不同模態(tài)(自然語言、代碼、語音、圖像、醫(yī)療影像、視頻等)之間的鴻溝,充分利用不同模態(tài)的信息,通過跨模態(tài)逆渲染、多模態(tài)思維鏈等技術(shù)創(chuàng)新,實現(xiàn)數(shù)據(jù)之間的集成和交互。由此,模型的感知和理解能力將得到極大增強(qiáng),并支持多模態(tài)融合推理的實現(xiàn)。

跨模態(tài)融合有多種方法。例如,通過融合預(yù)訓(xùn)練以及后訓(xùn)練技術(shù),商湯日日新多模態(tài)大模型大幅增強(qiáng)了數(shù)理邏輯和推理能力。

評測中,當(dāng)我們從“五年高考,三年模擬”里隨機(jī)抽取幾道高考數(shù)學(xué)題,日日新多模態(tài)大模型都可以輕松應(yīng)對。

此外,通過多模態(tài)融合并對模型進(jìn)行定向優(yōu)化,商湯日日新多模態(tài)大模型還大幅提升了對統(tǒng)計圖表和多模態(tài)文檔的理解能力。

評測中,當(dāng)難度提升,讓我們看看結(jié)果如何。

商湯日日新成功輸出推理結(jié)果,效果令人驚嘆。

隨著融合模態(tài)有效提升AI大模型性能,多模態(tài)融合未來可廣泛應(yīng)用于諸多場景,例如在線上教育、語音客服等場景,結(jié)合語音和自然語言來提升交互體驗;在自動駕駛場景,融合視覺及多種模態(tài)數(shù)據(jù),來提升感知精度和決策能力等。

數(shù)理還只是起點。目前,日日新SenseNova多模態(tài)大模型已經(jīng)可以通過API調(diào)用,即將開放普通用戶體驗。

One more thing,商湯日日新多模態(tài)大模型還能看懂中國書畫。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    48987

    瀏覽量

    249007
  • 商湯科技
    +關(guān)注

    關(guān)注

    8

    文章

    563

    瀏覽量

    36781
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3131

    瀏覽量

    4044

原文標(biāo)題:挑戰(zhàn)高考數(shù)學(xué)完勝!商湯日日新多模態(tài)大模型權(quán)威評測第一

文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    商湯日日新SenseNova融合模態(tài)模型 國內(nèi)首家獲得最高評級的大模型

    近日,中國信息通信研究院(以下簡稱“中國信通院”)完成可信AI模態(tài)模型首輪評估。 商湯日日新SenseNova融合
    的頭像 發(fā)表于 06-11 11:57 ?649次閱讀

    商湯科技日日新V6大模型斬獲“雙料第一項國內(nèi)榜首,個全球第一

    衛(wèi)冕“雙冠”! 通用語言能力并列國內(nèi)榜首、模態(tài)能力全球最強(qiáng),商湯日日新V6」近期斬獲“雙料第一”。 5月28日,
    的頭像 發(fā)表于 05-30 11:13 ?850次閱讀
    <b class='flag-5'>商湯</b>科技<b class='flag-5'>日日新</b>V6大<b class='flag-5'>模型</b>斬獲“雙料<b class='flag-5'>第一</b>” <b class='flag-5'>一</b>項國內(nèi)榜首,<b class='flag-5'>一</b>個全球<b class='flag-5'>第一</b>

    深蘭科技醫(yī)療大模型榮獲MedBench評測第一

    近日,國內(nèi)權(quán)威醫(yī)療大模型評測平臺MedBench在官網(wǎng)更新了榜單,多個知名醫(yī)療AI產(chǎn)品及研究團(tuán)隊入榜,其中深蘭DeepBlue-MR-v1醫(yī)療大模型以復(fù)雜醫(yī)學(xué)推理
    的頭像 發(fā)表于 04-30 16:08 ?381次閱讀

    商湯科技助力如影數(shù)字人超級直播間全新升級

    作為數(shù)字人全行業(yè)首創(chuàng),如影數(shù)字人超級直播間可實現(xiàn)模態(tài)智能運(yùn)營,依托“商湯日日新SenseNova”
    的頭像 發(fā)表于 04-23 16:31 ?411次閱讀

    商湯科技日日新模型SenseNova上線聲網(wǎng)云市場

    日前,商湯科技日日新模型SenseNova即將正式上線聲網(wǎng)云市場,開發(fā)者和企業(yè)用戶可通過聲網(wǎng)的實時互動云服務(wù)進(jìn)行調(diào)用,將商湯領(lǐng)先的模型能力
    的頭像 發(fā)表于 04-08 17:24 ?890次閱讀

    商湯日日新”融合大模型登頂大語言與模態(tài)雙榜單

    據(jù)弗若斯特沙利文(Frost & Sullivan, 簡稱“沙利文”)聯(lián)合頭豹研究院發(fā)布的《2025年中國大模型年度評測》結(jié)果顯示:在語言和模態(tài)核心能力測評中,
    的頭像 發(fā)表于 03-18 10:35 ?575次閱讀

    商湯日日新”融合大模型榮獲雙料冠軍

    近日,商湯科技正式推出了其創(chuàng)新力作——“日日新”融合大模型。該模型在技術(shù)上實現(xiàn)了原生融合模態(tài)的突破,使得其深度推理能力和
    的頭像 發(fā)表于 01-13 16:10 ?569次閱讀

    商湯科技推出“日日新”融合大模型

    剛剛,商湯正式推出“日日新”融合大模型,領(lǐng)先實現(xiàn)原生融合模態(tài),深度推理能力與模態(tài)信息處理能力均
    的頭像 發(fā)表于 01-10 15:59 ?633次閱讀

    商湯日日新·商量大模型位列國內(nèi)大模型第一梯隊

    剛剛,中文大模型測評基準(zhǔn)SuperCLUE發(fā)布《中文大模型基準(zhǔn)測評2024年10月報告》。
    的頭像 發(fā)表于 11-08 15:38 ?998次閱讀

    云知聲山海模態(tài)模型UniGPT-mMed登頂MMMU測評榜首

    近日,模態(tài)人工智能模型基準(zhǔn)評測集MMMU更新榜單,云知聲山海模態(tài)
    的頭像 發(fā)表于 10-12 14:09 ?657次閱讀
    云知聲山海<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>UniGPT-mMed登頂MMMU測評榜首

    商湯Sensechat向香港用戶免費開放

    「Sensechat 」基于商湯今年5月推出的“商量模態(tài)模型粵語版”。依托商湯日日新”出色
    的頭像 發(fā)表于 09-18 15:53 ?1142次閱讀

    商湯日日新模型中標(biāo)上海電信訂單

    近日,中國電信上海公司公布《產(chǎn)數(shù)開發(fā)代碼助手》項目采購結(jié)果:憑借「日日新」大模型出色的代碼能力,商湯科技中標(biāo)。由「商湯?小浣熊家族」系列產(chǎn)品團(tuán)隊提供相關(guān)業(yè)務(wù)產(chǎn)品服務(wù)支持。
    的頭像 發(fā)表于 07-29 14:25 ?878次閱讀

    商湯絕影在行業(yè)率先實現(xiàn)原生模態(tài)模型的車端部署

    “基于原生模態(tài)模型,商湯絕影正在打造系列全新的車載智能化產(chǎn)品,推動智能汽車向超級智能體進(jìn)化?!?b class='flag-5'>商湯
    的頭像 發(fā)表于 07-23 10:52 ?872次閱讀
    <b class='flag-5'>商湯</b>絕影在行業(yè)率先實現(xiàn)原生<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>的車端部署

    商湯AI大模型與中國國家籃球隊達(dá)成戰(zhàn)略合作

    商湯科技與中國國家籃球隊達(dá)成戰(zhàn)略合作,將基于商湯日日新SenseNova5.5”大模型技術(shù)共同打造AI大模型籃球產(chǎn)品,推動AI大
    的頭像 發(fā)表于 07-17 09:58 ?1163次閱讀

    商湯科技推出SenseFoundry-VL方舟模態(tài)新智平臺

    WAIC 2024期間,基于 “日日新5.5”大模型體系能力,商湯“方舟城市開放平臺”進(jìn)行全新產(chǎn)品架構(gòu)升級, 推出首個“大模型+城市服務(wù)”的解決方案及應(yīng)用實踐「SenseFoundry
    的頭像 發(fā)表于 07-12 14:15 ?1065次閱讀
    <b class='flag-5'>商湯</b>科技推出SenseFoundry-VL方舟<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>新智平臺

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品