據(jù)弗若斯特沙利文(Frost & Sullivan, 簡稱“沙利文”)聯(lián)合頭豹研究院發(fā)布的《2025年中國大模型年度評測》結(jié)果顯示:在語言和多模態(tài)核心能力測評中,商湯“日日新”融合大模型斬獲國內(nèi)第一梯隊成績。
其中,核心的通用基礎(chǔ)能力與多模態(tài)圖像理解能力上,商湯“日日新”實現(xiàn)雙雙登頂,在16家國產(chǎn)主流大模型中排名第一。
通用基礎(chǔ)能力:三大維度全面領(lǐng)先
此次評測的“通用基礎(chǔ)能力”涵蓋數(shù)理科學、語言能力和道德風險控制三大核心維度。商湯日日新在這三個方面均表現(xiàn)出色,位列第一,得分超越國際均線,展現(xiàn)出多維度的綜合優(yōu)勢。
數(shù)理科學能力方面,商湯日日新以 88 分的高分位列第二,在數(shù)學推理、代碼編寫、科學常識等細分領(lǐng)域,展現(xiàn)出極強的邏輯推理和計算能力。報告特別指出,邏輯推理和數(shù)學能力已成為衡量大模型實力的關(guān)鍵分水嶺。而商湯在這方面的優(yōu)勢尤為顯著。
語言能力方面,在意圖理解、角色扮演、開放式推理等方面表現(xiàn)優(yōu)異,尤其是在語境適應(yīng)性、指令遵循及輸出穩(wěn)定性上表現(xiàn)出色,確保了生成內(nèi)容的準確性和一致性。
道德責任能力方面,以 75.88 分的成績位居榜首,在風險信息識別、偏見控制等方面表現(xiàn)突出,充分體現(xiàn)了商湯在倫理安全與風險控制上的嚴格標準。
多模態(tài)能力:圖像理解與生成雙突破
在多模態(tài)能力評測中,商湯日日新同樣表現(xiàn)亮眼。在多模態(tài)圖像理解能力評測中,商湯日日新以 84.05的高分位居榜首,在文字識別、物體定位、圖像風格識別、圖片邏輯理解等九個細分維度中奪得三項第一,顯示出強大的圖像理解能力。
其中,文字識別能力在復雜背景和低質(zhì)量圖像中表現(xiàn)遠超中國及國際行業(yè)平均水平;物體定位能力精準度國內(nèi)領(lǐng)先;圖像風格識別準確率顯著高于中國大模型均線。
在多模態(tài)生成能力評測中,商湯秒畫在商業(yè)型和藝術(shù)型圖像生成方面表現(xiàn)優(yōu)異,尤其是在商業(yè)圖像生成中,圖像質(zhì)量、指令遵循和風格多樣性得分領(lǐng)先,展現(xiàn)出強大的技術(shù)實力和應(yīng)用潛力,能夠很好地滿足廣告、電商等商業(yè)場景的需求。
專業(yè)應(yīng)用能力:多行業(yè)場景表現(xiàn)優(yōu)異
在專業(yè)應(yīng)用能力評測中,商湯日日新同樣處于第一梯隊,位居前二。其綜合能力涵蓋 AI 智能體、專業(yè)文本處理及超長文本處理,展現(xiàn)出在復雜決策、專業(yè)知識理解與長文本推理方面的強大能力。
在行業(yè)應(yīng)用能力方面,商湯日日新在金融、醫(yī)療、政務(wù)、教育等 14 個行業(yè)場景中均表現(xiàn)優(yōu)異,體現(xiàn)了其對不同領(lǐng)域知識的深度理解和應(yīng)用能力,以及強大的行業(yè)適配性和落地能力。
自 2023 年 4 月首次發(fā)布以來,日日新 SenseNova 大模型體系已進行了多次大版本迭代。今年 1 月推出的日日新融合大模型更是在行業(yè)內(nèi)率先實現(xiàn)了原生融合模態(tài)訓練的突破,打破了大語言與多模態(tài)分立的局面,支持文本、圖像、視頻、語音等多源異構(gòu)信息的綜合處理,為多場景應(yīng)用奠定了堅實基礎(chǔ),推動了AI大模型的工業(yè)化發(fā)展。
-
AI
+關(guān)注
關(guān)注
87文章
32569瀏覽量
271899 -
商湯科技
+關(guān)注
關(guān)注
8文章
528瀏覽量
36358 -
大模型
+關(guān)注
關(guān)注
2文章
2804瀏覽量
3456
原文標題:大語言通用能力第一!多模態(tài)圖像理解能力第一!
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
商湯“日日新”融合大模型榮獲雙料冠軍
商湯科技推出“日日新”融合大模型
商湯日日新多模態(tài)大模型權(quán)威評測第一
商湯日日新大模型中標上海電信訂單
商湯科技"日日新SenseNova 5.5"大模型閃耀WAIC,引領(lǐng)AI新紀元
商湯“日日新”大模型全面賦能2024 WAIC
商湯科技發(fā)布日日新5.5大模型體系
商湯發(fā)布日日新大模型5.0粵語版
中文大模型測評基準SuperCLUE:商湯日日新5.0,刷新國內(nèi)最好成績

商湯科技即將推出日日新大模型5.0粵語版本
商湯將發(fā)布日日新大模型5.0粵語版本
商湯科技發(fā)布“日日新SenseNova 5.0”大模型
商湯科技聯(lián)合海通證券發(fā)布業(yè)內(nèi)首個面向金融行業(yè)的多模態(tài)全棧式大模型

評論