0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲山海多模態(tài)大模型UniGPT-mMed登頂MMMU測評榜首

云知聲 ? 來源:云知聲 ? 2024-10-12 14:09 ? 次閱讀

近日,多模態(tài)人工智能模型基準評測集MMMU更新榜單,云知聲山海多模態(tài)大模型UniGPT-mMed以通用能力、醫(yī)療專業(yè)能力雙雙排名第一的優(yōu)異成績登頂榜首,力壓GPT-4V,充分彰顯其硬核實力。

作為國內(nèi)權(quán)威多模態(tài)基準評測,MMMU由IN.AI Research等多家機構(gòu)聯(lián)合構(gòu)建,專注于考量人工智能在解決大學層次多學科問題時的多模態(tài)理解與推理能力。

該評測集涉及藝術(shù)與設(shè)計、商科、科學、健康與醫(yī)學、人文與社會科學、技術(shù)與工程等六個常見學科,包含 1.15 萬個精心選取的多模態(tài)問題,涵蓋 30 個不同的科目和183 個子領(lǐng)域。同時,MMMU 中許多問題都需要專家級的推理能力,例如,使用傅立葉變換或均衡理論來推導(dǎo)問題的解,這在滿足評測內(nèi)容廣泛性的同時,也確保了其深度。

此外,MMMU還提出了兩個獨特的挑戰(zhàn):一是其涵蓋多種圖像格式,從照片和繪畫等視覺場景到圖表和表格,可用于測試 LMM 的感知能力;二是MMMU的輸入形式是文本和圖像的混合,要求AI模型能夠?qū)D像和文本信息結(jié)合起來進行深入理解,并在此基礎(chǔ)上執(zhí)行復(fù)雜推理。這不僅考驗了模型的學科知識儲備,也對其綜合分析和應(yīng)用能力提出了更高要求。

評測結(jié)果顯示,云知聲山海多模態(tài)大模型UniGPT-mMed以總分57的優(yōu)異成績登頂榜首,并在健康與醫(yī)學細分賽道超越GPT-4V,力壓一眾大模型拔得頭籌,充分展現(xiàn)出其在擁有業(yè)內(nèi)一流的通用能力之外,更具備打造世界領(lǐng)先的行業(yè)大模型的能力。

bca3a6b2-877d-11ef-b8af-92fbcf53809c.png

UniGPT-mMed是云知聲基于山海大模型底座構(gòu)建的多模態(tài)大模型。其通過分析和整合海量論文、書籍及網(wǎng)站數(shù)據(jù),利用精細化數(shù)據(jù)處理技術(shù),自動識別并提取圖片及其相關(guān)文本描述,并通過多模態(tài)分析技術(shù)評估圖片的質(zhì)量和圖文之間的匹配度,篩選出最優(yōu)數(shù)據(jù)。與此同時,系統(tǒng)能夠參考圖片和上下文信息對圖片進行重新描述,使得圖文數(shù)據(jù)更加對齊。

通過預(yù)設(shè)問答場景,UniGPT-mMed能夠?qū)D文對齊數(shù)據(jù)轉(zhuǎn)化為高質(zhì)量的場景問答數(shù)據(jù)集,并采用思維鏈和自我反思技術(shù),進一步優(yōu)化生成數(shù)據(jù),最終構(gòu)建起一個包含數(shù)億條高質(zhì)量圖文問答的數(shù)據(jù)集,進而為用戶提供更加豐富、準確和可靠的信息檢索和問答服務(wù)。

此次評測,是云知聲在多模態(tài)大模型賽道持續(xù)深耕、不斷技術(shù)創(chuàng)新的成果體現(xiàn)。

作為中國AGI技術(shù)產(chǎn)業(yè)化的先行者,云知聲于2016年開始打造Atlas人工智能基礎(chǔ)設(shè)施,并以此為基礎(chǔ),構(gòu)建云知大腦(UniBrain)技術(shù)中臺——以山海(UniGPT)通用認知大模型為核心,結(jié)合多模態(tài)感知與生成、知識圖譜、物聯(lián)平臺等智能組件,為云知聲智慧物聯(lián)、智慧醫(yī)療、智慧座艙、智慧交通等業(yè)務(wù)提供高效的產(chǎn)品化支撐,持續(xù)推動“U(云知大腦)+X(應(yīng)用場景)”戰(zhàn)略布局,致力推動千行百業(yè)的智慧化升級。

作為云知大腦的核心,山海大模型具備語言生成、語言理解、知識問答、邏輯推理、代碼能力、數(shù)學能力、安全合規(guī)能力七項通用能力及插件擴展、領(lǐng)域增強、企業(yè)定制三項行業(yè)落地能力,能夠滿足更多場景的應(yīng)用需求。今年8月,云知聲推出山海多模態(tài)大模型,通過整合跨模態(tài)信息,山海多模態(tài)大模型能夠接收文本、音頻、圖像等多種形式作為輸入,并實時生成文本、音頻和圖像的任意組合輸出,帶來實時多模態(tài)擬人交互體驗,開啟AGI新范式。

目前,山海大模型已相繼在OpenCompass大模型評測、SuperCLUE中文大模型基準測評、MedBench評測、Flageval大模型評測、SuperBench等多個權(quán)威評測中屢創(chuàng)佳績,穩(wěn)居國內(nèi)大模型第一梯隊;在醫(yī)療專業(yè)能力上,其基于山海大模型孵化的醫(yī)療大模型在CCKS 2023 PromptCBLUE醫(yī)療大模型評測中奪得通用賽道一等獎,并在MedBench評測中位列全球第一,各項指標全面超越GPT-4。

登頂MMMU評測榜,充分印證了云知聲山海多模態(tài)大模型在通用能力、專業(yè)能力層面的突出實力,也將鞭策云知聲持續(xù)迭代多模態(tài)大模型技術(shù)底座,實現(xiàn)大模型技術(shù)在多領(lǐng)域場景下的滲透和應(yīng)用,以技術(shù)創(chuàng)新為各行各業(yè)帶來更多智能化變革。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47279

    瀏覽量

    238493
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    185

    瀏覽量

    8391
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2450

    瀏覽量

    2706

原文標題:引領(lǐng)多模態(tài)大模型新高度,山海UniGPT-mMed登頂MMMU權(quán)威測評榜

文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    騰訊混元文生圖登頂智源FlagEval評測榜首

    近日,北京智源人工智能研究院(BAAI)發(fā)布了最新的FlagEval大模型評測排行榜,其中模態(tài)模型評測榜單的文生圖模型引起了廣泛關(guān)注。結(jié)果
    的頭像 發(fā)表于 12-25 10:06 ?136次閱讀

    與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于山海模型的多元智慧場景

    ?? 12月6日,(上海)智能科技有限公司(以下簡稱““)與上海英內(nèi)物聯(lián)網(wǎng)科技股份有
    的頭像 發(fā)表于 12-06 20:05 ?852次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>的多元智慧場景

    榮登2024大模型企業(yè)TOP50榜單

    近日,智領(lǐng)未來·向新而行—2024人工智能大模型產(chǎn)業(yè)大會在京召開,會上揭曉2024大模型企業(yè)TOP50榜單,榮登榜單,
    的頭像 發(fā)表于 11-29 17:52 ?501次閱讀

    基于AX650N/AX630C部署模態(tài)模型InternVL2-1B

    InternVL2是由上海人工智能實驗室OpenGVLab發(fā)布的一款模態(tài)模型,中文名稱為“書生·萬象”。該模型在多學科問答(MMMU)等
    的頭像 發(fā)表于 11-18 17:32 ?734次閱讀
    基于AX650N/AX630C部署<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>InternVL2-1B

    山海模型多項能力全球領(lǐng)跑

    國內(nèi)人工智能權(quán)威機構(gòu)清華大學基礎(chǔ)模型研究中心發(fā)布SuperBench九月綜合榜單。本次評測選取海內(nèi)外24個具有代表性的大模型,結(jié)果顯示,山海模型對齊、智能體、安全等多項能力全球領(lǐng)跑。
    的頭像 發(fā)表于 10-12 14:30 ?418次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>多項能力全球領(lǐng)跑

    山海模型醫(yī)療專業(yè)能力全球第一

    近日,由上海AI實驗室和上海市數(shù)字醫(yī)學創(chuàng)新中心聯(lián)合推出的MedBench評測更新榜單,繼4月份奪冠后,山海模型醫(yī)療行業(yè)版(
    的頭像 發(fā)表于 09-19 15:47 ?341次閱讀

    山海模型助力司法領(lǐng)域智慧化升級

    近期,成功助力上海市徐匯區(qū)虹梅街道司法所打造基于山海模型的司法領(lǐng)域應(yīng)用,極大提升了司法服務(wù)的可及性與便利性。這不僅是
    的頭像 發(fā)表于 09-12 14:44 ?603次閱讀

    山海模型位居全球大模型第一梯隊

    SuperCLUE發(fā)布《中文大模型基準測評2024上半年報告》,報告選取國內(nèi)外有代表性的33個大模型在6月份的版本,通過多維度綜合性測評,對國內(nèi)外大
    的頭像 發(fā)表于 09-12 14:41 ?604次閱讀

    推出山海模態(tài)模型

    在人工智能技術(shù)的浩瀚星海中,模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標。繼OpenAI的GPT-4o掀起滔天巨浪后,以創(chuàng)新之姿,推出了其匠心
    的頭像 發(fā)表于 08-27 15:20 ?393次閱讀

    在邊緣側(cè)大模型技術(shù)探索和應(yīng)用

    解決的課題。 2024高工智能汽車開發(fā)者大會暨艙駕智能與跨域論壇上,智慧座艙解決方案中心總經(jīng)理鮑晴峰以《邊緣側(cè)大模型帶來智能座艙交互新體驗》為題,分享了
    的頭像 發(fā)表于 06-29 15:30 ?825次閱讀

    山海模型醫(yī)療行業(yè)版登頂上海AI實驗室權(quán)威大模型評測榜

    近日,上海AI實驗室和上海市數(shù)字醫(yī)學創(chuàng)新中心聯(lián)合推出的MedBench評測更新榜單,山海模型醫(yī)療行業(yè)版(
    的頭像 發(fā)表于 04-24 14:28 ?1849次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>醫(yī)療行業(yè)版<b class='flag-5'>登頂</b>上海AI實驗室權(quán)威大<b class='flag-5'>模型</b>評測榜

    山海模型再赴港IPO

    智能科技股份有限公司(簡稱“”)于3月15日更新了招股書,繼續(xù)其在港交所主板上市的步
    的頭像 發(fā)表于 03-22 14:51 ?720次閱讀

    再闖港股IPO

    近日,備受矚目的智能科技股份有限公司(以下簡稱)再次更新了其招股書,繼續(xù)穩(wěn)步推進其在
    的頭像 發(fā)表于 03-22 14:42 ?708次閱讀

    山海模型獲得華為昇騰技術(shù)認證

    山海模型近日取得了重大突破,順利通過了華為Atlas 800訓(xùn)練服務(wù)器和華為AI框架昇思MindSpore的兼容性測試。這一成就標志
    的頭像 發(fā)表于 02-05 09:32 ?1005次閱讀

    全新推出AIGC內(nèi)容創(chuàng)作平臺藍藻AI

    近日,基于智能語音技術(shù)和山海模型技術(shù),全新推出AIGC內(nèi)容創(chuàng)作平臺——藍藻AI,為創(chuàng)作者提供AI聲音克隆、AI文字配音、AI文案創(chuàng)作
    的頭像 發(fā)表于 01-10 13:38 ?839次閱讀