0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲山海大模型醫(yī)療專業(yè)能力全球第一

云知聲 ? 來源:云知聲 ? 2024-09-19 15:47 ? 次閱讀

近日,由上海AI實(shí)驗(yàn)室和上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合推出的MedBench評測更新榜單,繼4月份奪冠后,云知聲山海大模型醫(yī)療行業(yè)版(UniGPT-Med)再次以綜合得分82.2的優(yōu)異成績位列全球第一,各項(xiàng)指標(biāo)全面超越GPT-4,充分展現(xiàn)出山海大模型在擁有業(yè)內(nèi)一流的通用能力之外,更具備打造世界領(lǐng)先的行業(yè)大模型的能力。

MedBench致力于打造一個(gè)科學(xué)、公平且嚴(yán)謹(jǐn)?shù)闹形尼t(yī)療大模型評測體系及開放平臺(tái),其基于醫(yī)學(xué)權(quán)威標(biāo)準(zhǔn),不斷更新維護(hù)高質(zhì)量的醫(yī)學(xué)數(shù)據(jù)集,全方位多維度量化模型在各個(gè)醫(yī)學(xué)維度的能力。

MedBench的五大評測維度——醫(yī)學(xué)語言理解、醫(yī)學(xué)語言生成、醫(yī)學(xué)知識(shí)問答、復(fù)雜醫(yī)學(xué)推理、醫(yī)療安全和倫理,構(gòu)成了其專業(yè)評測框架的核心。這一框架吸納了海量醫(yī)學(xué)知識(shí)庫和醫(yī)院醫(yī)學(xué)專家的豐富經(jīng)驗(yàn),涵蓋8個(gè)公開數(shù)據(jù)集和12個(gè)自建數(shù)據(jù)集,總計(jì)約30萬道中文醫(yī)療專業(yè)測評題目,覆蓋了從醫(yī)學(xué)考試題庫到患者服務(wù)、醫(yī)學(xué)問診、病例分析以及病歷生成等廣泛的醫(yī)學(xué)任務(wù),致力為中文醫(yī)療大模型提供客觀科學(xué)的性能評測參考。

今年5月,MedBench平臺(tái)全面升級,不僅引入API評測方式,豐富了參評途徑,還優(yōu)化了開放域問答的評估指標(biāo)。通過醫(yī)學(xué)專家的精準(zhǔn)標(biāo)注,平臺(tái)進(jìn)一步提升了評測結(jié)果的公正性和專業(yè)性。同時(shí),平臺(tái)在數(shù)據(jù)集、評測方法和系統(tǒng)功能等方面也進(jìn)行了升級,旨在為醫(yī)療大模型評測構(gòu)建一個(gè)更加完善的社區(qū)環(huán)境,并提供更加豐富、真實(shí)的實(shí)踐場景。

此次評測,云知聲山海大模型醫(yī)療行業(yè)版(UniGPT-Med)通過API提交方式,不僅以82.2的綜合得分刷新了MedBench評測記錄,更是在各個(gè)維度上力壓GPT-4,排名全球第一。這一成績的取得,是山海大模型醫(yī)療專業(yè)能力的集中展現(xiàn),也標(biāo)志著其技術(shù)迭代和創(chuàng)新發(fā)展達(dá)到了一個(gè)新的高度。

目前,山海大模型通用能力已超越GPT-3.5,并在SuperCLUE 4月評測中躋身國內(nèi)大模型Top10;與GPT-4的對戰(zhàn)中,山海綜合勝率與和率為75.55%。

在醫(yī)療專業(yè)能力上,山海大模型于2023年6月的MedQA任務(wù)中超越Med-PaLM 2,取得87.1%的優(yōu)異成績;在臨床執(zhí)業(yè)醫(yī)師資格考試中以523分(總分600分)的優(yōu)異成績,超過99%的考生水平;其基于山海大模型孵化的醫(yī)療行業(yè)版大模型,也在CCKS 2023 PromptCBLUE醫(yī)療大模型評測中奪得通用賽道一等獎(jiǎng)。

隨著醫(yī)療行業(yè)對智能化、精準(zhǔn)化服務(wù)需求的不斷增長,云知聲山海大模型醫(yī)療行業(yè)版(UniGPT-Med)有望在醫(yī)療健康領(lǐng)域扮演更加關(guān)鍵的角色,為提升醫(yī)療服務(wù)效率、優(yōu)化患者體驗(yàn)、推動(dòng)醫(yī)療科技進(jìn)步提供強(qiáng)有力的支持。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 醫(yī)療
    +關(guān)注

    關(guān)注

    8

    文章

    1823

    瀏覽量

    58762
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    185

    瀏覽量

    8391
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2450

    瀏覽量

    2714

原文標(biāo)題:MedBench最新評測:山海大模型醫(yī)療專業(yè)能力全球第一,各項(xiàng)指標(biāo)力壓GPT-4

文章出處:【微信號(hào):云知聲,微信公眾號(hào):云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于山海模型的多元智慧場景

    ?? 12月6日,(上海)智能科技有限公司(以下簡稱““)與上海英內(nèi)物聯(lián)網(wǎng)科技股份有
    的頭像 發(fā)表于 12-06 20:05 ?852次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>的多元智慧場景

    榮登2024大模型企業(yè)TOP50榜單

    近日,智領(lǐng)未來·向新而行—2024人工智能大模型產(chǎn)業(yè)大會(huì)在京召開,會(huì)上揭曉2024大模型企業(yè)TOP50榜單,榮登榜單,
    的頭像 發(fā)表于 11-29 17:52 ?502次閱讀

    榮登2024全球AIGC先鋒者系列榜單

    近日,由PEC China、至頂科技、軟積木主辦的“2024 AI創(chuàng)新者大會(huì)暨PEC提示工程峰會(huì)”在北京舉行,會(huì)上發(fā)布“2024全球AIGC先鋒者系列榜單”,入選“2024
    的頭像 發(fā)表于 11-21 14:14 ?239次閱讀

    山海模型多項(xiàng)能力全球領(lǐng)跑

    國內(nèi)人工智能權(quán)威機(jī)構(gòu)清華大學(xué)基礎(chǔ)模型研究中心發(fā)布SuperBench九月綜合榜單。本次評測選取海內(nèi)外24個(gè)具有代表性的大模型,結(jié)果顯示,山海模型對齊、智能體、安全等多項(xiàng)
    的頭像 發(fā)表于 10-12 14:30 ?418次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>多項(xiàng)<b class='flag-5'>能力</b><b class='flag-5'>全球</b>領(lǐng)跑

    山海多模態(tài)大模型UniGPT-mMed登頂MMMU測評榜首

    近日,多模態(tài)人工智能模型基準(zhǔn)評測集MMMU更新榜單,山海多模態(tài)大模型UniGPT-mMed
    的頭像 發(fā)表于 10-12 14:09 ?299次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>多模態(tài)大<b class='flag-5'>模型</b>UniGPT-mMed登頂MMMU測評榜首

    山海模型助力司法領(lǐng)域智慧化升級

    近期,成功助力上海市徐匯區(qū)虹梅街道司法所打造基于山海模型的司法領(lǐng)域應(yīng)用,極大提升了司法服務(wù)的可及性與便利性。這不僅是
    的頭像 發(fā)表于 09-12 14:44 ?603次閱讀

    山海模型位居全球模型第一梯隊(duì)

    SuperCLUE發(fā)布《中文大模型基準(zhǔn)測評2024上半年報(bào)告》,報(bào)告選取國內(nèi)外有代表性的33個(gè)大模型在6月份的版本,通過多維度綜合性測評,對國內(nèi)外大模型發(fā)展現(xiàn)狀進(jìn)行觀察與思考。
    的頭像 發(fā)表于 09-12 14:41 ?605次閱讀

    推出山海多模態(tài)大模型

    在人工智能技術(shù)的浩瀚星海中,多模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后,以創(chuàng)新之姿,推出了其匠心獨(dú)運(yùn)的山海多模態(tài)大
    的頭像 發(fā)表于 08-27 15:20 ?394次閱讀

    在邊緣側(cè)大模型技術(shù)探索和應(yīng)用

    解決的課題。 2024高工智能汽車開發(fā)者大會(huì)暨艙駕智能與跨域論壇上,智慧座艙解決方案中心總經(jīng)理鮑晴峰以《邊緣側(cè)大模型帶來智能座艙交互新體驗(yàn)》為題,分享了
    的頭像 發(fā)表于 06-29 15:30 ?828次閱讀

    山海模型醫(yī)療行業(yè)版登頂上海AI實(shí)驗(yàn)室權(quán)威大模型評測榜

    近日,上海AI實(shí)驗(yàn)室和上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合推出的MedBench評測更新榜單,山海模型醫(yī)療
    的頭像 發(fā)表于 04-24 14:28 ?1851次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b><b class='flag-5'>醫(yī)療</b>行業(yè)版登頂上海AI實(shí)驗(yàn)室權(quán)威大<b class='flag-5'>模型</b>評測榜

    山海模型再赴港IPO

    智能科技股份有限公司(簡稱“”)于3月15日更新了招股書,繼續(xù)其在港交所主板上市的步
    的頭像 發(fā)表于 03-22 14:51 ?722次閱讀

    再闖港股IPO

    近日,備受矚目的智能科技股份有限公司(以下簡稱)再次更新了其招股書,繼續(xù)穩(wěn)步推進(jìn)其在
    的頭像 發(fā)表于 03-22 14:42 ?708次閱讀

    再闖港股IPO,深耕AI領(lǐng)域

    近日,智能科技股份有限公司(簡稱:)正式向港交所遞交了招股書,計(jì)劃主板IPO上市。這
    的頭像 發(fā)表于 03-19 15:36 ?828次閱讀

    山海模型獲得華為昇騰技術(shù)認(rèn)證

    山海模型近日取得了重大突破,順利通過了華為Atlas 800訓(xùn)練服務(wù)器和華為AI框架昇思MindSpore的兼容性測試。這
    的頭像 發(fā)表于 02-05 09:32 ?1005次閱讀

    全新推出AIGC內(nèi)容創(chuàng)作平臺(tái)藍(lán)藻AI

    近日,基于智能語音技術(shù)和山海模型技術(shù),全新推出AIGC內(nèi)容創(chuàng)作平臺(tái)——藍(lán)藻AI,為創(chuàng)作者提供AI聲音克隆、AI文字配音、AI文案創(chuàng)作
    的頭像 發(fā)表于 01-10 13:38 ?839次閱讀