0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

首個中文醫(yī)學(xué)知識LLM:真正的賽華佗—華駝(HuaTuo)

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2023-05-08 11:30 ? 次閱讀

先劃重點:中文醫(yī)學(xué)知識,不是「中醫(yī)」。

自從 Meta(原 Facebook)的 LLaMA 大語言模型發(fā)布以來,相信大家看到了許多以“駝類動物”命名的 LLM。比如斯坦福用了 Alpaca,伯克利用了 Vicuna,Joseph Cheung 等開發(fā)者團隊用了 Guanaco。

d543e460-ed4c-11ed-90ce-dac502259ad0.jpg

據(jù)說南美洲的無峰駝類動物一共就是上圖列出的 4 種 —— 已經(jīng)被各家的大模型命名使用。

不得不承認(rèn)這些以“駝類動物”命名的 LLM 都很厲害,但如果,我是說如果,我拿出下面這個 LLM,閣下又當(dāng)如何應(yīng)對?

d55439dc-ed4c-11ed-90ce-dac502259ad0.png

沒錯,正是「華駝」。

見名知意,華駝肯定跟醫(yī)學(xué)有關(guān)——這是一個基于中文醫(yī)學(xué)知識的LLaMA 微調(diào)模型。

說到這,這個 LLM 的命名很難不讓人拍案叫絕,將神醫(yī)華佗與基于“羊駝”的大語言模型巧妙地結(jié)合在一起。

此項目開源了經(jīng)過中文醫(yī)學(xué)指令精調(diào) / 指令微調(diào) (Instruct-tuning) 的 LLaMA-7B 模型。

通過醫(yī)學(xué)知識圖譜和 GPT 3.5 API 構(gòu)建了中文醫(yī)學(xué)指令數(shù)據(jù)集,并在此基礎(chǔ)上對 LLaMA 進行了指令微調(diào),提高了 LLaMA 在醫(yī)療領(lǐng)域的問答效果。

據(jù)介紹,醫(yī)學(xué)知識庫圍繞疾病、藥物、檢查指標(biāo)等構(gòu)建,字段包括并發(fā)癥,高危因素,組織學(xué)檢查,臨床癥狀,藥物治療,輔助治療等。知識庫示例如下:

{“中心詞”: “偏頭痛”, “相關(guān)疾病”: [“妊娠合并偏頭痛”, “惡寒發(fā)熱”], “相關(guān)癥狀”: [“皮膚變硬”, “頭部及眼后部疼痛并能聽到連續(xù)不斷的隆隆聲”, “晨起頭痛加重”], “所屬科室”: [“中西醫(yī)結(jié)合科”, “內(nèi)科”], “發(fā)病部位”: [“頭部”]}

然后利用 GPT3.5 接口圍繞醫(yī)學(xué)知識庫構(gòu)建問答數(shù)據(jù),并設(shè)置了多種 Prompt 形式來充分利用知識。指令微調(diào)的訓(xùn)練集數(shù)據(jù)示例如下:

“問題:一位年輕男性長期使用可卡因,突然出現(xiàn)胸痛、嘔吐、出汗等癥狀,經(jīng)檢查發(fā)現(xiàn)心電圖反映心肌急性損傷,請問可能患的是什么疾???治療方式是什么?” 回答: 可能患的是心肌梗塞,需要進行維拉帕米、依普利酮、硝酸甘油、?阻滯劑、嗎啡等藥物治療,并進行溶栓治療、低分子量肝素、鈣通道阻滯劑等輔助治療。此外需要及時停用可卡因等藥物,以防止病情加重?!?/p>

該項目提供模型的訓(xùn)練數(shù)據(jù)集共計八千余條,需要注意的是,雖然訓(xùn)練集的構(gòu)建融入了知識,但是仍存在錯誤和不完善的地方。

基于相同的數(shù)據(jù),項目團隊還訓(xùn)練了醫(yī)療版本的 ChatGLM 模型:ChatGLM-6B-Med。

這些模型在醫(yī)療領(lǐng)域的問答效果得到了顯著提升,下面是不同模型的效果對比:

d573ca86-ed4c-11ed-90ce-dac502259ad0.png

由此可見,指令微調(diào)在醫(yī)療領(lǐng)域具有很大的應(yīng)用潛力。

同時,該項目還嘗試將醫(yī)學(xué)文獻的【結(jié)論】融入多輪對話,在此基礎(chǔ)上對 LLaMA 進行指令微調(diào),以進一步提高模型的實用性。

目前,項目團隊只開放針對”肝癌“單個疾病訓(xùn)練的模型參數(shù)。未來計劃發(fā)布融入文獻結(jié)論的醫(yī)學(xué)對話數(shù)據(jù)集,并且會針對“肝膽胰”相關(guān) 16 種疾病訓(xùn)練模型。這將有助于廣泛應(yīng)用于更多疾病的診斷和治療建議。

下面是訓(xùn)練樣本的示例:

d58ccb08-ed4c-11ed-90ce-dac502259ad0.png

華駝項目團隊稱下一個發(fā)布的新模型會被命名為扁鵲 (PienChueh)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3248

    瀏覽量

    48864
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    526

    瀏覽量

    10277
  • 知識圖譜
    +關(guān)注

    關(guān)注

    2

    文章

    132

    瀏覽量

    7709
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    0

    文章

    288

    瀏覽量

    351

原文標(biāo)題:首個中文醫(yī)學(xué)知識LLM:真正的賽華佗—華駝(HuaTuo)

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Smarter跑步鞋:生物醫(yī)學(xué)與健身設(shè)備的完美結(jié)合

    利用現(xiàn)代信息通訊技術(shù)(ICT),整合檢測裝置、控制保障、預(yù)防傷害以及生物醫(yī)學(xué)知識,設(shè)計一款新型的“智能”(Smarter)跑步鞋。該項技術(shù)適應(yīng)于包括Web2.0功能的移動互聯(lián)網(wǎng),為整合在跑步者中現(xiàn)行流行的基于智能手機的心臟速率檢測器或全球?qū)Ш蕉ㄎ幌到y(tǒng)提供了可能。
    發(fā)表于 01-25 09:18 ?1095次閱讀

    中文編碼的基礎(chǔ)知識

    中文編碼的基礎(chǔ)知識:1.本文主要包括以下幾個方面:編碼基本知識,java,系統(tǒng)軟件,url,工具軟件等。在下面的描述中,將以"中文"兩個字為例,經(jīng)查表可以知道其GB2312編碼
    發(fā)表于 07-11 06:45

    中國首個中文離線語音模塊標(biāo)準(zhǔn)即將誕生

    2019年11月27日,全國家用自動控制器標(biāo)準(zhǔn)化委員會組織了全國一百多位專家,在福州市召開了五屆三次工作年會,并對《家用及類似電器用中文離線語音識別控制模塊技術(shù)規(guī)范》等六個團標(biāo)和行標(biāo)進行了審查
    發(fā)表于 12-18 16:35

    秋DFM 安裝后是英文版,怎么切換為中文?

    秋DFM有英文版和中文版,安裝會跟隨電腦語言變化。如果安裝后是英文版怎么修改為中文版呢?1、在任務(wù)欄軟件圖標(biāo)右擊,選擇“設(shè)置”。2、在“設(shè)置”里將軟件語言切換為中文。3、重啟軟件后就
    發(fā)表于 07-13 18:11

    20屆電腦知識題庫(已分類)

    20屆電腦知識題庫(已分類), 電腦知識必備
    發(fā)表于 01-06 10:22 ?10次下載

    人類發(fā)現(xiàn)首個中等質(zhì)量黑洞

    日前,美國和歐洲的天文學(xué)家宣布,他們首次探測到了一個中等質(zhì)量的黑洞。這項由超過1500名研究人員參與的引力波探測研究顯示,約70億年前,質(zhì)量分別為太陽的66倍和85倍的兩個黑洞,在發(fā)生激烈碰撞后,形成了一個新的中等質(zhì)量黑洞。這也是人類迄今探測到的首個中等質(zhì)量黑洞。
    的頭像 發(fā)表于 11-08 09:07 ?1502次閱讀

    網(wǎng)絡(luò)華佗 | 軟SDN運維不用怕,iMaster NCE-FabricInsight網(wǎng)絡(luò)華佗幫您忙

    往期 精彩 推薦 網(wǎng)絡(luò)華佗 | “千人千面”的網(wǎng)絡(luò)華佗,你愛了嗎? 網(wǎng)絡(luò)華佗|網(wǎng)購送達越來越快?是誰在為你保駕護航? 網(wǎng)絡(luò)華佗|如何讓球館Wi-Fi網(wǎng)絡(luò)體驗狂飆? 點擊“閱讀原文”,了
    的頭像 發(fā)表于 06-12 18:25 ?604次閱讀
    網(wǎng)絡(luò)<b class='flag-5'>華佗</b> | 軟SDN運維不用怕,iMaster NCE-FabricInsight網(wǎng)絡(luò)<b class='flag-5'>華佗</b>幫您忙

    基于醫(yī)學(xué)知識增強的基礎(chǔ)模型預(yù)訓(xùn)練方法

    對領(lǐng)域?qū)I(yè)知識的高度依賴和其本身細粒度的特征,通用基礎(chǔ)模型在醫(yī)療領(lǐng)域的應(yīng)用十分有限。因此,如何將醫(yī)療知識注入模型,提高基礎(chǔ)模型在具體診療任務(wù)上的準(zhǔn)確度與可靠性,是當(dāng)前醫(yī)學(xué)人工智能研究領(lǐng)域的熱點。 ? 在此背景之下,上海交通大學(xué)與
    的頭像 發(fā)表于 07-07 11:10 ?814次閱讀
    基于<b class='flag-5'>醫(yī)學(xué)知識</b>增強的基礎(chǔ)模型預(yù)訓(xùn)練方法

    最新綜述!當(dāng)大型語言模型(LLM)遇上知識圖譜:兩大技術(shù)優(yōu)勢互補

    LLM 是黑箱模型,缺乏可解釋性,因此備受批評。LLM 通過參數(shù)隱含地表示知識。因此,我們難以解釋和驗證 LLM 獲得的知識。此外,
    的頭像 發(fā)表于 07-10 11:35 ?2043次閱讀
    最新綜述!當(dāng)大型語言模型(<b class='flag-5'>LLM</b>)遇上<b class='flag-5'>知識</b>圖譜:兩大技術(shù)優(yōu)勢互補

    Stability AI發(fā)布首個用于編程的生成式LLM AI產(chǎn)品—StableCode

    Stability AI 近日宣布了他們首個用于編程的生成式 LLM AI 產(chǎn)品 ——StableCode。該產(chǎn)品旨在幫助程序員完成日常工作,并為新手開發(fā)者提供實用的學(xué)習(xí)工具。
    的頭像 發(fā)表于 08-24 11:27 ?888次閱讀
    Stability AI發(fā)布<b class='flag-5'>首個</b>用于編程的生成式<b class='flag-5'>LLM</b> AI產(chǎn)品—StableCode

    網(wǎng)絡(luò)華佗 | 大明星出行記

    往期 精彩 推薦 網(wǎng)絡(luò)華佗 | 如何在茫茫人海中保障VIP的用網(wǎng)體驗? 網(wǎng)絡(luò)華佗 | 軟SDN運維不用怕,iMaster NCE-FabricInsight網(wǎng)絡(luò)華佗幫您忙 網(wǎng)絡(luò)華佗 |
    的頭像 發(fā)表于 10-24 16:05 ?391次閱讀
    網(wǎng)絡(luò)<b class='flag-5'>華佗</b> | 大明星出行記

    網(wǎng)絡(luò)華佗 | iMaster NCE-FabricInsight帶你玩轉(zhuǎn)網(wǎng)絡(luò)“迷宮”

    相關(guān)閱讀 網(wǎng)絡(luò)華佗 | 大明星出行記 網(wǎng)絡(luò)華佗 | 如何在茫茫人海中保障VIP的用網(wǎng)體驗? 網(wǎng)絡(luò)華佗 | 軟SDN運維不用怕,iMaster NCE-FabricInsight網(wǎng)絡(luò)華佗
    的頭像 發(fā)表于 11-29 18:15 ?576次閱讀
    網(wǎng)絡(luò)<b class='flag-5'>華佗</b> | iMaster NCE-FabricInsight帶你玩轉(zhuǎn)網(wǎng)絡(luò)“迷宮”

    首個中紅外波長超級反射鏡制成,反射率為99.99%

    來自奧地利、美國和瑞士的科學(xué)家組成的國際科研團隊,研制出了首個中紅外波長范圍超級反射鏡,有望用于測量微量溫室氣體或用于切割和焊接的工業(yè)激光器等領(lǐng)域。
    的頭像 發(fā)表于 12-11 09:27 ?700次閱讀

    MR混合現(xiàn)實情景實訓(xùn)教學(xué)在臨床醫(yī)學(xué)課堂中的應(yīng)用

    醫(yī)學(xué)知識。 在臨床醫(yī)學(xué)課堂中,**[MR混合現(xiàn)實情景實訓(xùn)教學(xué)]**的應(yīng)用可以帶來許多優(yōu)勢。首先,它可以通過提供模擬的疾病和手術(shù)場景,使學(xué)生有機會在安全的環(huán)境中實踐操作。其次,這種技術(shù)可以幫助學(xué)生更好地理解和記憶復(fù)雜的醫(yī)學(xué)概念
    的頭像 發(fā)表于 01-17 09:51 ?310次閱讀

    如何訓(xùn)練自己的LLM模型

    訓(xùn)練自己的大型語言模型(LLM)是一個復(fù)雜且資源密集的過程,涉及到大量的數(shù)據(jù)、計算資源和專業(yè)知識。以下是訓(xùn)練LLM模型的一般步驟,以及一些關(guān)鍵考慮因素: 定義目標(biāo)和需求 : 確定你的LLM
    的頭像 發(fā)表于 11-08 09:30 ?568次閱讀