近來,微軟對(duì)于提示工程能力的最新研究1(鏈接詳見文末)再次吸引了一眾媒體的目光:“無需額外微調(diào)、無需專業(yè)策劃,僅憑提示GPT-4就能化身專家!”報(bào)道中這樣描述道2。
基于最新提示策略Medprompt,GPT-4在醫(yī)療專業(yè)領(lǐng)域MultiMed QA的九個(gè)測試集中,均取得最優(yōu)結(jié)果。不僅如此,在MedQA數(shù)據(jù)集(美國醫(yī)師執(zhí)照考試題)上,Medprompt還令GPT-4的準(zhǔn)確率首次超過了90%,超越了BioGPT和Med-PaLM等微調(diào)方法。
圖為Artificial Intuition作者Carlos E. Perez在社交媒體上坦言“出色的提示策略可以更勝微調(diào)一籌”,相關(guān)內(nèi)容還獲得沃頓商學(xué)院教授Ethan Mollick等的轉(zhuǎn)發(fā)
基于上述報(bào)道,全新AI技術(shù)對(duì)醫(yī)療領(lǐng)域的顛覆式影響可見一斑。事實(shí)上,早在ChatGPT發(fā)布之初,微軟創(chuàng)始人比爾·蓋茨(Bill Gates)就曾有言:以GPT為代表的技術(shù)革命將改變世界3。醫(yī)療健康作為現(xiàn)代社會(huì)中人類最關(guān)心的領(lǐng)域,必將出現(xiàn)革命性的變化,創(chuàng)新式技術(shù)、方法的不斷涌現(xiàn)將更有利于提高診療水平、降低疾病風(fēng)險(xiǎn)、改善生活質(zhì)量。
對(duì)于技術(shù)之于醫(yī)療的關(guān)系,OpenAI創(chuàng)始人薩姆·奧爾特曼(Sam Altman)也曾表示——運(yùn)用AI提高人類健康水平,將為全世界帶來巨大的益處。
但前進(jìn)之路并非坦途,AI醫(yī)療或?qū)⒚媾R多方考驗(yàn)。本期專欄文章,我們基于《The AI Revolution in Medicine: GPT-4 and Beyond》(中譯版名為《超越想象的GPT醫(yī)療》)一書,探討AI大模型與未來醫(yī)療前景。
專欄導(dǎo)讀
“2023年是具有里程碑意義的一年。這一年,如同蒸汽機(jī)之于工業(yè)革命,人工智能已然成為顛覆世界的新生產(chǎn)范式。隨著Copilot時(shí)代的到來,AI工具躍升成為人們工作、生活不可或缺的部分,全面提升著全球生產(chǎn)力水平,為人類應(yīng)對(duì)那些最緊迫的挑戰(zhàn)提供著支持。
GPT技術(shù)的最新突破對(duì)醫(yī)療健康等領(lǐng)域產(chǎn)生了深遠(yuǎn)甚至顛覆性的影響,專業(yè)人士有必要抓住AI帶來的機(jī)會(huì),獲得更高的效率,完成更有意義的工作。微軟希望通過持續(xù)創(chuàng)新,讓全球80億人都能夠享受到更加個(gè)性化的智能醫(yī)療服務(wù),讓不可能成為可能?!?/span>
張祺
微軟全球資深副總裁
當(dāng)AI與醫(yī)療相遇
?AI輔助醫(yī)療創(chuàng)意圖 由New Bing生成
當(dāng)AI與醫(yī)療相遇,究竟會(huì)發(fā)生什么?首先,讓我們一起看看來自《超越想象的GPT醫(yī)療》引言部分的一個(gè)GPT醫(yī)療場景。(*注:該示例并非現(xiàn)實(shí),因GPT-4尚未在醫(yī)院中廣泛應(yīng)用,但所描述的情景完全符合OpenAI GPT-4系統(tǒng)的現(xiàn)有能力。)
圖為《超越想象的GPT醫(yī)療》中文版封面,該書的作者之一彼得·李(Peter Lee)系微軟全球資深副總裁,領(lǐng)導(dǎo)微軟研究院及新技術(shù)孵化業(yè)務(wù),包括如今快速發(fā)展的醫(yī)療和生命科學(xué)領(lǐng)域
患者的病情突然惡化。他的心率急速上升至每分鐘 160次以上,但血壓卻降至危險(xiǎn)的80/50毫米汞柱?;颊呙纨嬌n白,略帶青紫,并急促地喘息著。然而,這并不像是他患有的囊性纖維化的典型癥狀。作為二年級(jí)的醫(yī)學(xué)住院實(shí)習(xí)生,克里斯騰一邊撥打緊急號(hào)碼,一邊與其他團(tuán)隊(duì)成員一起迅速采取行動(dòng),將一支又一支注射器插入患者的靜脈輸液器,試圖通過注入升壓藥物來提高血壓,但這并未奏效,用于增強(qiáng)心肌收縮力的藥物同樣沒有效果。
克里斯騰拿出手機(jī),打開GPT-4應(yīng)用程序,說道:“患者胡安對(duì)血壓支持沒有反應(yīng)。他的病歷顯示,他最近接受了諾氟沙星第二階段研究引發(fā)的血液感染治療。我不知道發(fā)生了什么,也不知道怎么辦?!?/p>
▲AI輔助醫(yī)療創(chuàng)意圖 Getty
GPT-4回復(fù): “胡安所使用的實(shí)驗(yàn)性抗生素與5% 的患者白細(xì)胞減少有關(guān),這一結(jié)論源于最近發(fā)表的一篇第二階段研究論文。在過去兩天內(nèi),他的白細(xì)胞計(jì)數(shù)在連續(xù)三次抽血檢測中呈下降趨勢。研究發(fā)現(xiàn),G-CSF(粒細(xì)胞集落刺激因子) 在恢復(fù)白細(xì)胞數(shù)量方面具有很好的效果。這是一個(gè)值得考慮的策略?!?/p>
克里斯騰立刻明白了其中的意思,由于胡安的白細(xì)胞減少,他變得易感染,導(dǎo)致了敗血癥的發(fā)生。她致電藥房,要求發(fā)送一劑 G-CSF 輸注液,同時(shí)準(zhǔn)備詳細(xì)核查這項(xiàng)新研究結(jié)果,對(duì)GPT-4說:“讓我看看那篇第二階段研究報(bào)告?!?/p>
研究概述和相關(guān)論文都出現(xiàn)在她的手機(jī)屏幕上,她請(qǐng)求GPT-4 為她概括這些信息。果然,感染病學(xué)雜志上的報(bào)道印證了 AI所言,并且最新的實(shí)驗(yàn)室數(shù)據(jù)顯示,患者的白細(xì)胞數(shù)量甚至低于她在接觸化療的時(shí)候。克里斯騰實(shí)施了輸注,看著胡安被送往了重癥監(jiān)護(hù)室。
她對(duì)GPT-4說道:“給他注射了 G-CSF,希望能見效?!?/p>
▲AI輔助醫(yī)療創(chuàng)意圖 Getty
GPT-4回應(yīng)道: “面對(duì)患者病情如此迅速地惡化,確實(shí)壓力很大。先前的研究表明,在其他患者中也觀察到類似的狀況,而且G-CSF 的療效始終穩(wěn)定。請(qǐng)放心,你已竭盡所能,你的團(tuán)隊(duì)會(huì)與你同在?!?/p>
她對(duì)著手機(jī)說:“胡安需要更換一種更昂貴的抗生素。我得向他的保險(xiǎn)公司申請(qǐng)預(yù)先授權(quán)。請(qǐng)幫我寫一段理由,我將把它填入表格中?!?/p>
“好的?!睅酌腌姾螅欢?00 字的文本出現(xiàn)在她的手機(jī)屏幕上,這是為保險(xiǎn)公司預(yù)授權(quán)申請(qǐng)表格而準(zhǔn)備的。文本概述了胡安曾使用過的所有其他抗生素及其對(duì)這些藥物的耐藥性記錄。同時(shí),它簡要介紹了關(guān)于他所需的新抗生素的7項(xiàng)研究,并估計(jì)了如果保險(xiǎn)無法支付這種藥物的費(fèi)用,可能導(dǎo)致的因長期住院而產(chǎn)生的翻倍費(fèi)用。
“請(qǐng)將這段文字和預(yù)授權(quán)表格的鏈接發(fā)送至我的收件箱,”克里斯騰邊走邊說,走向下一個(gè)患者。
摘自《超越想象的GPT醫(yī)療》
在這個(gè)虛擬案例中,GPT-4 可以根據(jù)可靠的信息來源回答患者或?qū)I(yè)人士的醫(yī)學(xué)問題;能運(yùn)用自然語言生成技術(shù)從醫(yī)療記錄或文獻(xiàn)中提煉摘要或報(bào)告;還能借助自然語言理解技術(shù)幫助醫(yī)護(hù)人員進(jìn)行臨床決策或記錄,減輕煩瑣的文書工作。
更讓人振奮的是,想象已經(jīng)照進(jìn)現(xiàn)實(shí),這樣的故事正在真實(shí)上演4。
4歲男孩Alex在某次運(yùn)動(dòng)后,身體開始劇痛。Alex的母親Courtney在三年時(shí)間里帶他看了17名醫(yī)生,從牙科、兒科、骨科到各種專家,先后進(jìn)行了磁共振成像(MRI)等一系列檢查,但沒一個(gè)真正找出病因。
?
醫(yī)療創(chuàng)意圖 Getty
直到不抱太多希望的母親Courtney注冊(cè)了一個(gè)ChatGPT賬號(hào),整個(gè)事件出現(xiàn)了180度大逆轉(zhuǎn)。Courtney將Alex的癥狀和MRI報(bào)告中的注釋一并輸入對(duì)話框,其中有一個(gè)細(xì)節(jié),就是Alex無法完成盤腿坐的動(dòng)作。ChatGPT給出了診斷——脊髓栓系綜合征(TCS)。
Courtney帶著這一結(jié)論和Alex的MRI報(bào)告,找到了神經(jīng)外科醫(yī)生。這次終于找對(duì)了人,神外醫(yī)生看了一眼MRI就給出了和ChatGPT一樣的結(jié)論,并指出了栓系的具體位置!后來Alex接受了手術(shù)治療,目前正在進(jìn)行康復(fù)。
在上述的兩個(gè)案例中,GPT-4似乎擁有異常豐富的醫(yī)學(xué)知識(shí),或許有不少讀者會(huì)心存疑慮,GPT-4真有這么厲害嗎?
就GPT-4目前的表現(xiàn)看來,它,確實(shí)強(qiáng)大得令人驚嘆。
3大技能疊加
AI能力實(shí)測
技能1:學(xué)富五車,無所不知
在醫(yī)療領(lǐng)域應(yīng)用大模型前,我們首先感興趣的是,大模型的醫(yī)學(xué)知識(shí)是否足夠。美國職業(yè)醫(yī)師資格考試是美國醫(yī)學(xué)界對(duì)具有執(zhí)業(yè)醫(yī)師資格的醫(yī)學(xué)生和畢業(yè)生進(jìn)行的一種標(biāo)準(zhǔn)化考試,通過考試后,才可以獲得在美國執(zhí)業(yè)的資格。當(dāng)使用一整套美國職業(yè)醫(yī)師資格考試問題對(duì)GPT-4進(jìn)行測試時(shí),GPT-4的正確率超過90%。作為目前最先進(jìn)的大模型代表,雖然GPT-4并非專門為醫(yī)學(xué)領(lǐng)域打造,但其展現(xiàn)出的醫(yī)學(xué)知識(shí)能力已經(jīng)非常出色,將大模型應(yīng)用于醫(yī)療領(lǐng)域讓許多人非??春谩?/p>
技能2:醫(yī)護(hù)人員的智能助手
在傳統(tǒng)醫(yī)療健康領(lǐng)域,醫(yī)護(hù)人員和患者是該領(lǐng)域中的兩個(gè)重要組成部分。對(duì)醫(yī)護(hù)人員來說,大模型是一種能夠與人合作、提升工作效率的智能助手。
大模型擁有強(qiáng)大的自然語言處理能力,借助語音識(shí)別等技術(shù),能夠根據(jù)醫(yī)生和患者之間的交流,自動(dòng)幫助醫(yī)生生成電子健康記錄,以及填寫保險(xiǎn)的事前授權(quán)等,把醫(yī)生從這些繁瑣的工作中解放出來。這具有十分重要的現(xiàn)實(shí)意義,使得醫(yī)護(hù)人員有更多的時(shí)間用于關(guān)愛患者,從而在親自從事護(hù)理時(shí)獲得更高的成就感。在治療方面,大模型可以幫助醫(yī)生對(duì)病人的病歷和醫(yī)學(xué)數(shù)據(jù)進(jìn)行更加全面和深入的分析,給出相應(yīng)的治療建議,幫助醫(yī)生制定更加精準(zhǔn)的治療方案,提高醫(yī)生的診斷水平和治療效果。
技能3:患者的超級(jí)醫(yī)療顧問
對(duì)于患者來說,大模型可以作為高級(jí)的醫(yī)學(xué)知識(shí)搜索引擎,充當(dāng)患者的超級(jí)醫(yī)療顧問。當(dāng)今全球有一半的人口,約40億人缺乏足夠的醫(yī)療保健服務(wù)(書中第119頁),AI大模型豐富的醫(yī)學(xué)知識(shí),在很大程度上可以填補(bǔ)醫(yī)療保健服務(wù)的空白,這對(duì)于偏遠(yuǎn)貧窮地區(qū)的人們格外重要,并能為貧窮人員節(jié)省許多就醫(yī)費(fèi)用。
?
AI輔助醫(yī)療創(chuàng)意圖 Getty
同時(shí),GPT-4等大模型本身具有強(qiáng)大的自然語音理解和對(duì)話能力,在和患者聊天的過程中,GPT-4不僅回答內(nèi)容條理清晰,還能對(duì)一些伴有主觀情緒的問題做出有效回復(fù),讓人感覺到它充滿同情心,能夠與患者共情。雖然大模型不是人,不具備人的情感,但能在一定程度上緩解、減輕患者的焦慮,這本身就具有十分重要的意義。
因此,微軟公司前副總裁格雷格·穆爾博士認(rèn)為,AI 醫(yī)學(xué)正朝著一個(gè)全新的醫(yī)療體系演進(jìn),在傳統(tǒng)的“醫(yī)生-患者”關(guān)系中引入AI實(shí)體,作為三角關(guān)系的第三支柱。不管是從醫(yī)生還是患者的角度,大模型都是一個(gè)全新的AI伙伴,能夠與人密切協(xié)作。
但是,不得不提的是,目前的AI遠(yuǎn)非完美,它既需要繼續(xù)學(xué)習(xí),也需要被有效監(jiān)管。
機(jī)遇與挑戰(zhàn)并存,
AI修煉還需“仁心”
首先,作為AI研究人員,我們需要思考的是,如何充分利用大模型的能力,來暢想和構(gòu)建未來的醫(yī)療。
生成式的大模型,并不總是提供真實(shí)的信息,因此需要對(duì)結(jié)果進(jìn)行仔細(xì)審查。醫(yī)療錯(cuò)誤一直以來都是個(gè)頑固的問題,技術(shù)的進(jìn)步與危險(xiǎn)錯(cuò)誤信息的增加總是相伴相生,新技術(shù)的運(yùn)用需要盡可能地避免加重這一問題。微軟總裁布拉德·史密斯在《工具,還是武器?》一書中提到,當(dāng)一個(gè)技術(shù)或工具能力非常強(qiáng)大時(shí),它所帶來的幫助和危害同時(shí)也是巨大的。作為計(jì)算機(jī)科學(xué)的研究人員,需要始終考慮,如何以負(fù)責(zé)任、安全和有效的方式利用大模型。
正因?yàn)槿绱耍④洺闪⒘藢iT的研究部門“人工智能道德委員會(huì)”,以保證人工智能技術(shù)和大模型應(yīng)用的公平性、可靠性和安全性。
在中文語境下,我們形容德才兼?zhèn)涞尼t(yī)者“妙手仁心”,AI想成為“妙手”或許不難,但要習(xí)得“仁心”卻任重道遠(yuǎn)。從臨床醫(yī)學(xué)的角度,應(yīng)用AI 大模型帶來的不可避免的問題在于,大模型缺乏一個(gè)明確的人來衡量價(jià)值體系,因此難以檢驗(yàn)醫(yī)療過程中的人性化關(guān)懷。
?
AI輔助醫(yī)療創(chuàng)意圖 Getty
例如,大模型沒有明確指標(biāo)來表示,一位鋼琴家寧愿冒著死亡的風(fēng)險(xiǎn),也不愿因糖尿病引發(fā)的壞疽癥而截取手指。大模型的回答目前還無法周全考慮患者的偏好、價(jià)值觀、對(duì)風(fēng)險(xiǎn)的態(tài)度以及人類的眾多偏見。縱然GPT-4能夠在執(zhí)業(yè)資格考試中取得優(yōu)異成績,但這是否就足以讓患者和醫(yī)生對(duì)大規(guī)模應(yīng)用GPT-4這樣的大模型感到安心?答案恐怕不盡如人意。
要讓大眾對(duì)大模型做出的醫(yī)療決策有足夠的信心,需要我們對(duì)大模型進(jìn)行更深入、更全面的研究和探索,需要我們對(duì)安全利用大模型有更深層的思考和更有效的掌控,只有這樣,最終大模型在醫(yī)療領(lǐng)域才能夠真正落地,造福人類。
問題重重,答案寥寥。如微軟(中國)公司首席技術(shù)官韋青所言,盡管當(dāng)下AI領(lǐng)域時(shí)有日新月異的突破,但是沒有答案的問題遠(yuǎn)多過有答案的問題。如何塑造我們的AI未來,以期實(shí)現(xiàn)單憑人類或AI無法實(shí)現(xiàn),而人類與AI結(jié)合卻可以完成的目標(biāo),達(dá)到更高的成就,是我們當(dāng)下需要重點(diǎn)思考和著手研究的問題。
LLM專欄作者:房磊
微軟(亞洲)互聯(lián)網(wǎng)工程院
高級(jí)研究員
[1]https://arxiv.org/pdf/2311.16452.pdf
[2]https://mp.weixin.qq.com/s/l5WJnpF9sY6htciztYUEnQ
[3]https://www.cnbc.com/2023/02/10/bill-gates-says-ai-like-chatgpt-is-the-most-important-innovation.html
[4]ChatGPT Diagnosed A Boy's Pain. 17 Doctors Over 3 Years Could Not (today.com)
本文為《AI觀察》專欄系列文章之一
專欄介紹:AI大航海時(shí)代,前沿技術(shù)無疑為行業(yè)革新、企業(yè)增長與創(chuàng)意變現(xiàn)提供了新機(jī)遇,一場創(chuàng)新模式的革命已如箭在弦,這正是我們策劃此專欄系列文章的初衷。在此,來自微軟(亞洲)互聯(lián)網(wǎng)工程院的首席應(yīng)用科學(xué)家以及高級(jí)、資深研究員們,將在系列專欄文章中分享他們對(duì)人工智能、大語言模型及其應(yīng)用領(lǐng)域如何實(shí)現(xiàn)技術(shù)賦能的洞察及前瞻。更多專欄內(nèi)容,敬請(qǐng)期待!
-
微軟
+關(guān)注
關(guān)注
4文章
6620瀏覽量
104246
原文標(biāo)題:AI觀察 | 今年最火的GPT-4,正在締造科幻版妙手仁心!
文章出處:【微信號(hào):mstech2014,微信公眾號(hào):微軟科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論