醫(yī)療領(lǐng)域存在一些長久以來的弊病,現(xiàn)在很多人相信人工智能技術(shù)有望為這些問題帶來根本性的解決方案。近日,Nature Medicine 發(fā)布了斯克里普斯研究所(Scripps Research)Eric J. Topol 的「高性能醫(yī)學(xué)」綜述論文,文中認(rèn)為醫(yī)學(xué)領(lǐng)域內(nèi) AI 的發(fā)展目標(biāo)是人類智能與機器智能的結(jié)合。
有標(biāo)注大數(shù)據(jù)的使用以及顯著提升的計算能力和云存儲實現(xiàn)了人工智能在各行各業(yè)的應(yīng)用,尤其是其中的深度學(xué)習(xí)子類別。在醫(yī)學(xué)領(lǐng)域,人工智能開始在三個層面產(chǎn)生影響:臨床(主要是通過快速、準(zhǔn)確的圖像解讀)、健康系統(tǒng)(通過改善工作流程和降低醫(yī)療錯誤的潛力)、病人(讓他們能處理自己的數(shù)據(jù),從而提升健康狀況)。本文也將會討論當(dāng)前的局限性(包括偏差/偏見、隱私和安全、缺乏透明)以及這些應(yīng)用的未來方向。隨著時間的推移,準(zhǔn)確度、生產(chǎn)力和工作流程方面很可能能夠?qū)崿F(xiàn)顯著的提升,但這會被用于改善醫(yī)患關(guān)系還是導(dǎo)致其惡化,這一點還有待觀察。
醫(yī)學(xué)位于兩大主要趨勢的交叉口。第一個趨勢是業(yè)務(wù)模式的失敗——雖然與醫(yī)療保健相關(guān)的支出和工作崗位都在增加,但關(guān)鍵的結(jié)果卻每況愈下,包括美國預(yù)期壽命下降以及較高的嬰兒、兒童和孕產(chǎn)婦死亡率。這體現(xiàn)了一個悖論,一個并不僅限于美國醫(yī)學(xué)界的悖論:投入更多人力資本卻得到了更糟糕的人類健康狀況。第二個趨勢是數(shù)據(jù)正大規(guī)模地生成,其來源包括高分辨率醫(yī)療成像、具有持續(xù)的生理指標(biāo)輸出的生物傳感器、基因組測序和電子病歷。僅靠人類很顯然已經(jīng)難以分析這些數(shù)據(jù),也就必須增加對機器的依賴。因此,為了提供醫(yī)療保健,在對人類的依賴超越以往的同時,我們也迫切需要算法提供幫助。然而,在醫(yī)學(xué)領(lǐng)域,人類與人工智能(AI)的整合才剛剛開始。
從更深層次看,醫(yī)療保健領(lǐng)域存在顯著的長期缺陷,正是這些缺陷導(dǎo)致其回報越來越低。其中包括大量嚴(yán)重的誤診、治療方法錯誤、資源的極大浪費、低效的工作流程、不平等、患者和臨床醫(yī)生之間時間不足。帶著改善這些問題的渴望,醫(yī)療行業(yè)的領(lǐng)軍者與計算機科學(xué)家聲稱 AI 也許能幫助解決所有這些問題。也許最后確實會如此,但研究者才剛剛開始使用神經(jīng)網(wǎng)絡(luò)來改良醫(yī)療實踐中的弊病。在這篇回顧中,我收集了很多在醫(yī)學(xué)領(lǐng)域使用 AI 的已有證據(jù),并列出了其中的機會和陷阱。
臨床醫(yī)生使用的人工智能
幾乎每種類型的臨床醫(yī)生(從專科醫(yī)生到護(hù)理人員)未來都將會使用 AI 技術(shù),尤其是深度學(xué)習(xí)。這很大程度上涉及到使用(DNN)的模式識別,這可以幫助解讀醫(yī)療掃描結(jié)果、病理切片、皮膚病變、視網(wǎng)膜圖像、心電圖、內(nèi)窺鏡檢查、面部和生命體征。我們通常使用一種真陽性與假陽性比率的圖表(被稱為受試者工作特征曲線(ROC))來比較神經(jīng)網(wǎng)絡(luò)的解讀結(jié)果與醫(yī)生的評估,使用該曲線下的面積(AUC)來表示神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確度水平。
放射科
病理學(xué)
皮膚科
眼科
心臟病學(xué)
消化內(nèi)科
心理健康
表 1:與醫(yī)生比較的經(jīng)過同行評議的 AI 算法論文
表 2:美國食品藥品監(jiān)督管理局(FDA)正在加速審批 AI
人工智能與健康系統(tǒng)
理論上而言,預(yù)測關(guān)鍵性結(jié)果的能力能讓醫(yī)院更有效和更準(zhǔn)確地使用姑息療法。
使用電子病歷數(shù)據(jù),機器學(xué)習(xí)和深度學(xué)習(xí)算法可以預(yù)測很多重要的臨床參數(shù),涵蓋阿爾茨海默病到死亡等許多情況。
表 3:這里選擇性地展示了一些用于預(yù)測臨床結(jié)果和相關(guān)參數(shù)的機器學(xué)習(xí)與深度學(xué)習(xí)算法
除了電子病歷的數(shù)據(jù),也可以使用影像來提升預(yù)測準(zhǔn)確度。有多項研究試圖預(yù)測生物學(xué)年齡,而結(jié)果已經(jīng)表明使用基于 DNA 甲基化的生物標(biāo)志物來完成這一任務(wù)是最佳的。
人工智能與患者
深度學(xué)習(xí)算法的發(fā)展讓公眾可以將自己的醫(yī)療保健掌控在自己手中,但這方面的工作目前落后于臨床和健康系統(tǒng)。這類算法中有一些已經(jīng)獲得了 FDA 的批準(zhǔn),正處于后期臨床開發(fā)階段。
圖 2:AI 在人類生命周期中的應(yīng)用實例。dx 表示診斷;IVF 表示體外受精;K+ 表示血鉀水平
研究者也在尋求通過 AI 借助智能手機完成一些醫(yī)療診斷,其中包括皮膚病變和皮疹、耳部感染、偏頭痛和視網(wǎng)膜疾?。ū热缣悄虿⌒砸暰W(wǎng)膜病變以及與年齡相關(guān)的黃斑變性)。
科學(xué)家也在研究如何整合有關(guān)人體健康狀況的多模態(tài)數(shù)據(jù)。最終,當(dāng)可以整合一個個體的所有數(shù)據(jù)與醫(yī)療文獻(xiàn)語料庫時,就有可能實現(xiàn)全面系統(tǒng)的預(yù)防方法。
圖 3:使用多模態(tài)數(shù)據(jù)輸入和算法的虛擬醫(yī)療教練模型,能夠提供個性化的指導(dǎo)。使用來自個體的全面輸入的虛擬醫(yī)療教練經(jīng)過深度學(xué)習(xí)后,可以為人們提供保持健康的建議。
人工智能與數(shù)據(jù)分析
在臨床實踐的上游,生命科學(xué)領(lǐng)域內(nèi)的 AI 進(jìn)展明顯要快得多,也有廣泛的有同行評議的出版物,這是在沒有監(jiān)管監(jiān)督時更容易驗證的道路,而且科研界有遠(yuǎn)遠(yuǎn)更強的實現(xiàn)意愿。正如聽診器是醫(yī)生的標(biāo)志一樣,顯微鏡是科學(xué)家的標(biāo)志??茖W(xué)家目前正在研究一些「無圖像的」顯微方法。除了改進(jìn)無圖像顯微方法和細(xì)胞分析,深度學(xué)習(xí)人工智能也已被用于恢復(fù)或修復(fù)失焦圖像。而且計算機視覺也已經(jīng)幫助實現(xiàn)了單個細(xì)胞內(nèi)的 40-plex 蛋白質(zhì)和細(xì)胞器的高通量評估。
研究者也在使用 AI 工具來提升對癌癥演化方式的理解——他們將一種算法用在了多區(qū)域腫瘤測序數(shù)據(jù)上,將計算機視覺用于通過微流體隔離的在單個細(xì)胞分辨率上的活體癌細(xì)胞分析。
既然我們已經(jīng)在用「神經(jīng)網(wǎng)絡(luò)」描述 AI 了,那么生物神經(jīng)科學(xué)與人工智能互相提供靈感也就不足為奇了。
AI 已被用于重建神經(jīng)回路,能讓我們根據(jù)電子顯微成像理解連接組。AI 帶來的一個最激動人心的進(jìn)展是理解人類大腦的網(wǎng)格細(xì)胞。反過來,神經(jīng)形態(tài)計算(通過對大腦逆向工程來研發(fā)計算機芯片)不僅能實現(xiàn)更高效的計算,還能幫助研究者理解大腦回路和構(gòu)建腦機接口。使用遷移學(xué)習(xí)算法實現(xiàn)人類和動物行為的機器視覺跟蹤是另一個正在進(jìn)行中的進(jìn)展。
AI 正在多個層面上改寫藥物發(fā)現(xiàn)的方式,包括對生物醫(yī)學(xué)文獻(xiàn)的復(fù)雜的自然語言處理搜索、對數(shù)百萬分子結(jié)構(gòu)的數(shù)據(jù)挖掘、設(shè)計和制作新的分子、預(yù)測脫靶效應(yīng)和毒性、預(yù)測實驗藥物的合適劑量以及進(jìn)行大規(guī)模的細(xì)胞檢測分析。
局限和挑戰(zhàn)
盡管 AI 技術(shù)有望實現(xiàn)所有這些成就,但也存在艱巨的障礙和陷阱。AI 當(dāng)前的炒作熱潮已經(jīng)遠(yuǎn)遠(yuǎn)超出了 AI 科學(xué)的當(dāng)前現(xiàn)狀,尤其涉及到病患護(hù)理中的實現(xiàn)的驗證和可讀性時。IBM Watson Health 的癌癥 AI 算法(被稱為 Watson for Oncology)就是近期的一個案例。這個算法已被全球數(shù)百家醫(yī)院用于為癌癥患者推薦治療方法,但該算法卻基于少量合成的、非真實的案例,僅有非常有限的腫瘤專家的輸入(真實數(shù)據(jù))。實際輸出的很多治療方法建議都被證明是錯誤的,比如建議嚴(yán)重出血的患者使用貝伐珠單抗(Bevacizumab),這是一種明確的禁忌癥狀和該藥物的「黑箱」警告。這個例子說明有缺陷的算法有可能會給患者造成重大的傷害,導(dǎo)致醫(yī)療事故。不同于一位醫(yī)生的錯誤只會傷害到一位病人,機器算法有可能帶來巨大的醫(yī)源性風(fēng)險(iatrogenic risk)。因此在將 AI 算法用于醫(yī)療實踐時,需要進(jìn)行系統(tǒng)性的調(diào)試、審計、廣泛的模擬和驗證以及前瞻性的審查。還需要更多證據(jù)和穩(wěn)健的研究以達(dá)到 FDA 近期已經(jīng)降低了的審批醫(yī)療算法的監(jiān)管要求。
有關(guān)算法的黑箱的內(nèi)容已被寫了很多,圍繞這一主題的爭論也有很多;尤其是在 DNN 的情況中,我們有可能無法理解輸出的決定因素。這種不透明帶來了可解釋性需求,比如,歐盟的《一般數(shù)據(jù)保護(hù)條例》要求在將算法用于患者護(hù)理之前需要有透明性——打開算法的黑箱。盡管是否可以接受為患者護(hù)理使用不透明算法的爭議尚未解決,但仍需指出醫(yī)學(xué)實踐的很多方面都是不可解釋的,比如在不知道作用機制的前提下的藥物處方。
不平等是現(xiàn)今最重要的問題之一,尤其是在美國,也就是醫(yī)療護(hù)理并不向所有公民提供。大家都知道社會經(jīng)濟地位是過早死亡的一個主要風(fēng)險因素,有產(chǎn)者和無產(chǎn)者對 AI 的不成比例的應(yīng)用可能拉大兩者之間的現(xiàn)有差距。這種已經(jīng)存在的不平等之所以會加大,一個原因是現(xiàn)今很多算法中嵌入的偏見,這又源自于數(shù)據(jù)集中缺乏對少數(shù)群體的覆蓋。比如,有的診斷黑素瘤的皮膚科算法沒有覆蓋不同膚色以及使用基因組數(shù)據(jù)語料庫,這樣的算法在代表性不足的少數(shù)群體上存在嚴(yán)重問題。盡管有人認(rèn)為算法偏見還比不上人類偏見,但仍然還需要很多工作以消除嵌入的偏見,也需要爭取讓醫(yī)療研究提供真正有代表性的人口情況。
AI 在醫(yī)學(xué)領(lǐng)域的未來的一個最重要問題是能在確保數(shù)據(jù)的隱私和安全上做到多好。鑒于普遍存在的黑客攻擊和數(shù)據(jù)泄露問題,人們將不會有什么興趣使用有風(fēng)險泄漏患者病歷細(xì)節(jié)的算法。此外,也存在故意攻擊算法以造成大規(guī)模傷害的風(fēng)險,比如為糖尿病過量使用胰島素或刺激除顫器在心臟病患者的胸腔內(nèi)放電。通過人臉識別或基因序列從大規(guī)模數(shù)據(jù)庫中識別個人身份的可能性正越來越高,這又會進(jìn)一步阻礙對隱私的保護(hù)。與此同時,生成對抗網(wǎng)絡(luò)也可能模糊真相,幾乎有無限的操縱內(nèi)容的可能性,從而可能對健康非常不利。我們需要新的個人健康數(shù)據(jù)所有權(quán)模式、高度安全的數(shù)據(jù)平臺和政府立法(正如愛沙尼亞已經(jīng)實現(xiàn)的那樣),這樣才能應(yīng)對迫在眉睫的安全問題,否則 AI 在醫(yī)療領(lǐng)域的發(fā)展就會遭遇阻礙或失去機會。
考慮未來
我在這篇回顧中強調(diào)的一個關(guān)鍵點是將 AI 帶入醫(yī)學(xué)領(lǐng)域的故事才剛剛開始。對于機器能夠執(zhí)行的幫助臨床醫(yī)生或?qū)】迪到y(tǒng)有用的預(yù)測臨床結(jié)果的任務(wù),前瞻性的驗證真的非常少,對于以用戶為中心的算法就更少了。這個領(lǐng)域的承諾確實很多,而數(shù)據(jù)和證明相對較少。錯誤算法的風(fēng)險極大高于單個醫(yī)生-病患交互的風(fēng)險,但是降低誤差、低效和成本的回報也很大。因此,醫(yī)學(xué)領(lǐng)域的 AI 不能有例外——在患者護(hù)理中推出和實現(xiàn)之前,它需要嚴(yán)格的研究、在有同行評議的期刊上發(fā)表結(jié)果以及在真實世界環(huán)境中的臨床驗證。
圖 4:呼吁醫(yī)學(xué)領(lǐng)域中 AI 研究應(yīng)有正當(dāng)?shù)某绦?。在患者護(hù)理中實現(xiàn)之前,必需先在有同行評議的期刊上發(fā)表結(jié)果,在真實世界醫(yī)學(xué)場景中驗證。
有了這些警告,對 AI 最終將如何整合進(jìn)來要有合理的預(yù)期,這一點也很重要。現(xiàn)今有一種廣泛的炒作,說是醫(yī)生會被機器取代,我們可以將其與現(xiàn)實測試的自動駕駛汽車模型類比看看。大多數(shù)人都同意自動汽車是到目前為止 AI 最頂尖的技術(shù)成就,但「自動」一詞頗具誤導(dǎo)性。汽車工程師協(xié)會(SAE)已經(jīng)定義了五個自動化層級,其中第 5 級表示在所有情況下都完全由汽車控制,人類沒有任何可能性作為后備或接管汽車。現(xiàn)在普遍認(rèn)為這種定義的完全自動化很可能永遠(yuǎn)無法實現(xiàn),因為某些環(huán)境或道路條件會使得我們無法安全地使用這種車輛。基于同樣的原因,醫(yī)學(xué)可能永遠(yuǎn)無法突破第 3 級,這是一種有條件的自動化,因為其中肯定需要人類來監(jiān)管算法對圖像和數(shù)據(jù)的解讀。很難想象在治療病人時僅有非常有限的人類后備(第 4 級)。人類的健康太寶貴了——除了風(fēng)險極小的日常事務(wù)之外,還遠(yuǎn)遠(yuǎn)不能將其托付給機器。
圖 5:自動駕駛汽車與醫(yī)學(xué)自動化的類比。第 5 級是不存在人類醫(yī)生作為后備可能性的完全自動化,這不是目標(biāo)。第 4 級是僅在非常有限的條件下使用人類備份,這也不是目標(biāo)。目標(biāo)是協(xié)同,將機器做得最好的功能與那些最適合臨床醫(yī)生的工作結(jié)合起來。
激動人心的發(fā)展就在前方,但可能會比很多人預(yù)測的更遠(yuǎn)——軟件將快速、準(zhǔn)確和低成本地消化和有意義地處理大規(guī)模數(shù)據(jù),機器將有能力實現(xiàn)人類無法看到或做到的事情。這一能力最終將成為高性能醫(yī)學(xué)的基礎(chǔ),這是真正由數(shù)據(jù)驅(qū)動的,能減輕我們對人類資源的依賴,并最終將讓我們超越人類智能和機器智能單純相加之和。在生物醫(yī)學(xué)領(lǐng)域和發(fā)現(xiàn)中已經(jīng)實現(xiàn)的進(jìn)展在被接受和廣泛實現(xiàn)方面遇到的挫折要小得多,這些上游進(jìn)展將引領(lǐng)這一人機共生。
-
AI
+關(guān)注
關(guān)注
87文章
30947瀏覽量
269209 -
人工智能
+關(guān)注
關(guān)注
1791文章
47314瀏覽量
238643
原文標(biāo)題:結(jié)合人工智能的高性能醫(yī)學(xué):現(xiàn)狀、挑戰(zhàn)與未來
文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論