2013年,IBM以一個大膽的想法出售了德克薩斯大學(xué)的MD安德森癌癥中心:一個由人工智能驅(qū)動的平臺——IBM Watson——可以伸出一只數(shù)字化的手,對抗人類最可怕的疾病之一——癌癥。
在不到四年的時間里,這顆具有開拓性的月球探測器就解體了。然而,就在沃森步履蹣跚之時,它為機器學(xué)習(xí)技術(shù)如何在未來的某一天對醫(yī)生所做的幾乎每件事進行補充和革新提供了有價值的視角——而且是一個強有力的先見之明。
問題不在于人工智能是否會進入醫(yī)學(xué)領(lǐng)域。它是如何。在最好的情況下,機器學(xué)習(xí)可以利用幾乎所有臨床醫(yī)生的集體經(jīng)驗,為一位擁有數(shù)百萬類似病例經(jīng)驗的醫(yī)生提供明智的決策。在最糟糕的情況下,人工智能可能會助長不安全的做法,放大社會偏見,對分娩做出過度承諾,并失去醫(yī)生和患者的信任。
谷歌的Alvin Rajkomar博士、Jeffrey Dean博士和哈佛醫(yī)學(xué)院的Isaac Kohane博士在《新英格蘭醫(yī)學(xué)雜志》上共同撰寫了一份藍圖,概述了機器學(xué)習(xí)在醫(yī)學(xué)實踐中的前景和陷阱。
他們認為,人工智能不僅僅是一種新工具,像一個小工具或藥物。相反,它是一項擴展人類認知能力的基礎(chǔ)技術(shù),有潛力使醫(yī)療保健的幾乎每一步都變得更好。他們說,機器學(xué)習(xí)不是取代醫(yī)生,如果謹慎實施,它將通過提供額外的洞見來增強醫(yī)患關(guān)系。
當(dāng)涉及到人工智能和醫(yī)學(xué)時,診斷學(xué)受到的壓力最大。
基于人工智能的診斷工具,即使是在它們的初期,在發(fā)現(xiàn)乳房x線照片上潛在的致命病變、診斷皮膚癌和視網(wǎng)膜疾病(現(xiàn)在FDA批準了!)方面,也經(jīng)常比放射科專家和病理學(xué)家更聰明。一些人工智能模型甚至可以分析出精神癥狀,或者學(xué)會為轉(zhuǎn)診提供建議。
計算機診斷能力的提高得益于機器視覺和轉(zhuǎn)移學(xué)習(xí)方面的最新進展。雖然人工智能放射科醫(yī)生通常需要大型帶注釋的數(shù)據(jù)集來“學(xué)習(xí)”,但轉(zhuǎn)移學(xué)習(xí)允許受過訓(xùn)練的人工智能快速學(xué)習(xí)另一項類似的技能。例如,對標準存儲庫ImageNet中的數(shù)千萬個日常對象進行訓(xùn)練的算法可以對100,000張視網(wǎng)膜圖像進行再訓(xùn)練(這對于機器學(xué)習(xí)來說是一個相對較小的數(shù)字),從而診斷視力喪失的兩個常見原因。
更重要的是,機器學(xué)習(xí)非常適合分析日常護理期間收集的數(shù)據(jù),以確定未來可能出現(xiàn)的狀況——《少數(shù)族裔健康報告》。這些系統(tǒng)可以幫助預(yù)防措施,將健康問題消滅在萌芽狀態(tài),并降低醫(yī)療成本。當(dāng)提供足夠數(shù)量和質(zhì)量的患者健康縱向數(shù)據(jù)時,人工智能已經(jīng)能夠建立預(yù)測模型,其準確性遠遠超過任何使用醫(yī)學(xué)成像原始數(shù)據(jù)的醫(yī)生。
這個問題?這組作者說,相對老派的博士們將必須接受培訓(xùn),以便收集必要的信息,輸入人工智能預(yù)測引擎。這些模型需要仔細分析,以確保它們沒有反映出計費動機(更多的測試!)或通常不顯示癥狀的低建議條件。
護理治療的下一步對機器來說要困難得多。人工智能模型提供的治療數(shù)據(jù)可能只反映醫(yī)生的處方習(xí)慣,而不是理想的做法。一個更有幫助的系統(tǒng)必須從精心策劃的數(shù)據(jù)中學(xué)習(xí),以估計某一種治療方法對某一特定人群的影響。
你可以想象,這很困難。最近的幾次嘗試發(fā)現(xiàn),獲取專家數(shù)據(jù)、更新人工智能或根據(jù)本地實踐對其進行調(diào)整是非常具有挑戰(zhàn)性的。目前,使用人工智能作為治療建議仍然是一個未來的前沿,作者總結(jié)道。
也許更直接明顯的是人工智能對簡化醫(yī)生工作流程的影響。一般的人工智能能力,如智能搜索引擎,可以幫助提取必要的病人數(shù)據(jù),以及其他技術(shù),如預(yù)測打字或語音口述(醫(yī)生們已經(jīng)在日常工作中使用),可以減輕獲取醫(yī)療數(shù)據(jù)的繁瑣過程。
作者強調(diào),我們不應(yīng)該低估這種特殊的影響。醫(yī)生們被文書工作淹沒了,這占用了他們與病人相處的寶貴時間。對當(dāng)前的醫(yī)生隊伍進行人工智能技術(shù)培訓(xùn),提高工作效率,改善工作流程,可以降低工作倦怠率。更重要的是,這些數(shù)據(jù)反過來可以反饋給訓(xùn)練機器學(xué)習(xí)模型,進一步優(yōu)化對患者的護理,形成良性循環(huán)。
人工智能還掌握著將醫(yī)療保健擴展到物理診所之外的關(guān)鍵。例如,未來的應(yīng)用程序可以讓患者拍下皮疹的照片,并在不急著去急診的情況下獲得在線診斷。自動分診可以有效地將患者送到適當(dāng)?shù)尼t(yī)療機構(gòu)和醫(yī)生那里。在“看到”數(shù)十億次病人遭遇之后,機器學(xué)習(xí)或許是人工智能輔助醫(yī)療的最大希望,它可以讓醫(yī)生具備做出更好決定的能力。
然而,這個特定的場景只是在沒有數(shù)據(jù)支持的情況下?lián)]揮手。作者說,現(xiàn)在的關(guān)鍵是開發(fā)出正式的方法來測試這些想法,而不傷害醫(yī)生或病人。
正如IBM Watson的小插曲所表明的,人工智能和醫(yī)學(xué)界在學(xué)習(xí)協(xié)作的過程中都面臨著多重挑戰(zhàn)。Theranos的慘敗進一步描繪了一幅痛苦而清晰的畫面:在處理病人健康問題時,硅谷的信條“快速行動,打破現(xiàn)狀”既魯莽又極其危險。
醫(yī)學(xué)特別強調(diào)了機器學(xué)習(xí)的局限性。例如,如果沒有裝配一個具有代表性的、不同的疾病數(shù)據(jù)集,人工智能模型要么是錯誤的,要么是有偏見的——或者兩者兼而有之。這就是IBM Watson崩潰的部分原因:管理一個足夠大的帶注釋的數(shù)據(jù)集來發(fā)現(xiàn)未知的醫(yī)學(xué)發(fā)現(xiàn)是極其困難的,如果不是不可能的話。
然而,作者認為這并不是一個永久的障礙。人工智能模型越來越能夠處理嘈雜、不可靠或可變的數(shù)據(jù)集,只要數(shù)據(jù)量足夠大。雖然不完美,但是這些模型可以通過一個更小的注釋集進一步細化,這使得研究人員和臨床醫(yī)生能夠識別模型的潛在問題。
例如,谷歌Brain正在探索打開人工智能“黑匣子”的新方法,迫使算法解釋它們的決策。在臨床環(huán)境中,可解釋性變得越來越重要,幸運的是,如今發(fā)表在頂級期刊上的著名人工智能診斷學(xué)家往往帶有一種內(nèi)在的解釋機制。盡管人類專家可以監(jiān)督人工智能替代低誤診率的發(fā)展,但各方都應(yīng)該清楚:醫(yī)療錯誤率為零對男性和機器來說都是不現(xiàn)實的。
作者說,采用這些系統(tǒng)的臨床醫(yī)生和患者需要了解其最佳使用的局限性。任何一方都不應(yīng)過度依賴機器診斷,即使(或當(dāng))機器診斷變得司空見慣。
目前,我們僅限于基于歷史數(shù)據(jù)集的模型;未來幾年的關(guān)鍵是建立前瞻性模型,讓臨床醫(yī)生能夠在現(xiàn)實世界中評估,同時應(yīng)對為人工智能獲取和管理大型數(shù)據(jù)集而面臨的復(fù)雜的法律、隱私、倫理和監(jiān)管困境。
正如沃森痛苦地說明的那樣,過分夸大人工智能擾亂醫(yī)療保健的前景并不是最好的出路。相反,兩位作者“謹慎樂觀”,預(yù)計未來幾年將出現(xiàn)一些經(jīng)過仔細審查的早期模型,以及由經(jīng)濟激勵和全民價值醫(yī)療理想推動的文化變革。
最后,機器學(xué)習(xí)并沒有從醫(yī)生身上拿走任何東西。相反,醫(yī)生的溫暖——她的情感、敏感和對生命的欣賞永遠不會消失。只是補充一下。Kohane說:“這不是機器對抗人類,而是通過利用人工智能的優(yōu)勢來優(yōu)化人類醫(yī)生和病人的護理?!?/span>
評論
查看更多