人機對決的主角已經不再限于谷歌的 AlphaGo 。
5 月 20 日,《自然-醫(yī)學》報道了來自谷歌 AI 團隊的一項人工智能研究,這是根據(jù)低劑量計算機斷層掃描圖像來預測肺癌的。其結論是,AI 表現(xiàn)超越了 6 位專業(yè)的放射醫(yī)學專家。
4D預測肺癌
圖 |肺癌細胞的掃描電子顯微鏡照片。
2018 年,全世界有 960 萬人死于癌癥,其中肺癌死者就有 176 萬,高居癌癥死亡率第一位。在中國,由于人口老齡化和空氣污染的嚴重態(tài)勢,且吸煙率居高不下,肺癌也已成為死亡率最高的惡性腫瘤。據(jù)《中國肺癌低劑量螺旋 CT 篩查指南( 2018 年版)》,在 2015 年,中國肺癌的發(fā)病和死亡例數(shù)分別達 73萬 和 61 萬,發(fā)病率和死亡率非常接近,其主要原因是臨床診斷病例多已為晚期,失去了手術機會。
早期診斷和早期治療是提高肺癌生存、降低肺癌死亡率的重要措施。在高危人群中,與 X 線胸片比較,低劑量計算機斷層掃描( LDCT )可降低 20% 的肺癌死亡率。2013 年,美國預防醫(yī)學工作組( USPSTF )推薦對高危人群進行低劑量計算機斷層掃描篩查肺癌。不過今天也只有 2% 到 4% 的符合條件的美國患者進行了篩查。
谷歌產品經理 Lily Peng 博士指出,早期的微小腫瘤很難看到,超過 80% 的肺癌病例無法及早發(fā)現(xiàn)。肺部影像的評估是基于圖像中肺部的結節(jié)大小、密度和生長情況,但是假陰性和假陽性會導致很多不必要的活檢與漏診,于是大量肺癌在發(fā)現(xiàn)時已是晚期,這帶來高昂的臨床成本和經濟成本。
目前美國食品藥品監(jiān)督管理局(FDA)已經批準了一些軟件應用,這些應用主要是為醫(yī)學成像專家提供特定圖像的診斷支持,屬于計算機輔助檢測范疇。為了超越先前計算機輔助檢測方法的局限性,來自谷歌 AI 部門的 Daniel Tse 及同事建立了一種端到端的分析方法,僅使用輸入 CT 圖像就可以來預測肺癌風險。
此外,他們還使用卷積神經網絡(CNN)來進行訓練,這種技術在圖像識別方面能夠給出更好的結果。
圖 |谷歌肺癌 AI 模型的整體建模框架。(來源:《自然-醫(yī)學》論文)
圖 | 對于每個患者,新模型采用已有的低劑量計算機斷層掃描數(shù)據(jù)集,輸入患者 CT 圖像,經過分析輸出該病例的癌癥風險預測和風險評分。(來源:谷歌)
圖 |對于無癌癥病史的無癥狀患者,發(fā)現(xiàn)了潛在的肺癌腫瘤。
放射科醫(yī)生無法像計算機一樣檢查 3D 掃描,他們必須審查數(shù)百個單獨的 2D 掃描切片以發(fā)現(xiàn)問題,而腫瘤可能會很微小以至難以察覺,這種新的機器學習系統(tǒng)則可以分析高通量的 3D 肺部圖像,不僅可以對整體腫瘤進行預測,還可以通過肺結節(jié)識別細微的惡性組織。再加上先前的掃描數(shù)據(jù)對比,就可以用來評估肺結節(jié)的生長速度。
論文共同作者、美國西北大學醫(yī)學院 Mozziyar Etemadi 博士說,3D 檢測早期肺癌的能力比人眼檢測 2D 圖像要敏感得多。事實上,新系統(tǒng)在技術上可以納入 4D 范疇,因為它不僅僅是一次 CT 掃描,而是包括了當前和先前共計兩次的掃描,所以可以檢測肺結節(jié)隨時間的生長變化。
在這項研究中,谷歌的 AI 算法至關重要。當然,這也受益于谷歌強大的計算機運行能力。Daniel Tse 團隊用 42290 張 CT 掃描圖像進行訓練,以便在無人類參與的情況下預測肺結節(jié)的惡性程度。他們發(fā)現(xiàn),在 6716 個測試病例中,該人工智能系統(tǒng)能夠以 94% 的準確率發(fā)現(xiàn)極小的惡性肺結節(jié)。
在無先前 CT 掃描圖像的情況下,該系統(tǒng)的表現(xiàn)超越所有 6 位放射醫(yī)學專家,假陽性減少 11% ,假陰性減少 5% ;而在有先前 CT 掃描圖像的情況下,兩者表現(xiàn)不相上下。這 6 位放射專家有平均 8 年( 4 年到 20 年)的讀片經驗。2019 年 5 月 7 日,Lily Peng 在 2019 年開發(fā)者大會上稱,他們研發(fā)的人工智能技術可以比醫(yī)生早一年查出肺癌,使患者存活的概率提升 40% 。
開發(fā)人工智能系統(tǒng)的谷歌工程師強調,它不是為了取代放射科醫(yī)生,而是為了提高醫(yī)生檢測結節(jié)的能力并確定它們是否有危險。作者提醒說,這些發(fā)現(xiàn)還需要經過大規(guī)模的臨床驗證,但現(xiàn)有研究,仍說明這一模型有望推動改善肺癌患者的管理和預后。鑒于專業(yè)的胸透放射醫(yī)生缺乏,谷歌這個新系統(tǒng)對于社區(qū)醫(yī)院的普通放射科醫(yī)生將會是一個便捷工具,這可能會成為肺癌篩查推廣的利器。不僅僅是輔助檢測
那么,這個系統(tǒng)能否達到 100% 的肺癌預測率呢?他們下一步有什么規(guī)劃呢?對此,這項研究的負責人 Daniel Tse 接受了 DeepTech 的專訪。DeepTech:這項研究方法的特點是哪些呢?
Daniel Tse:今天的肺癌篩查存在若干挑戰(zhàn),包括高頻率的假陽性和假陰性、整體變異性以及實施廣泛成像篩查計劃的現(xiàn)實障礙。這些弊端就給 AI 留下了施展拳腳的空間。深度學習方法可以進行復雜的自動化圖像分析,檢測細微的圖像變化以及統(tǒng)一圖像評估方法。
我們的模型結合了檢測和診斷雙重功能,并且經過深度學習算法,擁有計算機輔助檢測所不能進行的解釋功能。這套系統(tǒng)可以使用患者當前和先前的 3D CT圖像來預測肺癌發(fā)展。
DeepTech:AI 的肺癌評估準確率有極限嗎?現(xiàn)在是 94% 的準確率,那么是不是意味著還有接近 6% 的提升空間?
Daniel Tse:目前的研究主要目的是為了創(chuàng)建深度學習的模型,且可以解決目前肺癌篩查中的高假陽性和高假陰性問題。而現(xiàn)實應用中,總會有一些限制因素,這就使得AI 不能得到 100% 的精確度。
事實上,AI 并不以精確度為唯一追求,而是兼顧特異性(假陽性)和敏感性(假陰性)?;趯嶋H結果的意義,后兩者的重要性可能不同。比如,減少假陰性意味著將檢測到更多的癌癥,也就減少漏診。
下一步,我們的系統(tǒng)要給醫(yī)生提供這些預測結論的表述方式,以及給患者提供積極的建議。DeepTech:下一步會如何推進大規(guī)模臨床驗證?在將來如何推進這方面研究的產品化?
Daniel Tse:目前這些結果令人鼓舞,但還是早期階段。我們需要進一步改進和驗證這套系統(tǒng),并探索放射科醫(yī)生更實用的使用方法。此外,還要與世界各地的監(jiān)管機構合作,確保產品應用前有充分的研究。DeepTech:谷歌 AI 部門之前在視網膜病變和乳腺癌方面都有很重要的工作,這些產品有哪些進展?目前你們在這方面的工作與美國 FDA 有溝通嗎?
Daniel Tse:我們的大部分工作仍處于研究階段,但我們與谷歌旗下子公司 Verily-Alphabet 合作的糖尿病視網膜病變計劃現(xiàn)已部署在印度的診所。這也得到了歐洲的健康、安全和環(huán)保的CE認證。我們正在與 FDA 進行研發(fā)產品的溝通。
在印度,7200 萬糖尿病患者中只有 600 萬人有機會接受糖尿病視網膜病變篩查,他們的眼科醫(yī)生缺口超過 10 萬名。在過去 3 年中,我們開發(fā)了一種機器學習算法,更容易篩查糖尿病性視網膜病變(DR)和糖尿病性黃斑水腫(DME)。
2018 年年末,我們在泰國也開展了這項工作。今年我們會在全球開展更多工作。業(yè)內點評
關于這篇文章,DeepTech 也專訪了醫(yī)學成像國際權威、美國倫斯勒理工學院講席教授王革?!暗蛣┝?CT 檢查對于肺癌普查極為重要”, 王革說,“在這個領域人工智能 AI 方法大有作為。若干團隊都先后獨立報告了令人鼓舞的結果,而這篇文章是一個杰出的代表?!蓖醺镔澩?Daniel Tse 的觀點,這些結果還在早期階段。如何改進、優(yōu)化和驗證,以及如何融入放射科醫(yī)生的工作流程、如何實現(xiàn)可解釋性等方面均有大量的工作要做。他最后強調,“人工智能 AI 是新的范式,道路曲折,前景光明。必將顯著提高醫(yī)療質量,造福民眾?!?/p>
《麻省理工科技評論》發(fā)表評論認為,這些研究雖然是令人興奮的,但應該被視為小的進步。因為出于隱私原因,在醫(yī)療保健中使用 AI 仍然具有挑戰(zhàn)性。此外,現(xiàn)實世界的數(shù)據(jù)集很少像研究中使用的那樣完美。值得注意的是,治療癌癥不僅僅涉及檢測。例如,患者與患者之間多種因素的差異使得診治難以完全實現(xiàn)自動化。
不過,紐約時報提出了疑問:如果這套 AI 系統(tǒng)得到 FDA 的批準,那么隨著系統(tǒng)經驗和更多數(shù)據(jù)的更新,開發(fā)商是否需要再次提交申請?如果是這樣,多久提交一次呢?
-
谷歌
+關注
關注
27文章
6180瀏覽量
105775 -
人工智能
+關注
關注
1793文章
47604瀏覽量
239531
原文標題:肺癌預測的人機對決:谷歌 AI 挫敗 6 位放射專家
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論