AI 特別是深度學(xué)習(xí)在提升醫(yī)療診斷的速度和準(zhǔn)確率上擁有相當(dāng)?shù)臐摿Γ谂R床醫(yī)師可以駕馭 AI 的能力識別醫(yī)學(xué)圖像(例如 X 射線影像)中反映的疾病之前,他們需要先對模型進(jìn)行大量訓(xùn)練,而罕見疾病標(biāo)記圖像的匱乏一直是深度學(xué)習(xí)醫(yī)療的一大障礙?,F(xiàn)在,多倫多大學(xué)教授 Shahrokh Valaee 和他的團(tuán)隊設(shè)計了一種 AI 醫(yī)療領(lǐng)域中的新方法:使用生成對抗網(wǎng)絡(luò)創(chuàng)建的 X 射線影像來增強(qiáng) AI 訓(xùn)練集。實驗表明,通過數(shù)據(jù)增強(qiáng),無論對常見疾病還是罕見疾病,系統(tǒng)的識別準(zhǔn)確率都有大幅提高。
Shahrokh Valaee 教授和博士生 Hojjat Salehinejad 正在使用機(jī)器學(xué)習(xí)創(chuàng)建虛擬 X 射線胸透影像來訓(xùn)練 AI 系統(tǒng)識別罕見疾病。攝影:Jess MacInnis
由于以監(jiān)督學(xué)習(xí)方式訓(xùn)練 AI 系統(tǒng)的醫(yī)學(xué)圖像非常稀少,識別醫(yī)學(xué)圖像中的罕見疾病對于研究者而言一直是很有挑戰(zhàn)的問題。
Shahrokh Valaee 教授和他的團(tuán)隊設(shè)計了一種新方法:使用機(jī)器學(xué)習(xí)創(chuàng)建計算機(jī)生成的 X 射線影像以增強(qiáng) AI 的訓(xùn)練集。
在每個象限的左側(cè)是一張真實的病人 X 射線胸透影像,其旁邊是由 DCGAN 生成的合成 X 射線影像。在 X 射線影像的下方是對應(yīng)的熱圖,是機(jī)器學(xué)習(xí)系統(tǒng)觀察影像后得到的。圖源:Hojjat Salehinejad/MIMLab
「在某種意義上,我們在使用機(jī)器學(xué)習(xí)來做機(jī)器學(xué)習(xí),」多倫多大學(xué) Edward S. Rogers 高級電氣與計算機(jī)工程系(ECE)教授 Valaee 說?!肝覀冋趧?chuàng)建模擬的但反映了特定罕見疾病的 X 射線影像,從而我們可以將它們和真實 X 射線影像結(jié)合起來,以得到足夠規(guī)模的數(shù)據(jù)庫,來訓(xùn)練神經(jīng)網(wǎng)絡(luò)在其它 X 射線影像上識別這些疾病。」
Valaee 是醫(yī)學(xué)實驗室機(jī)器智能(MIMLab)的成員,MIMLab 是一個由醫(yī)師、科學(xué)家和工程研究員組成的團(tuán)隊,致力于將他們的專業(yè)知識結(jié)合到圖像處理、人工智能和醫(yī)學(xué)中以解決醫(yī)學(xué)挑戰(zhàn)?!窤I 在醫(yī)療領(lǐng)域中有無數(shù)種方式能提供幫助,」Valaee 說,「為此我們需要大量數(shù)據(jù)。但對于某些罕見疾病,并沒有讓這些系統(tǒng)正常工作而必要的數(shù)千張標(biāo)記圖像?!?/p>
為了創(chuàng)建這些人工 X 射線影像,該團(tuán)隊使用了稱為深度卷積生成對抗網(wǎng)絡(luò)(DCGAN)的 AI 技術(shù),來生成和不斷提升模擬圖像。GAN 是一類由兩個網(wǎng)絡(luò)構(gòu)成的算法:一個網(wǎng)絡(luò)生成圖像,另一個嘗試將合成圖像和真實圖像區(qū)分開來(判別器)。這兩個網(wǎng)絡(luò)被持續(xù)訓(xùn)練直到判別器無法將合成圖像和真實圖像區(qū)分。一旦創(chuàng)建了足夠多的人工 X 射線影像,它們就和真實 X 射線影像結(jié)合起來以訓(xùn)練一個深度卷積神經(jīng)網(wǎng)絡(luò)(即分類器),然后該分類器用于對其它圖像進(jìn)行診斷(正?;蛴屑膊。?/p>
「我們的實驗表明,由 DCGAN 生成的人工數(shù)據(jù)可以用于增強(qiáng)真實數(shù)據(jù)集,」Valaee 說?!高@為我們提供了更多的訓(xùn)練數(shù)據(jù),并提升了這些系統(tǒng)在識別罕見疾病上的性能?!?/p>
MIMLab 將用增強(qiáng)數(shù)據(jù)集獲得的識別準(zhǔn)確率和原始數(shù)據(jù)集獲得的準(zhǔn)確率進(jìn)行對比,發(fā)現(xiàn)對于常見疾病,其識別準(zhǔn)確率提高了 20%。對于某些罕見疾病,準(zhǔn)確率提高了約 40%,并且由于合成的 X 射線影像不是源于真實的個體,該數(shù)據(jù)集可以輕易地提供給醫(yī)院外的研究者,而不會侵犯個人隱私。
「這實在令人激動,通過證實這些增強(qiáng)數(shù)據(jù)集幫助提高了分類準(zhǔn)確率,我們已經(jīng)可以克服將人工智能應(yīng)用到醫(yī)療中的一大障礙,」Valaee 說?!干疃葘W(xué)習(xí)僅當(dāng)訓(xùn)練數(shù)據(jù)足夠多的時候才有效,而數(shù)據(jù)增強(qiáng)是可以確保神經(jīng)網(wǎng)絡(luò)能以高精度分類圖像的一種方式。
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8418瀏覽量
132656 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1208瀏覽量
24704 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5503瀏覽量
121176
原文標(biāo)題:業(yè)界 | AI醫(yī)療新突破:增強(qiáng)罕見疾病的影像數(shù)據(jù)集,大幅提高識別準(zhǔn)確率
文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論