(文章來(lái)源:雷鋒網(wǎng))
近日,香港大學(xué)統(tǒng)計(jì)與精算學(xué)系系主任尹國(guó)圣教授聯(lián)合其他多位學(xué)者發(fā)表一篇最新論文,介紹了一個(gè)最新的新冠肺炎在線診斷系統(tǒng)。據(jù)了解,該系統(tǒng)對(duì)新冠肺炎診斷的準(zhǔn)確率88%、AUC值93%、敏感度86%、特異度90%,參與這項(xiàng)研究的人員,還有西南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院助理教授劉斌博士、研究生高曉雪、何孟霜、劉霖以及劉斌博士的同事呂鳳毛(西南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院助理教授)。
尹國(guó)圣教授表示,通過(guò)對(duì)非典疫情及各類流感病毒的研究,香港大學(xué)一直都走在世界科研的最前沿。2003年非典期間,深圳和香港的科研人員就曾聯(lián)合宣布,從果子貍等野生動(dòng)物體內(nèi)找到非典病毒前體?;谏锝y(tǒng)計(jì)和臨床試驗(yàn)方向的多年研究經(jīng)驗(yàn),從2020年1月底,尹國(guó)圣教授帶領(lǐng)的研究團(tuán)隊(duì)開(kāi)始嘗試一些新冠肺炎方面的研究,基于CT圖像診斷是其中一項(xiàng)工作。
但是,由于沒(méi)有公開(kāi)的CT圖像數(shù)據(jù)集,團(tuán)隊(duì)需要花大量的時(shí)間去尋找開(kāi)放的樣本并對(duì)樣本進(jìn)行標(biāo)記。后來(lái),medRxiv上有一項(xiàng)工作,整理了一些關(guān)于新冠病人CT圖像分析的論文預(yù)印本。該論文從medRxiv和bioRxiv文章的預(yù)印本中提取了746張病人的CT圖像,并訓(xùn)練了一個(gè)新冠病人二分類的神經(jīng)網(wǎng)絡(luò)。
然而,其結(jié)果顯示的預(yù)測(cè)效果還未能達(dá)到臨床標(biāo)準(zhǔn)。尹國(guó)圣教授認(rèn)為,一個(gè)原因是樣本量較小,另一個(gè)重要原因是沒(méi)有充分利用CT圖像樣本自身豐富的標(biāo)注信息。這批CT數(shù)據(jù)跟傳統(tǒng)的醫(yī)療圖像數(shù)據(jù)最大的差別是,每個(gè)樣本都來(lái)自一篇醫(yī)學(xué)影像學(xué)論文。在這些文章中,臨床醫(yī)生對(duì)新冠病人的胸部CT病灶特征做了詳細(xì)的描述,有些還和其他常見(jiàn)肺部疾病的病灶特征做了仔細(xì)的對(duì)比分析。
因此,在尹教授看來(lái),“這批數(shù)據(jù),雖然樣本數(shù)量有限,但信息量極大,是一個(gè)具有代表性,價(jià)值很高的數(shù)據(jù)集。”研究人員進(jìn)一步對(duì)樣本附帶的文本信息進(jìn)行了針對(duì)性的研究,發(fā)現(xiàn)760篇論文涵蓋了對(duì)于新冠肺炎的五種病灶(Lesion)的描述,其中每個(gè)病人CT影像上均會(huì)出現(xiàn)其中一種或者多種病灶。通過(guò)對(duì)新冠確診病人的CT圖像的診斷描述進(jìn)行分析,這五種病灶是影像學(xué)上對(duì)新冠肺炎診斷的主要標(biāo)準(zhǔn)。于是,團(tuán)隊(duì)設(shè)計(jì)出一個(gè)基于CT圖像的Lesion-Attention深度神經(jīng)網(wǎng)絡(luò)模型(LA-DNN)。
模型一方面學(xué)習(xí)圖像中可以區(qū)分新冠病人和非新冠病人的特征,另一方面把模型的“注意力”集中在病灶區(qū)域,即學(xué)習(xí)多標(biāo)簽病灶,這就是團(tuán)隊(duì)提出的LA-DNN(Lesion-Attention Deep Neural Networks)模型,如同臨床醫(yī)生通過(guò)CT圖像判斷病情時(shí)會(huì)側(cè)重關(guān)注異常的病灶區(qū)域而略過(guò)正常區(qū)域一樣,模型同時(shí)訓(xùn)練兩個(gè)任務(wù),相互協(xié)調(diào),從而使得模型性能得到顯著的提升,其各項(xiàng)指標(biāo)均達(dá)到了臨床標(biāo)準(zhǔn)。
同時(shí),團(tuán)隊(duì)也采用了遷移學(xué)習(xí),即利用預(yù)訓(xùn)練的VGG、DenseNet等神經(jīng)網(wǎng)絡(luò)來(lái)作為模型的骨干網(wǎng)絡(luò)。
尹國(guó)圣教授向雷鋒網(wǎng)說(shuō)到,新冠CT圖像診斷系統(tǒng)上線后,團(tuán)隊(duì)仍然在繼續(xù)收集新的樣本,在線系統(tǒng)的訓(xùn)練樣本比最初的樣本數(shù)量翻了一倍,并定期重新訓(xùn)練模型,在線系統(tǒng)的效果比論文中的結(jié)果又有提升。對(duì)于該成果未來(lái)的應(yīng)用方向,尹教授表示,希望前線抗擊疫情的醫(yī)務(wù)人員使用該系統(tǒng),分享數(shù)據(jù)、開(kāi)展合作研究,幫助進(jìn)一步測(cè)試和改進(jìn)系統(tǒng)。
“目前,中國(guó)的疫情得以控制,而其他許多國(guó)家和地區(qū)仍然存在很大壓力,希望該系統(tǒng)可以在疫情仍然嚴(yán)重的區(qū)域發(fā)揮作用,減輕核酸檢測(cè)的負(fù)擔(dān)?!?br /> (責(zé)任編輯:fqj)
-
醫(yī)療
+關(guān)注
關(guān)注
8文章
1824瀏覽量
58817 -
AI
+關(guān)注
關(guān)注
87文章
31133瀏覽量
269466
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論