乳腺癌是美國(guó)第二大、中國(guó)第一大女性惡性腫瘤相關(guān)的致死因素。2019年的最新數(shù)據(jù)顯示,美國(guó)有近27萬(wàn)名女性被診斷為乳腺癌,4萬(wàn)多人因此死亡。在中國(guó),僅2015年就有約28萬(wàn)乳腺癌新發(fā)病例,位居女性惡性腫瘤發(fā)病的首位。在現(xiàn)代醫(yī)學(xué)的眾多研究領(lǐng)域中,如何盡早發(fā)現(xiàn)和治療乳腺癌,早已成為一個(gè)十分重要的核心課題。
近日,來(lái)自麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(MIT CSAIL)和馬薩諸塞州綜合醫(yī)院的研究人員合作,共同打造出了一種深度學(xué)習(xí)模型。通過(guò)分析約9萬(wàn)張乳腺X光照片與6萬(wàn)多名患者的真實(shí)數(shù)據(jù),該模型可以找出人眼不易察覺的精細(xì)信息和規(guī)律,作為預(yù)測(cè)女性是否可能在未來(lái)五年內(nèi)罹患乳腺癌的依據(jù)。相比于傳統(tǒng)檢測(cè)模型,該模型將預(yù)測(cè)準(zhǔn)確率從18%提高到31%,在不同族裔女性罹患乳腺癌風(fēng)險(xiǎn)的預(yù)測(cè)普適性上取得突破。
新的深度學(xué)習(xí)模型可以在癌癥發(fā)?。ㄓ覉D)前4年,識(shí)別出乳腺癌風(fēng)險(xiǎn)(左圖)
個(gè)性化檢查方案,抓住最佳治療時(shí)機(jī)
乳腺X光檢查技術(shù)是目前臨床醫(yī)學(xué)廣泛使用的檢測(cè)乳腺癌風(fēng)險(xiǎn)的手段,但業(yè)界對(duì)檢查頻次和合適的檢查年齡一直存在爭(zhēng)議。美國(guó)癌癥協(xié)會(huì)認(rèn)為女性應(yīng)從45歲開始進(jìn)行年度檢查,有些機(jī)構(gòu)則建議50歲以上的女性每?jī)赡杲邮芤淮螜z查。不過(guò)由于個(gè)人體質(zhì)各異,其罹患乳腺癌的風(fēng)險(xiǎn)也不同,以年齡作為標(biāo)準(zhǔn)劃分篩查頻率過(guò)于泛化,很容易無(wú)法及時(shí)發(fā)現(xiàn)早期乳腺癌而錯(cuò)失最佳治療時(shí)機(jī)。另外,由于X光的輻射性和乳腺的敏感性,很多人甚至認(rèn)為乳腺癌X光篩查對(duì)女性有一定危害。
針對(duì)這一情況,MIT的研究人員認(rèn)為如果能夠提前預(yù)測(cè)出女性罹患乳腺癌的風(fēng)險(xiǎn)系數(shù),可以幫助個(gè)體制定更完善的個(gè)性化篩查方案,如建議高危人群在 30 多歲時(shí)進(jìn)行年度檢查,低危人群則每三年檢查一次。該論文的作者之一Regina Barzilay博士是乳腺癌幸存者,她希望通過(guò)該模型幫助更多女性將乳腺癌風(fēng)險(xiǎn)扼殺在搖籃中,抑制其發(fā)病率增長(zhǎng)趨勢(shì)。
Regina Barzilay博士
設(shè)計(jì)檢測(cè)模型,獲取精準(zhǔn)信息
自1989年第一個(gè)乳腺癌風(fēng)險(xiǎn)預(yù)測(cè)模型誕生以來(lái),很多風(fēng)險(xiǎn)因素被囊括在內(nèi):年齡、家族遺傳、荷爾蒙和生殖激素、乳腺密度等。但是由于大多數(shù)因素與乳腺癌的關(guān)聯(lián)度較低,導(dǎo)致這些傳統(tǒng)模型對(duì)個(gè)體的預(yù)測(cè)并不準(zhǔn)確。
與傳統(tǒng)的檢測(cè)模型不同,MIT的研究團(tuán)隊(duì)開發(fā)出了一種全新的深度學(xué)習(xí)模型——基于邏輯回歸模型+圖片識(shí)別深度學(xué)習(xí)模型的混合模型,使用乳腺X光照片與真實(shí)已知結(jié)果對(duì)模型進(jìn)行訓(xùn)練、驗(yàn)證和測(cè)試。
“1960年以來(lái),放射科醫(yī)生已經(jīng)注意到女性乳腺X光片上可以看到各具特性且不斷變化的乳房組織,代表著遺傳、激素、懷孕、哺乳、飲食、體重變化對(duì)乳腺產(chǎn)生的影響?,F(xiàn)在我們可以利用深度學(xué)習(xí)在風(fēng)險(xiǎn)評(píng)估中更準(zhǔn)確地利用這些詳細(xì)信息,從而提出個(gè)性化的預(yù)測(cè)結(jié)果和預(yù)防方案?!盧egina Barzilay表示。
首先,每一個(gè)風(fēng)險(xiǎn)因素都會(huì)經(jīng)過(guò)獨(dú)熱編碼(one-hot encoding)——一種在機(jī)器學(xué)習(xí)中常見的變量轉(zhuǎn)換機(jī)制,將變量的狀態(tài)用 0 和 1 組成的二進(jìn)制向量表示,再將所有編碼整合組成風(fēng)險(xiǎn)因素向量,作為邏輯回歸模型(risk-factor-based logistic regression model: RF-LR)的輸入值。
在此基礎(chǔ)上,研究人員又開發(fā)了一套以深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)為核心的圖片識(shí)別模型(image-only DL),使用開源的預(yù)訓(xùn)練模型 ResNet-18 。他們沒有根據(jù)圖片分辨率變化調(diào)整模型,直接以1664 x 2048 像素的乳腺X 光照片作為輸入值進(jìn)行訓(xùn)練。
風(fēng)險(xiǎn)因素的訓(xùn)練、驗(yàn)證及測(cè)試
最后,他們整合了邏輯回歸和圖像識(shí)別兩個(gè)模型,制作了一個(gè)混合模型(Hybrid DLModel)。結(jié)合風(fēng)險(xiǎn)因素和圖像信息,該模型開始學(xué)習(xí)預(yù)測(cè)女性在五年內(nèi)是否會(huì)出現(xiàn)乳腺癌風(fēng)險(xiǎn)。
幾種模型預(yù)測(cè)準(zhǔn)確率的比較
以乳腺密度為例,與目前臨床上使用乳腺密度作為評(píng)估乳腺癌風(fēng)險(xiǎn)標(biāo)準(zhǔn)的Tyrer-Cuzick模型相比,該模型識(shí)別風(fēng)險(xiǎn)的準(zhǔn)確率有所提高。研究人員發(fā)現(xiàn),高乳腺密度且模型評(píng)估乳腺癌風(fēng)險(xiǎn)高的患者癌癥發(fā)病率,是乳腺密度和乳腺癌風(fēng)險(xiǎn)都較低的患者的3.9倍。這一趨勢(shì)在不同女性群體中都體現(xiàn)了出來(lái)。
對(duì)不同族裔的女性預(yù)測(cè)準(zhǔn)確率相同
值得注意的是,該論文提出的深度學(xué)習(xí)模型提高了對(duì)不同族裔女性的預(yù)測(cè)適用性,而包括Tyrer-Cuzick模型在內(nèi)的很多現(xiàn)有模型大多依照白人女性數(shù)據(jù)建立,對(duì)非白人族裔的預(yù)測(cè)效果較差。該論文的突破對(duì)于預(yù)防乳腺癌的種族平等尤為重要,數(shù)據(jù)顯示黑人女性罹患乳腺癌的機(jī)率比白人女性高40%,這可能由于不同族裔女性在檢測(cè)和獲得醫(yī)療保健方面的差異。
模型對(duì)不同族裔女性未來(lái)5年罹患乳腺癌的風(fēng)險(xiǎn)預(yù)測(cè)
研究人員成該深度學(xué)習(xí)模型在未來(lái)可以為乳腺X光檢查奠定基礎(chǔ),從而預(yù)測(cè)患者是否可能存在其他健康風(fēng)險(xiǎn),如心血管疾病、胰腺癌等。他們希望這個(gè)模型能幫助更多人早發(fā)現(xiàn)、早預(yù)防、早治療,將癌癥風(fēng)險(xiǎn)扼殺于搖籃之中。
-
AI
+關(guān)注
關(guān)注
87文章
30898瀏覽量
269130 -
MIT
+關(guān)注
關(guān)注
3文章
253瀏覽量
23397 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5503瀏覽量
121175
原文標(biāo)題:女性的福音:MIT研究員最新AI模型可提前5年預(yù)測(cè)乳腺癌風(fēng)險(xiǎn)!
文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論