0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于深度學(xué)習(xí)的計算機視覺技術(shù)在醫(yī)療領(lǐng)域中的現(xiàn)狀與應(yīng)用

新機器視覺 ? 來源:機器之心 ? 作者:機器之心 ? 2021-03-20 10:02 ? 次閱讀

計算機視覺在醫(yī)療領(lǐng)域得到了廣泛應(yīng)用,如醫(yī)學(xué)影像處理等。

最近,來自 Salesforce AI 研究院、谷歌、斯坦福大學(xué)等機構(gòu)的研究人員合作撰寫了一篇文章,綜述了基于深度學(xué)習(xí)的計算機視覺技術(shù)在醫(yī)療領(lǐng)域中的現(xiàn)狀與應(yīng)用。該論文發(fā)表在 Nature 旗下期刊 npj Digital Medicine 上。

機器之心選取文章的部分內(nèi)容為大家展開介紹。

論文地址:https://www.nature.com/articles/s41746-020-00376-2#Sec6

摘要

十年來,人工智能取得了前所未有的進展,包括醫(yī)學(xué)在內(nèi)的許多領(lǐng)域都有望從中受益。在該論文中,研究者調(diào)查了以深度學(xué)習(xí)為支撐的現(xiàn)代計算機視覺技術(shù)在醫(yī)學(xué)領(lǐng)域的最新進展,重點包括醫(yī)學(xué)成像、醫(yī)療視頻和臨床部署。

該論文首先簡要概述了卷積神經(jīng)網(wǎng)絡(luò)的十年進展,包括它們在醫(yī)療領(lǐng)域中實現(xiàn)的視覺任務(wù)。接下來,論文討論了一些有益的醫(yī)學(xué)成像應(yīng)用示例,涉及心臟病學(xué)、病理學(xué)、皮膚病學(xué)、眼科醫(yī)學(xué),并為后續(xù)研究工作提出了新的方向。此外,研究者還介紹了醫(yī)療視頻,重點介紹了如何將臨床工作流程與計算機視覺結(jié)合來改善醫(yī)療效果。最后,論文討論了在現(xiàn)實世界中部署這些技術(shù)面臨的挑戰(zhàn)和障礙。

圖 1:醫(yī)療領(lǐng)域中的計算機視覺任務(wù)示例。

計算機視覺

目標(biāo)分類、定位和檢測分別是指識別圖像中的目標(biāo)類型、確定目標(biāo)所在位置,以及同時確定目標(biāo)的類型和位置。過去十年,ImageNet 大規(guī)模視覺識別挑戰(zhàn)賽(ILSVRC)是促成這些任務(wù)進步的先鋒。它創(chuàng)建了一個由深度學(xué)習(xí)研究人員組成的大型社區(qū),社區(qū)中的研究者相互競爭和合作以改進各種 CV 任務(wù)的技術(shù)。

2012 年,首個使用 GPU 的現(xiàn)代 DL 方法成為該社區(qū)發(fā)展的拐點,它預(yù)示著該領(lǐng)域接下來幾年的顯著進展,直到 2017 年 ILSVRC 競賽舉辦了最后一屆。值得注意的是,在此期間,分類準(zhǔn)確率已經(jīng)達到了人類級別。在醫(yī)學(xué)上,這些方法的細(xì)粒度版本已成功用于許多疾病的分類和檢測,如下圖 2 所示。

圖 2:醫(yī)師級別的診斷性能。

醫(yī)學(xué)成像

近年來,使用計算機視覺技術(shù)處理靜態(tài)醫(yī)學(xué)成像的論文從數(shù)百篇增長至幾千篇。其中,放射學(xué)、病理學(xué)、眼科醫(yī)學(xué)和皮膚病學(xué)等幾個領(lǐng)域受到了廣泛關(guān)注。

醫(yī)學(xué)影像的獨特特征給基于 DL 的計算機視覺提出了許多挑戰(zhàn)。例如,圖像可能非常龐大,數(shù)字化組織病理學(xué)圖像可以產(chǎn)生約 100000 x 100000 像素的千兆像素圖像,而典型的 CNN 圖像輸入約為 200 x 200 像素。

目前已有數(shù)十家公司獲得美國 FDA 和歐盟 CE 的醫(yī)學(xué)成像 AI 批準(zhǔn)。隨著可持續(xù)商業(yè)模式的建立,商業(yè)市場已經(jīng)開始形成。例如,印度和泰國等地歡迎部署糖尿病性視網(wǎng)膜病變篩查系統(tǒng)等技術(shù)。如今這種快速發(fā)展已經(jīng)達到了直接影響患者治療效果的地步。

心臟病學(xué)

心臟成像越來越廣泛地應(yīng)用于臨床診斷等流程中,深度學(xué)習(xí)的關(guān)鍵臨床應(yīng)用包括診斷和篩選。心血管醫(yī)學(xué)中最常見的成像方式是心臟超聲或超聲心動圖。作為一種經(jīng)濟高效的無輻射技術(shù),超聲心動圖因其直接的數(shù)據(jù)采集和解釋功能而特別適合應(yīng)用 DL 技術(shù),它常被用于急診住院設(shè)施、門診中心和急診室中。

病理學(xué)

病理學(xué)家在癌癥的檢測和治療中起著關(guān)鍵作用。病理分析(基于顯微鏡下組織樣本的目視檢查)本質(zhì)上是主觀的,視覺感知和臨床訓(xùn)練的差異可能導(dǎo)致診斷和預(yù)測意見不一致。

DL 可以支持很多重要的醫(yī)療任務(wù),包括診斷、預(yù)測病情和治療效果、疾病監(jiān)測等。

近年來,醫(yī)療領(lǐng)域已經(jīng)采用了亞微米級分辨率的組織掃描儀,該儀器可以捕獲千兆像素的全視野數(shù)字切片(whole-slide images ,WSI)。這種發(fā)展和計算機視覺的進步促成了 AI 驅(qū)動的數(shù)字組織病理學(xué)的研究和商業(yè)化活動。該領(lǐng)域具有以下潛力:

通過提高日常任務(wù)的效率和準(zhǔn)確性來克服人類視覺感知和認(rèn)知的局限性;

從人眼看不見的形態(tài)結(jié)構(gòu)中開發(fā)出疾病和治療的新特征;

將病理學(xué)與放射學(xué)、基因組學(xué)和蛋白質(zhì)組學(xué)測量結(jié)合起來,以改善診斷和預(yù)測效果。

皮膚病學(xué)

皮膚病學(xué)中 DL 的關(guān)鍵臨床任務(wù)包括特定于病灶的鑒別診斷、在良性病灶中發(fā)現(xiàn)與病灶有關(guān)的問題,以及幫助跟蹤病灶隨時間的增長。一系列研究表明,CNN 在歸類良性與惡性皮膚病變時的性能可以媲美皮膚科醫(yī)生。這些研究依次測試了越來越多的皮膚科醫(yī)生,并且始終展示出匹配甚至超過醫(yī)師水平的分類敏感性和特異性。但這些研究很大程度上局限于二分類任務(wù),如鑒別良性與惡性皮膚病變。

最近,這些研究還包括了對數(shù)十種皮膚病的診斷,包括非贅生性皮膚?。ㄈ缙ふ睿?,其分類器輸入還囊括了非視覺元數(shù)據(jù)(如病人的人口統(tǒng)計特征)。

將這些算法集成到臨床工作流程可以使其支持其他關(guān)鍵任務(wù),包括對具有多個病灶的病人進行大規(guī)模惡性病變檢測等。這一領(lǐng)域仍待探索。

眼科學(xué)

近年來,眼科領(lǐng)域出現(xiàn)了很多 AI 研究,許多論文展示了其 AI 成果超出當(dāng)前人類的臨床診斷和分析能力。這帶來的潛在影響是巨大的,眼睛檢查儀器的便攜性意味著可以利用臨時診所和遠(yuǎn)程醫(yī)療為偏遠(yuǎn)地區(qū)帶去檢測點。該領(lǐng)域極大地依賴眼底成像和光學(xué)相干斷層掃描 (OCT) 來診斷和管理病人。

CNN 可以準(zhǔn)確診斷許多疾病。眼睛包含大量人類無法解釋的特征,包含有意義的醫(yī)療信息,而 CNN 可以獲取這些特征。CNN 還可以基于眼底成像分類多種心血管和糖尿病風(fēng)險因素,包括年齡、性別、收縮壓等。這表明未來 AI 研究有可能基于眼部圖像預(yù)測非眼部信息,帶來醫(yī)療領(lǐng)域的范式轉(zhuǎn)變,即通過眼部檢查判斷眼部和非眼部疾病,而這是人類醫(yī)生目前無法做到的。

醫(yī)療視頻

手術(shù)應(yīng)用

計算機視覺可以在手術(shù)和內(nèi)窺鏡檢查等醫(yī)療步驟中提供極大的用途。深度學(xué)習(xí)在醫(yī)療方面的重要應(yīng)用包括通過實時環(huán)境感知、技能評估和訓(xùn)練來提升手術(shù)性能。早期研究主要在基于視頻的機器人手術(shù)和腹腔鏡手術(shù)中開展。另一個方向則是利用計算機視覺識別不同的手術(shù)階段,從而開發(fā)環(huán)境感知的計算機輔助系統(tǒng)。

此外,計算機視覺還開始出現(xiàn)在開放手術(shù)中。這里的挑戰(zhàn)在于視頻捕捉視角的多樣性(如頭戴式、側(cè)視和懸吊式攝影機)和手術(shù)類型的多樣化。對于所有類型的手術(shù)視頻,將 CV 分析轉(zhuǎn)換為可以提升治療效果的工具與應(yīng)用是下一個研究方向。

人類活動

計算機視覺可以識別物理空間中的人類活動,可用于大量「環(huán)境智能」應(yīng)用。環(huán)境智能指連續(xù)、非侵入式地感知物理空間中的活動,從而為醫(yī)生、護士等醫(yī)療工作人員提供幫助,如病人監(jiān)測、自動化文檔等,參見圖 3。

圖 3:環(huán)境智能。計算機視覺與傳感器和視頻流讓很多安全應(yīng)用在臨床和居家環(huán)境中變?yōu)榱丝赡?,為醫(yī)護工作者擴展了監(jiān)測病人的能力。這些應(yīng)用主要使用細(xì)粒度活動識別模型構(gòu)建,可能包括 ICU 中的患者監(jiān)測、醫(yī)院和診所中的洗手動作監(jiān)測、異常事件檢測等。

環(huán)境感知還可以在醫(yī)院之外應(yīng)用,幫助更多人及時獲取醫(yī)療服務(wù)。例如,它可以通過監(jiān)測日?;顒又械漠惓G闆r來幫助獨居老人及時獲取醫(yī)療服務(wù)。此外,計算機視覺技術(shù)還有望成為遠(yuǎn)程生理指標(biāo)測量的工具,例如系統(tǒng)利用視頻來分析心率和呼吸頻率。

臨床部署

醫(yī)療 AI 的應(yīng)用可以給社會帶來福利,也有可能加劇長期存在的不平等。當(dāng)?shù)玫角‘?dāng)、符合倫理的使用時,醫(yī)療 AI 可以促成更公平的醫(yī)療環(huán)境。而其關(guān)鍵在于理解模型基于什么樣的數(shù)據(jù)構(gòu)建、在什么樣的環(huán)境中部署。該論文展示了將機器學(xué)習(xí)技術(shù)應(yīng)用于醫(yī)療領(lǐng)域時需要注意的四個要點:數(shù)據(jù)評估、模型局限性解決、社區(qū)參與和信任建立。

數(shù)據(jù)質(zhì)量很大程度上決定了模型質(zhì)量,發(fā)現(xiàn)數(shù)據(jù)中的不公平并解決將帶來更公平的醫(yī)療環(huán)境。目前有多種移除數(shù)據(jù)偏見的方法。個體層面上的偏見可以通過專家討論和標(biāo)注判定來解決,而群體層面偏見則需要缺失數(shù)據(jù)補足和分布漂移來解決。國際多機構(gòu)評估是確定模型在多種不同群體、醫(yī)療設(shè)備、資源設(shè)置和實踐模式間泛化性能的魯棒方法。此外,使用多任務(wù)學(xué)習(xí)訓(xùn)練模型執(zhí)行多種任務(wù)也會使模型更具普遍用途和魯棒性。

透明報告可以解決模型的潛在缺陷,幫助解決模型局限性。然而,僅僅報告,以及在通用數(shù)據(jù)集上實現(xiàn)強大性能并不足夠,我們還應(yīng)理解模型失敗的特定實例。一種解決方案是將評估人口統(tǒng)計性能與顯著圖結(jié)合起來,從而可視化模型關(guān)注的地方,發(fā)現(xiàn)潛在的偏差。下圖 4 展示了模型部署中的偏見。

圖 4:模型部署中的偏見。

從病人、醫(yī)生、計算機科學(xué)家和其他利益相關(guān)人的角度來看,社區(qū)參與對于模型的成功部署更為重要。它可以幫助識別醫(yī)療診斷中種族偏見的結(jié)構(gòu)化成因,具體表現(xiàn)是發(fā)現(xiàn)數(shù)據(jù)集中的偏見、確定導(dǎo)致模型失敗的人口統(tǒng)計特征。以用戶為中心的評估是確保模型可用性并使其適應(yīng)現(xiàn)實世界的重要工具。

另一個使醫(yī)生建立起對 AI 信任的有效工具是 ML 模型與現(xiàn)有工作流的并行部署,參見圖 5:

77f9542a-88ef-11eb-8b86-12bb97331649.png

圖 5:臨床部署。該示例工作流程展示了 AI 增強工作流的積極效果,以及可建立起的信任。人工智能的預(yù)測結(jié)果為醫(yī)生提供了直接價值,而隨著收集到的數(shù)據(jù)增加,這種能力還會不斷提升。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • CV
    CV
    +關(guān)注

    關(guān)注

    0

    文章

    53

    瀏覽量

    16882
  • 計算機視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1699

    瀏覽量

    46052
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5510

    瀏覽量

    121345

原文標(biāo)題:CV技術(shù)在醫(yī)療領(lǐng)域中有哪些應(yīng)用?Salesforce、谷歌、斯坦福綜述文章登上Nature子刊

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【小白入門必看】一文讀懂深度學(xué)習(xí)計算機視覺技術(shù)學(xué)習(xí)路線

    一、什么是計算機視覺?計算機視覺,其實就是教機器怎么像我們?nèi)艘粯樱脭z像頭看看周圍的世界,然后理解它。比如說,它能認(rèn)出這是個蘋果,或者那邊有輛車。除此之外,還能把拍到的照片或者視頻轉(zhuǎn)換
    的頭像 發(fā)表于 10-31 17:00 ?494次閱讀
    【小白入門必看】一文讀懂<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>計算機</b><b class='flag-5'>視覺</b><b class='flag-5'>技術(shù)</b>及<b class='flag-5'>學(xué)習(xí)</b>路線

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領(lǐng)域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動了多個行業(yè)的變革,也
    的頭像 發(fā)表于 08-14 09:49 ?1067次閱讀

    計算機視覺技術(shù)的AI算法模型

    計算機視覺技術(shù)作為人工智能領(lǐng)域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現(xiàn)這一目標(biāo),
    的頭像 發(fā)表于 07-24 12:46 ?1007次閱讀

    計算機視覺的五大技術(shù)

    計算機視覺作為深度學(xué)習(xí)領(lǐng)域最熱門的研究方向之一,其技術(shù)涵蓋了多個方面,為人工智能的發(fā)展開拓了廣闊
    的頭像 發(fā)表于 07-10 18:26 ?1465次閱讀

    計算機視覺的工作原理和應(yīng)用

    圖像和視頻中提取有用信息,進而進行決策和行動。自1960年代第一批學(xué)術(shù)論文問世以來,計算機視覺技術(shù)已經(jīng)取得了長足的發(fā)展,并在多個領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力和價值。
    的頭像 發(fā)表于 07-10 18:24 ?2169次閱讀

    計算機視覺與人工智能的關(guān)系是什么

    引言 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識別、機器學(xué)習(xí)等多個
    的頭像 發(fā)表于 07-09 09:25 ?708次閱讀

    計算機視覺與智能感知是干嘛的

    感知(Intelligent Perception)則是計算機視覺的一個分支,它強調(diào)計算機處理視覺信息時的智能性和自適應(yīng)性。 隨著
    的頭像 發(fā)表于 07-09 09:23 ?999次閱讀

    計算機視覺和機器視覺區(qū)別在哪

    計算機視覺和機器視覺是兩個密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 一、定義 計算機視覺
    的頭像 發(fā)表于 07-09 09:22 ?487次閱讀

    計算機視覺人工智能領(lǐng)域有哪些主要應(yīng)用?

    與分類是計算機視覺的基礎(chǔ)應(yīng)用之一。通過訓(xùn)練機器學(xué)習(xí)模型,計算機可以識別和分類各種圖像,如動物、植物、物體等。這種技術(shù)
    的頭像 發(fā)表于 07-09 09:14 ?1526次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領(lǐng)域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有
    的頭像 發(fā)表于 07-09 09:11 ?1362次閱讀

    計算機視覺怎么給圖像分類

    圖像分類是計算機視覺領(lǐng)域中的一項核心任務(wù),其目標(biāo)是將輸入的圖像自動分配到預(yù)定義的類別集合中。這一過程涉及圖像的特征提取、特征表示以及分類器的設(shè)計與訓(xùn)練。隨著深度
    的頭像 發(fā)表于 07-08 17:06 ?810次閱讀

    深度學(xué)習(xí)計算機視覺領(lǐng)域的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其中的核心技術(shù)之一,已經(jīng)計算機
    的頭像 發(fā)表于 07-01 11:38 ?883次閱讀

    機器視覺計算機視覺的區(qū)別

    人工智能和自動化技術(shù)的快速發(fā)展中,機器視覺(Machine Vision, MV)和計算機視覺(Computer Vision, CV)作
    的頭像 發(fā)表于 06-06 17:24 ?1379次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領(lǐng)域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著
    的頭像 發(fā)表于 06-06 17:17 ?1039次閱讀

    計算機視覺的十大算法

    隨著科技的不斷發(fā)展,計算機視覺領(lǐng)域也取得了長足的進步。本文將介紹計算機視覺領(lǐng)域的十大算法,包括它
    的頭像 發(fā)表于 02-19 13:26 ?1290次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法