四川大學(xué)華西醫(yī)院與依圖醫(yī)療合作研發(fā)國內(nèi)首個(gè)肺癌臨床科研智能病種庫和全球首個(gè)肺癌多學(xué)科智能診斷系統(tǒng),讓人工智能走向臨床科室,也給AI醫(yī)療創(chuàng)造了更多想象空間。
AI又對死亡率最高癌癥——肺癌,下手了。
6月15日,四川大學(xué)華西醫(yī)院與依圖醫(yī)療合作研發(fā)出國內(nèi)首個(gè)肺癌臨床科研智能病種庫(以下簡稱“肺癌病種庫”)和全球首個(gè)肺癌多學(xué)科智能診斷系統(tǒng)。
肺癌病種庫收錄肺癌患者的影像、病理、基因檢測、病歷文本等多維數(shù)據(jù),利用AI對數(shù)據(jù)進(jìn)行整合。肺癌多學(xué)科智能診斷系統(tǒng)則依托病種庫,以臨床指南為指導(dǎo),并融匯華西醫(yī)學(xué)專家智慧,實(shí)現(xiàn)結(jié)節(jié)篩查、肺癌全類型病灶診斷覆蓋。
跟目前廣泛存在的AI醫(yī)療影像系統(tǒng)不同之處在于,肺癌多學(xué)科智能診斷系統(tǒng)綜合多學(xué)科臨床信息進(jìn)行綜合診斷,讓醫(yī)療影像走向臨床,也給AI醫(yī)療創(chuàng)造了更多想象空間。
不久前,IBM Watson Health裁員50%至70%,讓AI醫(yī)療再次受到落地難的質(zhì)疑。依圖醫(yī)療總裁倪浩在接受包括新智元在內(nèi)的媒體專訪時(shí)表示,Watson不是AI醫(yī)療的代表,不是一流的人工智能公司,裁員對行業(yè)來說是好事。
破解三大難題:文本數(shù)據(jù)轉(zhuǎn)化、影像提取復(fù)雜、數(shù)據(jù)標(biāo)準(zhǔn)化
肺癌的死亡率有多高?
四川大學(xué)華西醫(yī)院院長李為民給出以下數(shù)據(jù):
肺癌發(fā)病人數(shù)、死亡人數(shù)我國居世界之首,每年肺癌發(fā)病人數(shù)約83萬,占全國癌癥發(fā)病人數(shù)的20.5%;
每年肺癌死亡人數(shù)約62萬,占全國癌癥發(fā)病人數(shù)的27.2%,是死亡率最高的癌癥。
對抗肺癌的關(guān)鍵是早期診斷和規(guī)范治療,其中AI診斷又在早期診斷中不斷發(fā)揮作用,研究意義重大。
不過,在AI診斷肺癌過程中,通常面臨以下三個(gè)問題:
1、文本數(shù)據(jù)轉(zhuǎn)化問題。臨床語言屬于自然語言范疇,同時(shí)具備醫(yī)學(xué)表述所特有的語法結(jié)構(gòu)特點(diǎn)和語義特點(diǎn),特定醫(yī)學(xué)實(shí)體識別相對容易,全量信息解析提取沒有現(xiàn)成可用的成果。
2、醫(yī)療影像提取復(fù)雜度問題。醫(yī)療影像數(shù)據(jù)屬于典型的“高維數(shù)據(jù)”,內(nèi)容豐富但提取復(fù)雜,若使用人工判讀,工作量和一致性極差,無法進(jìn)行萬量級大數(shù)據(jù)處理,若基于報(bào)告進(jìn)行提取,會(huì)遺漏大量信息。
3、數(shù)據(jù)標(biāo)準(zhǔn)化問題。在術(shù)語使用、描述方式等多層面,臨床數(shù)據(jù)要完成徹底的標(biāo)準(zhǔn)化,才能成為高質(zhì)量數(shù)據(jù),臨床工作強(qiáng)度高,部分?jǐn)?shù)據(jù)存在描述不完整設(shè)置表述錯(cuò)誤的情況,質(zhì)量治理工作復(fù)雜。
針對上述三個(gè)問題,依圖醫(yī)療分別給出三個(gè)應(yīng)對措施:
1、結(jié)合醫(yī)學(xué)術(shù)語本體構(gòu)建技術(shù)與自然語義理解技術(shù),自主研發(fā)醫(yī)學(xué)語義解析算法,實(shí)現(xiàn)全量醫(yī)學(xué)信息提取。
比如,醫(yī)生給出如下診斷,肺癌病種庫會(huì)將其分為信息抽取邏輯和信息抽取網(wǎng)絡(luò)架構(gòu)。(下圖)
左肺上葉中分化腺癌(乳頭型腺癌+粘液腺癌)。侵及臟層胸膜,周圍肺呈慢性炎改變伴灶區(qū)碳末沉積,免疫組化示腺癌細(xì)胞:ALK-V(+,建議FISH檢測)。
這樣的效果是臨床信息覆蓋度超過95%,重要信息覆蓋度超過99.5%;自動(dòng)化提取正確率98%,人工審核后綜合正確率達(dá)到99.3%。
2、自主研發(fā)基于深度神經(jīng)網(wǎng)絡(luò)的影像結(jié)構(gòu)化提取模型,覆蓋病灶類型、病灶大小、解剖學(xué)位置、影像學(xué)征象等影像診斷的核心內(nèi)容,實(shí)現(xiàn)病灶倍增時(shí)間自動(dòng)計(jì)算與提取,進(jìn)一步實(shí)現(xiàn)影像的高維信息提取。
隨著時(shí)間的推移,病灶的大小和位置都會(huì)有變化,依圖通過深度學(xué)習(xí),把肺的葉和段分割成3D模型,再判斷病灶的位置和大小。
3、對于數(shù)據(jù)標(biāo)準(zhǔn)化問題,依圖聯(lián)合四川大學(xué)華西醫(yī)院基于本體構(gòu)建方法,建設(shè)中文醫(yī)學(xué)術(shù)語庫,文本結(jié)構(gòu)化提取模型融合術(shù)語庫,實(shí)現(xiàn)表述歸一化;并建立精細(xì)化質(zhì)量控制模型,基于邏輯推理實(shí)現(xiàn)錯(cuò)誤糾正。
李為民介紹,通過上述手段,肺癌病種庫完成2.8萬例肺癌患者全周期數(shù)據(jù)跨系統(tǒng)集成,容納超百萬份臨床文檔與報(bào)告,超過千萬份原始醫(yī)學(xué)圖像。
醫(yī)療影像走向臨床,算法將頂級專家的知識和經(jīng)驗(yàn)下沉
建設(shè)全球頂級肺癌病種庫是依圖醫(yī)療與華西醫(yī)院的合作的第一步,兩者合作的路徑是:
人工智能研究及成果轉(zhuǎn)化→臨床多中心實(shí)驗(yàn)→制定精準(zhǔn)化肺癌早篩專家共識,最終讓醫(yī)療影像走向臨床科室。
在肺癌診斷層面上,依圖醫(yī)療總裁倪浩有三代定義。
第一代是大家熟悉的基于影像的病灶檢出和測量。
第二代是對于病灶描述的細(xì)致的程度。第一代和第二代在整個(gè)人工智能的發(fā)展的階段其實(shí)還處于非常早期的階段,依圖與華西醫(yī)院一起合作的間接診斷和決策產(chǎn)品,倪浩將其定義為第三代。
與目前廣泛存在的AI醫(yī)療影像系統(tǒng)不同,肺癌多學(xué)科智能診斷系統(tǒng)跨越了影像,把臨床的各種各樣的數(shù)據(jù)集合到系統(tǒng)里面來,能夠做到多學(xué)科的綜合診斷。系統(tǒng)幫助的對象也不止是放射科的醫(yī)生,還覆蓋到臨床的醫(yī)生,為他們提供臨床上更加有價(jià)值的建議和更加有價(jià)值的結(jié)論。
第一,實(shí)現(xiàn)以患者為中心的個(gè)性化的基于基因組的診斷和檢測,為臨床的醫(yī)生打造一個(gè)多學(xué)科的智能的決策的系統(tǒng);第二,能夠突破現(xiàn)行科室的限制,其讓患者享受專家級MDT團(tuán)隊(duì)服務(wù);第三,算法將頂級醫(yī)院的數(shù)據(jù)和專家的知識集成到系統(tǒng)里面,將頂級專家的知識和經(jīng)驗(yàn)下沉,最后推廣到基層醫(yī)院里面,讓全國各級醫(yī)院都能夠受益。
此外,倪浩還曝光了依圖醫(yī)療的產(chǎn)品矩陣。
倪浩:IBM Watson不是一流的人工智能公司,完全不能代表醫(yī)療人工智能產(chǎn)業(yè)
在“華西醫(yī)院&依圖醫(yī)療”肺癌人工智能成果發(fā)布會(huì)后,倪浩接受了包括新智元在內(nèi)的媒體專訪,被問及IBM Watson 醫(yī)療部門裁員、依圖醫(yī)療的商業(yè)模式等問題。
問:不久前,IBM Watson Health裁員50%至70%,其中一個(gè)重要的原因就是它很難實(shí)現(xiàn)商業(yè)變現(xiàn),您怎么看待這個(gè)問題?
倪浩:我的一個(gè)非常明確的觀點(diǎn):沃森從來都不是人工智能或者是醫(yī)療人工智能行業(yè)的代表,在我們看來它不是一流的人工智能公司。在美國,沃森從來沒有招到過頂級的人才,沃森之前一直在用IBM的一些市場上和品牌上的優(yōu)勢,然后去在炒作一個(gè)概念,這次它出了問題其實(shí)對于整個(gè)行業(yè)是好事情,就是把一些渾水摸魚的人清理走。
中國以前不少人對人工智能的認(rèn)識不到位,覺得IBM做出來的東西肯定是好的,但并非如此。其實(shí)對于沃森這件事情,它完全不能代表醫(yī)療人工智能產(chǎn)業(yè),我們是以比較積極的眼光看待它出的這些問題的。
問:依圖有沒有想過與華西醫(yī)院合作,未來形成怎樣的商業(yè)模式?
倪浩:我們做某一個(gè)方向,明確它有足夠大的商業(yè)空間、通過什么方式來明確,這是非常考驗(yàn)我們的戰(zhàn)略眼光。
現(xiàn)在在解決的這個(gè)問題是一個(gè)革命性的東西嗎?這個(gè)東西如果不是一個(gè)革命性東西,它有沒有真正的去解決一個(gè)痛點(diǎn),而不是一個(gè)癢點(diǎn)?很多人會(huì)搞不清楚痛點(diǎn)和癢點(diǎn)的差別,癢點(diǎn)是沒有商業(yè)化前景的,痛點(diǎn)才有商業(yè)化前景。所以其實(shí)在我們看來,只要痛點(diǎn)足夠明確,而且是在增長而不是萎縮的一個(gè)市場,這個(gè)市場就會(huì)越來越大。
得肺癌的人一年幾十萬,其實(shí)很少,但是屬于應(yīng)該要去篩查范圍的人很多,而且國家的鼓勵(lì)政策下來之后,醫(yī)院接不住,數(shù)量可能是幾十倍的翻上去。醫(yī)院是接不住的,所以可以判斷是有一個(gè)明確的市場空間。
其實(shí)我覺得今天也不用算投入產(chǎn)出比,因?yàn)獒t(yī)療行業(yè)本身它的特點(diǎn)就是周期長,然后做一個(gè)產(chǎn)品要拿證,把這個(gè)產(chǎn)品再改一遍,你還要重新再去申請一遍證,很多公司沒有這個(gè)能力能夠這樣做下去的。其實(shí)去年已經(jīng)倒掉一批人工智能公司,對于我們來說,確定它有明確的前景之后,其實(shí)我們不會(huì)太算細(xì)的賬,你做到業(yè)內(nèi)最好的,首先是能夠活下去,然后再說是不是能變得偉大這件事情。
問:包括Google、DeepMind等大量的公司都在把人工智能應(yīng)用放在早期疾病的篩查和識別上,但實(shí)際上人工智能面臨一個(gè)不透明性的問題,特別是一旦在醫(yī)療中幫助決策,如果是不可追溯和解釋的,這個(gè)東西會(huì)變得非常麻煩,我不知道你們在這方面有些什么樣的準(zhǔn)備和計(jì)劃?
倪浩:確實(shí)目前基于深度學(xué)習(xí)技術(shù)建立的模型本身是不可解釋的。但是其實(shí)我們在產(chǎn)品的層面上做了一些可解釋性,也就是說為什么我今天告訴醫(yī)生說,我覺得這個(gè)病灶是一個(gè)惡性的,惡性概率有99%,那我為什么給了你這么一個(gè)結(jié)論?我會(huì)給你證據(jù),我們做了很多的模型,為了讓他去接受這個(gè)99%是合理的。
-
算法
+關(guān)注
關(guān)注
23文章
4623瀏覽量
93104 -
AI
+關(guān)注
關(guān)注
87文章
31262瀏覽量
269627 -
人工智能
+關(guān)注
關(guān)注
1792文章
47497瀏覽量
239211
原文標(biāo)題:【AI又對肺癌下手】依圖倪浩拆解全球首個(gè)肺癌智能診斷系統(tǒng)
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論