昨天,備受關注的全球首場神經(jīng)影像人機大戰(zhàn)在國家會議中心舉行,在腦腫瘤和腦血管影像判讀比賽中,醫(yī)療AI最終以高出20%的準確率戰(zhàn)勝25名人類醫(yī)生。如果這款AI產(chǎn)品投入實用,核磁檢查的出片速度將從現(xiàn)在的幾天縮短至幾分鐘。
2018年6月29日-30日,一場AI vs人類醫(yī)生的“讀片大戰(zhàn)”在北京國家會議中心展開。
這場比賽由國家神經(jīng)系統(tǒng)疾病臨床醫(yī)學研究中心、首都醫(yī)科大學人腦保護高精尖創(chuàng)新中心和中國卒中學會聯(lián)合主辦,是全球首場神經(jīng)影像人工智能人機大賽。
參加比賽的雙方,AI這邊是一個名叫“BioMind 天醫(yī)智”的系統(tǒng),由國家神經(jīng)系統(tǒng)疾病臨床醫(yī)學研究中心與首都醫(yī)科大學人腦保護高精尖創(chuàng)新中心、北京安德醫(yī)智科技有限公司共同研發(fā),號稱全球首款CT、MRI神經(jīng)影像人工智能輔助診斷產(chǎn)品。
人類這邊,則由25名全球神經(jīng)影像領域頂尖專家、學者和優(yōu)秀臨床醫(yī)生組成,他們中有擁有幾十年臨床工作積累的影像學大咖,也有有志于AI系統(tǒng)研究的青年科技人才。經(jīng)過前期招募、預賽及定向邀請選拔而出。
經(jīng)過緊張激烈的角逐,在兩輪比賽中,BioMind分別以87%、83%的準確率,戰(zhàn)勝醫(yī)生戰(zhàn)隊66%、63%的準確率。值得一提的是,兩輪比賽BioMind均僅用15分鐘左右時間便答完所有題目,而醫(yī)生戰(zhàn)隊幾乎答到最后一秒。
醫(yī)生隊伍緊張討論
A組比賽結果
神經(jīng)影像人工智能人機大賽賽制介紹
據(jù)了解,大賽將分A、B組進行,內(nèi)容包括:顱內(nèi)腫瘤CT、MRI(核磁)影像判讀;腦血管疾病CT、MRI影像判讀及血腫預測;腦血管?。íM窄、微出血、梗死、腦白質病變、腔隙灶、血腫)病灶標識,出血體積及梗死體積測量。
A組比賽中,有15名人類醫(yī)生,包括此前全國線上預賽產(chǎn)生的優(yōu)勝者6名、國內(nèi)神經(jīng)疾病排名前列的專家7名,以及國外知名醫(yī)院專家2名。本組試題共225題,人類選手每人回答15題,AI 回答225題,最終以人類選手整體成績與AI對比。
B組比賽由10名人類神經(jīng)影像領域“大咖”(國內(nèi)神經(jīng)疾病排名前列醫(yī)院專家8名+知名醫(yī)院的專家2名)和AI比賽。其中,每名人類選手都與AI一樣,完成30道題的挑戰(zhàn),最終將以人類選手整體成績 VS AI成績。
A組試題為首都醫(yī)科大學附屬北京天壇醫(yī)院神經(jīng)影像學中心主任高培毅教授從天壇醫(yī)院腦腫瘤病例庫中隨機挑選,B組為首都醫(yī)科大學附屬北京天壇醫(yī)院常務副院長王擁軍教授從國家神經(jīng)系統(tǒng)疾病臨床醫(yī)學研究中心腦出血病例庫隨機挑選,兩組試題均非AI訓練試題,為保證試題的保密性,北京市長安公證處的公證人員為試題挑選、封存進行了公證。
賽前,公證人員正式為試題解封,并交付本次決賽評審專家,進行最終題目抽取。據(jù)了解,由于本次比賽使用的病例均為首都醫(yī)科大學附屬北京天壇醫(yī)院病例庫中回顧性病例,因此,最終評判結果以醫(yī)院最終病理結果為準。為保證準確性,選手開始答題后,評委對試題結果進行二次審核。
最終,在A組比賽中:225例判讀,AI用15分鐘準確率達87%,15位醫(yī)生用30分鐘準確率達66%;B組比賽中,10名頂尖醫(yī)生對戰(zhàn)AI,同樣完成30道腦血腫擴大預測試題,AI以83% VS 63% 準確率勝出。
獲勝醫(yī)療AI:每個腫瘤背后都學習了1000個病例,基本掌握50種顱腦腫瘤
參加比賽的AI——BioMind天醫(yī)智,是由國家神經(jīng)體系疾病臨床醫(yī)學研討中心和首都醫(yī)科大學人腦維護高精尖立異中心等一起研制的全球首款CT、MRI神經(jīng)印象人工智能輔佐確診產(chǎn)品。
在參加比賽前,它已經(jīng)跟著北京天壇醫(yī)院神經(jīng)影像學中心主任高培毅學習了半年。
對于本次比賽AI學生取得的成績,高培毅并不意外,他介紹說,通過對北京天壇醫(yī)院近十年來接診的數(shù)萬余神經(jīng)系統(tǒng)相關疾病病例影像的系統(tǒng)學習,“BioMind天醫(yī)智”在腦膜瘤、膠質瘤等常見病領域的磁共振影像診斷能力相當于一個高級職稱醫(yī)師級別的水平,實力不容小覷。
“每種腫瘤背后,它都學習了1000個病例,目前基本上已經(jīng)掌握了50種顱腦腫瘤,這是任何一名醫(yī)生都難以實現(xiàn)的。”
北京天壇醫(yī)院,作業(yè)人員正在調(diào)試“BioMindTM”天醫(yī)智
在近期“人機大戰(zhàn)”決賽備戰(zhàn)中,高培毅還為提高AI體系應戰(zhàn)表現(xiàn)打開集訓。300多個病例,陪練醫(yī)師們需10小時以上時刻才做完結,AI只需不到半小時。除了學習速度外,它的安穩(wěn)性也顯著逾越人類。“不知道累,也不受外界攪擾要素的影響。不像醫(yī)師會被心情、狀況、時刻地址等外界要素打擾,然后影響描繪準確性。它永久堅持鎮(zhèn)定,水平安穩(wěn)?!?/p>
不過,他對自己AI學生的表現(xiàn)還不太滿意。“對它的比賽成績不夠滿意,我認為它的準確率應該在90%以上,”高培毅說,接下來他們將對AI的“丟分”原因進行研究分析。
戰(zhàn)勝25位醫(yī)生≠戰(zhàn)勝人類醫(yī)生,AI和專業(yè)醫(yī)師仍然存在差距
關于這次比賽結果,中國科學院院士、第三軍醫(yī)大學病理學研究所所長、西南醫(yī)院病理科主任卞修武表示,“我希望大家不要產(chǎn)生對立性思維,因為無論醫(yī)生勝還是人工智能勝,對于醫(yī)療界和廣大患者都是一件大好事?!北逍尬湔J為,人工智能更聚焦于某一細分領域,但醫(yī)生有其系統(tǒng)性的學習,所以人工智能如果能作為一個幫手幫助醫(yī)生工作,將會是醫(yī)生的一大福利。
美國卡內(nèi)基梅隆大學(CMU)計算機科學學院副教授馬堅告訴新智元,AI對一些特定的問題在特定的時間內(nèi)比人做得更好,這類事情之前也發(fā)生過,這可能是又一個有意思的案例。但是,通過 AI 和幾個醫(yī)生的比賽的結果,就說AI戰(zhàn)勝某個整個的職業(yè)領域肯定不妥。
馬堅表示,目前AI對單一數(shù)據(jù)源的分類可能做的不錯,但是如何從復雜的多模態(tài)數(shù)據(jù)中有效綜合作出診斷和治療意見,AI可能還有非常多問題要解決,而且,這還涉及到更多社會學意義上的問題,譬如AI和醫(yī)生以及病人互相間信任、溝通的問題。
BioMind的老師高培毅也表示,“覺得它容易就能代替醫(yī)師的人,把醫(yī)師的作業(yè)看得太簡略了?!盇I在大數(shù)據(jù)深度學習方面確實具有巨大的優(yōu)勢,不過在實踐確診中,放射科醫(yī)師仍具有很強的不行代替性。
“除了影像查看,一個合格的放射科醫(yī)師還需求看化驗單、體檢單,問詢宗族史、個人病史,了解患者從前接受過的藥物、醫(yī)治、反響。歸納以上狀況后,才敢做出確診。”AI或許能夠代替“看片匠”的任務,但不可能成為一個真實的醫(yī)師。
王擁軍也以為,人工智能使用能夠將醫(yī)師們從單調(diào)、重復的作業(yè)中解放出來,然后騰出更多時刻進行開發(fā)性作業(yè)。
此外,現(xiàn)在AI在神經(jīng)體系印象確診方面,仍徹底依賴于數(shù)據(jù)真實性和質量的支撐,在缺少大數(shù)據(jù)支撐的疑難病、稀有病確診范疇,AI和專業(yè)醫(yī)師之間仍存在距離。
使用AI輔助,核磁檢查結果有望縮短至幾分鐘
王擁軍表示,這次向全球招募神經(jīng)科醫(yī)師打開“人機大賽”,意圖主要是為了驗證天醫(yī)智確診的準確性。
目前,全國影像科人才資源地域性分配不均衡問題十分突出。以腦腫瘤為例,北京天壇醫(yī)院每年手術量約為一萬例,而在大部分底層醫(yī)院,這個數(shù)字可能只停留在兩位數(shù)。大多數(shù)患者即便在底層做了查看,仍是會挑選帶著片子到三甲大醫(yī)院來看,有的在“上流”的過程中重復屢次拍片,形成資源糟蹋。假如底層醫(yī)院能使用AI技能為確診賦能,讓底層醫(yī)師在讀片確診上與大醫(yī)院具有平等水準,提高醫(yī)治功率,就能削減患者不必要的醫(yī)治環(huán)節(jié)和經(jīng)濟損失,也能減輕大醫(yī)院壓力。
此外,在天壇醫(yī)院,天醫(yī)智有用發(fā)掘信息與疾病的潛在聯(lián)絡的才干還可輔佐醫(yī)師對疾病做出更為精準的猜測,如猜測患者血腫后是否會大出血的準確度,可從人為判別的60%提高至90%,輔佐醫(yī)療團隊提早為患者可能遇到的風險供給處理方案。
這次比賽,醫(yī)療AI表現(xiàn)出了速度快、準確率高的結果,令人贊嘆的同時,更多人關心的是它未來將給神經(jīng)醫(yī)學帶來哪些改變——人腦疾病真的可以實現(xiàn)電腦診斷嗎?
高培毅介紹說,一個CI病例背后,可能是近千張片子,天壇醫(yī)院一個影像大夫每天讀片診斷的時間甚至達到18個小時。按照“BioMind天醫(yī)智”目前的速度,一個大夫一天的工作量,它只需要400-500秒,也就是不到10分鐘的時間。
“現(xiàn)在患者到醫(yī)院做核磁,結果都要等第二天以后才能拿到。如果讓AI來做,那么核磁結果基本上立等可取,幾分鐘就行”。
北京天壇醫(yī)院院長王擁軍介紹說,目前已經(jīng)向國家藥監(jiān)局提交申請,希望在臨床中應用這款AI產(chǎn)品,提高基層醫(yī)院影像診斷準確率,同時也提高影像判讀速度,為患者節(jié)約時間。
不必擔心機器在臨床技術上超越人類醫(yī)生
北京大數(shù)醫(yī)達有限公司創(chuàng)始人、CMU博士鄧侃在了解到這項比賽后,給出了如下的點評:
以往司機必須具備三種能力,第一種是規(guī)劃路徑的導航能力,熟悉地圖,能夠規(guī)劃從起點到終點的合理路徑。第二種是駕駛汽車的操作能力,包括踩油門、踩剎車、轉方向盤等等。第三種是對交通實況,迅速做出判斷的能力,譬如避讓行人,如何處理其它車輛超車。
有了導航軟件以后,司機們不再需要熟記地圖,不再需要第一種能力。隨著無人駕駛技術的發(fā)展,不久的將來,司機們也不再需要第二種和第三種能力。
隨著人工智能醫(yī)療技術的發(fā)展,人類醫(yī)生也將不再像以往那樣,依賴臨床經(jīng)驗的個人積累,而是越來越依賴電腦的提示。
讀片是醫(yī)療過程中,診斷的一個環(huán)節(jié)。輸入是檢查設備生成的影像,輸出是文字版的檢查報告,檢查報告中包括兩部分,一個是檢查所見,列出檢查影像中需要關注的特征標志物。另一個是檢查結果,根據(jù)檢查特征標志物,判斷患者罹患的疾病。
昨天北京舉辦了一場AI vs人類神經(jīng)科醫(yī)生的讀片大賽,在A組比賽中,225例判讀,AI 系統(tǒng)用 15分鐘完成讀片,準確率達87%,15位醫(yī)生用30分鐘準確率達66%;B組比賽中,10名頂尖醫(yī)生對戰(zhàn)AI,同樣完成30道腦血腫擴大預測試題,AI 系統(tǒng)以83% vs 人類醫(yī)生 63% 準確率勝出。
昨天的比賽,人工智能系統(tǒng)以 20% 的顯著優(yōu)勢,戰(zhàn)勝人類醫(yī)生。這說明,在某幾類疾病的讀片中,人工智能確實比人類智能更有優(yōu)勢。而且,不久的將來,在其它疾病的讀片中,機器也勢必超越人類。
整個診斷過程,包括問診、體檢、化驗、檢查。讀片只是檢查這個單個環(huán)節(jié)。不久的將來,機器勢必在診斷和治療全過程,而不僅僅是讀片單個環(huán)節(jié),超越人類。人工智能醫(yī)療,下一步的發(fā)力點,一定是診斷和治療的全過程的整合,把問診、體檢、化驗、檢查全部串連起來。
人類醫(yī)生會失業(yè)嗎?醫(yī)療界有句名言,“To Cure Sometimes, To Relieve Often, To Comfort Always,有時是治愈;常常是幫助;總是去安慰”。也許機器在治愈和幫助方面,確實比人類醫(yī)生更精準,但是患者需要關懷,需要安慰,醫(yī)生提供的“話療”,哪怕是無聲的一個同情的眼神,機器能難替代人類醫(yī)生。
不用擔心機器在臨床技術方面超越人類,就像不用擔心導航軟件和無人駕駛技術,超越人類司機一樣。歷史經(jīng)驗表明,機器取代人類,完成繁瑣的工作,讓人類騰出手去,完成更精巧的工作。全球人口發(fā)展的歷史也表明,隨著機器的普及和進步,人類人口非但沒有下降,反而不斷增加。
-
神經(jīng)系統(tǒng)
+關注
關注
0文章
84瀏覽量
12999 -
AI
+關注
關注
87文章
31054瀏覽量
269407 -
人工智能
+關注
關注
1792文章
47387瀏覽量
238900
原文標題:全球首場神經(jīng)影像人機對決:AI戰(zhàn)勝25位醫(yī)界“最強大腦”!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論