小編搞了大半輩子測試和容錯,對這方面消息比較敏感。最近看到新聞,商業(yè)巨頭亞馬遜2016年推出圖像識別AI系統(tǒng)“Rekognition”,還積極向美國警方推銷以幫助其辦案。不過近日,“Rekognition”卻鬧了一個大烏龍:28名美國國會議員被它識別成了罪犯。
這一錯誤也讓發(fā)起這項測試、反對警方使用“Rekognition”的美國公民自由聯(lián)盟(ACLU)抓到把柄,他們表示,測試結(jié)果引起了民眾對警方使用該系統(tǒng)的嚴(yán)重?fù)?dān)憂。7月26日,ACLU在其網(wǎng)站披露:該組織對“Rekognition”進行了測試,結(jié)果系統(tǒng)錯誤地將28名國會議員識別為曾因犯罪而被捕的人員。
所以,人工智能應(yīng)用被吹得熱熱鬧鬧,場景令人振奮,但是,真要付諸應(yīng)用,人們對這些系統(tǒng)信任度存在疑問,可能產(chǎn)生嚴(yán)重后果。怎么能提供這些系統(tǒng)的高可信性呢?這就要深入到每一個具體系統(tǒng),進行科學(xué)分析。本月IEEE Spectrum 2018/8發(fā)表一篇文章,“MAKING MEDICAL AI TRUSTWORTHY”,很有參考價值。
醫(yī)藥工業(yè)領(lǐng)域是人工智能系統(tǒng)應(yīng)用的理想之地。醫(yī)學(xué)檢驗、醫(yī)生的面談和過程被成文為患者病歷,存為電子格式。AI系統(tǒng)可以摘要這些數(shù)據(jù),從而決定較好和性價比較高的治療方案?,F(xiàn)在許多研究都在建造這種系統(tǒng),許多文章描述關(guān)于分析紀(jì)錄、掃描圖像、產(chǎn)生患者健康的診斷和預(yù)言。譬如下圖所示一個低分辨率的反映心臟跳動的心動圖,用AI程序分離,取出最相關(guān)的部分,然后用解剖學(xué)的理解去進行診斷。
這類文章很多,但是,這些系統(tǒng)很少能進入醫(yī)院里實際應(yīng)用。
為什么會這樣?匹茲堡大學(xué)的醫(yī)學(xué)研究專家和物理學(xué)家Shinjini Kundu說:問題在于信任方面,你有可行的技術(shù),但你怎么能得到人們的信任而使用之?
許多醫(yī)用AI系統(tǒng)是個黑盒子,輸入數(shù)據(jù),得出答案。醫(yī)生們搞不懂它為什么要這么處理。所以,Kunda研究AI對醫(yī)學(xué)圖像的分析與解釋。她從對醫(yī)學(xué)圖像,譬如核磁共振圖像,機器學(xué)習(xí)開始,從而發(fā)現(xiàn)醫(yī)生感興趣的模式。
Kunda最近用AI分析膝蓋核磁共振圖像(MRI),分析三年內(nèi)會發(fā)展為骨關(guān)節(jié)炎的可能性。她用“生長模型化”技術(shù),用AI產(chǎn)生一個新圖像,一個保證會發(fā)病的圖像。Kunda解釋說,他們開發(fā)了一個黑盒子分類器,去產(chǎn)生一個圖像,顯示支持其診斷的模式。
人眼無法根據(jù)下圖的MRI圖像判斷患者三年內(nèi)是否會得關(guān)節(jié)炎,譬如上左圖不會,但上右圖就會得關(guān)節(jié)炎。而AI程序進行統(tǒng)計分析可以得出幾倍方差范圍內(nèi)得這種病的概率。
AI產(chǎn)生的圖像基于MRI掃描軟骨的微妙變化,這些變化可能是醫(yī)生們沒有注意到的。這幫助人們?nèi)ダ斫膺^去治關(guān)節(jié)炎的過程為什么沒注意到。
舊金山加州大學(xué)助理教授、心臟病專家Rima Arnaout訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)去分類超聲波心電圖,在分辨微小而低分辨率圖像方面比心臟病專家精確多了。下一步將用該圖像信息去識別解剖結(jié)構(gòu)和診斷心臟疾病和缺陷。
但是,Arnaout說:“我不會去做自己無法信服的診斷?!彼脙蓚€技術(shù)去搞懂她的分類器是怎么做出決定的。在封閉試驗中,他考察測試圖像的部分變化如何改變AI的回答;用顯著圖,她跟蹤神經(jīng)網(wǎng)絡(luò)的最后回答返回到原圖,去發(fā)現(xiàn)什么像素權(quán)重最高。這兩技術(shù)說明圖像的那些部分對AI做出結(jié)論最重要,正和專家看重的結(jié)構(gòu)相重合。
微軟一位骨干研究人員Rich Caruana十年來一直致力于一項研究,就是讓機器學(xué)習(xí)模型不但是智能的,而且是可以理解的。他用AI拿醫(yī)院的電子病歷去預(yù)計患者的結(jié)果。他發(fā)現(xiàn)即使是高度精確的模型也隱藏著嚴(yán)重的缺陷。他引用他對肺癌患者的數(shù)據(jù)集,訓(xùn)練機器學(xué)習(xí)模型去區(qū)分該入院的高危患者和可在家恢復(fù)的低?;颊?。該模型發(fā)現(xiàn)有心臟病的人較少死于肺炎,可以安心地算作低危人群。他解釋說,診斷有肺炎的心臟病患者其所以結(jié)局較好,不是因為他們低危險,而是如果他們的呼吸困難早就進了急診,從而得到治療。模型發(fā)現(xiàn)的這種關(guān)聯(lián)性是正確的。但是,假如我們用這種關(guān)聯(lián)性去干預(yù)衛(wèi)生保健,我們可能傷害甚至殺死某些患者。由于這些麻煩的發(fā)現(xiàn),他正在研究清楚顯示變量相關(guān)的機器學(xué)習(xí)模型,讓它判斷模型不但統(tǒng)計意義上精確,而且醫(yī)學(xué)上可用。
所以,人工智能應(yīng)用需要應(yīng)用領(lǐng)域?qū)<业纳钊敕治?、?yán)格的測試過程、有效的容錯技術(shù),才能保證人工智能應(yīng)用系統(tǒng)的安全可靠,人們才能放心使用。
-
圖像識別
+關(guān)注
關(guān)注
9文章
520瀏覽量
38286 -
人工智能
+關(guān)注
關(guān)注
1792文章
47372瀏覽量
238857
原文標(biāo)題:人工智能應(yīng)用需要高可信性(180806)
文章出處:【微信號:AItists,微信公眾號:人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論