人工智能(AI)往往被視為一種暗箱實(shí)踐,即人們并不關(guān)注技術(shù)本身的運(yùn)作方式,只強(qiáng)調(diào)其能夠提供看似正確的結(jié)果。在某些情況下,這種效果就已經(jīng)可以滿(mǎn)足需求,因?yàn)榇蠖鄶?shù)時(shí)候我們都更關(guān)注結(jié)果,而非結(jié)果的具體實(shí)現(xiàn)方式。
遺憾的是,將AI視為暗箱過(guò)程會(huì)產(chǎn)生信任與可靠性等問(wèn)題。從純技術(shù)的角度來(lái)看,這也導(dǎo)致我們難以分析或解決AI模型中存在的問(wèn)題。
在本文中,我們將共同了解其中的部分潛在問(wèn)題以及幾種解決方案思路。
AI是什么?
不少企業(yè)已經(jīng)將人工智能(AI)元素納入自家產(chǎn)品。雖然有些“AI”表述只是虛假的營(yíng)銷(xiāo)策略,但也確實(shí)有不少產(chǎn)品開(kāi)始使用AI及機(jī)器學(xué)習(xí)(ML)技術(shù)實(shí)現(xiàn)自我提升。
簡(jiǎn)而言之,AI是指一切能夠表現(xiàn)出智能行為的計(jì)算機(jī)系統(tǒng)。在本文的語(yǔ)境下,智能代表著計(jì)算機(jī)在學(xué)習(xí)、理解或者概念總結(jié)等層面的飛躍式進(jìn)步。
當(dāng)前,AI技術(shù)最常見(jiàn)的實(shí)現(xiàn)形式為機(jī)器學(xué)習(xí),其中由計(jì)算機(jī)算法學(xué)習(xí)并識(shí)別數(shù)據(jù)中的模式。機(jī)器學(xué)習(xí)大致分為三類(lèi):
監(jiān)督學(xué)習(xí):即使用已知數(shù)據(jù)進(jìn)行模型訓(xùn)練。這有點(diǎn)像給孩子們看最簡(jiǎn)單的看圖識(shí)字教材。這類(lèi)ML也是大家最常接觸到的實(shí)現(xiàn)形式,但其有著一個(gè)致命缺點(diǎn):只有具備大量可信且經(jīng)過(guò)正確標(biāo)記的訓(xùn)練數(shù)據(jù),才能建立起相關(guān)模型。
無(wú)監(jiān)督學(xué)習(xí):模型自行在數(shù)據(jù)中查找模式。手機(jī)導(dǎo)航軟件使用的就是這種學(xué)習(xí)方式,特別適合我們對(duì)數(shù)據(jù)一無(wú)所知的情況。目前業(yè)界往往使用無(wú)監(jiān)督學(xué)習(xí)從數(shù)據(jù)中識(shí)別出可能具有現(xiàn)實(shí)意義的重要聚類(lèi)。
強(qiáng)化學(xué)習(xí):模型在每次正確執(zhí)行時(shí)都會(huì)得到獎(jiǎng)勵(lì)。因?yàn)檫@是一種典型的“實(shí)驗(yàn)試錯(cuò)”學(xué)習(xí)方法。如果我們初期只有少量數(shù)據(jù),那么這種ML方法將表現(xiàn)得尤為強(qiáng)大。它的出現(xiàn),直接令持續(xù)學(xué)習(xí)模型成為可能,即模型在接觸到新數(shù)據(jù)后會(huì)不斷適應(yīng)及發(fā)展,從而保證自身永不過(guò)時(shí)。
但這些方法都面臨著同一個(gè)問(wèn)題,我們無(wú)法理解學(xué)習(xí)后生成的最終模型。換言之,人工智能無(wú)法實(shí)現(xiàn)人性化。
信任問(wèn)題
暗箱式AI系統(tǒng)大多屬于由機(jī)器經(jīng)過(guò)自學(xué)過(guò)程建立起模型。但由于無(wú)法理解系統(tǒng)得出結(jié)論的過(guò)程,我們就很難理解模型給出特定結(jié)論的理由,或者對(duì)該結(jié)論缺乏信心。我們無(wú)法詢(xún)問(wèn)模型為什么會(huì)這么判斷,只能拿結(jié)果跟自己的期望進(jìn)行比較。
如果不理解AI模型的起效原理,我們又怎么能相信模型會(huì)永遠(yuǎn)正確?
結(jié)果就是,這種不可理解性同無(wú)數(shù)反烏托邦科幻作品映射起來(lái),讓AI成了恐怖神秘的代名詞。更糟糕的是,不少AI模型確實(shí)表現(xiàn)出嚴(yán)重的偏差,這也令信任危機(jī)被進(jìn)一步激化。
偏差或者說(shuō)偏見(jiàn),一直植根于人類(lèi)的思想意識(shí)當(dāng)中,現(xiàn)在它也開(kāi)始成為AI技術(shù)無(wú)法回避的大難題。因?yàn)橄到y(tǒng)只能從過(guò)往的情況中學(xué)習(xí)經(jīng)驗(yàn),而這些可能并不足以指導(dǎo)模型做出面向未來(lái)的正確選擇。
以AI模型在犯罪預(yù)測(cè)中的應(yīng)用為例,這些模型會(huì)使用以往犯罪統(tǒng)計(jì)數(shù)據(jù)來(lái)確定哪些地區(qū)的犯罪率比較高。執(zhí)法部門(mén)則調(diào)整巡邏路線(xiàn)以向這些地區(qū)集中警力資源。但人們普遍質(zhì)疑,使用這類(lèi)數(shù)據(jù)本身就是在加強(qiáng)偏見(jiàn),或者潛在地將相關(guān)性混淆為因果性。
例如,隨著新冠疫情的肆虐,美國(guó)各大主要城市的暴力犯罪率開(kāi)始顯著下降;但在某些司法管轄區(qū)內(nèi),汽車(chē)盜竊及其他劫掠案件卻有所增加。普通人可能會(huì)將這些變化與全國(guó)范圍內(nèi)的社交隔離合理聯(lián)系起來(lái),但預(yù)測(cè)性警務(wù)模型卻有可能錯(cuò)誤地將犯罪數(shù)量及逮捕率的降低解釋為穩(wěn)定性與治安水平的提升。
目前,人工智能中存在多種形式的偏見(jiàn)。以人臉識(shí)別軟件為例,研究表明包含“人口統(tǒng)計(jì)學(xué)偏見(jiàn)”的算法會(huì)根據(jù)對(duì)象的年齡、性別或種族做出準(zhǔn)確率波動(dòng)極大的判斷。
有時(shí),數(shù)據(jù)科學(xué)家在執(zhí)行特征工程以嘗試清洗源數(shù)據(jù)時(shí),同樣會(huì)引發(fā)偏差/偏見(jiàn)問(wèn)題,導(dǎo)致其中某些微妙但卻極為重要的特征意外丟失。
影響最大的偏見(jiàn)甚至可能引發(fā)社會(huì)層面的問(wèn)題。例如,廣告算法會(huì)根據(jù)人口統(tǒng)計(jì)數(shù)據(jù)定期投放廣告,從而將對(duì)于年齡、性別、種族、宗教或社會(huì)經(jīng)濟(jì)等因素的偏見(jiàn)永久留存在模型之內(nèi)。AI技術(shù)在招聘應(yīng)用中也暴露出了類(lèi)似的缺陷。
當(dāng)然,這一切都源自人類(lèi)自己引發(fā)的原始偏見(jiàn)。但是,我們?cè)撊绾卧贏(yíng)I模型中發(fā)現(xiàn)這些偏見(jiàn)并將其清除出去?
可解釋AI
為了增加對(duì)AI系統(tǒng)的信任度,AI研究人員正在探索構(gòu)建可解釋AI(XAI)的可能性,希望借此實(shí)現(xiàn)AI方案的人性化。
XAI能夠避免我們?cè)诎迪淠P椭须y以識(shí)別的種種問(wèn)題。例如,2017年研究人員的報(bào)告稱(chēng)發(fā)現(xiàn)了一項(xiàng)AI作弊問(wèn)題。該AI模型在訓(xùn)練之后能夠成功識(shí)別出馬匹的圖像,相當(dāng)于對(duì)經(jīng)典狗/貓識(shí)別能力的變體。但事實(shí)證明,AI學(xué)會(huì)的實(shí)際上是識(shí)別與馬匹圖片相關(guān)的特定版權(quán)標(biāo)注。
為了實(shí)現(xiàn)XAI,我們需要觀(guān)察并理解模型內(nèi)部的整個(gè)運(yùn)作過(guò)程。這項(xiàng)探索本身已經(jīng)構(gòu)成了理論計(jì)算機(jī)科學(xué)中的一大分支,其困難程度可能也遠(yuǎn)超大家的想象。
比較簡(jiǎn)單的機(jī)器學(xué)習(xí)算法當(dāng)然相對(duì)易于解釋?zhuān)?a href="http://www.wenjunhu.com/tags/神經(jīng)網(wǎng)絡(luò)/" target="_blank">神經(jīng)網(wǎng)絡(luò)則復(fù)雜得多。即使是包括分層相關(guān)性傳播(LRP)在內(nèi)的各類(lèi)最新技術(shù),也只能顯示哪些輸入對(duì)于決策制定更為重要。因此,研究人員的注意力開(kāi)始轉(zhuǎn)向本地可解釋性目標(biāo),希望借此對(duì)模型做出的某些特定預(yù)測(cè)做出解釋。
AI模型為什么難以理解?
目前,大多數(shù)ML模型基于人工神經(jīng)元。人工神經(jīng)元(或稱(chēng)感知器)使用傳遞函數(shù)對(duì)一個(gè)或多個(gè)加權(quán)輸入進(jìn)行組合。以此為基礎(chǔ),激活函數(shù)將使用閾值以決定是否觸發(fā)。這種方法,實(shí)際上限制了神經(jīng)元在人腦中的工作方式。
作為一種常見(jiàn)的ML模型,神經(jīng)網(wǎng)絡(luò)由多層人工神經(jīng)元組成。輸入層與重要特征擁有相同的輸入數(shù)量,同時(shí)輔以大量隱藏層。最后,輸出層也將擁有與重要特征相同的輸出數(shù)量。
我們以最簡(jiǎn)單的應(yīng)用場(chǎng)景為例,考慮ML模型如果根據(jù)今天是星期幾及是否屬于假期來(lái)預(yù)測(cè)您的起床時(shí)間。
在隨機(jī)分配權(quán)重的情況下,模型會(huì)生成錯(cuò)誤的結(jié)果,即我們周三需要在上午9點(diǎn)起床。
我們當(dāng)然不可能以手動(dòng)方式為每個(gè)人工神經(jīng)元設(shè)置確切的權(quán)重。相反,我們需要使用所謂反向傳播過(guò)程,算法將在模型中反向運(yùn)作,借此調(diào)整網(wǎng)絡(luò)的權(quán)重與偏差,力求將預(yù)測(cè)輸出與預(yù)期輸出間的差異控制在最小范圍。在調(diào)整之后,結(jié)果是周三早上應(yīng)該7點(diǎn)起床。
信任與道德
技術(shù)信任問(wèn)題正變得愈發(fā)重要,畢竟我們已經(jīng)在嘗試使用AI診斷癌癥、識(shí)別人群中的通緝犯并做出雇用/解雇決策。如果無(wú)法實(shí)現(xiàn)AI人性化,又怎么能要求人們向其給予信任呢?如果沒(méi)有這種信任,以符合道德的方式加以使用更是癡人說(shuō)夢(mèng)。
對(duì)于這個(gè)重要問(wèn)題,歐盟已經(jīng)通過(guò)一套關(guān)于可信AI的道德準(zhǔn)則,針對(duì)AI是否符合道德及具備可信度設(shè)置了七項(xiàng)測(cè)試:
人類(lèi)代理與監(jiān)督:AI系統(tǒng)不可在人類(lèi)不具備最終決定權(quán)的情況下做出決策。
技術(shù)的健壯性與安全性:在使用AI技術(shù)之前,必須明確其是否可靠,包括具備故障保護(hù)能力且不會(huì)被黑客入侵。
隱私與數(shù)據(jù)治理:AI模型往往需要處理個(gè)人數(shù)據(jù),例如通過(guò)醫(yī)學(xué)造影圖像診斷疾病。這意味著數(shù)據(jù)隱私將非常重要。
透明度:AI模型應(yīng)該具備人類(lèi)可解釋的基本屬性。
多樣性、非歧視性與公平性:主要涉及我們前文討論過(guò)的偏見(jiàn)問(wèn)題。
環(huán)境與社會(huì)福祉:在這里,準(zhǔn)則制定者們希望消除人們對(duì)于A(yíng)I技術(shù)發(fā)展造成反烏托邦式未來(lái)的擔(dān)憂(yōu)。
問(wèn)責(zé)制度:必須建立起獨(dú)立的監(jiān)督或監(jiān)控制度。
當(dāng)然,指南也強(qiáng)調(diào),必須以合法方式使用AI技術(shù)。
AI的人性化之路
本文關(guān)注的重點(diǎn)只有一個(gè):人工智能該如何實(shí)現(xiàn)人性化,從而切實(shí)建立起自身可信度。
人類(lèi)很難相信自己無(wú)法理解的機(jī)器,并最終阻礙了我們從這一創(chuàng)新技術(shù)中切實(shí)受益。
這個(gè)問(wèn)題在軟件測(cè)試自動(dòng)化領(lǐng)域表現(xiàn)得尤其明顯,因?yàn)榇祟?lèi)系統(tǒng)的意義就是在應(yīng)用方案發(fā)布之前找到其中存在的潛在問(wèn)題。如果不了解具體流程,我們要如何確定測(cè)試結(jié)果的正確性?如果做出了錯(cuò)誤決定,該怎么辦?如果AI系統(tǒng)遺漏了某些問(wèn)題,我們?cè)撊绾伟l(fā)現(xiàn)或者做出響應(yīng)?
為了解決這個(gè)難題,必須將ML算法與測(cè)試體系結(jié)合起來(lái),實(shí)現(xiàn)決策制定與相應(yīng)數(shù)據(jù)間關(guān)聯(lián)關(guān)系的可視化。只有這樣,我們才能徹底告別暗箱式AI。這是一項(xiàng)踏踏實(shí)實(shí)的工作,沒(méi)有奇跡、沒(méi)有魔法,可以依賴(lài)的只有不懈努力與對(duì)機(jī)器學(xué)習(xí)美好未來(lái)的憧憬。
責(zé)編AJX
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7113瀏覽量
89303 -
AI
+關(guān)注
關(guān)注
87文章
31321瀏覽量
269664 -
人工智能
+關(guān)注
關(guān)注
1792文章
47532瀏覽量
239278
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論