關(guān)于AI歧視我們也聊了很多,比如相貌偏見、語言歧視等,但AI的歧視顯然不僅只在這一個淺顯的領(lǐng)域。在其相貌和語言歧視的背后,矗立的其實是AI對這個社會全方位的片面判斷。
那么,AI的歧視問題也就不是一個簡單的算法問題了。今天我們就再聊一聊AI的偏見問題,以及面對它,我們究竟能做些什么。
始作俑者的人類本身:AI歧視產(chǎn)生的根源
首先我們需要清楚的是,發(fā)生AI歧視這種事情的原因在哪里。目前來看,大體上有兩個個方面。
1. 數(shù)據(jù)和算法的限制。
首先是數(shù)據(jù)的限制。AI對事物作出的判斷不是憑空或者隨機而得的,它必須要經(jīng)過一些列的訓(xùn)練學(xué)習(xí)才可以。那么,如果要訓(xùn)練它在某方面的能力,就要將相關(guān)領(lǐng)域的數(shù)據(jù)搜集起來供其學(xué)習(xí)。在這一方面,如果數(shù)據(jù)訓(xùn)練量不足,那么就會造成AI學(xué)習(xí)的不完備,其也就可能作出錯誤的判斷。
而數(shù)據(jù)限制的另一方面則來自數(shù)據(jù)本身。比如某個群體會有一些共性的特征,那么AI將會把這些大多數(shù)的共性特征數(shù)據(jù)作為標簽來用。一旦對象不在這個群體特征里,或?qū)儆谶@個群體的少數(shù)特征,其就有可能采取否定的態(tài)度。
其次則是算法的限制。程序員在設(shè)置AI學(xué)習(xí)程序的時候,無法做到過濾到每一條消極的信息。因此,AI在經(jīng)過大量的數(shù)據(jù)學(xué)習(xí)之后,其會自動匹配不同群體之間的關(guān)鍵詞,然后做出判斷。比如職業(yè)的男女分化問題。
事實上,目前我們面臨的所有AI的歧視問題基本上是圍繞著這兩個方面展開的。數(shù)據(jù)學(xué)習(xí)不夠多,或者數(shù)據(jù)學(xué)習(xí)夠多之后,其學(xué)習(xí)范圍超出了程序員設(shè)定的內(nèi)容,然后開始進行自我學(xué)習(xí)和判斷。這就造成了歧視行為的發(fā)生。
2. 人類固有偏見的強化。
但AI的歧視問題的根源并不在于數(shù)據(jù)和算法。在一定程度上,AI的歧視實際上是人類偏見的一種顯現(xiàn)和強化。人類是善于進行言語上的克制的,或者表現(xiàn)出在溝通交流中的表面客套。長此以往,人們似乎把隱藏自己對別人的偏見當(dāng)成了一種有素質(zhì)的美德。問題變成了你心里歧視與否不重要,面上做得好,你就是一個好人。
在這方面,做慈善的被曝丑聞后對比尤其突出。
而AI出現(xiàn)的意義之一就是打破了人們維持表面友好的自我欺騙的情況,它把那些被人們刻意隱藏的,并且似乎被隱藏得很好的東西重新抖摟了出來。這就是顯現(xiàn),那么為什么說會得到強化呢?
首先,AI學(xué)習(xí)就是一個排除的過程,比如對圖像語義分割,它要找到眼球,就必須要先進行圖像的分割,否定其他不適眼球的東西。同理,要招到一個合適的員工,它也是重點去排除不合適的選項。否定的過程,就是一個強化的過程。
其次,是基于AI的特殊屬性。AI是有史以來第一個人造的、有自己的判斷能力的事物,當(dāng)它出現(xiàn)一些違背人類維持表面友好而設(shè)定的一些規(guī)則的時候,人們一方面感到驚異,另一方面則會由此而進一步看清自己。它毫不留情地折了人類的面子,自然換來了更大的關(guān)注。
算法的限制和對人類固有觀念的強化,大抵可以說明了AI歧視橫行的原因所在。
AI歧視不僅類別多,影響可能還很大
如果我們僅僅是被AI歧視了,并且知道它的歧視是算法和人類本身問題所致,那也就無需擔(dān)心。畢竟,歧視無處不在,心理足夠強大,任何歧視都夠不成火力傷害。論不要臉的自黑精神,似乎沒誰能比得過現(xiàn)代人。
但是,當(dāng)AI不僅僅是歧視你,還要對你做出判斷,決定你的人生、工作、地位……的時候,你還能對它的歧視坐視不管嗎?
比如現(xiàn)在非常流行一個概念,用AI來進行招聘。
在理論上來講,它能夠通過學(xué)習(xí)既有的員工資料來篩選最符合公司需求的新人。對這些員工進行標簽分類是學(xué)習(xí)的一環(huán),能力強、口才好、實習(xí)經(jīng)驗豐富等可能會被篩選出來,但是,萬一在這些樣本中,AI找到了其他具有高度相同但和招聘又無關(guān)的標簽了呢?
比如這些人可能男生多一點,它可能會認為女生不適合這項工作;如果城市戶口的人多一點,來自農(nóng)村的就有可能被篩掉;如果23歲以前的人多一點的話,那23歲以后的人就可能被認為不適合……
你看,僅僅就是這幾個方面,就已經(jīng)涉及到性別歧視、地域歧視、年齡歧視了。雖然人們開發(fā)AI進行招聘是為了避免面試官會憑主觀印象決定去留,但太過于客觀的AI招聘同樣也會引發(fā)一些值得考慮的問題。
再比如把AI布置在警務(wù)工作當(dāng)中。
最近一段時間提到最多的就是利用AI幫助識別甚至是預(yù)測罪犯。比如去年上海交大的一篇論文中提出,可以通過人的樣貌進行分析,來判斷此人是否有犯罪的傾向。簡單來說,就是看你是不是長了一張“犯人臉”。而美國的警察也在最近試圖部署一套警務(wù)系統(tǒng),來預(yù)測犯罪發(fā)生的人員相關(guān)、地理區(qū)域等,然后來針對性加強監(jiān)控。英國來采用過類似的方法來預(yù)防犯罪。
這其中自然存在著嚴重的問題。看“人臉”就能辨罪犯?雖然相貌歧視確實一直存在,但基本上都是基于五官的缺陷?,F(xiàn)在居然升級了。美國的預(yù)測犯罪往往會把黑人和黑人集中區(qū)域當(dāng)做重點預(yù)測對象,這是很難令人接受的。尤其是美國這樣一個對黑人歧視非常忌諱的國家,AI即便不是個人,這一舉動也會招致人們的討厭。英國就更不用說了,他們的這個監(jiān)視系統(tǒng)運行了一段時間之后,窮人被特別針對了,因此最終不得不緊急下線。
從這幾個案例當(dāng)中,我們發(fā)現(xiàn),AI還存在著相貌歧視、種族歧視、貧富歧視。除此之外,AI的歧視還深度存在于各行各業(yè)當(dāng)中,甚至未來的一天我們可能真的會像《黑鏡》當(dāng)中一樣戴一個隱形眼鏡,然后就可以看到眼鏡對面來人的安全度識別。高安全度也不一定真的安全,很有可能是刷出來的呢?
也就是說,AI的歧視是一個綜合性的東西。問題又來了:難道因此我們就要將AI廢棄嗎?我們?nèi)祟惥湍敲床A膯幔?/p>
當(dāng)然,棄用AI不現(xiàn)實,這是一個因噎廢食的行為。它畢竟還在深刻地改變著我們的這個社會。但是,隨著AI的大規(guī)模應(yīng)用,努力減輕甚至是消除AI的偏見,也已經(jīng)顯得迫在眉睫。
AI歧視的解決之道
谷歌的一款數(shù)據(jù)庫被人們發(fā)現(xiàn)有存在著明顯的性別歧視。比如一個簡單的問答,巴黎:法國,那么東京:X,系統(tǒng)就會給出X=日本。如果是“父親:醫(yī)生”,其則將會對應(yīng)“母親:護士”;“男人:程序員”,“女人:家庭主婦”,諸如此類。
研究者們創(chuàng)建了一種“硬性糾錯”的方法。簡單來講,就是把系統(tǒng)判斷出的對應(yīng)關(guān)系放到一個論壇平臺上去發(fā)布并詢問是否合適。如果有一半的人認為不合適,那么這個類比就不恰當(dāng)。這種方式進行了一段時間之后,對AI進行單詞搭配的改善效果是非常顯著的。
這個方法雖然有效,但是明顯看出它只能適用于一些數(shù)據(jù)范圍較小的方面。比如某一家公司的招聘,可以在招聘之前對AI進行訓(xùn)練,然后找出問題,再用這種方法進行硬性糾錯。但是如果要用它來解決AI所有的問題,卻有點不現(xiàn)實。
哥倫比亞大學(xué)的研究者們則開發(fā)出了另外一種方式。深度學(xué)習(xí)研究的進步是AI復(fù)活的一個重要因素,但是AI的黑箱問題仍然沒有解決。因此,這些研究者們就試圖用打開黑箱的方式去弄明白為什么AI會做出一些錯誤的決定。他們開發(fā)出了一個能在神經(jīng)網(wǎng)絡(luò)中通過欺騙系統(tǒng)從而使其暴露自身缺陷的軟件,名叫“DeepX plore”。這個軟件能夠激活系統(tǒng)中幾乎百分之百的神經(jīng)元,從而讓整個神經(jīng)網(wǎng)絡(luò)去掃描錯誤。
也有其他的人建議從編程上去解決問題。但是從根本上來說,人類應(yīng)該把AI的歧視當(dāng)做一面鏡子,仔細審視自己在社會活動中種下的禍根。由此,不斷減少自己實際意義上的歧視和偏見。只有學(xué)習(xí)的內(nèi)容消失了,AI才可能避免產(chǎn)生歧視的問題。
但是我們?nèi)匀灰⒁獾囊粋€問題是,用“偏見”和“歧視”去概括AI所有的“區(qū)別對待”是不合適的。人類發(fā)展到現(xiàn)在,不同職業(yè)對人有不同的要求,男人耕田女人織布反映的其實是歷史經(jīng)過長期發(fā)展后的自然分工。那么,在處理AI歧視問題的時候就不是一個簡單的算法糾正了,它還涉及到社會學(xué)、經(jīng)濟學(xué)等各個方面的問題。
這樣來看,解決AI的歧視和偏見,我們可能仍然有很長的路要走。目前能做的就是,生殺大權(quán)這件事兒,還是交給人類自己吧。
評論
查看更多