機器現(xiàn)在可以識別憤怒、恐懼、厭惡和悲傷,而情感檢測已從一個研究項目發(fā)展到價值200億美元的產(chǎn)業(yè)。
檢測程序能通過讀取面部表情和行為發(fā)現(xiàn)潛在的***嗎?這是美國交通安全管理局(TSA)2003年提出的一個假設(shè),在開發(fā)這個項目時,他們咨詢了舊金山加利福尼亞大學(xué)心理學(xué)榮譽退休教授保羅·艾克曼(Paul Ekman)。幾十年前,艾克曼(Ekman)已經(jīng)開發(fā)出了一種識別細微面部表情的方法,并將它們映射到相應(yīng)的情緒上,這種方法被用來訓(xùn)練“行為檢測人員”——掃描臉部觀察是否有欺騙的跡象。
但當(dāng)該計劃于2007年推出時,卻面臨種種問題,比如警察利用該技術(shù)經(jīng)常錯誤的逮捕嫌犯,更令人擔(dān)憂的是,該計劃據(jù)稱涉嫌種族歧視。
此后,艾克曼(Ekman)試圖與美國交通安全管理局的項目脫離關(guān)系,聲稱他的方法被誤用了,但分析人士認為,該計劃的失敗是因為艾克曼(Ekman)的一個過時科學(xué)理論;即情緒可以通過面部的分析客觀地推斷出來。
近年來,科技公司已經(jīng)開始使用艾克曼(Ekman)的方法來訓(xùn)練從面部表情中檢測情感的算法,一些開發(fā)人員聲稱,自動情緒檢測系統(tǒng)不僅比人類更好地通過分析面部表情洞察真實的情緒,而且這些算法也將適應(yīng)檢測我們內(nèi)心的感受,極大地改善了我們與電子設(shè)備的交互。
但是許多研究情感科學(xué)的專家擔(dān)心這些算法會再次失敗,基于錯誤的科學(xué)對我們的生活做出高風(fēng)險的決定。
01
價值200億美元的大生意
情感檢測科技需要兩種技術(shù):計算機視覺,用于精確識別面部表情。機器學(xué)習(xí)算法,用于分析和解釋這些面部特征表達的情感內(nèi)容。
行人檢測攝像頭正在工作 圖/紐約時報
第二步通常采用一種名為監(jiān)督學(xué)習(xí)的技術(shù)。通過這種技術(shù),一個算法被訓(xùn)練出來識別它曾經(jīng)見過的東西?;镜南敕ㄊ?,如果你在“happy”(“快樂”)這個標(biāo)簽下顯示出成千上萬張笑臉的圖像,當(dāng)它看到一張上面有笑臉的新照片時,會再次把它識別為“happy”(“快樂”)。
研究生拉娜·艾爾·卡利歐比(Rana el Kaliouby)是最早開始試驗這種方法的研究人員之一。2001年,從埃及來到劍橋大學(xué)攻讀計算機科學(xué)博士學(xué)位后,她發(fā)現(xiàn)自己花在電腦上的時間比花在與其他人相處的時間更多。她認為,如果她能教電腦識別自己的情緒狀態(tài)并做出反應(yīng),那么沒有家人和朋友在身邊時,她也不會那么孤獨了。
卡利歐比(Kaliouby)博士階段的其余研究都致力于解決這個問題。最終,她開發(fā)出了一種設(shè)備,可以幫助患有亞斯伯格綜合癥(Asperger syndrome)的兒童閱讀面部表情并做出相應(yīng)的反應(yīng)。她稱其為“情感助聽器”。
2006年,卡利歐比(Kaliouby)加入麻省理工學(xué)院的情感計算實驗室,在那里,她與實驗室主任羅莎琳德·皮卡德(Rosalind Picard)一起,繼續(xù)改進和完善這項技術(shù)。此后,2009年,她們共同創(chuàng)辦Affectiva公司,面向市場銷售“人工情感智能”。
一開始,Affectiva將她們的情感檢測技術(shù)作為一種市場研究產(chǎn)品出售,為廣告和產(chǎn)品做出實時的情感反應(yīng),他們找到了諸如瑪氏(Mars),家樂氏(Kellogg’s)和哥倫比亞廣播公司(CBS)這樣的客戶。如今,亞馬遜、微軟和IBM也將“情感分析”作為他們的面部識別產(chǎn)品之一,許多較小的公司,如Kairos 和Eyris也已經(jīng)開始崛起,提供類似的服務(wù)。
除了市場研究以外,情感檢測技術(shù)現(xiàn)在還被用于監(jiān)控和檢測駕駛員的身體損傷,測試視頻游戲的用戶體驗,以及幫助醫(yī)療專業(yè)人士評估患者的健康狀況。
卡利歐比(Kaliouby)目睹了情感檢測從一個研究項目成長為一個價值200億美元的行業(yè)。她相信該行業(yè)將繼續(xù)發(fā)展壯大??ɡ麣W比(Kaliouby)預(yù)言,在不久的將來,這項技術(shù)將無處不在,并整合到我們所有的設(shè)備當(dāng)中,能夠“利用我們內(nèi)在的、潛意識的、時時刻刻的反應(yīng)”。
02
囊括87個國家750萬張人臉的數(shù)據(jù)庫
與大多數(shù)機器學(xué)習(xí)應(yīng)用程序一樣,情感檢測的進展取決于訪問更高質(zhì)量的數(shù)據(jù)。
展會上的面部識別軟件 圖/路透社
Affectiva公司表示,他們的情感數(shù)據(jù)存儲庫包含來自87個國家的750多萬張面孔,其中大部分是從收看電視或每天上下班行人的選擇性錄像中收集的。
目前,利用該技術(shù)可以將面部表情翻譯成對應(yīng)的情緒,例如,如果他們看到眉毛低垂,嘴唇緊閉,眼睛凸出的面容,就會貼上“憤怒”的標(biāo)簽。然后,這個帶有標(biāo)記的人類情緒數(shù)據(jù)集就會被用來訓(xùn)練算法,該算法會學(xué)習(xí)如何將皺眉頭的臉與憤怒、微笑的臉與幸福等等聯(lián)系起來。
這種標(biāo)注方法,在情感檢測行業(yè)中被許多人認為是衡量情感的黃金標(biāo)準(zhǔn),它是由保羅·艾克曼(Paul Ekman)和弗里森(Wallace V Friesen)于20世紀80年代開發(fā)的一款名為“情感面部動作編碼系統(tǒng)”(Emfacs)衍生而來。
這個系統(tǒng)的科學(xué)根源可以追溯到20世紀60年代,當(dāng)時艾克曼(Ekman)和兩位同事假設(shè)世界上存在六種普遍的情緒——憤怒、厭惡、恐懼、幸福、悲傷和驚訝——這些是我們與生俱來的情緒反應(yīng),可以通過分析面部肌肉運動在所有身處不同文化的人群中檢測到。
為了驗證這一假設(shè),他們向全世界不同地區(qū)的人群展示了面部照片,要求他們辨別他們所看到的情緒。他們發(fā)現(xiàn),盡管存在巨大的文化差異,人類還是會將相同的面部表情與相同的情感匹配在一起。對于美國的銀行家和巴布亞新幾內(nèi)亞的半游牧獵人來說,眉毛低,嘴唇緊閉,眼睛凸出的臉都意味著“憤怒”。
此后的二十年里,艾克曼(Ekman)利用他的發(fā)現(xiàn)開發(fā)了一種識別面部特征并將其映射到對應(yīng)情緒的方法,潛在的前提是如果一個人的普遍情緒被觸發(fā),那么一個相關(guān)的面部動作就會自動地出現(xiàn)在臉上。即使那個人試圖掩飾情緒,真實的本能感覺也會“泄露”出來,因此懂得觀察的人可以捕捉到對方的情緒。
整個20世紀后半葉,這個理論被稱之為經(jīng)典情感理論,開始主宰情感科學(xué)。艾克曼(Ekman)為他的情感檢測方法申請了專利,并開始將其作為訓(xùn)練項目出售給CIA、FBI、海關(guān)和邊境保護局以及TSA,真實情感可讀的觀念甚至滲透到了大眾文化之中,構(gòu)成了電視劇Lie to Me的理論基礎(chǔ)。
然而,眾多研究情感本質(zhì)的科學(xué)家和心理學(xué)家對經(jīng)典理論和??寺‥kman)的相關(guān)情感檢測方法提出質(zhì)疑,近年來,東北大學(xué)心理學(xué)教授麗薩·費爾德曼·巴雷特(Lisa Feldman Barrett)提出了一個強烈且持久的批評。
巴雷特(Barrett)在研究生時期首先遇到了經(jīng)典理論,她需要一種客觀測量情感的方法,于是發(fā)現(xiàn)了艾克曼(Ekman)的方法。在回顧文獻時,她開始擔(dān)心潛在的研究方法有缺陷。具體地說,她認為通過給人們提供預(yù)選的情感標(biāo)簽來匹配照片,艾克曼(Ekman)無意中“已經(jīng)有了預(yù)設(shè)的答案”。
巴雷特(Barrett)和一組同事通過重新運行艾克曼(Ekman)的測試來檢驗這個假設(shè)。但他們不提供標(biāo)簽,讓測試者自由地描述自己所看到圖像中的情緒,具體面部表情和具體情緒之間的關(guān)系直線下降。
從那時起,巴雷特(Barrett)發(fā)展了自己的情感理論,在她的著作《情感是如何產(chǎn)生的:大腦的秘密生活》(How Emotions Are Made: the Secret Life of the Brain)中得以闡述,她認為,大腦中沒有由外部刺激觸發(fā)的普遍情緒,相反,每一次情感體驗都是由更基本的部分構(gòu)成的。
她寫道:“情感是你身體物理特性的結(jié)合,是一個靈活的大腦,可以連接到所處的任何環(huán)境中,是你的文化和教養(yǎng)提供了這種環(huán)境,情感是真實的,但在客觀意義上不是說分子或神經(jīng)元是真實的,與金錢一樣真實,這不是幻覺,而是人類一致同意的產(chǎn)物。”
巴雷特解釋說,把面部表情直接映射到所有文化和環(huán)境中的情緒,這么做是沒有意義的,一個人生氣時可能會皺眉,而另一個人可能會向敵人禮貌地微笑,因此,評估情緒最好理解為一種動態(tài)實踐,包括自動認知過程、人與人的互動、具體經(jīng)驗和文化能力。她說,“這聽起來很費勁,但確實如此?!笨ɡ麣W比同樣認為“情感是復(fù)雜的。”
這就是為什么她和她在情感研究所的團隊一直努力提高數(shù)據(jù)豐富性和復(fù)雜性的原因。
除了使用視頻而不是靜止圖像來訓(xùn)練他們的算法外,他們還嘗試捕捉更多的背景數(shù)據(jù),比如聲音、步態(tài)以及人類感知之外的面部細微變化,她相信更好的數(shù)據(jù)將意味著更準(zhǔn)確的結(jié)果,一些研究甚至聲稱機器在情感檢測方面已經(jīng)優(yōu)于人類。
但據(jù)巴雷特所說,這不僅與數(shù)據(jù)有關(guān),而且與數(shù)據(jù)如何被標(biāo)記有關(guān),情感檢測公司和其他情感檢測公司用來訓(xùn)練算法的標(biāo)記過程,只能識別巴雷特所說的“情感刻板印象”,就像表情符號一樣,這些符號符合我們文化中普遍的情感主題。
紐約大學(xué)人工智能研究所的聯(lián)合主任梅雷迪思·惠特克(Meredith Whittaker)認為,基于艾克曼過時的科學(xué)構(gòu)建機器學(xué)習(xí)應(yīng)用程序不僅僅是一種糟糕的實踐,還會轉(zhuǎn)化為真正的社會危害。
她說:“你已經(jīng)看到招聘公司使用這些技術(shù)來衡量應(yīng)聘者是否是一個好員工,你還可以看到用于學(xué)校的實驗性技術(shù),以觀察學(xué)生在課堂上是忙碌、無聊還是憤怒??ɡ麣W比表示,“這些信息可以用來阻止人們獲得工作或改變他們在學(xué)校的待遇和評估方式,如果分析并非十分準(zhǔn)確,那將會是一種傷害。”
卡利歐比也敏銳地意識到建立不同數(shù)據(jù)集的重要性。她說:“我們要確保訓(xùn)練這些算法時,訓(xùn)練數(shù)據(jù)是多樣化的,我們需要代表白種人、亞洲人、膚色較深的人,甚至是戴頭巾的人。”這就是為什么研究團隊要從87個國家收集數(shù)據(jù)的原因。
通過這個過程,他們注意到在不同的國家,情感表達似乎呈現(xiàn)出不同的強度和細微差別。例如,巴西人用寬而長的微笑來表達幸福,而在日本,微笑并不表示幸福,而是表示禮貌。情感分析解釋了這種文化差異,增加了對系統(tǒng)的另一層分析,匯編了卡里歐比所說的“基于種族的基準(zhǔn)”,編纂了關(guān)于不同種族文化中如何表達情感的假設(shè)。
但正是這種基于種族等標(biāo)記的算法判斷讓惠特克(Whittaker) 擔(dān)心情緒檢測技術(shù)暗示了自動化面相的未來。事實上,已經(jīng)有公司對某人成為犯罪分子的可能性進行了預(yù)測。
最近幾項研究還表明,面部識別技術(shù)更容易產(chǎn)生傷害少數(shù)族裔群體的偏見,去年12月發(fā)表的一篇文章顯示,與白人相比,情感檢測技術(shù)顯示出黑人臉上的負面情緒更多。
卡利歐比認為,情感系統(tǒng)確實有一個種族分類器,她承認,這項技術(shù)目前并非萬無一失。
-
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3842瀏覽量
64547 -
計算機視覺
+關(guān)注
關(guān)注
8文章
1699瀏覽量
46052 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8428瀏覽量
132850
原文標(biāo)題:87個國家 750萬張臉部表情 一個價值200億美金的AI大生意
文章出處:【微信號:smartman163,微信公眾號:網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論