微軟的研究人員正在給AI程序提供焦慮的粗略模擬,當(dāng)計(jì)算機(jī)學(xué)習(xí)駕駛虛擬世界時,它會使用這些“恐懼”信號作為指導(dǎo):如果一個人會感到害怕,計(jì)算機(jī)也可能會冥想,“我做錯了?!睆亩嵘{駛的安全性。
在迎合你的口味上,人工智能可能比你父母都了解你。我們可以完全信賴人工智能推薦的飯店、小說、電影。但當(dāng)涉及到人身財(cái)產(chǎn)安全的場景時,人工智能就顯得沒那么值得信賴了。
人工智能就是一個冷冰冰的系統(tǒng),它沒有感情,不會高興、憤怒、悲傷或者恐懼。
機(jī)器有情緒,對人類有用嗎?
就目前人工智能完成的各項(xiàng)任務(wù)來看,似乎也不太需要AI產(chǎn)生什么感情?但如果我們把視線再往后移一點(diǎn),就會發(fā)現(xiàn)人類其實(shí)需要與這些機(jī)器建立情感聯(lián)系。并且可能在某些時候,會要求這些聯(lián)系是互惠和真實(shí)的,就像人與人之間發(fā)生的那樣。
在和人類產(chǎn)生交互的場景中,比如聊天機(jī)器人,可以通過屏幕上的眼睛傳遞情感,以及合成的語音來表達(dá)情緒。當(dāng)你表現(xiàn)的低落時,它會安慰你;當(dāng)你表現(xiàn)的高興時,它會激勵你,你會被它感染。尤其是當(dāng)被用來照顧人類的時候。你會覺得面對的不是一個冷冰冰的機(jī)器,而是能夠滿足內(nèi)心情感的一個對象。
但這并不意味著人工智能“具有情感”,只不過是人工智能應(yīng)用的產(chǎn)品經(jīng)理,按照社會工程學(xué)玩的一些小伎倆。換句話說,機(jī)器不一定是移情,它們只需要看似移情。
情緒有助于人們決定什么是重要的,并將復(fù)雜的信息整合到關(guān)鍵決策中。 因此,嘗試制造具有情感的機(jī)器人應(yīng)該是有用的。
從人類物種的優(yōu)勢來看,一些觀點(diǎn)認(rèn)為,如果人工智能系統(tǒng)有情感,他們就會富有同情心,也許會避免一些讓人擔(dān)心的事情發(fā)生,比如,自動駕駛撞到人。
人自主神經(jīng)系統(tǒng)(ANS)由兩個分支組成。其中交感神經(jīng)系統(tǒng)(SNS)用于應(yīng)對潛在的危險情況,會針對眼前的威脅會減少或繞過意識做出快速決策,保護(hù)自己免受危險。
人類本能的會根據(jù)情緒做出不同的反應(yīng)。雖然這些預(yù)期反應(yīng)的主要作用是幫助人們做好行動準(zhǔn)備,但同時也在我們對當(dāng)前處境做出評估的時候,發(fā)揮作用。
感官刺激、生理反應(yīng)和認(rèn)知評估的組合,形成影響人類學(xué)習(xí)、計(jì)劃和決策。例如當(dāng)我們心跳加速、手心出汗表示出內(nèi)心的“恐懼”時,本能可能會希望采取行動,逃離當(dāng)前處境。此時如果要打斷這種逃避心理,就需要有明確目標(biāo)的外在動機(jī)。
開車,是非常典型的依賴于本能和外在動機(jī)并會出現(xiàn)重大的生理變化的例子。當(dāng)我們飆車的時候可能會處于一種高度覺醒的狀態(tài),比如在撞人之前會感受到極大的緊張從而開始迅速打輪避開。這種獎勵機(jī)制,顯然要優(yōu)于基于“事后諸葛亮”形式的獎勵機(jī)制。
學(xué)會恐懼吧,AI!
微軟的研究人員正在試圖教會計(jì)算機(jī)什么是“恐懼”。他們在ICLR上發(fā)表了一篇論文,提出一種強(qiáng)化學(xué)習(xí)框架。該框架結(jié)合了用于實(shí)現(xiàn)特定任務(wù)目標(biāo)的獎勵函數(shù),并且還最小化了與壓力相關(guān)的對環(huán)境的生理響應(yīng)的訓(xùn)練成本。
為了驗(yàn)證具有外在和內(nèi)在成分的這種獎勵函數(shù)是否在強(qiáng)化學(xué)習(xí)環(huán)境中有用,他們在駕駛?cè)蝿?wù)中,訓(xùn)練了一個加入了真實(shí)人類生理反應(yīng)的模型。
在現(xiàn)實(shí)世界中應(yīng)用RL的主要挑戰(zhàn)包括需要大量的訓(xùn)練數(shù)據(jù)、以及相關(guān)的故障案例。例如,當(dāng)在自動駕駛中使用RL時,獎勵通常是稀疏和傾斜的。不良行為可能導(dǎo)致災(zāi)難性的后果,并且恢復(fù)成本非常昂貴。
RL的大部分工作都是有任務(wù)或目標(biāo)依賴性的,而人類還會根據(jù)神經(jīng)系統(tǒng)的反應(yīng)做出決策。在強(qiáng)化學(xué)習(xí)智能體中加入這種機(jī)制,有助于降低樣本的復(fù)雜性。因?yàn)楠剟羁梢猿掷m(xù)獲得,并且在任務(wù)結(jié)束之前就可以發(fā)出成功或失敗的信號。這些生理反應(yīng)信號提供了警告機(jī)制,反過來又可以導(dǎo)致更安全的探索。
具體來說,就是考慮一個獎勵函數(shù),包含兩個元素:外在動機(jī)r,用來獎勵特定任務(wù)的行為;內(nèi)在本能r?,用來預(yù)測人類對交感神經(jīng)系統(tǒng)的反饋,并獎勵導(dǎo)致放松和減緩焦慮的行為。
為簡單起見,本文中只考慮外在動機(jī)和本能的獎勵的線性組合。在形式上,考慮一個基于帶有獎勵r的DQN的RL框架,然后使用一個r和r?的凸組合
公式如下:
其中λ是加權(quán)參數(shù),其提供了對任務(wù)完成(外在動機(jī))和生理反應(yīng)(本能)的期望之間的權(quán)衡。
在凸幾何領(lǐng)域,凸組合(英語:convex combination)指點(diǎn)的線性組合,要求所有系數(shù)都非負(fù)且和為1。 此處的“點(diǎn)”可以是仿射空間中的任何點(diǎn),包括向量和標(biāo)量。
那么一個“會恐懼”的AI表現(xiàn)如何呢?
研究人員邀請了4位擁有7年駕齡的老司機(jī),2男2女,并在他們的手指上安裝探測機(jī),以記錄在駕駛模擬器中的脈搏振幅。并訓(xùn)練了五個模型,每個參與者對應(yīng)一個模型,另外一個統(tǒng)一面向全部參與者。
針對每種情況下,來自實(shí)驗(yàn)記錄的前75%的幀作為訓(xùn)練樣例,后25%作為測試數(shù)據(jù)。訓(xùn)練分組中的數(shù)據(jù)是隨機(jī)的,并且使用了一個擁有128個實(shí)例的batch。
獎勵模型訓(xùn)練期間的損失是均方誤差。每個模型訓(xùn)練50個時期,之后所有模型的訓(xùn)練均方根誤差(RMSE)損失小于0.1。然后在獨(dú)立測試集上計(jì)算RMSE,對于所有參與者,RMSE在0.10和0.19之間。
隨機(jī)預(yù)測的測試損失平均為0.210。在所有情況下,CNN模型損失顯著低于隨機(jī)預(yù)測損失(基于未配對的T檢驗(yàn))。
根據(jù)Science報(bào)道,該實(shí)驗(yàn)仍然需要碰撞實(shí)驗(yàn)來驗(yàn)證模型的效果,但一個會恐懼的AI需要的碰撞數(shù)據(jù),要比無所畏懼的AI少1/4。聽起來不錯。
人工智能是否有可能產(chǎn)生類似人類的情緒?
那么是否我們就可以認(rèn)為人工智能產(chǎn)生了像人類一樣,真正的恐懼呢?如果人工智能可以產(chǎn)生恐懼,那么是否可以產(chǎn)生其他情緒呢?
要回答這個問題,了解導(dǎo)致情緒和推理的原因非常重要。基本上情緒反應(yīng)可能是由我們的感官捕獲的外部刺激引起的,或者是內(nèi)部刺激引起的,這可能是體內(nèi)平衡(身體自動調(diào)節(jié)系統(tǒng))的改變或由于我們自己的認(rèn)知。
處理刺激會在軀體狀態(tài)下產(chǎn)生非意識水平的變化,這被稱為情緒。如果情緒足夠強(qiáng)烈,那么就會進(jìn)行認(rèn)知,社交,語境和周圍相關(guān)的評估,我們稱之為體驗(yàn)情緒。
研究人類情緒的方法之一是研究人體內(nèi)發(fā)生的無意識和不可控的變化。由于神經(jīng)圖像和神經(jīng)技術(shù)的最新進(jìn)展,我們可以精確測量這些變化,然后進(jìn)行研究。
但這其中面臨的一些困難,例如反向推理問題(沒有與每種情緒相關(guān)的特定體細(xì)胞模式),主體間變異(沒有兩個大腦是相同的),以及主體間變異(一個人的大腦變化和進(jìn)化),導(dǎo)致我們還無法創(chuàng)建一種能夠復(fù)制人類情緒的算法。
當(dāng)前標(biāo)準(zhǔn)是使用校準(zhǔn)刺激來進(jìn)行研究,然后應(yīng)用機(jī)器學(xué)習(xí)算法搜索大腦活動中測量的情緒反應(yīng)與EEG系統(tǒng)之間的相關(guān)性以及圖像的分類。隨后,計(jì)算機(jī)程序開發(fā)計(jì)算模型,用來表示特定人的大腦或神經(jīng)系統(tǒng)如何對特定刺激(圖像)作出反應(yīng),從而引發(fā)特定情緒。
測量人類情緒模式的最科學(xué)方法是采用腦電圖,而通過面部特征、皮膚電活動和語音識別也是很好的輔助手段。
但計(jì)算模型不是人類的大腦的復(fù)刻,而且人類的情緒也取決于對外部世界和內(nèi)在自我的看法。人類通過感官獲得外部世界的感知,對內(nèi)心的感知則依賴于體內(nèi)平衡,以及認(rèn)知。換句話說,計(jì)算機(jī)不會產(chǎn)生任何源于內(nèi)省的情緒,因此,很難感受到愛或嫉妒。
一個億Ray Kurzweil預(yù)測計(jì)算機(jī)將在2029年通過圖靈的測試,表現(xiàn)出與人類無法區(qū)分的智能行為,其中就包括展現(xiàn)出自我意識以及豐富的情感。
十年后,準(zhǔn)備迎接一個覺醒的人工智能吧!
-
AI
+關(guān)注
關(guān)注
87文章
31023瀏覽量
269360 -
人工智能
+關(guān)注
關(guān)注
1792文章
47372瀏覽量
238857 -
自動駕駛
+關(guān)注
關(guān)注
784文章
13843瀏覽量
166562
原文標(biāo)題:ICLR論文:讓AI學(xué)會恐懼
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論