隨著機(jī)器人進(jìn)入日常生活中的各個方面,人們對其提出了更高的要求,希望它們具有感知人類情感、意圖的能力,這類機(jī)器人稱為情感機(jī)器人。
情感機(jī)器人的出現(xiàn)將改變傳統(tǒng)的人機(jī)交互模式,實現(xiàn)人與機(jī)器人的情感交互。用人工的方法和技術(shù)賦予機(jī)器人以人類式的情感,使情感機(jī)器人具有識別、理解和表達(dá)喜樂哀怒的能力。
目前,機(jī)器人革命已經(jīng)進(jìn)入“互聯(lián)網(wǎng)+情感+智能”的時代,這就要求機(jī)器人具有情感。
情感計算
情感計算就是賦予計算機(jī)像人一樣的觀察、理解和表達(dá)各種情感特征的能力,最終使計算機(jī)能與人進(jìn)行自然、親切和生動的交互。情感計算及其在人機(jī)交互系統(tǒng)中的應(yīng)用必將成為未來人工智能的一個重要研究方向。
什么是情感計算?
情感計算的概念是在1997 年由麻省理工學(xué)院(Massachusetts Institute of Tech-nology,MIT)媒體實驗室Picard 教授提出的,她指出情感計算與情感相關(guān),源于情感或能夠?qū)η楦惺┘佑绊懙挠嬎恪?/p>
心理學(xué)和認(rèn)知科學(xué)對情感計算的發(fā)展起了很大的促進(jìn)作用。心理學(xué)研究表明,情感是人與環(huán)境之間某種關(guān)系的維持或改變,當(dāng)外界環(huán)境的發(fā)展與人的需求及愿望符合時會引起人積極肯定的情感,反之則會引起人消極否定的情感。情感是人態(tài)度在生理上一種較復(fù)雜而又穩(wěn)定的生理評價和體驗,在生理反應(yīng)上的反映包括喜、怒、憂、思、悲、恐、驚七種基本情感。
情感計算是一門綜合性很強(qiáng)的技術(shù),是人工智能情感化的關(guān)鍵一步。情感計算的主要研究內(nèi)容包括:分析情感的機(jī)制,主要是情感狀態(tài)判定及與生理和行為之間的關(guān)系;利用多種傳感器獲取人當(dāng)前情感狀態(tài)下的行為特征與生理變化信息,如語音信號、面部表情、身體姿態(tài)等體態(tài)語以及脈搏、皮膚電、腦電等生理指標(biāo);通過對情感信號的分析與處理,構(gòu)建情感模型將情感量化,使機(jī)器人具有感知、識別并理解人情感狀態(tài)的能力,從而使情感更加容易表達(dá);根據(jù)情感分析與決策的結(jié)果,機(jī)器人能夠針對人的情感狀態(tài)進(jìn)行情感表達(dá),并做出行為反應(yīng)。
不能理解怎能陪伴:情感計算關(guān)鍵技術(shù)
情感計算中關(guān)鍵的兩個技術(shù)環(huán)節(jié)是如何讓機(jī)器能夠識別人的情感、如何根據(jù)人的情感狀態(tài)產(chǎn)生和表達(dá)機(jī)器的情感。雖然情感計算是一門新興學(xué)科,但前期心理學(xué)、生理學(xué)、行為學(xué)和腦科學(xué)等相關(guān)學(xué)科的研究成果已經(jīng)為情感計算的研究奠定了堅實的基礎(chǔ)。目前,國內(nèi)外關(guān)于情感計算的研究已經(jīng)在情感識別和情感合成與表達(dá)方面,包括語音情感識別與合成表達(dá)、人臉表情識別與合成表達(dá)、生理信號情感識別、身體姿態(tài)情感識別與合成表達(dá)等,取得了初步成果。
1、情感識別現(xiàn)狀
情感識別是通過對情感信號的特征提取,得到能最大限度地表征人類情感的情感特征數(shù)據(jù),據(jù)此進(jìn)行建模,找出情感的外在表象數(shù)據(jù)與內(nèi)在情感狀態(tài)的映射關(guān)系,從而將人類當(dāng)前的內(nèi)在情感類型識別出來。在情感計算中,情感識別是最重要的研究內(nèi)容之一。情感識別的研究主要包括語音情感識別、人臉表情識別和生理信號情感識別等。
1)語音情感識別
MIT 媒體實驗室Picard 教授帶領(lǐng)的情感計算研究團(tuán)隊在1997 年就開始了對于語音情感的研究。在語音情感識別方面,該團(tuán)隊的成員Fernandez 等開發(fā)了汽車駕駛語音情感識別系統(tǒng),通過語音對司機(jī)的情感狀態(tài)進(jìn)行分析,有效減少了車輛行駛過程中因不好情感狀態(tài)而引起的危險。
2)人臉表情識別
人臉表情識別是情感識別中非常關(guān)鍵的一部分。在人類交流過程中,有55%是通過面部表情來完成情感傳遞的。
20 世紀(jì)70 年代,美國心理學(xué)家Ekman 和Friesen 對現(xiàn)代人臉表情識別做了開創(chuàng)性的工作。Ekman 定義了人類的6 種基本表情:高興、生氣、吃驚、恐懼、厭惡和悲傷,確定了識別對象的類別;建立了面部動作編碼系統(tǒng)(facial action coding system,F(xiàn)ACS),使研究者能夠按照系統(tǒng)劃分的一系列人臉動作單元來描述人臉面部動作,根據(jù)人臉運(yùn)動與表情的關(guān)系,檢測人臉面部細(xì)微表情。隨后,Suwa 等對人臉視頻動畫進(jìn)行了人臉表情識別的最初嘗試。隨著模式識別與圖像處理技術(shù)的發(fā)展,人臉表情識別技術(shù)得到迅猛發(fā)展與廣泛的應(yīng)用。目前,大多數(shù)情感機(jī)器人(如MIT 的Kismet 機(jī)器人、日本的AHI 機(jī)器人等)都具有較好的人臉表情識別能力。
3)生理信號情感識別
MIT 媒體實驗室情感計算研究團(tuán)隊最早對生理信號的情感識別進(jìn)行研究,同時也證明了生理信號運(yùn)用到情感識別中是可行的。Picard 教授在最初的實驗中采用肌電、皮膚電、呼吸和血容量搏動4 種生理信號,并提取它們的24 維統(tǒng)計特征對這4 種情感狀態(tài)進(jìn)行識別。德國奧格斯堡大學(xué)計算機(jī)學(xué)院的Wagner 等對心電、肌電、皮膚電和呼吸4 種生理信號進(jìn)行分析來識別高興、生氣、喜悅和悲傷4 種情緒,取得了較好的效果。韓國的Kim 等研究發(fā)現(xiàn)通過測量心臟心率、皮膚導(dǎo)電率、體溫等生理信號可以有效地識別人的情感狀態(tài),他們與三星公司合作開發(fā)了一種基于多生理信號短時監(jiān)控的情感識別系統(tǒng)。
2、情感合成與表達(dá)現(xiàn)狀
機(jī)器除了識別、理解人的情感之外,還需要進(jìn)行情感的反饋,即機(jī)器的情感合成與表達(dá)。人類的情感很難用指標(biāo)量化,機(jī)器則恰恰相反,一堆冷冰冰的零部件被組裝起來,把看不見摸不著的“情感”量化成機(jī)器可理解、表達(dá)的數(shù)據(jù)產(chǎn)物。與人類的情感表達(dá)方式類似,機(jī)器的情感表達(dá)可以通過語音、面部表情和手勢等多模態(tài)信息進(jìn)行傳遞,因此機(jī)器的情感合成可分為情感語音合成、面部表情合成和肢體語言合成。
1)情感語音合成
情感語音合成是將富有表現(xiàn)力的情感加入傳統(tǒng)的語音合成技術(shù)。常用的方法有基于波形拼接的合成方法、基于韻律特征的合成方法和基于統(tǒng)計參數(shù)特征的合成方法。
基于波形拼接的合成方法是從事先建立的語音數(shù)據(jù)庫中選擇合適的語音單元,如半音節(jié)、音節(jié)、音素、字等,利用這些片段進(jìn)行拼接處理得到想要的情感語音?;敉蒋B加技術(shù)就是利用該方法實現(xiàn)的。
基于韻律特征的合成方法是將韻律學(xué)參數(shù)加入情感語音的合成中。He 等提取基音頻率、短時能量等韻律學(xué)參數(shù)建立韻律特征模板,合成了帶有情感的語音信號。
2)面部表情合成
面部表情合成是利用計算機(jī)技術(shù)在屏幕上合成一張帶有表情的人臉圖像。常用的方法有4 種,即基于物理肌肉模型的方法、基于樣本統(tǒng)計的方法、基于偽肌肉模型的方法和基于運(yùn)動向量分析的方法。
基于物理肌肉模型的方法模擬面部肌肉的彈性,通過彈性網(wǎng)格建立表情模型?;跇颖窘y(tǒng)計的方法對采集好的表情數(shù)據(jù)庫進(jìn)行訓(xùn)練,建立人臉表情的合成模型?;趥渭∪饽P偷姆椒ú捎脴訔l曲線、張量、自由曲面變形等方法模擬肌肉彈性。基于運(yùn)動向量分析的方法是對面部表情向量進(jìn)行分析得到基向量,對這些基向量進(jìn)行線性組合得到合成的表情。
荷蘭數(shù)學(xué)和計算機(jī)科學(xué)中心的Hendrix 等提出的CharToon 系統(tǒng)通過對情感圓盤上的7 種已知表情(中性、悲傷、高興、生氣、害怕、厭惡和驚訝)進(jìn)行插值生成各種表情。荷蘭特溫特大學(xué)的Bui 等實現(xiàn)了一個基于模糊規(guī)則的面部表情生成系統(tǒng),可將動畫Agent 的7 種表情和6 種基本情感混合的表情映射到不同的3D 人臉肌肉模型上。我國西安交通大學(xué)的Yang 等提出了一種交互式的利用局部約束的人臉?biāo)孛璞砬樯煞椒?。該方法通過樣本表情圖像獲得面部形狀和相關(guān)運(yùn)動的預(yù)先信息,再結(jié)合統(tǒng)計人臉模型和用戶輸入的約束條件得到輸出的表情素描。
3)肢體語言合成
肢體語言主要包括手勢、頭部等部位的姿態(tài),其合成的技術(shù)是通過分析動作基元的特征,用運(yùn)動單元之間的運(yùn)動特征構(gòu)造一個單元庫,根據(jù)不同的需要選擇所需的運(yùn)動交互合成相應(yīng)的動作。由于人體關(guān)節(jié)自由度較高,運(yùn)動控制比較困難,為了豐富虛擬人運(yùn)動合成細(xì)節(jié),一些研究利用高層語義參數(shù)進(jìn)行運(yùn)動合成控制,運(yùn)用各種控制技術(shù)實現(xiàn)合成運(yùn)動的情感表達(dá)。
日本東京工業(yè)大學(xué)的Amaya 等提出一種由中性無表情的運(yùn)動產(chǎn)生情感動畫的方法。該方法首先獲取人的不同情感狀態(tài)的運(yùn)動情況,然后計算每一種情感的情感轉(zhuǎn)變,即中性和情感運(yùn)動的差異。Coulson 在Ekman 的情感模型的基礎(chǔ)上創(chuàng)造了6 種基本情感的相應(yīng)身體語言模型,將各種姿態(tài)的定性描述轉(zhuǎn)化成用數(shù)據(jù)定量分析各種肢體語言。瑞士洛桑聯(lián)邦理工學(xué)院的Erden 根據(jù)Coulson 情感運(yùn)動模型、NAO 機(jī)器人的自由度和關(guān)節(jié)運(yùn)動角度范圍,設(shè)置了NAO 機(jī)器人6 種基本情感的姿態(tài)的不同肢體語言的關(guān)節(jié)角度,使得NAO 機(jī)器人能夠通過肢體語言表達(dá)相應(yīng)的情感。
在我國,哈爾濱工業(yè)大學(xué)研發(fā)了多功能感知機(jī),主要包括表情識別、人臉識別、人臉檢測與跟蹤、手語識別、手語合成、表情合成和唇讀等功能,并與海爾公司合作研究服務(wù)機(jī)器人;清華大學(xué)進(jìn)行了基于人工情感的機(jī)器人控制體系結(jié)構(gòu)研究;北京交通大學(xué)進(jìn)行了多功能感知和情感計算的融合研究;中國地質(zhì)大學(xué)(武漢)研發(fā)了一套基于多模態(tài)情感計算的人機(jī)交互系統(tǒng),采用多模態(tài)信息的交互方式,實現(xiàn)語音、面部表情和手勢等多模態(tài)信息的情感交互。
雖然情感計算的研究已經(jīng)取得了一定的成果,但是仍然面臨很多挑戰(zhàn),如情感信息采集技術(shù)問題、情感識別算法、情感的理解與表達(dá)問題,以及多模態(tài)情感識別技術(shù)等。另外,如何將情感識別技術(shù)運(yùn)用到人性化和智能化的人機(jī)交互中也是一個值得深入研究的課題。顯然,為了解決這些問題,我們需要理解人對環(huán)境感知以及情感和意圖的產(chǎn)生與表達(dá)機(jī)理,研究智能信息采集設(shè)備來獲取更加細(xì)致和準(zhǔn)確的情感信息,需要從算法層面和建模層面進(jìn)行深入鉆研,使得機(jī)器能夠高效、高精度地識別出人的情感狀態(tài)并產(chǎn)生和表達(dá)相應(yīng)的情感。
情感計算的應(yīng)用
隨著情感計算技術(shù)的發(fā)展,相關(guān)的研究成果已經(jīng)廣泛應(yīng)用于人機(jī)交互中。人機(jī)交互是人與機(jī)器之間通過媒體或手段進(jìn)行交互。隨著科學(xué)技術(shù)的不斷進(jìn)步和完善,傳統(tǒng)的人機(jī)交互已經(jīng)滿足不了人們的需要。由于傳統(tǒng)的人機(jī)交互主要通過生硬的機(jī)械化方式進(jìn)行,注重交互過程的便利性和準(zhǔn)確性,而忽略了人機(jī)之間的情感交流,無法理解和適應(yīng)人的情緒或心境。如果缺乏情感理解和表達(dá)能力,機(jī)器就無法具有與人一樣的智能,也很難實現(xiàn)自然和諧的人機(jī)交互,使得人機(jī)交互的應(yīng)用受到局限。
由此可見,情感計算對于人機(jī)交互設(shè)計的重要性日益顯著,將情感計算能力與計算設(shè)備有機(jī)結(jié)合能夠幫助機(jī)器正確感知環(huán)境,理解用戶的情感和意圖,并做出合適反應(yīng)。具有情感計算能力的人機(jī)交互系統(tǒng)已經(jīng)應(yīng)用到許多方面,如健康醫(yī)療、遠(yuǎn)程教育和安全駕駛等。
除了在人機(jī)交互方面的應(yīng)用,情感計算還運(yùn)用到人們的日常生活中,為人類提供更好的服務(wù)。
在電子商務(wù)方面,系統(tǒng)可通過眼動儀追蹤用戶瀏覽設(shè)計方案時的眼睛軌跡、聚焦等參數(shù),分析這些參數(shù)與客戶關(guān)注度的關(guān)聯(lián),并記錄客戶對商品的興趣,自動分析其偏好。另外有研究表明,不同的圖像可以引起人不同的情緒。例如,蛇、蜘蛛和槍等圖片能引起恐懼,而有大量金錢和黃金等的圖片則可以讓人興奮和愉悅。如果電子商務(wù)網(wǎng)站在設(shè)計時考慮這些因素對客戶情緒的影響,將對提升客流量產(chǎn)生非常積極的作用。
在家庭生活方面,在信息家電和智能儀器中增加自動感知人們情緒狀態(tài)的功能,可提高人們的生活質(zhì)量。
在信息檢索方面,通過情感分析的概念解析功能,可以提高智能信息檢索的精度和效率。
另外,情感計算還可以應(yīng)用在機(jī)器人、智能玩具和游戲等相關(guān)產(chǎn)業(yè)中,以構(gòu)筑更加擬人化的風(fēng)格。
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1211瀏覽量
55450 -
機(jī)器人
+關(guān)注
關(guān)注
211文章
28575瀏覽量
207752
原文標(biāo)題:機(jī)器人也能擁有人類情感:“情感計算”讓機(jī)器人學(xué)會“讀心術(shù)”
文章出處:【微信號:AItists,微信公眾號:人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論