0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

女朋友生氣了嗎?算法比直男更懂她

Gv1N_smartman16 ? 來源:YXQ ? 2019-07-08 16:55 ? 次閱讀

利用 AI 技術(shù)判斷一個人的情緒通常有兩種途徑,一種是通過面部表情,另一種是通過語音。前者已經(jīng)比較成熟,而語音識別情感方面的研究,正在快速發(fā)展。近期,一些科研團(tuán)隊提出了新的方法,來更準(zhǔn)確地識別用戶聲音中的情緒。

知乎上有很多關(guān)于「如何判斷女朋友是否生氣」之類的問題,有人回答:字越少,事越大;還有人說:真生氣,一個月不聯(lián)系;假生氣,會撒嬌說「我生氣了」。

「女朋友是生氣了么?」是千古難題

所以,女朋友的「我沒生氣/真的沒生氣」=「很生氣」;「我生氣了」=「撒嬌,沒生氣,親親抱抱舉高高嘛」。這樣的情緒邏輯讓直男們抓狂。

女朋友的情緒根本就感受不出來啊

究竟應(yīng)該怎么樣才能聽出女朋友到底生氣了沒呢?據(jù)說,AI 已經(jīng)在聽音識情緒上做出成績,可能比男生抓耳撓腮地琢磨半天的結(jié)果更準(zhǔn)確。

Alexa 語音助手:正在修煉成為暖男

亞馬遜語音助手Alexa 在感知情緒方面,可能比男朋友還機智。

今年,經(jīng)過最新升級后,Alexa 已經(jīng)能夠通過分析用戶指令的高低和音量等反應(yīng),識別出快樂、高興、憤怒、悲傷、煩躁、恐懼、厭惡、厭倦甚至壓力等情緒,并對相應(yīng)指令做出回應(yīng)。

比如,如果一個女生一邊擤鼻涕一邊咳嗽一邊又跟 Alexa 說自己有點餓了,那么 Alexa 就會通過對女生說話的的音調(diào)(虛弱、低沉)和背景音(咳嗽、擤鼻涕)分析出她很可能得病了,然后發(fā)出來自機器的貼心關(guān)懷:要不要來碗雞湯,或者叫個外賣?甚至直接線上訂購一瓶止咳糖漿一小時內(nèi)送貨上門?

這表現(xiàn),是不是比鋼鐵直男男朋友還貼心?

人工智能做情緒分類已不是什么新鮮事了,不過,最近,亞馬遜 Alexa Speech 團(tuán)隊前段時間打破了傳統(tǒng)方法,發(fā)表了新的研究成果。

傳統(tǒng)的方法都是有監(jiān)督的,其獲取的訓(xùn)練數(shù)據(jù)已經(jīng)根據(jù)說話者的情緒狀態(tài)被標(biāo)記過。而亞馬遜 Alexa Speech 團(tuán)隊的科學(xué)家最近采用了一種不同的方法,他們在國際聲學(xué),語音和信號處理會議(ICASSP)上發(fā)表了介紹這種方法的論文《Improving Emotion Classification through Variational Inference of Latent Variables》(http://t.cn/Ai0se57g)

他們沒有采用詳盡注釋過「情感」的語料庫來訓(xùn)練系統(tǒng),而是提供了一個對抗自編碼器(AAE)。這是一個包含來自 10 個不同發(fā)言者的 10,000 話語的公開數(shù)據(jù)集。

他們得到的研究結(jié)果是,在判斷人們的聲音中的效價(emotion valence)或情感價值(emotional value)時,神經(jīng)網(wǎng)絡(luò)準(zhǔn)確度提高了 4%。在團(tuán)隊的努力下,通過用戶聲音,便能可靠地確定用戶的心情或情緒狀態(tài)。

AAE 模型原理示意圖

論文的共同作者,Alexa Speech 組高級應(yīng)用科學(xué)家 Viktor Rozgic 解釋道,對抗自編碼器是包含編碼器的兩部分模型——編碼器(encoder)和解碼器(decoder)。編碼器學(xué)習(xí)生成輸入語音的緊湊(或潛在)表示,編碼訓(xùn)練示例的所有屬性;而解碼器重建來自緊湊表示的輸入。

對抗自編碼器的架構(gòu)

研究人員的情緒表征由三個網(wǎng)絡(luò)節(jié)點組成,三個網(wǎng)絡(luò)節(jié)點分別用于三種情緒測量:效價,激活activation,說話者是警覺的,投入的還是被動的),以及支配(說話者是否感覺被周邊局面控制)。

訓(xùn)練分三個階段進(jìn)行。第一階段使用無標(biāo)簽的數(shù)據(jù)單獨訓(xùn)練編碼器和解碼器。第二階段為對抗訓(xùn)練,對抗性鑒別器試圖區(qū)分編碼器產(chǎn)生的真實表示與人工表示的技術(shù),該階段用于調(diào)整編碼器。在第三階段,調(diào)整編碼器以確保潛在情緒表示,來預(yù)測訓(xùn)練數(shù)據(jù)的情緒標(biāo)簽。

為了捕獲有關(guān)語音信號的信息,在涉及句子級特征表示的「hand-engineered」實驗中,他們的 AI 系統(tǒng)在評估效價方面比傳統(tǒng)訓(xùn)練網(wǎng)絡(luò)的準(zhǔn)確度提高了 3%。

此外,他們表示,當(dāng)向網(wǎng)絡(luò)提供一組表示 20 毫秒幀(或音頻片段)聲學(xué)特性的序列時,效果提高了 4%。

MIT 實驗室打造神經(jīng)網(wǎng)絡(luò)1.2 秒感知憤怒

亞馬遜不是唯一一家研究改進(jìn)的基于語音的情緒檢測公司。麻省理工學(xué)院媒體實驗室 Affectiva 最近演示了一個神經(jīng)網(wǎng)絡(luò) SoundNet:可以在短短 1.2 秒內(nèi)(已經(jīng)超越人類感知憤怒所需時間)將憤怒與音頻數(shù)據(jù)分類,并且無論哪種語言。

Affectiva 的研究人員在新論文《Transfer Learning From Sound Representations For Anger Detection in Speech》(https://arxiv.org/pdf/1902.02120.pdf)中描述了該系統(tǒng)。它建立在語音和面部數(shù)據(jù)打造情感檔案的基礎(chǔ)上。

為了測試 AI 模型的通用性,該團(tuán)隊使用以英文訓(xùn)練的模型,對普通話語音情感數(shù)據(jù)訓(xùn)練的模型(普通話情感語料庫,簡稱MASC)進(jìn)行了評估。結(jié)果它不僅可以很好地推廣到英語語音數(shù)據(jù),對漢語數(shù)據(jù)也很有效,盡管性能略有下降。

針對英文與中文的訓(xùn)練結(jié)果 ROC 曲線

虛線表示隨機分類器的 ROC

團(tuán)隊表示,「識別憤怒應(yīng)用廣泛,包括會話界面和社交機器人,交互式語音應(yīng)答(IVR)系統(tǒng),市場研究,客戶代理評估和培訓(xùn),以及虛擬現(xiàn)實和增強現(xiàn)實?!?/p>

未來的工作將開發(fā)其他大型公共語料庫,并為相關(guān)的基于語音的任務(wù)訓(xùn)練 AI 系統(tǒng),例如識別其他類型的情緒和情感狀態(tài)。

以色列 App 識別情緒:準(zhǔn)確率 80%

以色列創(chuàng)業(yè)公司 Beyond Verbal 開發(fā)了一款名為 Moodies 的應(yīng)用,它能夠通過麥克風(fēng)采集說話者的聲音,經(jīng)過 20 秒左右的分析,判斷說話者的情緒特征。

Moodies 擁有一套特殊的算法,軟件會對說話者的

節(jié)奏、時間、聲音大小、停頓以及能量等情緒維度進(jìn)行分析

盡管語音分析專家承認(rèn)語言與情緒具有相關(guān)性,但不少專家卻質(zhì)疑這種實時測算的準(zhǔn)確性——這類工具收集到的聲音樣本非常有限,實際的分析可能需要收集數(shù)年的樣本。

「以目前認(rèn)知神經(jīng)學(xué)的水平,我們根本沒有技術(shù)真正地了解一個人的思想或者情感?!垢鐐惐葋喆髮W(xué)心理學(xué)教授助理 Andrew Baron 說道。

不過 Beyond Verbal 負(fù)責(zé)市場的副總裁 Dan Emodi 表示,Moodies 經(jīng)過了三年多的研究,根據(jù)用戶的反饋,應(yīng)用分析的準(zhǔn)確率約為 80%。

Beyond Verbal 公司表示,Moodies 可以應(yīng)用于自我情緒診斷、客服中心處理顧客關(guān)系甚至檢測求職者是否說謊,當(dāng)然你也可以帶到約會的場景中,看對方是否真的對自己感興趣。

語音情緒識別依然面臨挑戰(zhàn)

雖然很多科技公司已經(jīng)在這方面有著多年的研究,也得到不錯的成果。但是,正如上文 Andrew Baron 所質(zhì)疑的,這項技術(shù)還面臨多個挑戰(zhàn)。

就像女朋友一句平靜的「我沒生氣」并不代表她真的沒生氣一樣,一個發(fā)音中可以包含多種感情,不同情感的邊界也難以界定,哪個情緒是當(dāng)前主導(dǎo)的情緒?

國內(nèi)某語音情緒識別產(chǎn)品展示

并不是所有的語氣都像視頻中這樣明顯與激烈,表達(dá)情感是一個個性化極強的事情,根據(jù)個人,環(huán)境甚至文化差異都很大。

此外,一種情緒可能持續(xù)很長時間,但期間也會有快速變化的情緒,情感識別系統(tǒng)是檢測長期的情緒還是短時的情緒呢?比如某人限于失業(yè)的痛苦中,但期間因為朋友的關(guān)心短暫開心了一下,但實際上他仍處于傷心狀態(tài),AI 該怎么定義他的狀態(tài)呢?

而另一個令人擔(dān)心的事是,當(dāng)這些產(chǎn)品能夠聽懂人的情緒后,是否會因為用戶對它的依賴,而詢問更多隱私性的問題,獲取用戶多方面信息,從而將「服務(wù)」變成「買賣」?

愿你會擁有大白,也擁有真正懂你的人

很多人都想擁有一個溫暖又貼心的大白,這個在科幻動畫里才有的高情商機器人,未來是否會成真呢?

非常低落而緩慢地跟小冰說話得到無情回答

目前,很多聊天機器人依然沒有情商,無法感知用戶的小情緒,常常把天聊死。所以,真正能夠聽懂你的,依然是陪伴在你身邊傾聽你的人。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4618

    瀏覽量

    93038
  • MIT
    MIT
    +關(guān)注

    關(guān)注

    3

    文章

    253

    瀏覽量

    23415

原文標(biāo)題:女朋友生氣了嗎?算法比直男更懂她

文章出處:【微信號:smartman163,微信公眾號:網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    ldc1000與mcu能正常通訊,傳回來的值一是0,為什么?

    ldc1000與mcu能正常通訊,一正常采集數(shù)據(jù),現(xiàn)在傳回來的值一是0是LDC燒了嗎
    發(fā)表于 01-02 08:10

    ADS1282無DRDY信號,一為高電平,是哪里出了問題?

    ADS1282無DRDY信號,一為高電平,檢查了MCLK,PWD,SYNC,RESET和電源,都沒有問題,是芯片壞了嗎
    發(fā)表于 12-27 06:54

    字節(jié)跳動為旗下車帝籌措資金

    字節(jié)跳動近期正全力為其旗下的汽車信息與服務(wù)平臺車帝籌集資金,旨在進(jìn)一步鞏固并擴大其在汽車領(lǐng)域的市場地位。自去年戰(zhàn)略調(diào)整后,車帝承擔(dān)起整合抖音、今日頭條及西瓜視頻等平臺汽車內(nèi)容的重任,實現(xiàn)了內(nèi)容
    的頭像 發(fā)表于 09-26 14:12 ?288次閱讀

    tpa3112 PVCC管腳是已經(jīng)內(nèi)部連接,無需外部接電源了嗎?

    其中PVCC管腳是已經(jīng)內(nèi)部連接,無需外部接電源了嗎?求datasheet詳細(xì)的電路圖。。
    發(fā)表于 09-11 07:38

    五大方法完美杜絕smt貼片加工過程中產(chǎn)生氣泡現(xiàn)象

    一站式PCBA智造廠家今天為大家講講如何有效減少SMT貼片加工過程中氣泡產(chǎn)生?預(yù)防SMT加工產(chǎn)生氣泡方法。在SMT貼片加工過程中,氣泡的產(chǎn)生是影響PCBA板質(zhì)量的一個常見問題。氣泡不僅影響電子產(chǎn)品
    的頭像 發(fā)表于 09-05 09:46 ?337次閱讀

    電感很燙是短路了嗎

    電子發(fā)燒友網(wǎng)站提供《電感很燙是短路了嗎.docx》資料免費下載
    發(fā)表于 09-04 11:31 ?0次下載

    鋰電池3.7v使用的插pmos有什么型號?

    鋰電池3.7v使用的插pmos有什么型號?電流要5A左右就行,真的很難找,小白一個,的給指導(dǎo)下,給個型號?某寶很多上百V的感覺沒必要。
    發(fā)表于 06-26 17:31

    降價潮背后:大模型落地門檻真的降了嗎?

    “比起價格門檻,AI大模型的應(yīng)用門檻,更難跨越?!贝竽P蜖幭嘟祪r下,AI應(yīng)用的門檻真的降低了嗎?答案還真不一定。因為除了價格門檻,AI大模型還有應(yīng)用門檻。甚至,后者前者更具挑戰(zhàn)性。B端業(yè)務(wù)場景向來
    的頭像 發(fā)表于 06-13 08:04 ?275次閱讀
    降價潮背后:大模型落地門檻真的降<b class='flag-5'>了嗎</b>?

    單片機引腳(有上下拉電阻)設(shè)成輸入 設(shè)成輸出的時候,做靜電測試容易損壞嗎?

    單片機引腳(有上下拉電阻)設(shè)成輸入 設(shè)成輸出的時候 做靜電測試容易損壞嗎
    發(fā)表于 05-07 08:11

    求助蜂鳴器一

    線路板功能正常,在蜂鳴器上接了一個電磁牽引后,蜂鳴器一響,本來是蜂鳴器是產(chǎn)量到達(dá)指定數(shù)值才響一次。有的不
    發(fā)表于 04-23 12:42

    采訪好好地怎么生氣了 #芯片銷售 #電子元器件

    芯片行業(yè)資訊
    貞光科技
    發(fā)布于 :2024年04月19日 13:22:16

    基于門控線性網(wǎng)絡(luò)(GLN)的高壓縮無損醫(yī)學(xué)圖像壓縮算法

    實現(xiàn)基于門控線性網(wǎng)絡(luò)(GLN)的高壓縮無損醫(yī)學(xué)圖像壓縮算法,以提高醫(yī)學(xué)圖像存儲和分發(fā)系統(tǒng)的效率。與“傳統(tǒng)”的基于上下文的數(shù)據(jù)壓縮算法相比,基于GLN的系統(tǒng)使用一組不同的上下文模型。
    的頭像 發(fā)表于 04-08 10:29 ?680次閱讀
    基于門控線性網(wǎng)絡(luò)(GLN)的高壓縮<b class='flag-5'>比</b>無損醫(yī)學(xué)圖像壓縮<b class='flag-5'>算法</b>

    在做pmsm電機的foc算法,但是電流環(huán)一沒辦法穩(wěn)定下來,電流采樣有很多毛刺的原因?

    最近在做pmsm電機的foc算法,但是電流環(huán)一沒辦法穩(wěn)定下來,電流采樣有很多毛刺 是否需要在程序中加入濾波算法
    發(fā)表于 04-01 07:48

    數(shù)字信號為啥模擬信號清晰和穩(wěn)定?

    數(shù)字信號為啥模擬信號清晰和穩(wěn)定? 數(shù)字信號相比模擬信號清晰和穩(wěn)定的原因,主要是由于數(shù)字信號的特性以及數(shù)字信號處理的優(yōu)勢。 一、數(shù)字信號的特性: 1. 離散性:數(shù)字信號是離散的,即信號在時間
    的頭像 發(fā)表于 02-01 09:45 ?2832次閱讀

    消失的,GERBER失蹤之謎

    這是一個PCB界的懸疑劇《消失的》,明明PCB原文件很完整,為什么gerber輸出只有1KB,你知道幕后的真實原因嗎,請打開今天的案例分析,發(fā)現(xiàn)不一樣的秘密。
    的頭像 發(fā)表于 01-24 11:09 ?565次閱讀
    消失的<b class='flag-5'>她</b>,GERBER失蹤之謎