0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器智能中的文本情感

2QeF_cetc49 ? 來源:未知 ? 作者:胡薇 ? 2018-08-04 09:26 ? 次閱讀

2018 全球人工智能機器人峰會(CCF-GAIR)在深圳召開,峰會由中國計算機學會(CCF)主辦,雷鋒網(wǎng)、香港中文大學(深圳)承辦,得到了寶安區(qū)政府的大力指導,是國內人工智能和機器人學術界、工業(yè)界及投資界三大領域的頂級交流盛會,旨在打造國內人工智能領域最具實力的跨界交流合作平臺。

秦兵,女,哈爾濱工業(yè)大學計算機學院教授、博士生導師。哈爾濱工業(yè)大學社會計算與信息檢索中心副主任。中國中文信息學會理事、中國中文信息學會語言與知識計算專委會副主任、社會媒體處理專委會情感分析工作組組長、信息檢索專委會常委,國家重點基金項目負責人。在頂級國際會議 ACL、COLING、EMNLP、IEEE TKDE、IEEE TASLP等國內外重要期刊及會議上發(fā)表論文60余篇,擔任多個會議領域主席以及多個期刊和會議的審稿人。主持多項國家自然科學基金以及國家科技部863項目。同時和多家互聯(lián)網(wǎng)企業(yè)開展合作,多項研究成果進入企業(yè)產(chǎn)品。獲中文信息學會錢偉長中文信息處理科學技術獎一等獎、黑龍江省技術發(fā)明二等獎。

秦兵教授的現(xiàn)場演講內容雷鋒網(wǎng) AI 科技評論回顧如下。

秦兵:大家上午好!感謝雷鋒網(wǎng)和劉挺教授的邀請,今天我報告的題目是:機器智能中的文本情感。

大家也知道,人工智能目前已進入迅猛發(fā)展階段,總體可以分為三個階段,第一個階段是計算智能的階段,這個階段計算機和人類相比是能存會算,它的超大存儲量、超高計算速度,這方面完勝人類。第二個階段是感知智能,以語音識別、圖像識別為代表的技術迅猛發(fā)展。大家也看過很多電視節(jié)目,包括“機智過人”、“最強大腦”;人和機器比圖象識別,機器已經(jīng)可以和人類相媲美甚至在某些方面超過人類。第三個階段是認知智能,這個階段需要機器能夠思考,能夠具有情感,這個階段考驗的是智能是否有情商,也就是說情感在人工智能認知階段還是非常重要的。

何為情感?嚴格定義來講就是情感是人對客觀事物是否滿足自己需要而產(chǎn)生的態(tài)度體驗。機器對于情感的要求就是機器情感計算,也就是機器理解人類的情感和生成情感的能力。所以賦予計算機情感計算能力的研究引起了學術界和企業(yè)界的廣泛關注。很多人都看過電影《她》,人機戀愛出現(xiàn)在科幻電影中,未來也許會出現(xiàn)在我們的生活當中。

機器情感怎么獲得?怎么和人進行交流?它首先要獲取人類的情感資源,比如它要去了解或學習如何識別情感、產(chǎn)生情感。今天的報告主要從情感計算的六個維度來講:

情感分類

首先從情感分類的角度出發(fā),比如說人類的情感是多樣性的,我們經(jīng)常能想起來的詞或者看到的詞,比如喜極而泣、抱頭痛哭、捶胸頓足、七情六欲、五味雜陳等等,表達了我們的喜怒哀樂。實際上多年來也有很多人在這方面做了很多研究,比如七情六欲分為好、惡、樂、怒、哀、懼、欲等。此外,還有人從高興、悲傷、憤怒、恐懼、厭惡、驚奇等進行分類。

對于情感分類,一般來講有粗粒度情感分類,粗粒度情感分類主要用來判斷文本整體情感傾向,表明一個人對某件事或對某個物體的整體評價。情感計算中大多采用兩種,一種是傾向性分類,即褒、貶、中的分類,還有一種是微博中經(jīng)常出現(xiàn)的情緒分類,表示個人主觀情緒的喜、怒、悲、恐、驚。

有了這么多類別體系,又有傾向性分類或情緒分類,分別針對我們對不同的產(chǎn)品、不同的服務,甚至表達的是我們個人的不同情感,無論它怎么劃分或者劃分的顆粒度有多細,總體來講它是一個分類任務,也就是說傳統(tǒng)的文本分類任務適用于情感分類,文本的情感分類可以看成是一種特殊的文本分類任務。那么傳統(tǒng)文本分類是通過訓練樣本、特征提取+機器學習模型,訓練好參數(shù),對未知樣本進行分類預測。對于情感分類,考慮到特定的情感資源,相對于傳統(tǒng)文本分類,有了更多可利用的知識。

當然,這種分類任務要結合文本當中不同的評價對象,所以面向評價對象的情感分類有很多種方法,比較典型的可以利用上下文信息,采用神經(jīng)網(wǎng)絡中的注意力機制,使某個評價對象和詞語能更好地尋找到搭配,從而來判斷。我們在 EMNLP2016上發(fā)表的一篇論文就介紹了我們的成果。

面向評價對象的情感分類,可以落地很多應用,比如現(xiàn)在網(wǎng)絡上有很多文本,海量的評論,比如評論手機,具體來講是華為手機,我們在評論時按照細粒度分類,可以把評價對象、評價詞、屬性抽取出來,進一步構建出評價手機體系的維度空間,也就是說你可能事先對某一個產(chǎn)品或某一個分類不知道從哪些角度去了解它,或者從哪些維度去分析它,但我們可以通過細粒度情感分類把這個體系歸納出來,同時對每一個粒度進行打分,比如圖中紅色和藍色的區(qū)別就是褒貶,顏色的不同表示它們打分值,這樣用戶可以在購買時進行評價,比如華為手機、蘋果手機或其他類型的手機。

粗粒度情感分類是為商家了解用戶對產(chǎn)品的評論,政府了解公眾輿情提供參考。細粒度情感分類可以提供所評價的產(chǎn)品或服務的精準畫像,為商家和用戶提供不同的評估。

隱式情感

無論是你聽別人的話,還是自己表達情感時,可能未必會使用情感詞。情感表達中有20%-30%是沒有情感詞的,它屬于隱式情感,而隱式情感多使用事實型陳述和語言修辭表達,從隱式情感分布來講,有事實型,有比喻型,有反問型,其中事實型情感占72%。采用事實型情感,比如一個人住到酒店,他在發(fā)微博時說“桌子上有一層灰”,這沒有任何情感詞,但實際上已經(jīng)表達了他的不滿,這就是事實型表述。再看褒義描述,“從下單到收到貨不到24小時”,表明他稱贊快遞速度很快,但沒有明顯的表達詞,這些都屬于事實型表述。

這種事實型描述怎么挖掘?這種事實型表述出現(xiàn)很頻繁,這個時候我們可以采用上下文,比如我說“桌子上有一層灰,很不高興”,就可以把“桌子上有一層灰”定義為貶義的?;蛘哒也坏缴舷挛牡脑挘部梢栽谄渌漠斨姓业礁嗨频恼Z句,再判定情感,通過借助周圍上下文的分析進行推理,得到這句話的情感,這是一種解決策略。同時,我們也可以借助某種知識,比如快遞多長時間算快,或者說這個人身高1.8米,我們有個常識,一米幾以上就算高個兒,類似這樣的知識可以幫助我們進行隱式情感分析。

情感溯因

分析情感的目的是什么?這些情感產(chǎn)生的原因又是什么?比如他是因為什么高興、因為什么傷心、因為什么憤怒,我們需要情感溯因,也為了大家更好地觀察產(chǎn)品、體會服務以及體察對方的情感。從原因來看,一般是“情”出有因,這里有一個例子看著懂事的女兒每天被病痛折磨著,自己卻不能為她捐腎,想到自己無能為力,張志英泣不成聲”。我們可以進行溯因,也就是要知其然,也要知其所以然,知道了原因之后,比如你知道一個人有潔癖,忍受不了桌子上有一層灰,下次她再看到一個地方的桌子上有一層灰,可能她沒有表達出來,但你能預期到她會生氣。

文本情感的原因發(fā)現(xiàn)方法,比如哈工大深圳研究院的徐睿峰老師做過一些工作,也有語料庫,一般是按照類似問答系統(tǒng)研究的方式,這里面有情感詞、有原文,通過記憶網(wǎng)絡判別這個文章中哪句話是原因,通過類別判斷是或不是。

個性化

通過進一步分析我們可以知道人和人是不同的,同一對象,不同人立場不同,可能表達出不同情感;相同對象,不同人表達相同情感,用詞風格不同。比如男生和女生對待某一件事的時候可能分歧很大,所以在情感計算中要加入用戶特征,比如用戶畫像技術,這里面包括自然屬性、社會屬性、興趣屬性、心理屬性等。

一般立場不同,情感可能會不同,比如去年廣為人知的“青島38元大蝦”和“哈爾濱天價魚”事件,關于青島38元大蝦,“在南方的東北妹子”評價說“米飯按粒賣,我不得不傾家蕩產(chǎn)么!”關于哈爾濱天價魚中的評價是“北方人覺得南方小小氣氣,南方人覺得北方人沒素質”。此外,人們的用詞風格也會不同,這里有兩個人,一個人很容易用非常夸張的詞,比如“這個車太漂亮了”,另一個人會說“還行吧”,他所說的“還行吧”對他來講就是很好了。我們用兩個人發(fā)表的文章進行對比,不同的人發(fā)表的文章在情感分值差異性上會有不同,用詞風格也如此,同一篇文檔,比如這個人發(fā)表的文檔相似度很高,他評價車、評價服裝時都會使用很夸張的詞。如果跟另外一個人來比較,文章用詞的相似度就很低。

我們在神經(jīng)網(wǎng)絡分類中融入用戶和產(chǎn)品的向量和矩陣表示信息,然后把它融入已有神經(jīng)網(wǎng)絡框架,應用到文本情感分類任務,這一部分內容的論文發(fā)表在 2015 年的 ACL 上。

領域問題

我們在不同的領域都存在遷移的問題,以圖書和電子領域為例,每個領域的評價對象都不同,不同領域的評價表達千差萬別,不同領域中的同一情感表達極性不同。比如“簡單”這一詞,情節(jié)簡單和上手簡單表達的情感就不一樣。這需要我們進行跨領域的情感研究,也就是進行模型遷移過程,通常在情感分析領域的遷移,一是利用領域無關的詞和領域相關詞的鏈接關系,再進行分別聚類。在神經(jīng)網(wǎng)絡當中,通過神經(jīng)網(wǎng)絡的隱層參數(shù)盡量提取與情感相關、但與領域無關的詞的特征來分類。

情感生成

實際上我們一直分析的是人類的情感,我們一直很期待機器是不是能產(chǎn)生情感,也就是說機器有情感嗎?有三觀嗎?目前機器是沒有自主意識的,而指定情感類別的情感生成可以做到,比如說我們可以根據(jù)指定的情感類別生成情感表達,也可以在聊天機器人當中根據(jù)轉移概率進行變換,此外也可以對情感表達進行潤色和風格轉換。

此外,我們可以進行文本的情感極性變換及潤色,比如原句是“服務不周,而且極其粗魯”,可以修改為“服務到位,而且非常清爽”。還可以進行文章的潤色,比如“兩只狗在樹邊玩?!保覀兛梢园阉薷臑椤皟芍还吩跇溥呁嫠?,享受童年的快樂”。

情感文本生成邁出機器發(fā)出情感的第一步,在聊天系統(tǒng)中可以進行情感互動,自動生成評論文本可以豐富用戶的表達方式,比如一個人不善表達,但他對這個東西打分非常好,我們可以幫助他生成一段文字,豐富他的表達方式。

總的來講,情感分析已經(jīng)發(fā)展了很多年,已經(jīng)落地產(chǎn)生了很多應用,產(chǎn)生巨大價值,比如在社會輿情方面、電子商務方面,如大家經(jīng)??吹降奶詫毦W(wǎng)等等,再比如在傳統(tǒng)行業(yè)方面,比如幫助ZARA進行服裝設計改進,此外在金融等特定領域都發(fā)揮了巨大的作用,這是一個很接地氣的方向,同時也具有很多技術挑戰(zhàn)。

我們來看一下能否進行詩詞鑒賞。例如一個高考題目,關于一首杜甫的詩,“韋曲花無賴,家家惱煞人”,描寫春色的美。“綠樽須盡日,白發(fā)好禁春”是說在這樣的日子需要喝酒,需要好好享受春天的氣息?!笆倾^衣破,藤梢刺眼新”描述他已經(jīng)不顧衣服被石角鉤破,欣賞藤梢冒出的新芽?!昂螘r占叢竹,頭戴小烏巾”表達什么時候能頭戴小烏巾歸隱山林。問題是談談詩的最后兩句表達了詩人怎樣的思想感情。參考答案是對于春色的描述表達出作者的喜愛之情,因此產(chǎn)生對歸隱山林的隱士生活的向往。情感分析中用了很多其他技術,包括古詩詞、隱喻等等,能表達情感和背后隱藏的歸隱山林的心情,什么時候·機器的情感分析也能進一步分析出這種情感,同時又能像剛才孫茂松老師介紹的古詩詞一樣,能夠生成帶有指定情感的古詩詞也是情感分析未來需要探索的。

最后總結一下。情感是人類的高級思維方式;機器可以通過學習理解人類的情感模式,了解人類的情感;情感溯因可以幫助更深入理解人類情感動機;機器可以借助指定情感類別方式生成情感文本;鑒賞類或文學作品賞析情感計算值得我們繼續(xù)探索。真正具有自主意識的情感智能還未到來。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28575

    瀏覽量

    207745
  • 人工智能
    +關注

    關注

    1793

    文章

    47532

    瀏覽量

    239299

原文標題:干貨|哈工大秦兵教授:機器智能中的文本情感計算

文章出處:【微信號:cetc49,微信公眾號:傳感技術】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人的基礎模塊

    具身智能機器人的基礎模塊,這個是本書的第二部分內容,主要分為四個部分:機器人計算系統(tǒng),自主機器人的感知系統(tǒng),自主機器人的定位系統(tǒng),自主
    發(fā)表于 01-04 19:22

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人大模型

    取得了令人矚目的效果。 閱讀感悟 從傳統(tǒng)的手動編程到借助大模型實現(xiàn)智能化、自主化,從單一模態(tài)的交互到多模態(tài)信息的深度融合,再到擴散模型的應用,機器人控制技術正在以驚人的速度進化。這不僅讓機器
    發(fā)表于 12-29 23:04

    【「具身智能機器人系統(tǒng)」閱讀體驗】1.初步理解具身智能

    感謝 感謝電子發(fā)燒友網(wǎng)社區(qū)給予《具身智能機器人系統(tǒng)》試讀機會。在這知識的盛宴,我感受到社區(qū)的關懷與支持。定不負期望,認真研讀,分享所學,回饋社區(qū)。 一、本書大綱 《具身智能
    發(fā)表于 12-28 21:12

    【「具身智能機器人系統(tǒng)」閱讀體驗】+數(shù)據(jù)在具身人工智能的價值

    嵌入式人工智能(EAI)將人工智能集成到機器人等物理實體,使它們能夠感知、學習環(huán)境并與之動態(tài)交互。這種能力使此類機器人能夠在人類社會中有效
    發(fā)表于 12-24 00:33

    【「具身智能機器人系統(tǒng)」閱讀體驗】+初品的體驗

    提高機器人的自適應性和自主性,賦能機器人在多種場景的應用。例如在家庭自動化領域,具身智能機器人能夠感知家庭成員的日常習慣和需求,自動執(zhí)行清
    發(fā)表于 12-20 19:17

    《具身智能機器人系統(tǒng)》第1-6章閱讀心得之具身智能機器人系統(tǒng)背景知識與基礎模塊

    、谷歌的RT系列等前沿產(chǎn)品展露鋒芒。這些突破性成果標志著AI正從虛擬世界邁向物理世界的深度交互。 而研讀《具身智能機器人系統(tǒng)》前六章,我對具身智能(Embodied Artifici
    發(fā)表于 12-19 22:26

    湯姆貓發(fā)布AI語音情感陪伴機器人研發(fā)進展

    湯姆貓公司近日透露了其AI產(chǎn)品的研發(fā)進展,其中AI語音情感陪伴機器人備受矚目。據(jù)官方介紹,這款機器人預計將于2024年12月底前正式發(fā)售,為用戶帶來全新的互動體驗。 該機器人頭部設有精
    的頭像 發(fā)表于 12-17 11:27 ?718次閱讀

    RNN的應用領域及未來發(fā)展趨勢

    多個領域得到了廣泛的應用。 RNN的應用領域 自然語言處理(NLP) 機器翻譯 :RNN能夠理解源語言的上下文信息,生成目標語言的翻譯。 文本生成 :利用RNN生成連貫的文本,如新聞文章、故事等。
    的頭像 發(fā)表于 11-15 10:10 ?614次閱讀

    圖紙模板文本變量

    “ ?文本變量和系統(tǒng)自帶的內置變量,可以幫助工程師靈活、高效地配置標題欄的信息,而不用擔心模板的文字對象被意外修改。 ? ” 文本變量的語法
    的頭像 發(fā)表于 11-13 18:21 ?207次閱讀
    圖紙模板<b class='flag-5'>中</b>的<b class='flag-5'>文本</b>變量

    基于LSTM神經(jīng)網(wǎng)絡的情感分析方法

    能力而受到廣泛關注。 1. 引言 情感分析在商業(yè)智能、客戶服務、社交媒體監(jiān)控等領域具有廣泛的應用。傳統(tǒng)的情感分析方法依賴于手工特征提取和機器學習算法,但這些方法往往難以處理
    的頭像 發(fā)表于 11-13 10:15 ?591次閱讀

    名單公布!【書籍評測活動NO.51】具身智能機器人系統(tǒng) | 了解AI的下一個浪潮!

    智能通過提高機器人的自適應性和自主性,賦能機器人在多種場景的應用。 例如,在家庭自動化領域,具身智能
    發(fā)表于 11-11 10:20

    soc在人工智能的創(chuàng)新應用

    的應用變得越來越廣泛和深入。 1. 社交媒體分析 社交媒體平臺已經(jīng)成為人們交流和分享信息的主要渠道。AI技術,特別是自然語言處理(NLP)和機器學習(ML),在分析社交媒體數(shù)據(jù)方面發(fā)揮著重要作用。 創(chuàng)新應用: 情感分析: AI可以分析社交媒體上的
    的頭像 發(fā)表于 11-10 09:30 ?432次閱讀

    自然語言處理是什么技術的一種應用

    廣泛,包括機器翻譯、語音識別、情感分析、信息檢索、問答系統(tǒng)、文本摘要、聊天機器人等。 一、自然語言處理的基本概念 自然語言:自然語言是人類用來交流思想、表達
    的頭像 發(fā)表于 07-03 14:18 ?1061次閱讀

    機器視覺在智能制造的應用

    隨著科技的飛速發(fā)展,智能制造已成為現(xiàn)代工業(yè)的重要趨勢。作為智能制造的關鍵技術之一,機器視覺技術正發(fā)揮著越來越重要的作用。機器視覺技術通過模
    的頭像 發(fā)表于 06-06 17:22 ?739次閱讀

    AI陪伴機器人市場需求快速增長,情感交互成重要布局方向

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)AI陪伴機器人是一種基于人工智能技術的智能機器人,它能夠與人類進行交互,并提供陪伴和幫助。它們通過模擬人類的行為和思維過程,具備一定的
    的頭像 發(fā)表于 04-20 00:19 ?3636次閱讀