0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于卷積神經(jīng)網(wǎng)絡(luò)的組合模型處理NLP任務(wù)諷刺檢測(cè)

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-07-02 08:37 ? 次閱讀

編者按:NTU研究人員Soujanya Poria等提出了一個(gè)組合模型,基于預(yù)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)提取情感、情緒、個(gè)性特征,以進(jìn)行諷刺檢測(cè)。NTHU PhD學(xué)生Elvis Saravia簡(jiǎn)明扼要地總結(jié)了論文的主要思路。

概覽

這篇論文使用基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的組合模型處理NLP任務(wù)諷刺檢測(cè)(sarcasm detection)。諷刺檢測(cè)對(duì)情感檢測(cè)和情感分析等領(lǐng)域而言十分重要,因?yàn)檫@一表達(dá)將翻轉(zhuǎn)句子的極性。

例子

人們可以認(rèn)為諷刺用來挖苦或奚落。比如“是你還是我該吃藥了”、“我每周工作40小時(shí)才這么窮”。(examples.yourdictionary.com上有更多例子。)

挑戰(zhàn)

理解和檢測(cè)諷刺很重要的一點(diǎn)就是理解關(guān)于事件的事實(shí)。這讓我們可以檢測(cè)客觀極性(通常是負(fù)面的)和作者的諷刺特征(通常是正面的)之間的反差。

考慮以下例子,“我愛分手之苦”,很難從中提取檢測(cè)其中是否存在諷刺的知識(shí)。例子中的“我愛其苦”提供了作者表達(dá)的情感的知識(shí)(在這個(gè)例子中是正面的),而“分手”描述了一個(gè)相反的情感(負(fù)面)。

諷刺語句中的其他挑戰(zhàn)包括指代多個(gè)事件,以及提取大量事實(shí)、常識(shí)、指代解析、邏輯推理。論文的作者依靠CNN從諷刺語料庫中自動(dòng)學(xué)習(xí)特征。

貢獻(xiàn)

深度學(xué)習(xí)應(yīng)用于諷刺檢測(cè)

利用用戶簡(jiǎn)介、情緒、情感特征進(jìn)行諷刺檢測(cè)

應(yīng)用預(yù)訓(xùn)練模型自動(dòng)提取特征

模型

情感轉(zhuǎn)移(sentiment shifting)在牽涉諷刺的交流中很常見。因此,論文作者首先訓(xùn)練基于CNN訓(xùn)練一個(gè)情感模型學(xué)習(xí)情感特定的特征提取。模型在低層學(xué)習(xí)局部特征,之后在高層轉(zhuǎn)換為全局特征。作者發(fā)現(xiàn)諷刺表達(dá)和用戶相關(guān)——某些用戶比其他用戶發(fā)布更多諷刺性內(nèi)容。

作者提出的框架整合了基于用戶個(gè)性的特征,情感特征,基于情緒的特征。每組特征通過獨(dú)立的模型學(xué)習(xí),成為從數(shù)據(jù)集中提取諷刺相關(guān)特征的預(yù)訓(xùn)練模型。

CNN框架

CNN能夠有效地建模局部特征以學(xué)習(xí)更全局的特征,本質(zhì)上,這是在學(xué)習(xí)上下文(learn context)。句子使用詞向量(嵌入)表示(基于Google的word2vec向量)。使用了非靜態(tài)表示,因此,詞向量的參數(shù)在訓(xùn)練階段學(xué)習(xí)。接著,在特征映射上應(yīng)用最大池化,以生成特征。然后是softmax層及全連接層,以輸出最終預(yù)測(cè)。(見下圖)

為了得到其他特征——情感(S)、情緒(E)、個(gè)性(P)——預(yù)訓(xùn)練了CNN模型,并使用這些預(yù)訓(xùn)練模型從諷刺數(shù)據(jù)集中提取特征。訓(xùn)練每個(gè)模型使用了不同的訓(xùn)練數(shù)據(jù)集。(參考論文了解更多細(xì)節(jié))

測(cè)試了兩個(gè)分類器——一個(gè)CNN分類器(CNN)和一個(gè)SVM分類器(CNN-SVM,使用CNN提取的特征作為輸入)。

另外還訓(xùn)練了一個(gè)基線分類器(B)——僅僅使用CNN模型,沒有結(jié)合其他模型(情緒、情感等)。

試驗(yàn)

數(shù)據(jù)為均衡和失衡的諷刺推文數(shù)據(jù)集,取自Ptacek等2014年的工作和The Sarcasm Detector。移除了用戶名、URL、#標(biāo)記,使用了NLTK Twitter Tokenizer。(參考論文了解更多細(xì)節(jié))

下表顯示了CNN和CNN-SVM分類器的表現(xiàn)。我們可以觀測(cè)到結(jié)合了諷刺特征、情感特征、情緒特征、個(gè)性特征的模型(特別是CNN-SVM)的表現(xiàn)超過了其他模型。

B = 基線,S = 情感,E = 情緒, P = 個(gè)性。所有試驗(yàn)使用了五折交叉驗(yàn)證

下表則是與當(dāng)前最先進(jìn)模型(第一行)和另一個(gè)知名的諷刺檢測(cè)模型(第二行)的比較。同樣,論文提出的模型的表現(xiàn)超過了其他模型。

D3 => D1意為在數(shù)據(jù)集3上訓(xùn)練,在數(shù)據(jù)集1上測(cè)試

論文測(cè)試了模型的概括能力,主要的發(fā)現(xiàn)是如果數(shù)據(jù)集本質(zhì)上很不相同,會(huì)顯著影響結(jié)果。(見下圖基于PCA可視化的數(shù)據(jù)集)。例如,在數(shù)據(jù)集1上訓(xùn)練,然后在數(shù)據(jù)集3上測(cè)試,模型的F1評(píng)分為33.05%.

結(jié)論

總體而言,論文作者發(fā)現(xiàn)諷刺高度依賴主題,并且高度上下文相關(guān)。因此,情感和其他上下文線索有助于從文本中檢測(cè)諷刺。使用預(yù)訓(xùn)練的情感、情緒、個(gè)性模型從文本中捕捉上下文信息。

手工構(gòu)造的特征(例如,n元語法),盡管某種程度上有助于諷刺檢測(cè),會(huì)產(chǎn)生非常稀疏的特征向量表示。因此,使用詞嵌入作為輸入特征。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:基于深度卷積網(wǎng)絡(luò)進(jìn)行諷刺檢測(cè)

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦

    卷積神經(jīng)網(wǎng)絡(luò)一維卷積處理過程

    。本文就以一維卷積神經(jīng)網(wǎng)絡(luò)為例談?wù)勗趺磥磉M(jìn)一步優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)使用的memory。文章(卷積神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 12-23 06:16

    卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

    神經(jīng)網(wǎng)絡(luò)已經(jīng)廣泛應(yīng)用于圖像分類、目標(biāo)檢測(cè)、語義分割以及自然語言處理等領(lǐng)域。首先分析了典型卷積神經(jīng)網(wǎng)絡(luò)模型
    發(fā)表于 08-02 10:39

    卷積神經(jīng)網(wǎng)絡(luò)為什么適合圖像處理

    卷積神經(jīng)網(wǎng)絡(luò)為什么適合圖像處理?
    發(fā)表于 09-08 10:23

    卷積神經(jīng)網(wǎng)絡(luò)原理:卷積神經(jīng)網(wǎng)絡(luò)模型卷積神經(jīng)網(wǎng)絡(luò)算法

    一。其主要應(yīng)用領(lǐng)域在計(jì)算機(jī)視覺和自然語言處理中,最初是由Yann LeCun等人在20世紀(jì)80年代末和90年代初提出的。隨著近年來計(jì)算機(jī)硬件性能的提升和深度學(xué)習(xí)技術(shù)的發(fā)展,CNN在很多領(lǐng)域取得了重大的進(jìn)展和應(yīng)用。 一、卷積神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 08-17 16:30 ?1677次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用 卷積神經(jīng)網(wǎng)絡(luò)通常用來處理什么

    卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用 卷積神經(jīng)網(wǎng)絡(luò)通常用來處理什么 卷積神經(jīng)網(wǎng)
    的頭像 發(fā)表于 08-21 16:41 ?5235次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)模型有哪些?卷積神經(jīng)網(wǎng)絡(luò)包括哪幾層內(nèi)容?

    、視頻等信號(hào)數(shù)據(jù)的處理和分析。卷積神經(jīng)網(wǎng)絡(luò)就是一種處理具有類似網(wǎng)格結(jié)構(gòu)的數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),其中每個(gè)單元只
    的頭像 發(fā)表于 08-21 16:41 ?2110次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)模型原理 卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)

    卷積神經(jīng)網(wǎng)絡(luò)模型原理 卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)? 卷積
    的頭像 發(fā)表于 08-21 16:41 ?1176次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)層級(jí)結(jié)構(gòu) 卷積神經(jīng)網(wǎng)絡(luò)卷積層講解

    卷積神經(jīng)網(wǎng)絡(luò)層級(jí)結(jié)構(gòu) 卷積神經(jīng)網(wǎng)絡(luò)卷積層講解 卷積神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 08-21 16:49 ?9357次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的介紹 什么是卷積神經(jīng)網(wǎng)絡(luò)算法

    的深度學(xué)習(xí)算法。CNN模型最早被提出是為了處理圖像,其模型結(jié)構(gòu)中包含卷積層、池化層和全連接層等關(guān)鍵技術(shù),經(jīng)過多個(gè)卷積層和池化層的
    的頭像 發(fā)表于 08-21 16:49 ?2136次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)算法流程 卷積神經(jīng)網(wǎng)絡(luò)模型工作流程

    獨(dú)特的卷積結(jié)構(gòu)可以有效地提取圖像和音頻等信息的特征,以用于分類、識(shí)別等任務(wù)。本文將從卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)、前向傳播算法、反向傳播算法等方面探討其算法流程與
    的頭像 發(fā)表于 08-21 16:50 ?3108次閱讀

    常見的卷積神經(jīng)網(wǎng)絡(luò)模型 典型的卷積神經(jīng)網(wǎng)絡(luò)模型

    常見的卷積神經(jīng)網(wǎng)絡(luò)模型 典型的卷積神經(jīng)網(wǎng)絡(luò)模型 卷積
    的頭像 發(fā)表于 08-21 17:11 ?3444次閱讀

    cnn卷積神經(jīng)網(wǎng)絡(luò)模型 卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型 生成卷積神經(jīng)網(wǎng)絡(luò)模型

    cnn卷積神經(jīng)網(wǎng)絡(luò)模型 卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型 生成卷積
    的頭像 發(fā)表于 08-21 17:11 ?1432次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)模型搭建

    卷積神經(jīng)網(wǎng)絡(luò)模型搭建 卷積神經(jīng)網(wǎng)絡(luò)模型是一種深度學(xué)習(xí)算法。它已經(jīng)成為了計(jì)算機(jī)視覺和自然語言
    的頭像 發(fā)表于 08-21 17:11 ?1100次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)模型的優(yōu)缺點(diǎn)

    等領(lǐng)域中非常流行,可用于分類、分割、檢測(cè)任務(wù)。而在實(shí)際應(yīng)用中,卷積神經(jīng)網(wǎng)絡(luò)模型有其優(yōu)點(diǎn)和缺點(diǎn)。這篇文章將詳細(xì)介紹
    的頭像 發(fā)表于 08-21 17:15 ?5146次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識(shí)別、視頻分析、自然語言處理等領(lǐng)域。本文將詳細(xì)介紹
    的頭像 發(fā)表于 07-03 09:15 ?694次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品