0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

面向Aspect情感分析的自動生成離散意見樹結(jié)構(gòu)

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:周婷 ? 2022-11-16 14:52 ? 次閱讀

在本文中,我們探索了一種簡單的方法,為每個方面自動生成離散意見樹結(jié)構(gòu)。用到了RL。

f0c94b24-64f0-11ed-8abf-dac502259ad0.png

首先為每個方面生成離散意見樹,設(shè)方面詞的位置為[b,e],則首先將方面跨度[b, e]作為根節(jié)點(diǎn),然后分別從跨度[1,b?1]和[e+1, n]構(gòu)建它的左子節(jié)點(diǎn)和右子節(jié)點(diǎn)。為了構(gòu)建左子樹或右子樹,我們首先選擇span中「得分最大的元素」作為子樹的根節(jié)點(diǎn),然后遞歸地對相應(yīng)的span分區(qū)使用build_tree調(diào)用。(除了方面詞外其他node都是單個詞)。

關(guān)于得分分?jǐn)?shù)的計(jì)算,選擇將""作為BERT的輸入得到特殊于方面詞的句子表達(dá)H,然后按照如下計(jì)算得分:

f0e49f78-64f0-11ed-8abf-dac502259ad0.png

其中h是H中方面詞部分的平均池化,構(gòu)建樹的這部分包含的參數(shù)有三個以及BERT參數(shù)部分。

構(gòu)建樹的這一部分稱為,輸入為x和a(用于打分),輸出為一棵樹,參數(shù) ? 包括上述參數(shù)。這一部分參數(shù)使用RL進(jìn)行更新而不是最終損失函數(shù)的反向傳播。

生成樹以后開始正式執(zhí)行預(yù)測任務(wù),模型非常簡單。

將上面得到的樹生成鄰接矩陣,經(jīng)過GCN(可能多層),取最后一層GCN的輸出結(jié)果的方面詞部分以及[CLS]這個token的表達(dá)之和作為query,與GCN的輸入的初始向量特征(也就是原句子經(jīng)過句子編碼器得到的)做注意力機(jī)制,用輸入去表達(dá)最終的方面級分類特征。

f0f904ea-64f0-11ed-8abf-dac502259ad0.png

最后輸出分類結(jié)果

f10b6658-64f0-11ed-8abf-dac502259ad0.png

損失函數(shù):

f11b98c0-64f0-11ed-8abf-dac502259ad0.png

注意這個論文分為兩個模塊,第一個是生成樹,利用得到t;第二部分是預(yù)測, ,這里的 θ 包括GCN模塊的參數(shù)和輸出(等式5)的部分,PS注意力模塊沒有引進(jìn)參數(shù)哦。

第二部分使用上述損失函數(shù)進(jìn)行優(yōu)化,由于樹的采樣過程是一個離散的決策過程,因此它是不可微的,第一部分使用的是RL進(jìn)行優(yōu)化。

強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)訓(xùn)練部分還沒看。

實(shí)驗(yàn)效果和分析

f12dd4fe-64f0-11ed-8abf-dac502259ad0.png

MAMS 開發(fā)集效果

f14769b4-64f0-11ed-8abf-dac502259ad0.png

在MAMS數(shù)據(jù)上和多語言評論數(shù)據(jù)的結(jié)果

f15af7fe-64f0-11ed-8abf-dac502259ad0.png

SemEval數(shù)據(jù)集上的效果

f1806476-64f0-11ed-8abf-dac502259ad0.png

和span-based RL作對比

圖3a和圖3b分別顯示了方面術(shù)語“scallops”的induced tree和dependency parse:

f1995490-64f0-11ed-8abf-dac502259ad0.png

圖4a和圖4b顯示了兩個情緒極性不同的方面術(shù)語的induced tree:

f1b6ef14-64f0-11ed-8abf-dac502259ad0.png

aspect 和 opinion word的距離分析:

f1dce70a-64f0-11ed-8abf-dac502259ad0.png

基于MAMS的測試集分類精度與訓(xùn)練集中各方面頻率的關(guān)系:

f203d5c2-64f0-11ed-8abf-dac502259ad0.png

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3663

    瀏覽量

    135036

原文標(biāo)題:ACL'22 | 西湖大學(xué)提出:面向Aspect情感分析的離散意見樹歸納方法

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    自動化巨頭布局生成式AI,先瞄準(zhǔn)PLC編程?

    ? ? ? 確實(shí),自動化巨頭正在積極布局生成式AI,并首先將目光瞄準(zhǔn)了PLC(可編程邏輯控制器)編程。以下是對這一趨勢的詳細(xì)分析: ? ? ? 一、自動化巨頭布局
    的頭像 發(fā)表于 01-21 17:24 ?60次閱讀

    EE-322:面向SHARC處理器的專家代碼生成

    電子發(fā)燒友網(wǎng)站提供《EE-322:面向SHARC處理器的專家代碼生成器.pdf》資料免費(fèi)下載
    發(fā)表于 01-07 14:04 ?0次下載
    EE-322:<b class='flag-5'>面向</b>SHARC處理器的專家代碼<b class='flag-5'>生成</b>器

    自動零件分析儀的原理和應(yīng)用

    定性分析,并將分析結(jié)果傳輸至數(shù)據(jù)處理系統(tǒng)。 數(shù)據(jù)處理系統(tǒng):對接收到的分析結(jié)果進(jìn)行處理,如計(jì)算濃度、生成報(bào)告等?,F(xiàn)代自動零件
    發(fā)表于 12-23 15:22

    AIGC與傳統(tǒng)內(nèi)容生成的區(qū)別 AIGC的優(yōu)勢和挑戰(zhàn)

    、AIGC與傳統(tǒng)內(nèi)容生成的區(qū)別 數(shù)據(jù)類型與處理 : AIGC主要面向結(jié)構(gòu)化數(shù)據(jù)的生成,如自然語言文本、圖像、音頻、視頻等。這類數(shù)據(jù)規(guī)模更大,內(nèi)在結(jié)
    的頭像 發(fā)表于 11-22 16:04 ?403次閱讀

    RNN的應(yīng)用領(lǐng)域及未來發(fā)展趨勢

    多個領(lǐng)域得到了廣泛的應(yīng)用。 RNN的應(yīng)用領(lǐng)域 自然語言處理(NLP) 機(jī)器翻譯 :RNN能夠理解源語言的上下文信息,生成目標(biāo)語言的翻譯。 文本生成 :利用RNN生成連貫的文本,如新聞文章、故事等。
    的頭像 發(fā)表于 11-15 10:10 ?639次閱讀

    如何實(shí)現(xiàn)離散傅里葉變換

    離散傅里葉變換(DFT)是將離散時序信號從時間域變換到頻率域的數(shù)學(xué)工具,其實(shí)現(xiàn)方法有多種,以下介紹幾種常見的實(shí)現(xiàn)方案: 一、直接計(jì)算法 直接依據(jù)離散傅里葉變換公式進(jìn)行計(jì)算,這種方法最簡單直接,但時間
    的頭像 發(fā)表于 11-14 09:35 ?476次閱讀

    基于LSTM神經(jīng)網(wǎng)絡(luò)的情感分析方法

    情感分析是自然語言處理(NLP)領(lǐng)域的一項(xiàng)重要任務(wù),旨在識別和提取文本中的主觀信息,如情感傾向、情感強(qiáng)度等。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于LSTM(長短期記憶)神經(jīng)網(wǎng)絡(luò)的
    的頭像 發(fā)表于 11-13 10:15 ?613次閱讀

    如何自動生成verilog代碼

    介紹幾種自動生成verilog代碼的方法。
    的頭像 發(fā)表于 11-05 11:45 ?414次閱讀
    如何<b class='flag-5'>自動</b><b class='flag-5'>生成</b>verilog代碼

    AIGC與傳統(tǒng)內(nèi)容生成的區(qū)別

    AIGC : 主要面向結(jié)構(gòu)化數(shù)據(jù)的生成,如自然語言文本、圖像、音頻、視頻等。 這類數(shù)據(jù)規(guī)模更大,內(nèi)在結(jié)構(gòu)更復(fù)雜,對處理技術(shù)提出了更高要求。 傳統(tǒng)內(nèi)容
    的頭像 發(fā)表于 10-25 15:13 ?527次閱讀

    TINA自動生成外形出錯怎么解決?

    我從TI官網(wǎng)下載了LM5145的PSPICE模型,想在TINA-TI中創(chuàng)建一個新宏,但是在自動生成外形的時候出錯了。請問這種問題怎么解決
    發(fā)表于 08-13 07:39

    關(guān)于Makefile自動生成-autotools的使用

    的Makefile并非日常任務(wù),但遇見需要構(gòu)建大型軟件項(xiàng)目時,利用工具自動生成Makefile就顯得尤為關(guān)鍵。接下來,我們將重點(diǎn)介紹一款自動化構(gòu)建工具——Autoto
    的頭像 發(fā)表于 07-25 15:50 ?1536次閱讀
    關(guān)于Makefile<b class='flag-5'>自動</b><b class='flag-5'>生成</b>-autotools的使用

    流程工業(yè)和離散工業(yè)是什么?

    一系列的化學(xué)、物理和生物反應(yīng),經(jīng)過不同的工藝步驟,最終轉(zhuǎn)化為成品。流程工業(yè)通常需要高度自動化和精確的控制,以確保生產(chǎn)過程的穩(wěn)定性和產(chǎn)品質(zhì)量的穩(wěn)定性。 離散工業(yè)是指以離散單位(如產(chǎn)品、零件)為基礎(chǔ)的生產(chǎn)方式,其生
    的頭像 發(fā)表于 05-09 14:01 ?807次閱讀

    探索編程世界的七大數(shù)據(jù)結(jié)構(gòu)

    樹結(jié)構(gòu)就像是一顆倒掛的小樹,有根、有枝、有葉。它是一種非線性的數(shù)據(jù)結(jié)構(gòu),以層級的方式存儲數(shù)據(jù),頂部是根節(jié)點(diǎn),底部是葉節(jié)點(diǎn)。
    的頭像 發(fā)表于 04-16 12:04 ?420次閱讀

    ΣΔ(Sigma-Delta)技術(shù)詳解(上):離散ΣΔ調(diào)制器

    ΣΔ調(diào)制器 → 模擬ΣΔ調(diào)制器 → ΣΔADC 本文詳細(xì)講解 離散ΣΔ調(diào)制器 。閱讀后,你就能分析、設(shè)計(jì) ΣΔDAC 。 本文會先為讀者建立足夠的知識鋪墊;然后從直觀理解和建模分析的角度講解
    的頭像 發(fā)表于 03-16 17:28 ?4345次閱讀
    ΣΔ(Sigma-Delta)技術(shù)詳解(上):<b class='flag-5'>離散</b>ΣΔ調(diào)制器

    利用邊緣計(jì)算網(wǎng)關(guān)解決離散行業(yè)數(shù)采的方案【天拓四方】

    一、引言 隨著工業(yè)4.0時代的來臨,離散制造行業(yè)正面臨數(shù)字化轉(zhuǎn)型的關(guān)鍵節(jié)點(diǎn)。離散制造的特點(diǎn)是小批量、多品種、高復(fù)雜度,如何實(shí)現(xiàn)高效、精準(zhǔn)的數(shù)據(jù)采集與分析,提升生產(chǎn)效率和產(chǎn)品質(zhì)量,成為行業(yè)亟待解決
    的頭像 發(fā)表于 03-04 16:27 ?471次閱讀
    利用邊緣計(jì)算網(wǎng)關(guān)解決<b class='flag-5'>離散</b>行業(yè)數(shù)采的方案【天拓四方】