0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹一種新穎的三元組對(duì)比學(xué)習(xí)訓(xùn)練框架

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:浙大KG ? 作者:葉宏彬 ? 2021-06-23 15:56 ? 次閱讀

摘要

在自然語(yǔ)言處理和知識(shí)圖譜領(lǐng)域的信息提取中,三元組抽取是必不可少的任務(wù)。在本文中,我們將重新審視用于序列生成的端到端三元組抽取任務(wù)。由于生成三元組抽取可能難以捕獲長(zhǎng)期依賴關(guān)系并生成不忠實(shí)的三元組,因此我們引入了一種新的模型,即使用生成式Transformer的對(duì)比學(xué)習(xí)三元組抽取框架。

具體來(lái)說(shuō),我們介紹了一個(gè)共享的Transformer模塊,用于基于編碼器-解碼器的生成。為了產(chǎn)生忠實(shí)的結(jié)果,我們提出了一種新穎的三元組對(duì)比學(xué)習(xí)訓(xùn)練框架。此外,我們引入了兩種機(jī)制來(lái)進(jìn)一步改善模型的性能(即,分批動(dòng)態(tài)注意掩碼和三元組校準(zhǔn))。在三個(gè)數(shù)據(jù)集(NYT,WebNLG和MIE)上的實(shí)驗(yàn)結(jié)果表明,我們的方法比基線具有更好的性能。我們的代碼和數(shù)據(jù)集將在論文出版后發(fā)布。

論文動(dòng)機(jī)

編碼器-解碼器模型是功能強(qiáng)大的工具,已在許多NLP任務(wù)中獲得成功,但是現(xiàn)有方法仍然存在兩個(gè)關(guān)鍵問(wèn)題。首先,由于遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的固有缺陷,它們無(wú)法捕獲長(zhǎng)期依賴關(guān)系,從而導(dǎo)致重要信息的丟失,否則將在句子中反映出來(lái),從而導(dǎo)致模型無(wú)法應(yīng)用更長(zhǎng)的文本。第二,缺乏工作致力于生成忠實(shí)的三元組,序列到序列的體系結(jié)構(gòu)會(huì)產(chǎn)生不忠實(shí)的序列,從而產(chǎn)生意義上的矛盾。例如,給定句子“美國(guó)總統(tǒng)特朗普在紐約市皇后區(qū)長(zhǎng)大,并居住在那里直到13歲”,該模型可以生成事實(shí)“(特朗普出生于皇后區(qū))”。盡管從邏輯上講是正確的,但我們無(wú)法從給定的句子中找到直接的證據(jù)來(lái)支持它。

為了解決這些問(wèn)題,我們引入了帶有生成變壓器(CGT)的對(duì)比學(xué)習(xí)三元組提取框架,該框架是一個(gè)共享的Transformer模塊,支持編碼器-解碼器的生成式三元組對(duì)比學(xué)習(xí)多任務(wù)學(xué)習(xí)。首先,我們使用分隔符和部分因果掩碼機(jī)制將輸入序列與目標(biāo)序列連接起來(lái),以區(qū)分編碼器-解碼器表示形式。除了預(yù)先訓(xùn)練的模型之外,我們的模型不需要任何其他參數(shù)。然后,我們介紹了一種新穎的三元組對(duì)比學(xué)習(xí)對(duì)象,該對(duì)象利用真實(shí)的三元組作為正實(shí)例,并利用隨機(jī)令牌采樣將損壞的三元組構(gòu)造為負(fù)實(shí)例。為了共同優(yōu)化三元組生成對(duì)象和對(duì)比學(xué)習(xí)對(duì)象,我們引入了分批動(dòng)態(tài)注意掩碼機(jī)制,該機(jī)制允許我們動(dòng)態(tài)選擇不同的對(duì)象并共同優(yōu)化任務(wù)。最后,我們介紹了一種新穎的三元組校準(zhǔn)算法,以在推理階段濾除虛假三元組。

這項(xiàng)工作的貢獻(xiàn)如下:

我們將三元組提取作為序列生成任務(wù)進(jìn)行了重新介紹,并引入了一種新穎的CGT模型??紤]到增加的提取功能,CGT除了在預(yù)訓(xùn)練語(yǔ)言模型中發(fā)現(xiàn)的參數(shù)外,不需要其他參數(shù)。

我們引入了兩種機(jī)制來(lái)進(jìn)一步提高模型性能(即,批處理動(dòng)態(tài)注意掩碼和三元組校準(zhǔn))。第一個(gè)可以聯(lián)合優(yōu)化不同的對(duì)象,第二個(gè)可以確保忠實(shí)的推理。

我們?cè)谌齻€(gè)基準(zhǔn)數(shù)據(jù)集上評(píng)估了CGT。 我們的模型優(yōu)于其他強(qiáng)大的基準(zhǔn)模型。我們還證明,在捕獲長(zhǎng)期依存關(guān)系方面,CGT比現(xiàn)有的三元組抽取方法更好,因此,在使用長(zhǎng)句子場(chǎng)景下依然可以獲得更好的性能。

模型框架

ffb2014e-d3f6-11eb-9e57-12bb97331649.png

這里我們展示了CGT生成式Transformer的總體架構(gòu)。右上部分表示Transformer生成模塊,右下部分表示三元組對(duì)比學(xué)習(xí)模塊。這兩個(gè)部分訓(xùn)練時(shí)共同優(yōu)化。生成模塊依靠部分因果掩碼機(jī)制建模成序列生成任務(wù),如右圖中的示例所示,對(duì)于三元組序列生成,其中右上部分設(shè)置為-∞以阻止從源段到目標(biāo)段的關(guān)注;左側(cè)部分設(shè)置為全0,表示令牌能夠參與第一段。利用交叉熵?fù)p失生成來(lái)優(yōu)化三元組生成過(guò)程,獲得生成損失。對(duì)比學(xué)習(xí)模塊將輸入文本與正確的三元組實(shí)例或者偽造的三元組進(jìn)行隨機(jī)拼接,依靠部分因果掩碼機(jī)制建模成文本分類任務(wù),其中mask矩陣的元素全為0,利用經(jīng)過(guò)MLP多層感知機(jī)層的特殊token[CLS]表示來(lái)計(jì)算分類打分函數(shù),鑒別是否為正確實(shí)例,從而增強(qiáng)模型對(duì)關(guān)鍵token的感知能力。我們利用交叉熵優(yōu)化對(duì)比損失。生成損失與對(duì)比學(xué)習(xí)損失通過(guò)一個(gè)超參數(shù)權(quán)衡構(gòu)成了我們最終的總體損失。我們的解碼推理采用的是波束搜索和啟發(fā)式約束。

實(shí)驗(yàn)結(jié)果

我們對(duì)三個(gè)基準(zhǔn)數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn):紐約時(shí)報(bào)(NYT),WebNLG和MIE。MIE是醫(yī)學(xué)領(lǐng)域的大規(guī)模中文對(duì)話信息提取數(shù)據(jù)集。圖2中中顯示了這三個(gè)數(shù)據(jù)集的部分實(shí)驗(yàn)統(tǒng)計(jì)信息。

ffcac79c-d3f6-11eb-9e57-12bb97331649.png

ffd4edda-d3f6-11eb-9e57-12bb97331649.png

責(zé)任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3701

    瀏覽量

    135690
  • 自然語(yǔ)言處理
    +關(guān)注

    關(guān)注

    1

    文章

    623

    瀏覽量

    13710

原文標(biāo)題:AAAI2021-基于對(duì)比學(xué)習(xí)的三元組生成式抽取方法

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于梯度下降算法的三元鋰電池循環(huán)壽命預(yù)測(cè)

    摘要:隨著電動(dòng)汽車(chē)產(chǎn)銷量的持續(xù)攀升,對(duì)于動(dòng)力電池循環(huán)壽命性能的評(píng)估及預(yù)測(cè)已成為行業(yè)內(nèi)重點(diǎn)關(guān)注的問(wèn)題之。對(duì)某款三元鋰電池進(jìn)行了25℃及45℃下的長(zhǎng)周期循環(huán)壽命試驗(yàn),將試驗(yàn)得到的循環(huán)壽命數(shù)據(jù)進(jìn)行了
    的頭像 發(fā)表于 01-16 10:19 ?227次閱讀
    基于梯度下降算法的<b class='flag-5'>三元</b>鋰電池循環(huán)壽命預(yù)測(cè)

    三元鋰電生命循環(huán)究竟是多長(zhǎng)?朗凱威鋰電電池定制 三元鋰電池DIY

    壽命長(zhǎng),節(jié)能環(huán)保無(wú)污染,維護(hù)成本低,充放電完全,重量輕等等優(yōu)勢(shì),在些宣傳的資料里,有人認(rèn)為三元鋰電池壽命長(zhǎng),真的是這樣嗎?它的生命循環(huán)周期究竟多少次呢?讓我們來(lái)揭開(kāi)真相。
    的頭像 發(fā)表于 12-19 15:59 ?265次閱讀
    <b class='flag-5'>三元</b>鋰電生命循環(huán)究竟是多長(zhǎng)?朗凱威鋰電電池定制 <b class='flag-5'>三元</b>鋰電池<b class='flag-5'>組</b>DIY

    朗凱威三元鋰電池 6020:高性能能源解決方案

    三元鋰電池 6020 (133-2632-1310)作為一種高性能的能源解決方案,具有高能量密度、長(zhǎng)壽命、快速充電、安全可靠、環(huán)保節(jié)能等優(yōu)點(diǎn),廣泛應(yīng)用于電動(dòng)自行車(chē)、電動(dòng)摩托車(chē)、電動(dòng)汽車(chē)等領(lǐng)域。在
    的頭像 發(fā)表于 11-21 17:23 ?498次閱讀
    朗凱威<b class='flag-5'>三元</b>鋰電池<b class='flag-5'>組</b> 6020:高性能能源解決方案

    三元鋰電池行業(yè)發(fā)展趨勢(shì)

    三元鋰電池,即三元正極材料鋰電池,因其正極材料由鎳、鈷、錳(或鋁)三種元素組成而得名。這種電池因其高能量密度、長(zhǎng)循環(huán)壽命和良好的安全性能而受到市場(chǎng)的廣泛關(guān)注。 三元鋰電池行業(yè)發(fā)展趨勢(shì)
    的頭像 發(fā)表于 10-31 10:28 ?895次閱讀

    三元鋰電池的優(yōu)勢(shì)和劣勢(shì)

    三元鋰電池,指的是以鎳(Ni)、鈷(Co)和錳(Mn)三種元素作為正極材料的鋰電池。這種電池因其高能量密度、長(zhǎng)循環(huán)壽命和較好的安全性能而被廣泛應(yīng)用于電動(dòng)汽車(chē)、移動(dòng)設(shè)備和儲(chǔ)能系統(tǒng)等領(lǐng)域。 三元鋰電池
    的頭像 發(fā)表于 10-31 09:49 ?2095次閱讀

    三元鋰電池在電動(dòng)車(chē)的應(yīng)用

    動(dòng)力電池的主流選擇。 三元鋰電池概述 三元鋰電池,全稱為三元正極材料鋰離子電池,其正極材料主要由鎳(Ni)、鈷(Co)和錳(Mn)三種元素組成,因此得名。這種電池因其高能量密度、良好的
    的頭像 發(fā)表于 10-31 09:47 ?951次閱讀

    三元鋰電池放電特性及應(yīng)用

    隨著科技的進(jìn)步和環(huán)保意識(shí)的增強(qiáng),鋰電池因其高能量密度、長(zhǎng)壽命和環(huán)保特性而成為新能源領(lǐng)域的明星。三元鋰電池作為鋰電池的一種,因其獨(dú)特的優(yōu)勢(shì)在眾多領(lǐng)域得到廣泛應(yīng)用。 三元鋰電池放電特性 1. 高能量密度
    的頭像 發(fā)表于 10-31 09:46 ?1044次閱讀

    三元鋰電池與磷酸鐵鋰對(duì)比

    隨著電動(dòng)汽車(chē)和儲(chǔ)能市場(chǎng)的快速發(fā)展,電池技術(shù)成為了能源轉(zhuǎn)型的關(guān)鍵。三元鋰電池(NMC/NCA)和磷酸鐵鋰電池(LFP)是兩主要的鋰離子電池技術(shù),它們?cè)谛阅?、成本、安全性和環(huán)境影響等方面各有千秋
    的頭像 發(fā)表于 10-31 09:40 ?1142次閱讀

    三元鋰電池使用壽命分析

    隨著全球能源結(jié)構(gòu)的轉(zhuǎn)型和新能源汽車(chē)的快速發(fā)展,電池技術(shù)成為推動(dòng)這變革的關(guān)鍵因素。三元鋰電池因其高能量密度、良好的循環(huán)穩(wěn)定性和較低的成本而受到青睞。 三元鋰電池的基本特性
    的頭像 發(fā)表于 10-31 09:39 ?1331次閱讀

    三元鋰電池的組成與功能

    在當(dāng)前新能源汽車(chē)的發(fā)展浪潮中,三元鋰電池作為一種先進(jìn)的儲(chǔ)能技術(shù),已經(jīng)成為推動(dòng)電動(dòng)汽車(chē)行業(yè)進(jìn)步的關(guān)鍵因素之。這種電池之所以被稱為“三元”,是因?yàn)樗Y(jié)合了
    的頭像 發(fā)表于 09-17 16:07 ?1984次閱讀

    鴻蒙原生應(yīng)用服務(wù)開(kāi)發(fā)-倉(cāng)頡基礎(chǔ)數(shù)據(jù)類型元組類型

    ,例如,(Int64, Float64) 表示個(gè)二元組類型,(Int64, Float64, String) 表示個(gè)三元組類型。
    發(fā)表于 09-12 11:02

    18650三元鋰電池的優(yōu)點(diǎn)

    18650三元鋰電池的優(yōu)點(diǎn)
    的頭像 發(fā)表于 08-30 20:07 ?1391次閱讀
    18650<b class='flag-5'>三元</b>鋰電池的優(yōu)點(diǎn)

    TensorFlow與PyTorch深度學(xué)習(xí)框架的比較與選擇

    深度學(xué)習(xí)作為人工智能領(lǐng)域的個(gè)重要分支,在過(guò)去十年中取得了顯著的進(jìn)展。在構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型的過(guò)程中,深度學(xué)習(xí)
    的頭像 發(fā)表于 07-02 14:04 ?1217次閱讀

    軟包三元鋰電池能和硬包三元鋰電池能混合用嗎

    在電池使用和系統(tǒng)中,將軟包三元鋰電池與硬包三元鋰電池混合使用是個(gè)復(fù)雜的問(wèn)題,涉及到電池的化學(xué)成分、物理結(jié)構(gòu)、電氣特性以及系統(tǒng)設(shè)計(jì)等多個(gè)方面的考量。
    的頭像 發(fā)表于 05-07 10:48 ?1242次閱讀

    刀片電池和三元鋰電池對(duì)比

    刀片電池和三元鋰電池是當(dāng)前電動(dòng)車(chē)動(dòng)力電池領(lǐng)域的兩大主流技術(shù)。它們各自具有獨(dú)特的優(yōu)勢(shì)和局限性,適用于不同的應(yīng)用場(chǎng)景和需求。
    的頭像 發(fā)表于 05-06 17:09 ?2884次閱讀