0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

半監(jiān)督算法DocRE的新組件

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 作者:深度學(xué)習(xí)自然語(yǔ)言 ? 2022-08-31 15:08 ? 次閱讀

今天給大家分享的是是ACL 2022上與實(shí)體關(guān)系抽取相關(guān)的部門(mén)論文范讀筆記。其中有一些小喵自己也在學(xué)習(xí),后續(xù)會(huì)推出精讀筆記。

1. DocRE

論文概括:具有自適應(yīng)焦點(diǎn)損失和知識(shí)蒸餾的文檔級(jí)關(guān)系抽取

文檔級(jí)關(guān)系抽取要同時(shí)從多個(gè)句子中提取關(guān)系。針對(duì)這個(gè)任務(wù),本文提出了一個(gè)半監(jiān)督算法 DocRE。DocRE 共有三個(gè)新組件:

第一,用軸向注意力模塊學(xué)習(xí)實(shí)體對(duì)之間的依賴關(guān)系。

第二,提出了一個(gè)自適應(yīng)的焦點(diǎn)損失來(lái)解決DocRE中類的不平衡問(wèn)題。

最后,利用知識(shí)蒸餾來(lái)克服人工標(biāo)注數(shù)據(jù)與遠(yuǎn)程監(jiān)督數(shù)據(jù)之間的差異。

現(xiàn)有問(wèn)題:現(xiàn)存的方法關(guān)注實(shí)體對(duì)的句法特征,而忽略了實(shí)體對(duì)之間的交互作用;目前還沒(méi)有工作可以直接地解決類的不平衡問(wèn)題?,F(xiàn)存的工作僅僅關(guān)注閾值學(xué)習(xí)來(lái)平衡正例和負(fù)例,但正例內(nèi)部的類不平衡問(wèn)題并沒(méi)有得到解決;關(guān)于將遠(yuǎn)程監(jiān)督數(shù)據(jù)應(yīng)用于DocRE任務(wù)的研究很少。

貢獻(xiàn)點(diǎn)

軸向注意力:提升two-hop關(guān)系的推理能力;

自適應(yīng)焦點(diǎn)損失:解決標(biāo)簽分配不平衡的問(wèn)題,長(zhǎng)尾類在總的損失中占比較多;

知識(shí)蒸餾:克服標(biāo)注數(shù)據(jù)和遠(yuǎn)程監(jiān)督數(shù)據(jù)之間的差異。

cdb08722-284d-11ed-ba43-dac502259ad0.pngDocRE

2. PL-Marker

論文名稱:《Packed Levitated Marker for Entity and Relation Extraction》

論文鏈接:https://aclanthology.org/2022.acl-long.337.pdf

代碼地址:https://github.com/thunlp/PL-Marker

論文概括:打包懸浮標(biāo)記用于實(shí)體和關(guān)系抽取

最近的命名實(shí)體識(shí)別和關(guān)系抽取工作專注于研究如何從預(yù)訓(xùn)練模型中獲得更好的span表示。然而,許多工作忽略了span之間的相互關(guān)系。本文提出了一種基于懸浮標(biāo)記的span表示方法,在編碼過(guò)程中通過(guò)特定策略打包標(biāo)記來(lái)考慮span之間的相互關(guān)系。對(duì)于命名實(shí)體識(shí)別任務(wù),提出了一種面向鄰居span的打包策略,以更好地建模實(shí)體邊界信息。對(duì)于關(guān)系抽取任務(wù),設(shè)計(jì)了一種面向頭實(shí)體的打包策略,將每個(gè)頭實(shí)體以及可能的尾實(shí)體打包,以共同建模同頭實(shí)體的span對(duì)。

cdd60db2-284d-11ed-ba43-dac502259ad0.pngPL-Marker

3. CRL

論文名稱:《Consistent Representation Learning for Continual Relation Extraction》

論文鏈接:https://aclanthology.org/2022.findings-acl.268.pdf

代碼地址:https://github.com/thuiar/CRL

論文概括:一致表示學(xué)習(xí)用于連續(xù)關(guān)系抽取

通過(guò)對(duì)比學(xué)習(xí)和回放記憶時(shí)的知識(shí)蒸餾,提出一種新穎的一致性表示學(xué)習(xí)方法。使用基于記憶庫(kù)的監(jiān)督對(duì)比學(xué)習(xí)來(lái)訓(xùn)練每一個(gè)新的任務(wù),以使模型高效學(xué)習(xí)特征表示。為了防止對(duì)老任務(wù)的遺忘,構(gòu)造了記憶樣本的連續(xù)回放,同時(shí)讓模型保留在知識(shí)蒸餾中歷史任務(wù)之間的關(guān)系。

cdf3f728-284d-11ed-ba43-dac502259ad0.pngCRL

4. MCMN

論文名稱:《Pre-training to Match for Unified Low-shot Relation Extraction》

論文鏈接:https://aclanthology.org/2022.acl-long.397.pdf

代碼地址:https://github.com/fc-liu/MCMN

論文概括:預(yù)訓(xùn)練用于匹配統(tǒng)一少樣本關(guān)系抽取

低樣本關(guān)系抽取旨在少樣本甚至零樣本場(chǎng)景下的關(guān)系抽取。由于低樣本關(guān)系抽取所包含任務(wù)形式多樣,傳統(tǒng)方法難以統(tǒng)一處理。本文針對(duì)這一問(wèn)題,提出了一種統(tǒng)一的低樣本匹配網(wǎng)絡(luò)

基于語(yǔ)義提示(prompt)范式,構(gòu)造了從關(guān)系描述到句子實(shí)例的匹配網(wǎng)絡(luò)模型;

針對(duì)匹配網(wǎng)絡(luò)模型學(xué)習(xí),設(shè)計(jì)了三元組-復(fù)述的預(yù)訓(xùn)練方法,以增強(qiáng)模型對(duì)關(guān)系描述與實(shí)例之間語(yǔ)義匹配的泛化性。

在零樣本、小樣本以及帶負(fù)例的小樣本關(guān)系抽取評(píng)測(cè)基準(zhǔn)上的實(shí)驗(yàn)結(jié)果表明,該方法能有效提升低樣本場(chǎng)景下關(guān)系抽取的性能,并且具備了較好的任務(wù)自適應(yīng)能力。

ce1c996c-284d-11ed-ba43-dac502259ad0.png

審核編輯:彭靜

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7035

    瀏覽量

    89045
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    942

    瀏覽量

    54836
  • 訓(xùn)練模型
    +關(guān)注

    關(guān)注

    1

    文章

    36

    瀏覽量

    3828

原文標(biāo)題:4. MCMN

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    監(jiān)督典型相關(guān)分析算法

    監(jiān)督典型相關(guān)分析算法:在典型相關(guān)分析算法(canonical correlation analysis,簡(jiǎn)稱CCA)的基礎(chǔ)上,通過(guò)引入以成對(duì)約束形式給出的
    發(fā)表于 10-31 08:59 ?12次下載

    基于監(jiān)督學(xué)習(xí)的跌倒檢測(cè)系統(tǒng)設(shè)計(jì)_李仲年

    基于監(jiān)督學(xué)習(xí)的跌倒檢測(cè)系統(tǒng)設(shè)計(jì)_李仲年
    發(fā)表于 03-19 19:11 ?4次下載

    監(jiān)督的譜聚類圖像分割

    采用IRAM算法計(jì)算相似度矩陣的主導(dǎo)特征值,減小運(yùn)算時(shí)間。為解決譜聚類敏感于尺度參數(shù)的問(wèn)題,提出利用少量監(jiān)督樣本求取每幅圖像特有的尺度參數(shù),進(jìn)行監(jiān)督圖像分割。通過(guò)對(duì)UCI數(shù)據(jù)集和自然
    發(fā)表于 11-13 11:17 ?4次下載

    基于C均值聚類和圖轉(zhuǎn)導(dǎo)的監(jiān)督分類算法

    針對(duì)傳統(tǒng)圖轉(zhuǎn)導(dǎo)( GT)算法計(jì)算量大并且準(zhǔn)確率不高的問(wèn)題,提出一個(gè)基于C均值聚類和圖轉(zhuǎn)導(dǎo)的監(jiān)督分類算法。首先,采用模糊C均值(FCM)聚類算法
    發(fā)表于 11-28 16:36 ?0次下載
    基于C均值聚類和圖轉(zhuǎn)導(dǎo)的<b class='flag-5'>半</b><b class='flag-5'>監(jiān)督</b>分類<b class='flag-5'>算法</b>

    基于最優(yōu)投影的監(jiān)督聚類算法

    針對(duì)譜聚類算法在解決高維、大數(shù)據(jù)量的聚類問(wèn)題時(shí)出現(xiàn)的效率不高和準(zhǔn)確率明顯下降的問(wèn)題進(jìn)行了研究,并在此研究基礎(chǔ)上結(jié)合最優(yōu)投影理論和Nystrom抽樣提出了基于最優(yōu)投影的監(jiān)督譜聚類算法
    發(fā)表于 01-14 11:54 ?0次下載

    基于監(jiān)督學(xué)習(xí)框架的識(shí)別算法

    問(wèn)題,對(duì)半監(jiān)督學(xué)習(xí)中的協(xié)同訓(xùn)練算法進(jìn)行改進(jìn),提出了一種基于多學(xué)習(xí)器協(xié)同訓(xùn)練模型的人體行為識(shí)別方法.這是一種基于監(jiān)督學(xué)習(xí)框架的識(shí)別算法,該方
    發(fā)表于 01-21 10:41 ?1次下載

    如何約束監(jiān)督分類方法的詳細(xì)資料概述

    假設(shè)聯(lián)合成對(duì)約束監(jiān)督分類方法( ACA-JPC-S3VM)。一方面,它將單個(gè)未標(biāo)記樣本到數(shù)據(jù)分布邊界的距離融入到模型的學(xué)習(xí)中,能夠一定程度上緩解此類情況下算法性能的下降程度;另一方面,它將成對(duì)約束信息引入,彌補(bǔ)了模型對(duì)
    發(fā)表于 11-15 11:32 ?4次下載
    如何約束<b class='flag-5'>半</b><b class='flag-5'>監(jiān)督</b>分類方法的詳細(xì)資料概述

    機(jī)器學(xué)習(xí)算法中有監(jiān)督和無(wú)監(jiān)督學(xué)習(xí)的區(qū)別

    無(wú)監(jiān)督學(xué)習(xí)的好處之一是,它不需要監(jiān)督學(xué)習(xí)必須經(jīng)歷的費(fèi)力的數(shù)據(jù)標(biāo)記過(guò)程。但是,要權(quán)衡的是,評(píng)估其性能的有效性也非常困難。相反,通過(guò)將監(jiān)督學(xué)習(xí)算法的輸出與測(cè)試數(shù)據(jù)的實(shí)際標(biāo)簽進(jìn)行比較,可以很
    的頭像 發(fā)表于 07-07 10:18 ?5774次閱讀

    最基礎(chǔ)的監(jiān)督學(xué)習(xí)

    導(dǎo)讀 最基礎(chǔ)的監(jiān)督學(xué)習(xí)的概念,給大家一個(gè)感性的認(rèn)識(shí)。 監(jiān)督學(xué)習(xí)(SSL)是一種機(jī)器學(xué)習(xí)技術(shù),其中任務(wù)是從一個(gè)小的帶標(biāo)簽的數(shù)據(jù)集和相對(duì)較大的未帶標(biāo)簽的數(shù)據(jù)中學(xué)習(xí)得到的。SSL的目標(biāo)是
    的頭像 發(fā)表于 11-02 16:08 ?2656次閱讀

    監(jiān)督學(xué)習(xí)最基礎(chǔ)的3個(gè)概念

    導(dǎo)讀 今天給大家介紹監(jiān)督學(xué)習(xí)中的3個(gè)最基礎(chǔ)的概念:一致性正則化,熵最小化和偽標(biāo)簽,并介紹了兩個(gè)經(jīng)典的監(jiān)督學(xué)習(xí)方法。 沒(méi)看一的點(diǎn)這里哈:
    的頭像 發(fā)表于 11-02 16:14 ?2969次閱讀
    <b class='flag-5'>半</b><b class='flag-5'>監(jiān)督</b>學(xué)習(xí)最基礎(chǔ)的3個(gè)概念

    為什么監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)的未來(lái)?

    為什么監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)的未來(lái)。 監(jiān)督學(xué)習(xí)是人工智能領(lǐng)域的第一種學(xué)習(xí)類型。從它的概念開(kāi)始,無(wú)數(shù)的算法,從簡(jiǎn)單的邏輯回歸到大規(guī)模的神經(jīng)網(wǎng)絡(luò),都已經(jīng)被研究用來(lái)提高精確度和預(yù)測(cè)能力。 然而
    的頭像 發(fā)表于 11-27 10:42 ?3910次閱讀

    一種帶有局部坐標(biāo)約束的監(jiān)督概念分解算法

    和數(shù)據(jù)有限的標(biāo)簽信息融入到CF模型中,提出了一種帶有局部坐標(biāo)約束的監(jiān)督的概念分解(SLCF)算法。SICF算法利用局部坐標(biāo)約束學(xué)習(xí)數(shù)據(jù)的稀疏性,數(shù)據(jù)標(biāo)簽約束矩陣能夠保證同類標(biāo)簽的數(shù)據(jù)
    發(fā)表于 03-31 11:47 ?10次下載
    一種帶有局部坐標(biāo)約束的<b class='flag-5'>半</b><b class='flag-5'>監(jiān)督</b>概念分解<b class='flag-5'>算法</b>

    一種基于光滑表示的監(jiān)督分類算法

    。文中提岀了一種基于光滑表示的監(jiān)督分類算法。具體來(lái)說(shuō),此方法通過(guò)應(yīng)用一個(gè)低通濾波器來(lái)實(shí)現(xiàn)數(shù)據(jù)的平滑,然后將光滑數(shù)據(jù)用于監(jiān)督分類。此外,所
    發(fā)表于 04-08 10:47 ?17次下載
    一種基于光滑表示的<b class='flag-5'>半</b><b class='flag-5'>監(jiān)督</b>分類<b class='flag-5'>算法</b>

    一種基于DE和ELM的監(jiān)督分類方法

    演化算法和分析方法的結(jié)合是機(jī)器學(xué)習(xí)領(lǐng)域近幾年的一個(gè)研究熱點(diǎn)。研究如何將差分進(jìn)化(DE)演化算法與基于超限學(xué)習(xí)機(jī)(ELM)的監(jiān)督分類算法相結(jié)
    發(fā)表于 04-09 16:16 ?5次下載
    一種基于DE和ELM的<b class='flag-5'>半</b><b class='flag-5'>監(jiān)督</b>分類方法

    一種基于偽標(biāo)簽監(jiān)督學(xué)習(xí)的小樣本調(diào)制識(shí)別算法

    一種基于偽標(biāo)簽監(jiān)督學(xué)習(xí)的小樣本調(diào)制識(shí)別算法 來(lái)源:《西北工業(yè)大學(xué)學(xué)報(bào)》,作者史蘊(yùn)豪等 摘 要:針對(duì)有標(biāo)簽樣本較少條件下的通信信號(hào)調(diào)制識(shí)別問(wèn)題,提出了一種基于偽標(biāo)簽
    發(fā)表于 02-10 11:37 ?822次閱讀