0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何解決NER覆蓋和不連續(xù)問(wèn)題

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 作者:zenRRan ? 2021-09-08 10:48 ? 次閱讀

論文:A Span-Based Model for Joint Overlapped and DiscontinuousNamed Entity Recognition

鏈接:https://aclanthology.org/2021.acl-long.372.pdf

代碼:https://github.com/foxlf823/sodner

提取摘要

由于普通的NER問(wèn)題被研究的透透的了,本文主要解決一種稍微復(fù)雜些問(wèn)題:一種帶有覆蓋和不連續(xù)(Overlapped and Discontinuous)的命名實(shí)體識(shí)別任務(wù)。

而在這兩者研究上來(lái)說(shuō),前人只是要么解決覆蓋問(wèn)題,要么解決不連續(xù)問(wèn)題,但是本文提出一種聯(lián)合解決這兩種問(wèn)題的span-based方法。

span-based方法昨天也提到過(guò)了,所以關(guān)于實(shí)體+關(guān)系抽取的任務(wù)都可以嘗試。

本文通過(guò)兩個(gè)步驟構(gòu)建模型:

通過(guò)列舉所有可能的text span來(lái)識(shí)別出實(shí)體片段(entity fragments);

在這些entity fragments上預(yù)測(cè)是兩種關(guān)系overlapping or succession。

這樣,我們不僅可以識(shí)別Discontinuous的實(shí)體,同時(shí)也可以對(duì)Overlapped的實(shí)體進(jìn)行雙重檢查。

通過(guò)上述方法輕松將NER裝換成RE(Relation Extraction)任務(wù)。最終實(shí)驗(yàn)在很多數(shù)據(jù)集上比如CLEF, GENIA andACE05上展現(xiàn)除了很強(qiáng)勁的性能。

該模型的步驟為

input一方面通過(guò)pre-train模型獲取word rep,一方面通過(guò)dependency parsing獲取句法信息;

GCN集合LSTM的輸出和句法輸入,得到syntax-enhanced的新的表達(dá);

獲取所有span表示;

通過(guò)兩個(gè)MLP預(yù)測(cè)span是否為實(shí)體,以及實(shí)體時(shí)間是否有關(guān)系;

最后每個(gè)loss加上權(quán)重,為最終優(yōu)化目標(biāo)。

關(guān)鍵分類

AGGCN用來(lái)融入句法信息

attention-guided GCN (AGGCN)比普通GCN要強(qiáng)一些,所以這里選用該方法。傳統(tǒng)的GCN:

124ac384-1003-11ec-8fb8-12bb97331649.png

而AGGCN就是使用self-attention,替換以前的鄰接矩陣A,最后通過(guò)線性方法將multi head生成的結(jié)果合一:

12545908-1003-11ec-8fb8-12bb97331649.png

Span的表示

解碼先預(yù)測(cè)實(shí)體片段,再預(yù)測(cè)關(guān)系。

12860e4e-1003-11ec-8fb8-12bb97331649.png

解碼公式

損失計(jì)算

實(shí)驗(yàn)實(shí)驗(yàn)數(shù)據(jù)介紹

在數(shù)據(jù)上的表現(xiàn)

在其他數(shù)據(jù)上與前人的對(duì)比,雖然性能不如SOTA,但是這種Span-based方式和SOTA差不了多少,是個(gè)新穎的想法。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3487

    瀏覽量

    49995
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    22485

原文標(biāo)題:ACL2021 | 一種巧妙解決NER覆蓋和不連續(xù)問(wèn)題的方法

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    STM32 LCD驅(qū)動(dòng)段碼屏,SEG1-SEG8可以連續(xù)配置嗎?

    求教各位大佬,在使用4*33的段碼屏中發(fā)現(xiàn)段碼引腳占用太對(duì)功能引腳,段碼驅(qū)動(dòng)引腳配置可以連續(xù)嗎?類似于這種配置?
    發(fā)表于 03-12 06:55

    DLPC3478投影灰階圖像出現(xiàn)條紋,亮度連續(xù)的原因?

    現(xiàn)在使用的平臺(tái)和相關(guān)配置如圖1,在投影灰階圖像時(shí)會(huì)發(fā)現(xiàn)投影的圖像不正常, 有條紋存在,亮度連續(xù)。投影原圖為圖2,錯(cuò)誤圖像為圖3。 請(qǐng)幫忙解答一下,謝謝。
    發(fā)表于 02-28 06:45

    DLP6500FYE投影時(shí)灰度連續(xù)是怎么回事?

    1、我使用的是反射式DMD+外部LED光源,投影時(shí)同樣出現(xiàn)了上面鏈接中投影灰度連續(xù)的情況,灰度呈階梯狀變化,且在128bit處也是必有跳變,無(wú)法實(shí)現(xiàn)線性變化。 相機(jī)曝光時(shí)間約為2ms,投影曝光
    發(fā)表于 02-21 10:20

    采用AD62P29進(jìn)行模數(shù)轉(zhuǎn)換,對(duì)正弦信號(hào)的轉(zhuǎn)換后的波形連續(xù),會(huì)出現(xiàn)臺(tái)階?為什么?

    為什么我們采用AD62P29進(jìn)行模數(shù)轉(zhuǎn)換,對(duì)正弦信號(hào)的轉(zhuǎn)換后的波形連續(xù),會(huì)出現(xiàn)臺(tái)階?
    發(fā)表于 02-06 07:13

    使用ADS1158進(jìn)入自動(dòng)掃描模式,對(duì)REF GAIN TEMP VCC OFFSET內(nèi)部信息進(jìn)行AD轉(zhuǎn)換,如何連續(xù)讀?。?/a>

    我使用ADS1158進(jìn)入自動(dòng)掃描模式,對(duì)REF GAIN TEMP VCC OFFSET 內(nèi)部信息進(jìn)行AD轉(zhuǎn)換,轉(zhuǎn)換后的數(shù)據(jù)只能讀取一個(gè),無(wú)法連續(xù)讀取,請(qǐng)問(wèn)如何連續(xù)讀取,還用我用的參考電壓是2.5V,讀取的數(shù)據(jù)為0xE207,還有除VCC以外的數(shù)據(jù)均是錯(cuò)誤的,顯示超出量
    發(fā)表于 01-17 08:36

    ADS1282無(wú)法實(shí)現(xiàn)轉(zhuǎn)換速率為128K的連續(xù)轉(zhuǎn)換與數(shù)據(jù)讀取,如何解決?

    SCLK最高頻率為1/2fCLK,因?yàn)檩敵?2位數(shù)據(jù)結(jié)果需要至少64個(gè)ADC時(shí)鐘周期。這顯然是一個(gè)矛盾:無(wú)法實(shí)現(xiàn)轉(zhuǎn)換速率為128K的連續(xù)轉(zhuǎn)換與數(shù)據(jù)讀取。請(qǐng)問(wèn):如何解決該問(wèn)題?
    發(fā)表于 01-14 06:23

    使用ADS1293EVM接心電模擬器做測(cè)試,波形連續(xù)中間有跳躍是什么原因?

    大家好,我在使用ADS1293EVM 接心電模擬器做測(cè)試的時(shí)候,發(fā)現(xiàn)一個(gè)小問(wèn)題,波形連續(xù),中間有跳躍的情況,請(qǐng)問(wèn)這是什么問(wèn)題?是放大倍數(shù)不夠還是AD分辨率的原因呢?謝謝! 軟件配置使用的是默認(rèn)3lead方式.
    發(fā)表于 12-27 06:22

    ADS1115返回值連續(xù)是怎么回事?

    ADS1115返回值連續(xù),每次都是0.16.32.48......變化,不是0.1.2.3.4.....變化的,用邏輯分析儀看了讀的值是對(duì)的,求教?。?!
    發(fā)表于 12-02 07:31

    ADS127L01使用Start從0到1啟動(dòng)ADC轉(zhuǎn)換,DRDY連續(xù)出現(xiàn),為什么?

    如圖,使用Start從0到1啟動(dòng)ADC轉(zhuǎn)換,出現(xiàn)DRDY時(shí),得到的數(shù)據(jù)時(shí)正確的,但DRDY連續(xù)出現(xiàn),不明白是哪里出現(xiàn)問(wèn)題了。
    發(fā)表于 11-25 06:24

    SRC4190波形連續(xù)的原因?怎么解決?

    我的電路如下圖: 其中dev1是CPU dev2是音頻處理芯片 現(xiàn)在CPU發(fā)送24bit的采樣率48K1KHZ正弦波 經(jīng)過(guò)src4190后進(jìn)入音頻處理芯片DAC輸出波形連續(xù) 如下:
    發(fā)表于 09-27 09:46

    何解決熱插拔時(shí)的電壓過(guò)沖

    電子發(fā)燒友網(wǎng)站提供《如何解決熱插拔時(shí)的電壓過(guò)沖.pdf》資料免費(fèi)下載
    發(fā)表于 09-06 11:34 ?0次下載
    如<b class='flag-5'>何解</b>決熱插拔時(shí)的電壓過(guò)沖

    何解決工字電感噪音大的問(wèn)題

    電子發(fā)燒友網(wǎng)站提供《如何解決工字電感噪音大的問(wèn)題.docx》資料免費(fèi)下載
    發(fā)表于 09-04 11:46 ?0次下載

    何解決電感的漏感問(wèn)題

    電子發(fā)燒友網(wǎng)站提供《如何解決電感的漏感問(wèn)題.docx》資料免費(fèi)下載
    發(fā)表于 09-02 14:48 ?0次下載

    何解決貼片繞線功率電感的兼容問(wèn)題

    電子發(fā)燒友網(wǎng)站提供《如何解決貼片繞線功率電感的兼容問(wèn)題.docx》資料免費(fèi)下載
    發(fā)表于 07-04 17:04 ?0次下載

    BP神經(jīng)網(wǎng)絡(luò)在處理連續(xù)變量時(shí)的應(yīng)用

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)是一種多層前饋神經(jīng)網(wǎng)絡(luò),廣泛應(yīng)用于各種領(lǐng)域的數(shù)據(jù)建模和預(yù)測(cè)任務(wù)。然而,BP神經(jīng)網(wǎng)絡(luò)在處理連續(xù)變量時(shí)可能會(huì)遇到一些挑戰(zhàn)
    的頭像 發(fā)表于 07-03 10:19 ?595次閱讀

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品