0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

匯總在事件抽取方向的相關廠商調(diào)研結(jié)果

深度學習自然語言處理 ? 來源:AI算法小喵 ? 作者:AI算法小喵 ? 2022-07-07 16:03 ? 次閱讀

寫在前面

本篇不具體談技術,主要是匯總在事件抽取方向的相關廠商調(diào)研結(jié)果。

1. 事件抽取范疇、范式、技術棧

領域范疇:廠商無論是在特定領域(如:法律、金融),還是通用領域,廠商做的都是限定類型的事件抽取。

范式:除標準抽取外(即事件檢測和事件論元識別),還有:僅抽取觸發(fā)詞和論元;僅抽取事件類型和論元。在論元抽取上也各不相同,有的僅抽取主體,有的抽取通用屬性(如:時間/地點,或者時間/地點/主體/客體)等。

技術棧:

預訓練語言模型+(BiLSTM)+CRF

預訓練語言模型+MRC

預訓練語言模型+Biaffine

Bert+BiLSTM+Self-Attention+Pointer Network

預訓練語言模型+指針結(jié)構+CLN(ConditionalLayerNorm)等

2. 相關廠商匯總

2.1 華為云

領域范疇

華為云/自然語言處理服務接口說明/事件抽取[1]目前只支持金融公告中的會議召開、聘任、辭職、股票增持、股票減持5類事件以及相關要素的抽取。

范式(標準事件抽?。?/p>

包括事件檢測(觸發(fā)詞抽取事件類型判定) 事件論元識別(論元抽取論元角色判定)

技術棧

未找到直接描述,但找到了華為云作為CCKS 2020篇章事件要素抽取比賽冠軍的方案解析[2],但注意這個比賽不屬于標準的事件抽取。

93cfbf0e-fced-11ec-ba43-dac502259ad0.png

940c94b0-fced-11ec-ba43-dac502259ad0.png

94254078-fced-11ec-ba43-dac502259ad0.png

上圖分別是他們的整體框架圖和子模型圖,他們將這個任務拆解了三個子任務:事件類型預測,事件要素抽取,以及事件表格填充。

值得關注的是在論元提取(要素抽?。╇A段,除了CRF外,他們也嘗試了MRC(閱讀理解范式)、Biaffine。其中Biaffine思想來自論文Named Entity Recognition as Dependency Parsing[3]。

另外在最后表格填充時,他們也采用了特殊處理。

2.2 百度

領域范疇

百度AI/知識圖譜/事件圖譜/事件屬性抽取[4]從資訊的標題與正文中,抽取事件發(fā)生時間、地點、參與者、觸發(fā)詞等事件元素。應該未限定領域范疇。

范式和技術棧

未找到直接描述,但可從其報告百度: 事件圖譜技術與應用[5]分析:

通用屬性抽取針對時間、地點、參與者、觸發(fā)詞進行抽取,采用的是實體識別常用的預訓練語言模型(ERNIE)+BiLSTM+CRF;

943a5940-fced-11ec-ba43-dac502259ad0.png

自定義論元抽取采用MRC(閱讀理解)方式,將抽取轉(zhuǎn)換成問答形式,通過問題嵌入要抽取的目標,如某角色的論元,來解耦了模型與事件類型、角色類型的相關部分;

94590fd4-fced-11ec-ba43-dac502259ad0.png

語義角色抽取和目前我實驗所采用的范式一樣,都是層疊指針結(jié)構。另外因為不同類型事件有各自的論元角色,如果全部建模到模型中,模型會變得很復雜,所以百度將所有角色分門別類,如主體、客體等等(這里百度稱為語義角色),然后利用多層指針結(jié)構同時抽取。

9470645e-fced-11ec-ba43-dac502259ad0.png

需要指出的是,通用屬性抽取的問題是無法靈活地泛化。MRC(閱讀理解方案)的問題則是效率,因為需要對每一個角色都進行單獨提問抽取。

2.3 科大訊飛

無,但科大訊飛有舉辦相關比賽,這里有一份參賽者的分享科大訊飛2020完整事件抽取系統(tǒng)[6]。

范式

非標準的事件抽取,任務包括:抽取觸發(fā)詞,主體/客體/時間/地點,判定事件發(fā)生狀態(tài)的屬性,包括極性、時態(tài)。極性分為:肯定、否定、可能;時態(tài)分為:過去、現(xiàn)在、將來、其他。

技術棧(pipeline)

觸發(fā)詞抽?。築ert+指針結(jié)構;特征層面:利用遠程監(jiān)督增加了已知的所有觸發(fā)詞的嵌入。

948fb5e8-fced-11ec-ba43-dac502259ad0.png

主體/客體/時間/地點抽?。築ert+conditionalLayerNorma+指針結(jié)構。特征層面:trigger在文本中的位置、其他詞到trigger的位置。

94bc173c-fced-11ec-ba43-dac502259ad0.png

2.4 深擎科技

在他們主頁上沒有找到相關接口,但是找到一篇他們分享的文章結(jié)合指針網(wǎng)絡的注意力機制(PAN模型)實現(xiàn)金融領域事件抽取[7]。這篇文章里主要提及了事件主體識別和事件類型判定:

事件類型判定:

金融事件的特征相對明顯,業(yè)務術語等很大程度上決定了分類的效果,他們直接采用Fasttext分類模型,在句子級的事件識別任務中達到了95.7%的準確率。

事件主體識別:

采用了基于指針網(wǎng)絡帶注意力機制(PAN,Point Attention Network:Bert+BiLSTM+Self-Attention+Pointer Network)的事件主體識別模型,從文本中找出在事件中充當?shù)闹黧w角色元素。

2.5 冪律智能

94e02780-fced-11ec-ba43-dac502259ad0.png

冪律智能-功能介紹

領域范疇

法律方向,分析對象主要為裁判文書、案件卷宗等法律描述文本

范式(非標準事件抽?。?/p>

主要抽取出獨立的包含時間、人物、地點、描述的子事件

技術棧

基于深度學習的序列標注模型,從探測出的事件片段中預測出時間、地點、任務、描述信息

值得注意的是,他們還有一個時間線(類似于事件脈絡),主要是通過提取出的時間標準化比對。

94fd655c-fced-11ec-ba43-dac502259ad0.png

冪律智能事件抽取展示頁面

2.6 云孚語義

有,而且已經(jīng)有了事件脈絡(原計劃將要做的,別人已經(jīng)有了),但是目前沒有看到云孚主頁[7]有演示接口,僅看到它的微信公眾號文章中的展示。

9514e4d4-fced-11ec-ba43-dac502259ad0.png

云孚語義-事件脈絡

3.總結(jié)

關于事件抽取方向的相關廠商調(diào)研內(nèi)容就到這里了,后續(xù)將會出事件抽取方向調(diào)研-技術棧篇等相關內(nèi)容。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 事件
    +關注

    關注

    0

    文章

    12

    瀏覽量

    9949
  • 語言模型
    +關注

    關注

    0

    文章

    535

    瀏覽量

    10306

原文標題:3.總結(jié)

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    請問AMC1203文檔中的OSC過采樣率和sinc3濾波器中的抽取率是不是同一個概念?

    1、請問AMC1203文檔中的OSC過采樣率和sinc3濾波器中的抽取率是不是同一個概念?同為256? 2、抽取率是不是MCLK時鐘的分頻因子? 3、Combining the ADS1202
    發(fā)表于 12-16 06:42

    ADS1299用ADS采集數(shù)據(jù),ADS可以不抽取看原始得數(shù)據(jù)嗎?

    1.用ADS采集數(shù)據(jù),將時域的數(shù)據(jù)進行FFT變換,得到頻譜里面看似有 Sinc Filter 抽取,不需要抽取是否可以?ADS可以不抽取看原始得數(shù)據(jù)嗎? 2.這個和手冊上的頻譜不一樣? 請問這個是什么問題呢?
    發(fā)表于 11-20 06:05

    求助,關于AMC1306M25抽取率OSR的疑問求解

    我客戶目前正在評估AMC1306M25,有以下疑問需要解答,可否幫忙確認一下: 圖為官方的例程,兩個都應該指的是抽取率OSR。但是當客戶在第一個函數(shù)中填的抽取率為64,到第二張圖中ratio的值
    發(fā)表于 11-14 07:09

    aic23b的AD和DA輸入輸出數(shù)據(jù)總在64000左右,AD設置的是16位,為什么才進來的數(shù)都這么大,是不是配置不對?

    你好,aic23b的AD和DA輸入輸出數(shù)據(jù)總在64000左右,AD設置的是16位,為什么才進來的數(shù)都這么大,是不是配置不對? 還有就是,輸入電壓和采樣值之間的對應關系是什么?
    發(fā)表于 11-05 06:53

    臺州市領導蒞臨新臺佳光電調(diào)研

    臺州市委書記李躍旗蒞臨新臺佳光電有限公司(臨海水晶)調(diào)研科技創(chuàng)新工作,臺州市委常委、秘書長陳挺晨參加調(diào)研,臨海市委書記吳華丁陪同調(diào)研。水晶光電董事長林敏、副總經(jīng)理鄭萍、熊波、臨海水晶總經(jīng)理王平攜其他干部進行接待。
    的頭像 發(fā)表于 09-14 10:11 ?469次閱讀

    求助,AD7190關于Σ-Δ ADC其中的抽取濾波器的數(shù)據(jù)轉(zhuǎn)換問題求解

    AD7190可以通過模式寄存器的FS[0:9]設置輸出速率, 0-1023的范圍;此時設置的數(shù)據(jù)速率選擇位是否就是Σ-Δ ADC抽取濾波器的抽取比? 關于抽取濾波器,此時我設置的為1023,那我是否
    發(fā)表于 09-09 06:11

    防水和防振動功能2.5 英寸SAS/SATA硬盤抽取盒 非常適合車載數(shù)據(jù)存儲

    首創(chuàng)的防水和防振動功能 2.5 英寸 SAS/SATA 硬盤抽取盒 – 非常適合車載數(shù)據(jù)存儲
    的頭像 發(fā)表于 08-12 19:16 ?484次閱讀
    防水和防振動功能2.5 英寸SAS/SATA硬盤<b class='flag-5'>抽取</b>盒 非常適合車載數(shù)據(jù)存儲

    用 AI 解鎖技術調(diào)研的新姿勢

    1. 前言 在日常開發(fā)中,為了保證技術方案的質(zhì)量,一般會在撰寫前進行調(diào)研。如果先前沒有相關領域的知識儲備,筆者的調(diào)研方式一般是先通過搜索引擎進行關鍵字查詢,然后再基于搜索的結(jié)果進行發(fā)散
    的頭像 發(fā)表于 08-05 13:44 ?223次閱讀
    用 AI 解鎖技術<b class='flag-5'>調(diào)研</b>的新姿勢

    負電荷的移動方向是電流方向

    負電荷的移動方向不是電流方向。電流方向的定義是正電荷的移動方向。在電學中,電流的方向通常被規(guī)定為正電荷的移動
    的頭像 發(fā)表于 07-29 17:03 ?1975次閱讀

    萬里紅榮獲GoUpSec《數(shù)據(jù)安全產(chǎn)品及服務購買決策參考》“酷廠商”推薦

    近日,國內(nèi)知名安全調(diào)研機構GoUpSec深入調(diào)研了37家國內(nèi)數(shù)據(jù)安全“酷廠商”(包括專業(yè)廠商和綜合安全廠商),從產(chǎn)品功能、應用行業(yè)、成功案例
    的頭像 發(fā)表于 06-19 09:26 ?983次閱讀
    萬里紅榮獲GoUpSec《數(shù)據(jù)安全產(chǎn)品及服務購買決策參考》“酷<b class='flag-5'>廠商</b>”推薦

    ICY DOCK Expresscage MB038SP-B硬盤抽取盒評測

    ICYDOCK最近又推出了一款ExpressCage系列的有趣產(chǎn)品,適用于SoHo、服務器和工業(yè)應用。今天,我們將測試這臺ExpressCageMB038SP-B全金屬硬盤抽取盒,該硬盤抽取盒有8個
    的頭像 發(fā)表于 05-17 16:20 ?477次閱讀
    ICY DOCK Expresscage MB038SP-B硬盤<b class='flag-5'>抽取</b>盒評測

    2024年儲能相關政策匯總

    2024年儲能相關政策匯總 2024年,儲能政策繼續(xù)加碼,2024年儲能產(chǎn)業(yè)必將迎來全新發(fā)展。本篇文章為大家?guī)?024年1-2月各地發(fā)布的儲能相關政策,以供參考。 01 安徽省 近日,安徽蕪湖發(fā)布
    的頭像 發(fā)表于 05-13 17:59 ?1370次閱讀
    2024年儲能<b class='flag-5'>相關</b>政策<b class='flag-5'>匯總</b>

    國產(chǎn)riscv芯片大匯總?

    請問有統(tǒng)計國產(chǎn)的riscv芯片的嗎?能匯總一下嗎?
    發(fā)表于 04-27 11:53

    柔性電流探頭方向判斷的方法

    柔性電流探頭是一種用于測量電流的設備,其特點是能夠彎曲和扭轉(zhuǎn)以適應不同的測量場景。在使用柔性電流探頭時,正確判斷其方向非常重要,因為方向錯誤可能導致測量結(jié)果的偏差。以下是柔性電流探頭方向
    的頭像 發(fā)表于 03-11 13:33 ?433次閱讀
    柔性電流探頭<b class='flag-5'>方向</b>判斷的方法

    Cadence17.4使用問題匯總

    電子發(fā)燒友網(wǎng)站提供《Cadence17.4使用問題匯總.docx》資料免費下載
    發(fā)表于 03-07 16:33 ?2次下載