0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一些NER的英文數(shù)據(jù)集推薦

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:深度學(xué)習(xí)自然語言 ? 2020-12-26 09:11 ? 次閱讀

1MUC Data Sets

https://www-nlpir.nist.gov/related_projects/muc/

2CoNLL-2002
https://www.clips.uantwerpen.be/conll2002/ner/

3CoNLL-2003
CoNLL 2003是由新聞通訊社的文章以四種不同的語言(西班牙語、荷蘭語、英語和德語)創(chuàng)建的,重點(diǎn)關(guān)注4個(gè)實(shí)體:PER(人員),LOC(位置),ORG(組織)和MISC(其他,包括所有其他類型的實(shí)體) https://www.clips.uantwerpen.be/conll2003/ner/


42010 I2B2
2010 I2B2 NER任務(wù)考慮了臨床數(shù)據(jù),重點(diǎn)關(guān)注臨床問題、測(cè)試和治療實(shí)體類型
https://www.i2b2.org/NLP/Relations/

5DDIExtraction2013(Drug NER)
重點(diǎn)關(guān)注藥品、品牌、集團(tuán)和藥品n(未批準(zhǔn)或新藥)實(shí)體類型
https://www.cs.york.ac.uk/semeval-2013/task9/index.html

6CHEMPROT(Similar to 5)
相比5更側(cè)重于化學(xué)和藥物實(shí)體,例如縮寫、配方、家族、標(biāo)識(shí)符等
https://biocreative.bioinformatics.udel.edu/

7 microbiology NER datasets
從PubMed和生物學(xué)網(wǎng)站收集,并且主要關(guān)注細(xì)菌、棲息地和地理位置實(shí)體
http://2016.bionlp-st.org/tasks/bb2 (需要FQ訪問)

責(zé)任編輯:xj

原文標(biāo)題:一些NER的英文數(shù)據(jù)集

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1208

    瀏覽量

    24754
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    489

    瀏覽量

    22065

原文標(biāo)題:一些NER的英文數(shù)據(jù)集

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AN29-關(guān)于DC-DC轉(zhuǎn)換器的一些想法

    電子發(fā)燒友網(wǎng)站提供《AN29-關(guān)于DC-DC轉(zhuǎn)換器的一些想法.pdf》資料免費(fèi)下載
    發(fā)表于 01-08 13:57 ?0次下載
    AN29-關(guān)于DC-DC轉(zhuǎn)換器的<b class='flag-5'>一些</b>想法

    ads1232獲取的數(shù)據(jù)中經(jīng)常有一些比較大的值或者一些錯(cuò)誤值,這個(gè)是因?yàn)槭裁丛颍?/a>

    數(shù)據(jù)中經(jīng)常有一些比較大的值 或者一些錯(cuò)誤值,這個(gè)是因?yàn)槭裁丛?。最?位數(shù)據(jù)致在跳動(dòng),是不是我的基準(zhǔn)電壓不夠穩(wěn)定。 -----85b1-
    發(fā)表于 01-08 08:19

    數(shù)據(jù)手冊(cè)中的一些參數(shù)的數(shù)值有時(shí)畫條橫線或者空著不填是什么意思?

    數(shù)據(jù)手冊(cè)中的一些參數(shù)的數(shù)值有時(shí)畫條橫線或者空著不填是什么意思? 如上表, tCS的最大值是15ns,最小值和典型值都是空著的,是不是最小值和典型值我可以隨便?。ù笥?小于15就行)?還是說只有最大值給出了,我只能取給出的最
    發(fā)表于 12-16 07:45

    云原生和數(shù)據(jù)庫哪個(gè)好一些?

    云原生和數(shù)據(jù)庫哪個(gè)好一些?云原生和數(shù)據(jù)庫各有其獨(dú)特的優(yōu)勢(shì),適用于不同的場(chǎng)景。云原生強(qiáng)調(diào)高效資源利用、快速開發(fā)部署和高可伸縮性,適合需要高度靈活性和快速迭代的應(yīng)用。而數(shù)據(jù)庫則注重
    的頭像 發(fā)表于 11-29 10:07 ?187次閱讀

    ADS1284通過SPI讀取數(shù)據(jù),長(zhǎng)期采集的時(shí)候發(fā)現(xiàn)會(huì)小概率丟一些數(shù)據(jù),什么原因?

    你好,使用ADS1284,通過SPI讀取數(shù)據(jù),長(zhǎng)期采集的時(shí)候發(fā)現(xiàn)會(huì)小概率丟一些數(shù)據(jù),請(qǐng)問從哪些方面分析問題
    發(fā)表于 11-19 06:30

    一些常見的動(dòng)態(tài)電路

    無論是模電還是數(shù)電,理論知識(shí)相對(duì)來說還是比較枯燥,各種電路原理理解清楚不算容易,換種生動(dòng)形象的方式或許會(huì)增加一些趣味性,也更容易理解這些知識(shí)。下面整理了一些常見的電路,以動(dòng)態(tài)圖形的方式展示。 整流
    的頭像 發(fā)表于 11-16 09:26 ?425次閱讀
    <b class='flag-5'>一些</b>常見的動(dòng)態(tài)電路

    分享一些常見的電路

    理解模電和數(shù)電的電路原理對(duì)于初學(xué)者來說可能比較困難,但通過一些生動(dòng)的教學(xué)方法和資源,可以有效地提高學(xué)習(xí)興趣和理解能力。 下面整理了一些常見的電路,以動(dòng)態(tài)圖形的方式展示。 整流電路 單相橋式整流
    的頭像 發(fā)表于 11-13 09:28 ?372次閱讀
    分享<b class='flag-5'>一些</b>常見的電路

    LED驅(qū)動(dòng)器應(yīng)用的一些指南和技巧

    電子發(fā)燒友網(wǎng)站提供《LED驅(qū)動(dòng)器應(yīng)用的一些指南和技巧.pdf》資料免費(fèi)下載
    發(fā)表于 09-25 11:35 ?0次下載
    LED驅(qū)動(dòng)器應(yīng)用的<b class='flag-5'>一些</b>指南和技巧

    pycharm怎么訓(xùn)練數(shù)據(jù)

    安裝了PyCharm。接下來,你需要安裝一些用于數(shù)據(jù)處理和機(jī)器學(xué)習(xí)的庫。在PyCharm中,你可以通過以下步驟安裝庫: 打開PyCharm,創(chuàng)建個(gè)新的項(xiàng)目。 轉(zhuǎn)到“File” > “Settings
    的頭像 發(fā)表于 07-11 10:10 ?687次閱讀

    咨詢一些關(guān)于LED燈具的問題

    各位大佬,咨詢一些關(guān)于LED燈具的問題 120W的吸頂燈,用的非隔離式電源,用不到1年,燈具就會(huì)閃爍、頻閃或不亮,主要是什么原因造成的?是不是驅(qū)動(dòng)芯片太差?
    發(fā)表于 07-02 22:33

    細(xì)談SolidWorks教育版的一些基礎(chǔ)知識(shí)

    SolidWorks教育版是款廣泛應(yīng)用于工程設(shè)計(jì)和教育領(lǐng)域的三維建模軟件。它具備直觀易用的操作界面和強(qiáng)大的設(shè)計(jì)功能,為學(xué)生提供了個(gè)學(xué)習(xí)和實(shí)踐的平臺(tái)。在本文中,我們將詳細(xì)探討SolidWorks教育版的一些基礎(chǔ)知識(shí),幫助初學(xué)者
    的頭像 發(fā)表于 04-01 14:35 ?363次閱讀

    555成芯片有哪些缺點(diǎn)

    555成芯片盡管在電子應(yīng)用中具有許多優(yōu)點(diǎn),但也存在一些缺點(diǎn),這些缺點(diǎn)可能在一些特定的應(yīng)用場(chǎng)景中限制其使用。
    的頭像 發(fā)表于 03-26 14:53 ?1080次閱讀

    一些有關(guān)通信電路的資料?

    有關(guān)嵌入式之間DSP、ARM、FPGA三者之間和這三款芯片和外部電路之間通信的一些資料,比如說芯片之間的并行通信和芯片和外部電路之間的串行通信,MODBUS、DP、CAN等,一些一些常用的通信協(xié)議的
    發(fā)表于 03-03 18:53

    一些無功補(bǔ)償裝置SVG的資料

    一些SVG電路原理和功能碼相關(guān)的技術(shù)說明書,想了解一些SVG的工作原理和工作過程
    發(fā)表于 02-03 10:13

    自動(dòng)駕駛領(lǐng)域的數(shù)據(jù)匯總

    發(fā)自動(dòng)駕駛論文哪少的了數(shù)據(jù),今天筆者將為大家推薦篇最新的綜述,總結(jié)了200多個(gè)自動(dòng)駕駛領(lǐng)域的數(shù)據(jù),大家堆工作量的時(shí)候也可以找
    的頭像 發(fā)表于 01-19 10:48 ?1030次閱讀
    自動(dòng)駕駛領(lǐng)域的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集</b>匯總