0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

哈工大訊飛聯(lián)合實(shí)驗(yàn)室發(fā)布的中文ELECTRA系列預(yù)訓(xùn)練模型再迎新成員

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 作者:哈工大訊飛聯(lián)合實(shí) ? 2020-12-26 09:49 ? 次閱讀

哈工大訊飛聯(lián)合實(shí)驗(yàn)室發(fā)布的中文ELECTRA系列預(yù)訓(xùn)練模型再迎新成員。我們基于大規(guī)模法律文本訓(xùn)練出中文法律領(lǐng)域ELECTRA系列模型,并且在法律領(lǐng)域自然語(yǔ)言處理任務(wù)中獲得了顯著性能提升。歡迎各位讀者下載試用相關(guān)模型。

項(xiàng)目地址:http://electra.hfl-rc.com

中文法律領(lǐng)域ELECTRA

我們?cè)?0G版(原版)中文ELECTRA的基礎(chǔ)上加入了高質(zhì)量2000萬(wàn)裁判文書(shū)數(shù)據(jù)進(jìn)行了二次預(yù)訓(xùn)練,在不丟失大規(guī)模通用數(shù)據(jù)上學(xué)習(xí)到的語(yǔ)義信息,同時(shí)使模型對(duì)法律文本更加適配。本次發(fā)布以下三個(gè)模型:

legal-ELECTRA-large, Chinese:24-layer,1024-hidden, 16-heads, 324M parameters

legal-ELECTRA-base, Chinese:12-layer,768-hidden, 12-heads, 102M parameters

legal-ELECTRA-small, Chinese: 12-layer, 256-hidden, 4-heads, 12M parameters

快速加載

哈工大訊飛聯(lián)合實(shí)驗(yàn)室發(fā)布的所有中文預(yù)訓(xùn)練語(yǔ)言模型均可通過(guò)huggingface transformers庫(kù)進(jìn)行快速加載訪問(wèn),請(qǐng)登錄我們的共享頁(yè)面獲取更多信息。

https://huggingface.co/HFL

模型鍵值如下:

hfl/chinese-legal-electra-large-discriminator

hfl/chinese-legal-electra-large-generator

hfl/chinese-legal-electra-base-discriminator

hfl/chinese-legal-electra-base-generator

hfl/chinese-legal-electra-small-discriminator

hfl/chinese-legal-electra-small-generator

效果評(píng)測(cè)

我們?cè)谧锩A(yù)測(cè)以及要素抽取任務(wù)上進(jìn)行了基線測(cè)試。其中罪名預(yù)測(cè)任務(wù)使用的是CAIL 2018數(shù)據(jù),要素抽取任務(wù)為in-house實(shí)際應(yīng)用。可以看到本次發(fā)布的法律領(lǐng)域ELECTRA模型均相比通用ELECTRA模型獲得了顯著性能提升。

表1罪名預(yù)測(cè)任務(wù)

e4007c02-4691-11eb-8b86-12bb97331649.png

表2要素抽取任務(wù)

e46fa672-4691-11eb-8b86-12bb97331649.png

其他相關(guān)資源

TextBrewer知識(shí)蒸餾工具

http://textbrewer.hfl-rc.com

中文BERT、RoBERTa、RBT系列模型

http://bert.hfl-rc.com

中文XLNet系列模型

http://xlnet.hfl-rc.com

中文MacBERT模型

http://macbert.hfl-rc.com

責(zé)任編輯:xj

原文標(biāo)題:哈工大訊飛聯(lián)合實(shí)驗(yàn)室發(fā)布法律領(lǐng)域ELECTRA預(yù)訓(xùn)練模型

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4623

    瀏覽量

    93105
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5510

    瀏覽量

    121338
  • 訓(xùn)練模型
    +關(guān)注

    關(guān)注

    1

    文章

    36

    瀏覽量

    3873

原文標(biāo)題:哈工大訊飛聯(lián)合實(shí)驗(yàn)室發(fā)布法律領(lǐng)域ELECTRA預(yù)訓(xùn)練模型

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    科大即將發(fā)布星火深度推理模型X1

    近日,科大飛在1月7日成功舉辦的辦公智能體產(chǎn)品升級(jí)發(fā)布會(huì)上,宣布了一項(xiàng)令人振奮的新進(jìn)展。據(jù)科大官方透露,公司將于1月15日正式對(duì)外發(fā)布
    的頭像 發(fā)表于 01-08 10:30 ?276次閱讀

    阿里云與零一萬(wàn)物戰(zhàn)略合作,成立產(chǎn)業(yè)大模型聯(lián)合實(shí)驗(yàn)室

    近日,阿里云與業(yè)界領(lǐng)先的大模型企業(yè)零一萬(wàn)物宣布達(dá)成模型平臺(tái)業(yè)務(wù)的戰(zhàn)略合作。此次合作的核心內(nèi)容是雙方將共同成立“產(chǎn)業(yè)大模型聯(lián)合實(shí)驗(yàn)室”,旨在加
    的頭像 發(fā)表于 01-03 11:12 ?214次閱讀

    小米與聚光電成立聯(lián)合實(shí)驗(yàn)室

    近日,“小米&聚聯(lián)合實(shí)驗(yàn)室”在惠州聚正式揭牌成立。該實(shí)驗(yàn)室將以Mini背光技術(shù)創(chuàng)新為主要方向,進(jìn)一步強(qiáng)化雙方在顯示終端領(lǐng)域的多元化合作。
    的頭像 發(fā)表于 11-27 10:45 ?215次閱讀

    科大發(fā)布星火4.0 Turbo大模型及星火多語(yǔ)言大模型

    ,科大以其一貫的創(chuàng)新精神,開(kāi)創(chuàng)性地發(fā)布了星火多語(yǔ)言大模型。這一創(chuàng)新之舉不僅進(jìn)一步鞏固了科大飛在中文
    的頭像 發(fā)表于 10-24 13:58 ?417次閱讀

    華工科技聯(lián)合哈工大實(shí)現(xiàn)國(guó)內(nèi)首臺(tái)激光智能除草機(jī)器人落地

    華工科技黨委書(shū)記、董事長(zhǎng)、總裁馬新強(qiáng)一行赴哈爾濱對(duì)哈爾濱工業(yè)大學(xué)機(jī)器人技術(shù)與系統(tǒng)全國(guó)重點(diǎn)實(shí)驗(yàn)室(后簡(jiǎn)稱哈工大機(jī)器人實(shí)驗(yàn)室)、愛(ài)輝區(qū)智能激光除草機(jī)器人試點(diǎn)基地進(jìn)行實(shí)地調(diào)研,代表華工科技中央研究院同
    的頭像 發(fā)表于 09-06 10:45 ?845次閱讀

    榮耀與智譜攜手共建AI大模型聯(lián)合實(shí)驗(yàn)室

    近日,榮耀終端有限公司與北京智譜華章科技有限公司正式攜手,共同宣布成立AI大模型技術(shù)聯(lián)合實(shí)驗(yàn)室,并簽署了戰(zhàn)略合作協(xié)議。此次合作標(biāo)志著雙方在人工智能領(lǐng)域的深度合作邁入新階段,共同致力于為用戶帶來(lái)前所未有的智能體驗(yàn)。
    的頭像 發(fā)表于 09-03 18:15 ?1062次閱讀

    高鴻信安出席飛騰基礎(chǔ)軟件聯(lián)合實(shí)驗(yàn)室第三屆年會(huì)

    7月12日,飛騰基礎(chǔ)軟件聯(lián)合實(shí)驗(yàn)室(簡(jiǎn)稱“實(shí)驗(yàn)室”)第三屆年會(huì)暨技術(shù)交流分享會(huì)在深圳順利召開(kāi)。大唐高鴻信安(浙江)信息科技有限公司(簡(jiǎn)稱“高鴻信安”)作為實(shí)驗(yàn)室
    的頭像 發(fā)表于 07-15 14:07 ?582次閱讀

    【大語(yǔ)言模型:原理與工程實(shí)踐】大語(yǔ)言模型預(yù)訓(xùn)練

    大語(yǔ)言模型的核心特點(diǎn)在于其龐大的參數(shù)量,這賦予了模型強(qiáng)大的學(xué)習(xí)容量,使其無(wú)需依賴微調(diào)即可適應(yīng)各種下游任務(wù),而更傾向于培養(yǎng)通用的處理能力。然而,隨著學(xué)習(xí)容量的增加,對(duì)預(yù)訓(xùn)練數(shù)據(jù)的需求也相
    發(fā)表于 05-07 17:10

    西井科技和香港理工大學(xué)簽署合作協(xié)議,將共建聯(lián)合創(chuàng)新實(shí)驗(yàn)室

    西井科技和香港理工大學(xué)簽署了人工智能和自動(dòng)駕駛方面的深度產(chǎn)學(xué)研合作協(xié)議,將共建聯(lián)合創(chuàng)新實(shí)驗(yàn)室,雙方共同探索該領(lǐng)域的前沿技術(shù)和應(yīng)用實(shí)踐。
    的頭像 發(fā)表于 04-29 09:42 ?595次閱讀
    西井科技和香港理<b class='flag-5'>工大</b>學(xué)簽署合作協(xié)議,將共建<b class='flag-5'>聯(lián)合</b>創(chuàng)新<b class='flag-5'>實(shí)驗(yàn)室</b>

    谷歌模型訓(xùn)練軟件有哪些功能和作用

    谷歌模型訓(xùn)練軟件主要是指ELECTRA,這是一種新的預(yù)訓(xùn)練方法,源自谷歌AI。ELECTRA不僅
    的頭像 發(fā)表于 02-29 17:37 ?828次閱讀

    科大發(fā)布星火V3.5”:基于全國(guó)產(chǎn)算力訓(xùn)練的全民開(kāi)放大模型

    科大,作為中國(guó)領(lǐng)先的智能語(yǔ)音和人工智能公司,近日宣布推出首個(gè)基于全國(guó)產(chǎn)算力訓(xùn)練的全民開(kāi)放大模型
    的頭像 發(fā)表于 02-04 11:28 ?1542次閱讀

    上海AI實(shí)驗(yàn)室發(fā)布新一代書(shū)生·視覺(jué)大模型

    近日,上海人工智能實(shí)驗(yàn)室(上海AI實(shí)驗(yàn)室)聯(lián)手多所知名高校及科技公司共同研發(fā)出新一代書(shū)生·視覺(jué)大模型(InternVL)。
    的頭像 發(fā)表于 02-04 11:25 ?1145次閱讀

    科大星火認(rèn)知大模型V3.5發(fā)布

    近日,科大舉辦了星火認(rèn)知大模型V3.5升級(jí)發(fā)布會(huì)。在發(fā)布會(huì)上,科大
    的頭像 發(fā)表于 01-31 17:28 ?1445次閱讀

    科大發(fā)布星火認(rèn)知大模型V3.5

    科大近日發(fā)布了星火認(rèn)知大模型V3.5版本,該版本基于全國(guó)產(chǎn)化算力底座“星一號(hào)”平臺(tái)進(jìn)行訓(xùn)練
    的頭像 發(fā)表于 01-31 14:40 ?930次閱讀

    模型星火V3.5,1月30日正式發(fā)布

    2024年1月30日14:00星火升級(jí);這一次首個(gè)基于全國(guó)產(chǎn)化算力平臺(tái)訓(xùn)練的全民開(kāi)放大模型
    的頭像 發(fā)表于 01-23 09:06 ?836次閱讀