亚洲人成无码WWW久久小尤奈,91麻豆国产精品,精品欧美成人高清在线观看

今天分享一個論文UniLM[1]，核心點是掌握三種LM任務(wù)形式：單向LM，雙向LM，序列到序列LM；

1. 生成任務(wù)

NLP任務(wù)大致可以分為NLU和NLG兩種；Bert在NLU任務(wù)上效果很好，但是天生不適合處理生成任務(wù)。

原因在于Bert的預(yù)訓(xùn)練過程是使用的MLM，和生成任務(wù)的目標(biāo)并不一致。

生成任務(wù)目標(biāo)是每次蹦出來一個詞，只能看到當(dāng)前位置之前的詞匯。

而Bert采用的是雙向的語言模型，除了mask的單詞，兩個方向的詞匯都可以被看到。

所以對Bert的一個改進思路就是讓它在具有NLU能力的時候，同時兼?zhèn)銷LG能力。

2. 三種LM任務(wù)

UniLM做的就是這樣一個事情。

具體的實現(xiàn)方式是設(shè)計了一系列的完形填空任務(wù)，這些完形填空任務(wù)的不同之處在于對上下文的定義。

從左到右的LM：使用mask單詞的左側(cè)單詞來預(yù)測被遮掩的單詞

從右到左的LM：和上面第一個相比就是方向的變化，使用mask單詞的右側(cè)單詞來預(yù)測遮掩的單詞

雙向LM：就是當(dāng)前mask的左右詞匯都可以看到

sequence-to-sequence LM：這個就是UniLM能夠具有生成能力的關(guān)鍵。我們的輸入是source句子和target句子，mask單詞在target上，那么當(dāng)前mask的上下文就是source句子的所有單詞和target句子中mask單詞左側(cè)的詞匯可以被看到

我們把從左到右LM和從右到左LM我們歸為一種任務(wù)叫單向LM；

有個點需要注意，三個任務(wù)是一起優(yōu)化的，具體來講是這樣做的：

在訓(xùn)練的時候，1/3的時候使用雙向LM，1/3的時候使用序列到序列 LM，1/6的時候使用從左到右的LM，1/6的時間使用從右到做的LM。

我們是使用不同的Mask矩陣來對應(yīng)不同任務(wù)輸入數(shù)據(jù)形式。

文中使用的是這樣一張圖來展示：

UniLM不同mask

3. 其他細(xì)枝末節(jié)

Gelu 激勵函數(shù)

24層TRM，最大長度512，1024Hidden Size，16Heads，340M參數(shù)量

初始化使用Bert Large

15%被mask，其中80%真正替換mask，10%隨機替換，10%不動。替換的時候，80% 的時候替換單個token，20%的時候替換bigram 或者 trigram

第四個步驟類似中文實體詞的mask，也算是一點改進。

有個細(xì)節(jié)點需要注意的是，作者強調(diào)，不同的segment embedding用來區(qū)分不同LM任務(wù)。

Bert的時候，區(qū)分上下句子，我們使用0和1，在這里，我們使用這個segment embedding用來區(qū)分任務(wù)：

比如說，雙向?qū)?yīng)0和1；單向left-right對應(yīng)2；單向right-left對應(yīng)3；序列對應(yīng)4和5；

4. 總結(jié)

掌握以下幾個細(xì)節(jié)點就可以：

聯(lián)合訓(xùn)練三種任務(wù)：單向LM，雙向LM，序列LM

使用不同的attention矩陣控制三種任務(wù)形式的參與

segment embedding可以區(qū)分不同的任務(wù)形式

mask的時候15% 的有被替換的概率，其中80% 被真正替換。在這80%真正替換的里面有80%單個token被替換，20%的二元或者三元tokens被替換

參考資料

[1]

Unified Language Model Pre-training for Natural Language Understanding and Generation: https://arxiv.org/pdf/1905.03197.pdf,

責(zé)任編輯：xj

原文標(biāo)題：如何讓BERT具有文本生成能力

文章出處：【微信公眾號：深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

自然語言

自然語言

+關(guān)注

關(guān)注
1

文章
291

瀏覽量
13387
nlp

nlp

+關(guān)注

關(guān)注
1

文章
489

瀏覽量
22086

原文標(biāo)題：如何讓BERT具有文本生成能力

文章出處：【微信號：zenRRan，微信公眾號：深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

LM73605/LM73606 EVM用戶指南

電子發(fā)燒友網(wǎng)站提供《LM73605/LM73606 EVM用戶指南.pdf》資料免費下載

發(fā)表于 01-03 15:33 ?0次下載

<b class='flag-5'>LM</b>73605/<b class='flag-5'>LM</b>73606 EVM用戶指南

LM74810評估模塊：LM74810EVM

電子發(fā)燒友網(wǎng)站提供《LM74810評估模塊：LM74810EVM.pdf》資料免費下載

發(fā)表于 11-29 16:28 ?0次下載

<b class='flag-5'>LM</b>74810評估模塊：<b class='flag-5'>LM</b>74810EVM

LM74800評估模塊：LM74800EVM-CD

電子發(fā)燒友網(wǎng)站提供《LM74800評估模塊：LM74800EVM-CD.pdf》資料免費下載

發(fā)表于 11-29 16:27 ?1次下載

<b class='flag-5'>LM</b>74800評估模塊：<b class='flag-5'>LM</b>74800EVM-CD

LM324和LM358器件應(yīng)用設(shè)計指南

電子發(fā)燒友網(wǎng)站提供《LM324和LM358器件應(yīng)用設(shè)計指南.pdf》資料免費下載

發(fā)表于 09-04 10:58 ?7次下載

<b class='flag-5'>LM</b>324和<b class='flag-5'>LM</b>358器件應(yīng)用設(shè)計指南

LM339能用LM324代替嗎

LM339簡介 LM339是一款四路比較器集成電路，由美國國家半導(dǎo)體公司（National Semiconductor）生產(chǎn)。它具有以下特點： 1.1. 四路比較器：LM339包含四個獨立的比較器

發(fā)表于 08-26 17:07 ?1594次閱讀

LM148、LM248和LM348運算放大器數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《LM148、LM248和LM348運算放大器數(shù)據(jù)表.pdf》資料免費下載

發(fā)表于 06-18 11:29 ?0次下載

<b class='flag-5'>LM</b>148、<b class='flag-5'>LM</b>248和<b class='flag-5'>LM</b>348運算放大器數(shù)據(jù)表

LM118-N/LM218-N/LM318-N運算放大器數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《LM118-N/LM218-N/LM318-N運算放大器數(shù)據(jù)表.pdf》資料免費下載

發(fā)表于 06-13 10:09 ?0次下載

<b class='flag-5'>LM</b>118-N/<b class='flag-5'>LM</b>218-N/<b class='flag-5'>LM</b>318-N運算放大器數(shù)據(jù)表

LM101A/LM201A/LM301A運算放大器數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《LM101A/LM201A/LM301A運算放大器數(shù)據(jù)表.pdf》資料免費下載

發(fā)表于 06-13 10:06 ?0次下載

<b class='flag-5'>LM</b>101A/<b class='flag-5'>LM</b>201A/<b class='flag-5'>LM</b>301A運算放大器數(shù)據(jù)表

LM118、LM218和LM318精密、快速運算放大器數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《LM118、LM218和LM318精密、快速運算放大器數(shù)據(jù)表.pdf》資料免費下載

發(fā)表于 06-12 10:47 ?0次下載

<b class='flag-5'>LM</b>118、<b class='flag-5'>LM</b>218和<b class='flag-5'>LM</b>318精密、快速運算放大器數(shù)據(jù)表

LM321LV、LM358LV、LM324LV運算放大器數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《LM321LV、LM358LV、LM324LV運算放大器數(shù)據(jù)表.pdf》資料免費下載

發(fā)表于 06-04 09:23 ?4次下載

<b class='flag-5'>LM</b>321LV、<b class='flag-5'>LM</b>358LV、<b class='flag-5'>LM</b>324LV運算放大器數(shù)據(jù)表

LM339、LM239、LM139、LM2901 四路差分比較器數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《LM339、LM239、LM139、LM2901 四路差分比較器數(shù)據(jù)表.pdf》資料免費下載

發(fā)表于 05-07 16:20 ?2次下載

有關(guān)LM3914N和LM3914N-1應(yīng)用的疑問

據(jù)手冊中，LM3914N-1的封裝形式按NS叫法為NA18A，LM3914N的封裝形式按NS叫法為N18A。僅此而已，在數(shù)據(jù)手冊中再無別的區(qū)別。三

發(fā)表于 04-28 11:36

1A降壓穩(wěn)壓器LM1575/LM2575/LM2575HV數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《1A降壓穩(wěn)壓器LM1575/LM2575/LM2575HV數(shù)據(jù)表.pdf》資料免費下載

發(fā)表于 03-28 13:50 ?1次下載

三電壓軌簡單電源序列發(fā)生器LM3880-Q1 數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《三電壓軌簡單電源序列發(fā)生器LM3880-Q1 數(shù)據(jù)表.pdf》資料免費下載

發(fā)表于 03-27 13:50 ?0次下載

三電壓軌簡單電源序列發(fā)生器LM3880數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《三電壓軌簡單電源序列發(fā)生器LM3880數(shù)據(jù)表.pdf》資料免費下載

發(fā)表于 03-26 13:45 ?0次下載

搜索歷史

三種LM任務(wù)形式：單向LM，雙向LM，序列到序列LM

評論