0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在Prompt Learning下引入外部知識(shí)達(dá)到好文本分類效果

深度學(xué)習(xí)自然語言處理 ? 來源:夕小瑤的賣萌屋 ? 作者:小偉 ? 2022-07-08 11:53 ? 次閱讀

背景

利用Prompt Learning(提示學(xué)習(xí))進(jìn)行文本分類任務(wù)是一種新興的利用預(yù)訓(xùn)練語言模型的方式。在提示學(xué)習(xí)中,我們需要一個(gè)標(biāo)簽詞映射(verbalizer),將[MASK]位置上對(duì)于詞表中詞匯的預(yù)測(cè)轉(zhuǎn)化成分類標(biāo)簽。例如{POLITICS: "politics", SPORTS: "sports"} 這個(gè)映射下,預(yù)訓(xùn)練模型在[MASK]位置對(duì)于politics/sports這個(gè)標(biāo)簽詞的預(yù)測(cè)分?jǐn)?shù)會(huì)被當(dāng)成是對(duì)POLITICS/SPORTS這個(gè)標(biāo)簽的預(yù)測(cè)分?jǐn)?shù)。

手工定義或自動(dòng)搜索得到的verbalizer有主觀性強(qiáng)覆蓋面小等缺點(diǎn),我們使用了知識(shí)庫(kù)來進(jìn)行標(biāo)簽詞的擴(kuò)展和改善,取得了更好的文本分類效果。同時(shí)也為如何在Prompt Learning下引入外部知識(shí)提供了參考。

方法

我們提出使用知識(shí)庫(kù)擴(kuò)展標(biāo)簽詞,通過例如相關(guān)詞詞表,情感詞典等工具,基于手工定義的初始標(biāo)簽詞進(jìn)行擴(kuò)展。例如,可以將{POLITICS: "politics", SPORTS: "sports"} 擴(kuò)展為以下的一些詞:

bd18025a-ed60-11ec-ba43-dac502259ad0.png

表1: 基于知識(shí)庫(kù)擴(kuò)展出的標(biāo)簽詞。

bd25f252-ed60-11ec-ba43-dac502259ad0.png

圖1: 以問題分類任務(wù)為例的KPT流程圖。

之后我們可以通過一個(gè)多對(duì)一映射將多個(gè)詞上的預(yù)測(cè)概率映射到某個(gè)標(biāo)簽上。

但是由于知識(shí)庫(kù)不是為預(yù)訓(xùn)練模型量身定做的,使用知識(shí)庫(kù)擴(kuò)展出的標(biāo)簽詞具有很大噪音。例如SPORTS擴(kuò)展出的movement可能和POLITICS相關(guān)性很大,從而引起混淆;又或者POLITICS擴(kuò)展出的machiavellian(為奪取權(quán)力而不擇手段的)則可能由于詞頻很低不容易被預(yù)測(cè)到,甚至被拆解成多個(gè)token而不具有詞語本身的意思。

因此我們提出了三種精調(diào)以及一種校準(zhǔn)的方法。

01

頻率精調(diào)

我們利用預(yù)訓(xùn)練模型M本身對(duì)于標(biāo)簽詞v的輸出概率當(dāng)成標(biāo)簽詞的先驗(yàn)概率,用來估計(jì)標(biāo)簽詞的先驗(yàn)出現(xiàn)頻率。我們把頻率較小的標(biāo)簽詞去掉。

bd379138-ed60-11ec-ba43-dac502259ad0.png

公式1: 頻率精調(diào)。C代表語料庫(kù)。

02

相關(guān)性精調(diào)

有的標(biāo)簽詞和標(biāo)簽相關(guān)性不大,有些標(biāo)簽詞會(huì)同時(shí)和不同標(biāo)簽發(fā)生混淆。我們利用TF-IDF的思想來賦予每個(gè)標(biāo)簽詞一個(gè)對(duì)于特定類別的重要性。

bd427238-ed60-11ec-ba43-dac502259ad0.png

公式2: 相關(guān)性精調(diào),r(v,y)是一個(gè)標(biāo)簽詞v和標(biāo)簽y的相關(guān)性,類似于TF項(xiàng)。右邊一項(xiàng)則類似IDF項(xiàng),我們要求這一項(xiàng)大也就是要求v和其非對(duì)應(yīng)類相關(guān)性小。

03

可學(xué)習(xí)精調(diào)

在少樣本實(shí)驗(yàn)中,我們可以為每個(gè)標(biāo)簽詞賦予一個(gè)可學(xué)習(xí)的權(quán)重,因此每個(gè)標(biāo)簽詞的重要性就變成:

bd4dc138-ed60-11ec-ba43-dac502259ad0.png

公式3:可學(xué)習(xí)的標(biāo)簽詞權(quán)重。

04

基于上下文的校準(zhǔn)

在零樣本實(shí)驗(yàn)中不同標(biāo)簽詞的先驗(yàn)概率可能差得很多,例如預(yù)測(cè) basketball可能天然比fencing大,會(huì)使得很多小眾標(biāo)簽詞影響甚微。我們使用校準(zhǔn)的方式來平衡這種影響。

bd5be0a6-ed60-11ec-ba43-dac502259ad0.png

公式4: 基于上下文的校準(zhǔn),分母是公式1中的先驗(yàn)概率。

使用上以上這些精調(diào)方法,我們知識(shí)庫(kù)擴(kuò)展的標(biāo)簽詞就能有效使用了。

實(shí)驗(yàn)

bd6714d0-ed60-11ec-ba43-dac502259ad0.png

表2:零樣本文本分類任務(wù)。

如表2所示,零樣本上相比于普通的Prompt模板,性能有15個(gè)點(diǎn)的大幅長(zhǎng)進(jìn)。相比于加上了標(biāo)簽詞精調(diào)的也最多能有8個(gè)點(diǎn)的提高。我們提出的頻率精調(diào),相關(guān)性精調(diào)等也各有用處。

bd73cfcc-ed60-11ec-ba43-dac502259ad0.png

表3:少樣本文本分類任務(wù)。

如表3所示,在少樣本上我們提出的可學(xué)習(xí)精調(diào)搭配上相關(guān)性精調(diào)也有較大提升。AUTO和SOFT都是自動(dòng)的標(biāo)簽詞優(yōu)化方法,其中SOFT以人工定義的標(biāo)簽詞做初始化,可以看到這兩種方法的效果都不如KPT。

bd83242c-ed60-11ec-ba43-dac502259ad0.png

圖2: SPORTS和BUSINESS類的知識(shí)庫(kù)擴(kuò)展的標(biāo)簽詞對(duì)于預(yù)測(cè)的貢獻(xiàn)。

標(biāo)簽詞的可視化表明,每一條句子可能會(huì)依賴不同的標(biāo)簽詞進(jìn)行預(yù)測(cè),完成了我們?cè)黾痈采w面的預(yù)期。

總結(jié)

最近比較受關(guān)注的Prompt Learning方向,除了template的設(shè)計(jì),verbalizer的設(shè)計(jì)也是彌補(bǔ)MLM和下游分類任務(wù)的重要環(huán)節(jié)。我們提出的基于知識(shí)庫(kù)的擴(kuò)展,直觀有效。同時(shí)也為如何在預(yù)訓(xùn)練模型的的利用中引入外部知識(shí)提供了一些參考。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 頻率
    +關(guān)注

    關(guān)注

    4

    文章

    1513

    瀏覽量

    59268
  • 知識(shí)庫(kù)
    +關(guān)注

    關(guān)注

    0

    文章

    10

    瀏覽量

    6726

原文標(biāo)題:ACL2022 | KPT: 文本分類中融入知識(shí)的Prompt Verbalizer

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    如何使用自然語言處理分析文本數(shù)據(jù)

    媒體、新聞報(bào)道、用戶評(píng)論等)收集你感興趣的文本數(shù)據(jù)。 數(shù)據(jù)清洗 :去除無關(guān)字符(如HTML標(biāo)簽、特殊符號(hào)等),確保文本數(shù)據(jù)干凈且一致。 2. 預(yù)處理 分詞 :將文本分割成有意義的單元(單詞、短語或句子),這取決于使用的語言和分析
    的頭像 發(fā)表于 12-05 15:27 ?305次閱讀

    何在文本字段中使用上標(biāo)、下標(biāo)及變量

    在KiCad的任何文本字段中,都可以通過以下的方式實(shí)現(xiàn)上標(biāo)、下標(biāo)、上劃線以及顯示變量及字段值的描述: 文本變量“文本變量”可以在 原理圖設(shè)置->工程->文本變量 中設(shè)置。下圖中設(shè)置了一
    的頭像 發(fā)表于 11-12 12:23 ?131次閱讀
    如<b class='flag-5'>何在</b><b class='flag-5'>文本</b>字段中使用上標(biāo)、下標(biāo)及變量

    AI對(duì)話魔法 Prompt Engineering 探索指南

    作者:京東物流 李雪婷 一、什么是 Prompt Engineering? 想象一,你在和一個(gè)智能助手聊天,你需要說出非常清晰和具體的要求,才能得到你想要的答案。Prompt
    的頭像 發(fā)表于 11-07 10:11 ?832次閱讀
    AI對(duì)話魔法 <b class='flag-5'>Prompt</b> Engineering 探索指南

    RK3588 技術(shù)分享 | 在Android系統(tǒng)中使用NPU實(shí)現(xiàn)Yolov5分類檢測(cè)

    : NPU幫助機(jī)器完成更高效的翻譯、文本分類和情感分析,推動(dòng)了自然語言處理技術(shù)的發(fā)展。 實(shí)例分享:Yolov5分類檢測(cè) 在RK3588處理器上,不僅可以基于Linux系統(tǒng)使用NPU,也可以
    發(fā)表于 10-24 10:13

    何在TMS320C6727 DSP上創(chuàng)建基于延遲的音頻效果

    電子發(fā)燒友網(wǎng)站提供《如何在TMS320C6727 DSP上創(chuàng)建基于延遲的音頻效果.pdf》資料免費(fèi)下載
    發(fā)表于 10-16 10:35 ?0次下載
    如<b class='flag-5'>何在</b>TMS320C6727 DSP上創(chuàng)建基于延遲的音頻<b class='flag-5'>效果</b>

    雷達(dá)的基本分類方法

    電子發(fā)燒友網(wǎng)站提供《雷達(dá)的基本分類方法.pdf》資料免費(fèi)下載
    發(fā)表于 09-11 09:09 ?6次下載

    RK3588 技術(shù)分享 | 在Android系統(tǒng)中使用NPU實(shí)現(xiàn)Yolov5分類檢測(cè)

    : NPU幫助機(jī)器完成更高效的翻譯、文本分類和情感分析,推動(dòng)了自然語言處理技術(shù)的發(fā)展。 實(shí)例分享:Yolov5分類檢測(cè) 在RK3588處理器上,不僅可以基于Linux系統(tǒng)使用NPU,也可以
    發(fā)表于 08-20 11:13

    利用TensorFlow實(shí)現(xiàn)基于深度神經(jīng)網(wǎng)絡(luò)的文本分類模型

    要利用TensorFlow實(shí)現(xiàn)一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)(DNN)的文本分類模型,我們首先需要明確幾個(gè)關(guān)鍵步驟:數(shù)據(jù)預(yù)處理、模型構(gòu)建、模型訓(xùn)練、模型評(píng)估與調(diào)優(yōu),以及最終的模型部署(盡管在本文中,我們將重點(diǎn)放在前四個(gè)步驟上)。下面,我將詳細(xì)闡述這些步驟,并給出一個(gè)具體的示例。
    的頭像 發(fā)表于 07-12 16:39 ?901次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)在文本分類領(lǐng)域的應(yīng)用

    顯著成就后,也逐漸被引入文本分類任務(wù)中。卷積神經(jīng)網(wǎng)絡(luò)通過模擬人類視覺系統(tǒng)的信息處理方式,能夠有效地提取文本中的局部特征,進(jìn)而實(shí)現(xiàn)高精度的文本分類。本文將對(duì)卷積神經(jīng)網(wǎng)絡(luò)在
    的頭像 發(fā)表于 07-01 16:25 ?750次閱讀

    何在idf工程中引入mdf WiFi-Mesh函數(shù)?

    我原先在idf開發(fā)好的程序,如何引入mdf進(jìn)行開發(fā)?需要用到WiFi-Mesh,看了mdf的例程是比較合適的,而idf的wifi-m
    發(fā)表于 06-28 14:59

    交換機(jī)的基本分類

      交換機(jī)作為網(wǎng)絡(luò)通訊中的核心設(shè)備之一,其在網(wǎng)絡(luò)架構(gòu)中起著至關(guān)重要的作用。隨著信息技術(shù)的飛速發(fā)展,交換機(jī)也在不斷演進(jìn)和革新,以滿足日益復(fù)雜的網(wǎng)絡(luò)需求。本文將對(duì)交換機(jī)的分類及其特點(diǎn)進(jìn)行詳細(xì)介紹,以期為讀者提供清晰、深入的理解。
    的頭像 發(fā)表于 06-06 11:06 ?2139次閱讀

    有誰知道如何在熱敏打印機(jī)中實(shí)現(xiàn)圖片的灰階打印效果嗎?

    有誰知道如何在熱敏打印機(jī)中實(shí)現(xiàn)圖片的灰階打印效果。 現(xiàn)在基本上文字打印,圖片打印功能都已開發(fā)結(jié)束,圖片打印現(xiàn)在用的是點(diǎn)陣打印的方法。想增加灰階打印的效果。 有哪個(gè)大神做過相關(guān)方面開發(fā),知道如何實(shí)現(xiàn)的嗎? 高價(jià)有償求指導(dǎo)?。?!
    發(fā)表于 04-24 15:43

    了解如何使用PyTorch構(gòu)建圖神經(jīng)網(wǎng)絡(luò)

    圖神經(jīng)網(wǎng)絡(luò)直接應(yīng)用于圖數(shù)據(jù)集,您可以訓(xùn)練它們以預(yù)測(cè)節(jié)點(diǎn)、邊緣和與圖相關(guān)的任務(wù)。它用于圖和節(jié)點(diǎn)分類、鏈路預(yù)測(cè)、圖聚類和生成,以及圖像和文本分類。
    發(fā)表于 02-21 12:19 ?798次閱讀
    了解如何使用PyTorch構(gòu)建圖神經(jīng)網(wǎng)絡(luò)

    何在VDAC上使用外部頻閃功能?

    何在 VDAC 上使用外部頻閃功能? 它使用上升邊緣嗎? 我看不到具體說明。
    發(fā)表于 01-30 08:12

    如何從訓(xùn)練集中生成候選prompt 三種生成候選prompt的方式

    預(yù)測(cè)正確的),讓LLM給出當(dāng)前prompt預(yù)測(cè)錯(cuò)誤的原因,這一原因即文本形式的“gradient”。使用的還是LLM!
    的頭像 發(fā)表于 01-12 11:29 ?1090次閱讀
    如何從訓(xùn)練集中生成候選<b class='flag-5'>prompt</b> 三種生成候選<b class='flag-5'>prompt</b>的方式