一级毛片高清大全免费观看,久久一区人妻视频,国产性夜夜春夜夜爽三级

研究動(dòng)機(jī)

多標(biāo)簽文本分類(lèi)（multi-label text classification, 簡(jiǎn)稱(chēng)MLTC）的目的是在給定文本后要求模型預(yù)測(cè)其多個(gè)非互斥的相關(guān)標(biāo)簽。該任務(wù)在許多自然語(yǔ)言處理任務(wù)上都有體現(xiàn)。如在表1中，需要給該文檔打上標(biāo)簽：basketball、NBA、sport。

表1多標(biāo)簽文本分類(lèi)的例子

文本	This article is about a game between Houston Rockets and Los Angeles Lakers.
相關(guān)標(biāo)簽	basketball, NBA, sport
不相關(guān)標(biāo)簽	football

一種處理MLTC的簡(jiǎn)單方法是將其轉(zhuǎn)換為多個(gè)獨(dú)立的二分類(lèi)問(wèn)題。該方法被稱(chēng)為BinaryRelevance (BR)，由于其簡(jiǎn)單性而被大規(guī)模使用。但該方法的弊端也十分明顯，即該方法完全忽略了標(biāo)簽之間的相關(guān)信息。直覺(jué)上，知道一些標(biāo)簽——如上例中的basketball及NBA——會(huì)使得預(yù)測(cè)其他標(biāo)簽（如sport）更加簡(jiǎn)單。研究者指出對(duì)于多標(biāo)簽分類(lèi)任務(wù)而言，有效利用標(biāo)簽之間的相關(guān)性是有益的、甚至是必要的。為此，涌現(xiàn)出許多利用標(biāo)簽關(guān)系的算法，其中最知名的就是算法Classifier Chains（CC）。該算法將多個(gè)二分類(lèi)器串聯(lián)起來(lái)，其中每個(gè)分類(lèi)器使用之前分類(lèi)器的預(yù)測(cè)結(jié)果作為額外的輸入。該方法將潛在的標(biāo)簽依賴(lài)納入考慮，但該問(wèn)題的最大缺陷在于不同的標(biāo)簽順序會(huì)產(chǎn)生天壤之別的性能。同時(shí)，CC算法的鏈?zhǔn)浇Y(jié)構(gòu)使得算法無(wú)法并行，在處理大規(guī)模數(shù)據(jù)集時(shí)效率低下。

近年來(lái)，也有學(xué)者將標(biāo)簽集合視作標(biāo)簽序列，并使用基于神經(jīng)網(wǎng)絡(luò)的端到端模型（seq2seq）來(lái)處理該任務(wù)。相較于CC預(yù)測(cè)所有標(biāo)簽，這類(lèi)seq2seq的模型只預(yù)測(cè)相關(guān)標(biāo)簽。因此該類(lèi)模型的決策鏈條長(zhǎng)度更短，性能更優(yōu)。但這類(lèi)模型的性能強(qiáng)烈依賴(lài)于標(biāo)簽的順序。在多標(biāo)簽數(shù)據(jù)集中，標(biāo)簽本質(zhì)上是無(wú)序的集合，未必可以線性排列。學(xué)者們指出不同的標(biāo)簽順序?qū)τ趯W(xué)習(xí)和預(yù)測(cè)有著重大影響。舉例來(lái)說(shuō)，對(duì)于表1中的例子，如果標(biāo)簽序列以sport開(kāi)始，則對(duì)于預(yù)測(cè)其他相關(guān)標(biāo)簽的幫助不大。

—

解決方案

為了處理上述問(wèn)題，我們提出了Multi-Label Reasoner（ML-Reasoner），一個(gè)基于推理機(jī)制的算法。ML-Reasoner的框架如圖1所示，我們?yōu)槊恳粋€(gè)標(biāo)簽分配一個(gè)二分類(lèi)器，它們同時(shí)預(yù)測(cè)所有標(biāo)簽以滿(mǎn)足標(biāo)簽的無(wú)序性質(zhì)。這樣的話，ML-Reasoner可以同時(shí)計(jì)算每一個(gè)標(biāo)簽相關(guān)的概率。例如在處理上例時(shí)，ML-Reasoner可能認(rèn)為標(biāo)簽NBA相關(guān)的概率為0.9，basketball的為0.7，sport為0.55，football為0.3.這樣，ML-Reasoner就完全避免依賴(lài)標(biāo)簽順序。同時(shí)為了有效利用標(biāo)簽的相關(guān)性，我們?cè)O(shè)置了一種新穎的迭代推理機(jī)制，即將上一輪對(duì)所有標(biāo)簽相關(guān)的預(yù)測(cè)作為下一次迭代的額外特征輸入。這種方法使得ML-Reasoner可以在每一輪的迭代中完善預(yù)測(cè)結(jié)果。舉例來(lái)說(shuō)，考慮到標(biāo)簽NBA與basketball相關(guān)的概率較高，模型可以在后續(xù)迭代中，將標(biāo)簽sport的概率調(diào)高。

圖1 Multi-Label Reasoner整體框架圖

具體到Reasoner的實(shí)現(xiàn)，我們將其劃分為五個(gè)組件，其相關(guān)交互關(guān)系見(jiàn)圖2。

圖2多標(biāo)簽文本分類(lèi)的Reasoner模塊

- Text Encoder將詞語(yǔ)序列轉(zhuǎn)換為稠密的向量表示，主要負(fù)責(zé)抽取文本特征；

- Label Encoder將上一輪次所有標(biāo)簽的相關(guān)概率轉(zhuǎn)換為相應(yīng)的標(biāo)簽表示；

- Attention模塊負(fù)責(zé)計(jì)算文本與不同標(biāo)簽之間的相關(guān)性；

- Combiner則將文本的原始特征與標(biāo)簽特征進(jìn)行整合；

- 具有相同結(jié)構(gòu)但不同參數(shù)的Classifier則預(yù)測(cè)各個(gè)標(biāo)簽的相關(guān)性。

至于損失函數(shù)，我們選擇了Binary Cross Entropy (BCE)。更具體的設(shè)置請(qǐng)參見(jiàn)原文。

—

實(shí)驗(yàn)

我們?cè)趦蓚€(gè)常用的多標(biāo)簽文本分類(lèi)數(shù)據(jù)集Arxiv Ac admeic Paper Dataset（AAPD）及Reuters Corpus Volum I （RCV1-V2）上進(jìn)行了實(shí)驗(yàn)。AAPD數(shù)據(jù)量更少、標(biāo)簽密度更大，分類(lèi)難度更大。評(píng)價(jià)指標(biāo)則選用了hamming loss，micro-precision，micro-recall及micro-F1；其中hamming loss越低越好，其他則越高越好。至于基準(zhǔn)模型，我們選用了經(jīng)典模型如BR、CC、LP，也有性能優(yōu)越的seq2seq模型如CNN-RNN、SGM，還有其他一些表現(xiàn)卓越的多標(biāo)簽文本分類(lèi)模型如LSAN，之外也將seq2set納入進(jìn)來(lái)作為比較。seq2set使用強(qiáng)化學(xué)習(xí)算法來(lái)緩解seq2seq模型對(duì)于標(biāo)簽順序的依賴(lài)程度。同時(shí)，為了驗(yàn)證ML-Reasoner在不同文本編碼器上能帶來(lái)的性能提升，我們分別使用了CNN、LSTM及BERT作為ML-Reasoner框架中的Text Encoder模塊。實(shí)驗(yàn)結(jié)果如表2所示。

表2 ML-Reasoner及基準(zhǔn)模型在兩個(gè)數(shù)據(jù)集上的性能

從表中可以看出，ML-Reasoner在兩個(gè)數(shù)據(jù)集上均達(dá)到了SOTA水準(zhǔn)，且在三種不同文本編碼器上都能帶來(lái)顯著提升。

為了驗(yàn)證ML-Reasoner可以完全避免對(duì)標(biāo)簽順序的依賴(lài)，我們隨機(jī)打亂AAPD數(shù)據(jù)集的標(biāo)簽順序，并進(jìn)行了測(cè)試；各個(gè)模型的性能如表3所示。從表中可以看到，CC及seq2seq模型的性能受標(biāo)簽順序的劇烈影響；seq2set可以顯著緩解seq2seq的問(wèn)題；而ML-Reasoner則完全不受標(biāo)簽順序的影響。

表3各模型在標(biāo)簽打亂的AAPD數(shù)據(jù)集上的性能

我們也通過(guò)燒蝕實(shí)驗(yàn)（見(jiàn)圖3），確定了推理機(jī)制確實(shí)是性能提升的關(guān)鍵。

圖3 ML-Reasoner（T=1,2,5）及CNN-Round（T=1,2,5）在AAPD測(cè)試集上的性能雷達(dá)圖

我們也探究了迭代次數(shù)對(duì)模型性能的影響，由圖4可知，進(jìn)行了一次推理就可以帶來(lái)顯著提升；而推理次數(shù)的再次提高并不能帶來(lái)更多的提升。這可能是因?yàn)槟Ｐ图皵?shù)據(jù)集的選擇導(dǎo)致的。

圖4不同迭代輪數(shù)下的ML-Reasoner在AAPD測(cè)試集上的性能雷達(dá)圖

為了進(jìn)一步理解Reasoner發(fā)揮作用的機(jī)制，我們從數(shù)據(jù)集中選取了一些典型示例（見(jiàn)表4）。在第一個(gè)例子中，模型通過(guò)推理將相關(guān)標(biāo)簽math.OC添上；模型處理第二個(gè)例子時(shí)，則將無(wú)關(guān)標(biāo)簽cs.LO剔除；有時(shí)添加與刪除的動(dòng)作也會(huì)同時(shí)發(fā)生（見(jiàn)第三個(gè)例子）。當(dāng)然，推理偶爾也會(huì)使預(yù)測(cè)結(jié)果變差（見(jiàn)第四、第五個(gè)例子）。

表4 AAPD測(cè)試集中一些由于推理機(jī)制預(yù)測(cè)結(jié)果出現(xiàn)變化的實(shí)例

為了驗(yàn)證上述例子的變化確實(shí)是因?yàn)榭紤]了標(biāo)簽之間的相關(guān)性，我們進(jìn)一步統(tǒng)計(jì)模型在添加或刪除某個(gè)標(biāo)簽時(shí)與其他標(biāo)簽的共現(xiàn)頻率。從圖5中，可以觀察到模型往往在添加某個(gè)標(biāo)簽時(shí)，其共現(xiàn)頻率（第二行）與真實(shí)共現(xiàn)頻率接近（第一行）；而刪除某個(gè)標(biāo)簽時(shí)，其共現(xiàn)頻率（第三行）與真實(shí)共現(xiàn)頻率（第一行）則相差較遠(yuǎn)。

圖5 AAPD標(biāo)簽的共現(xiàn)頻率圖

—

結(jié)論

在本文中，我們提出了算法ML-Reasoner。該算法可以同時(shí)預(yù)測(cè)所有標(biāo)簽進(jìn)而避免了對(duì)標(biāo)簽順序的依賴(lài)；之外，他通過(guò)新穎的推理機(jī)制利用了標(biāo)簽之間的高階關(guān)系。實(shí)驗(yàn)結(jié)果表明了ML-Reasoner在捕獲標(biāo)簽依賴(lài)之間的有效性；進(jìn)一步的分析驗(yàn)證了其確實(shí)未對(duì)標(biāo)簽順序產(chǎn)生依賴(lài)。一些經(jīng)驗(yàn)性試驗(yàn)也揭示了該算法發(fā)揮作用的機(jī)制。由于ML-Reasoner未顯式利用標(biāo)簽之間的關(guān)系，如層次結(jié)構(gòu)等，如何將這些信息納入考慮是值得進(jìn)一步探索的。

原文標(biāo)題：【IPM2020】一種處理多標(biāo)簽文本分類(lèi)的新穎推理機(jī)制

文章出處：【微信公眾號(hào)：深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯：haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1792

文章
47425

瀏覽量
238960
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8425

瀏覽量
132770
nlp

nlp

+關(guān)注

關(guān)注
1

文章
489

瀏覽量
22057

原文標(biāo)題：【IPM2020】一種處理多標(biāo)簽文本分類(lèi)的新穎推理機(jī)制

文章出處：【微信號(hào)：zenRRan，微信公眾號(hào)：深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

單日獲客成本超20萬(wàn)，國(guó)產(chǎn)大模型開(kāi)卷200萬(wàn)字以上的長(zhǎng)文本處理

更精準(zhǔn)的推理和高并發(fā)流量以外，似乎已經(jīng)沒(méi)有太多值得廠商大肆宣傳的特性了，直到最近超長(zhǎng)文本處理的爆火。 ? 國(guó)產(chǎn)大模型的新卷法，長(zhǎng)文本處理 ? 當(dāng)下將大模型長(zhǎng)文本處理炒熱的，無(wú)疑是來(lái)自月

發(fā)表于 03-27 00:53 ?3401次閱讀

單日獲客成本超20萬(wàn)，國(guó)產(chǎn)大模型開(kāi)卷200萬(wàn)字以上的長(zhǎng)<b class='flag-5'>文本處理</b>

如何使用自然語(yǔ)言處理分析文本數(shù)據(jù)

媒體、新聞報(bào)道、用戶(hù)評(píng)論等）收集你感興趣的文本數(shù)據(jù)。數(shù)據(jù)清洗：去除無(wú)關(guān)字符（如HTML標(biāo)簽、特殊符號(hào)等），確保文本數(shù)據(jù)干凈且一致。 2. 預(yù)處理

發(fā)表于 12-05 15:27 ?305次閱讀

BitEnergy AI公司開(kāi)發(fā)出一種新AI處理方法

BitEnergy AI公司，一家專(zhuān)注于人工智能（AI）推理技術(shù)的企業(yè)，其工程師團(tuán)隊(duì)創(chuàng)新性地開(kāi)發(fā)了一種名為線性復(fù)雜度乘法（L-Mul）的AI處理方法。該方法的核心在于，它用整數(shù)加法替代

發(fā)表于 10-22 15:15 ?406次閱讀

雷達(dá)的基本分類(lèi)方法

電子發(fā)燒友網(wǎng)站提供《雷達(dá)的基本分類(lèi)方法.pdf》資料免費(fèi)下載

發(fā)表于 09-11 09:09 ?6次下載

光學(xué)字符識(shí)別是什么的一種技術(shù)

光學(xué)字符識(shí)別（Optical Character Recognition，簡(jiǎn)稱(chēng)OCR）是一種將文本資料轉(zhuǎn)換為計(jì)算機(jī)可編輯和可搜索的數(shù)據(jù)格式的技術(shù)。這項(xiàng)技術(shù)廣泛應(yīng)用于文檔掃描、數(shù)據(jù)錄入、自動(dòng)化處理等

發(fā)表于 09-10 15:48 ?501次閱讀

【《大語(yǔ)言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)知識(shí)學(xué)習(xí)

習(xí)語(yǔ)言的表達(dá)方式和生成能力。通過(guò)預(yù)測(cè)文本中缺失的部分或下一個(gè)詞，模型逐漸掌握語(yǔ)言的規(guī)律和特征。常用的模型結(jié)構(gòu) Transformer架構(gòu)：大語(yǔ)言模型通?；赥ransformer架構(gòu)，這是一種能夠

發(fā)表于 08-02 11:03

如何訓(xùn)練一個(gè)有效的eIQ基本分類(lèi)模型

eIQ Neutron神經(jīng)處理單元(NPU)是一種高度可擴(kuò)展的加速器核心架構(gòu)，提供ML加速。與傳統(tǒng)MCU Kinetis、LPC系列相比，MCX N系列首次集成了恩智浦 eIQ Neutron神經(jīng)

發(fā)表于 08-01 09:29 ?1898次閱讀

利用TensorFlow實(shí)現(xiàn)基于深度神經(jīng)網(wǎng)絡(luò)的文本分類(lèi)模型

要利用TensorFlow實(shí)現(xiàn)一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)（DNN）的文本分類(lèi)模型，我們首先需要明確幾個(gè)關(guān)鍵步驟：數(shù)據(jù)預(yù)處理、模型構(gòu)建、模型訓(xùn)練、模型評(píng)估與調(diào)優(yōu)，以及最終的模型部署（盡管在本文中，我們將重點(diǎn)放在前四個(gè)步驟上）。下面，我將

發(fā)表于 07-12 16:39 ?901次閱讀

llm模型有哪些格式

Representations from Transformers）：BERT是一種雙向預(yù)訓(xùn)練模型，通過(guò)大量文本數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練，可以用于各種NLP任務(wù)，如文本分類(lèi)、問(wèn)答、命名實(shí)體識(shí)別等。 b. GPT（

發(fā)表于 07-09 09:59 ?660次閱讀

llm模型和chatGPT的區(qū)別

LLM（Large Language Model）是指大型語(yǔ)言模型，它們是一類(lèi)使用深度學(xué)習(xí)技術(shù)構(gòu)建的自然語(yǔ)言處理（NLP）模型。LLM模型可以處理各種語(yǔ)言任務(wù)，如文本生成、

發(fā)表于 07-09 09:55 ?1142次閱讀

自然語(yǔ)言處理是什么技術(shù)的一種應(yīng)用

自然語(yǔ)言處理（Natural Language Processing，簡(jiǎn)稱(chēng)NLP）是人工智能和語(yǔ)言學(xué)領(lǐng)域的一個(gè)分支，它涉及到使用計(jì)算機(jī)技術(shù)來(lái)處理、分析和生成自然語(yǔ)言文本。自然語(yǔ)言

發(fā)表于 07-03 14:18 ?998次閱讀

卷積神經(jīng)網(wǎng)絡(luò)在文本分類(lèi)領(lǐng)域的應(yīng)用

在自然語(yǔ)言處理（NLP）領(lǐng)域，文本分類(lèi)一直是一個(gè)重要的研究方向。隨著深度學(xué)習(xí)技術(shù)的飛速發(fā)展，卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，簡(jiǎn)稱(chēng)CNN）在圖像識(shí)

發(fā)表于 07-01 16:25 ?750次閱讀

基于神經(jīng)網(wǎng)絡(luò)的呼吸音分類(lèi)算法

。噪聲分類(lèi)器是一種稱(chēng)為NRNN的堆疊RNN，它預(yù)測(cè)樣本中每一幀的噪聲標(biāo)簽。NRNN優(yōu)化訓(xùn)練期間為每個(gè)輸出計(jì)算的交叉熵?fù)p失然后，預(yù)測(cè)噪聲標(biāo)簽

發(fā)表于 05-31 12:05

一屏萬(wàn)象，場(chǎng)景無(wú)限：藍(lán)牙墨水屏標(biāo)簽多功能多場(chǎng)景應(yīng)用帶您領(lǐng)略未來(lái)

藍(lán)牙墨水屏標(biāo)簽作為一種創(chuàng)新的顯示設(shè)備，通過(guò)提供API接口，助力各行各業(yè)共創(chuàng)智慧新生態(tài)。開(kāi)放API是為了促進(jìn)生態(tài)系統(tǒng)的共創(chuàng)和共贏，讓更多的開(kāi)發(fā)者和合作伙伴能夠參與到藍(lán)牙墨水屏標(biāo)簽的應(yīng)用和創(chuàng)新中來(lái)。自主

發(fā)表于 05-27 11:11 ?475次閱讀

介紹一種使用2D材料進(jìn)行3D集成的新方法

美國(guó)賓夕法尼亞州立大學(xué)的研究人員展示了一種使用2D材料進(jìn)行3D集成的新穎方法。

發(fā)表于 01-13 11:37 ?1092次閱讀

搜索歷史

一種處理多標(biāo)簽文本分類(lèi)的新穎推理機(jī)制

評(píng)論

單日獲客成本超20萬(wàn)，國(guó)產(chǎn)大模型開(kāi)卷200萬(wàn)字以上的長(zhǎng)文本處理

如何使用自然語(yǔ)言處理分析文本數(shù)據(jù)

BitEnergy AI公司開(kāi)發(fā)出一種新AI處理方法

雷達(dá)的基本分類(lèi)方法

光學(xué)字符識(shí)別是什么的一種技術(shù)

【《大語(yǔ)言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)知識(shí)學(xué)習(xí)

如何訓(xùn)練一個(gè)有效的eIQ基本分類(lèi)模型

利用TensorFlow實(shí)現(xiàn)基于深度神經(jīng)網(wǎng)絡(luò)的文本分類(lèi)模型

llm模型有哪些格式

llm模型和chatGPT的區(qū)別

自然語(yǔ)言處理是什么技術(shù)的一種應(yīng)用

卷積神經(jīng)網(wǎng)絡(luò)在文本分類(lèi)領(lǐng)域的應(yīng)用

基于神經(jīng)網(wǎng)絡(luò)的呼吸音分類(lèi)算法

一屏萬(wàn)象，場(chǎng)景無(wú)限：藍(lán)牙墨水屏標(biāo)簽多功能多場(chǎng)景應(yīng)用帶您領(lǐng)略未來(lái)

介紹一種使用2D材料進(jìn)行3D集成的新方法