0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PiCO核心點—對比學(xué)習(xí)引入PLL

深度學(xué)習(xí)自然語言處理 ? 來源:圓圓的算法筆記 ? 作者:圓圓的算法筆記 ? 2022-08-22 11:35 ? 次閱讀

今天給大家介紹ICLR 2022最佳論文PICO: CONTRASTIVE LABEL DISAMBIGUATION FOR PARTIAL LABEL LEARNING,這篇文章解決的是Partial Label Learning(PLL)問題,即訓(xùn)練數(shù)據(jù)中一個圖像不是一個確定的label,而是一組可能的label集合,需要預(yù)測出每個樣本的真實label。

2e372fe2-21c8-11ed-ba43-dac502259ad0.png

下載地址:https://openreview.net/pdf?id=EhYjZy6e1gJ

1什么是Partial Label Learning(PLL)

有監(jiān)督學(xué)習(xí)是最常見的一種機器學(xué)習(xí)問題,給定一個輸入樣本,預(yù)測該樣本的label是什么。Partial Label Learning(PLL)問題也是預(yù)測一個樣本對應(yīng)的label,但是和有監(jiān)督學(xué)習(xí)問題的差異是,PLL問題的訓(xùn)練數(shù)據(jù)中,一個輸入樣本對應(yīng)多個候選label,真正的label是候選label中的一個。

為什么會有PLL這樣的問題呢?因為在現(xiàn)實問題中,label來自于人工標注,而有的樣本人工標注比較困難,只標注一個label會造成噪聲較大的問題。例如下面的例子中,比較難區(qū)分這張狗對應(yīng)的類別是哈士奇、雪橇犬還是薩摩耶,強行讓人工標注成一個確定的label容易在數(shù)據(jù)中引入噪聲。PLL放寬了這種限制,在標注的label中可以引入一些不確定性,給一個樣本賦予多個候選label,模型學(xué)習(xí)從這些label中預(yù)測ground-truth對應(yīng)的那個label。

poYBAGMC-4eAYRYNAACACdSoxmk001.png

2PLL問題的難點

PLL的效果目前和有監(jiān)督學(xué)習(xí)還有一定差距。PLL問題的難點在于標簽消歧,也就是從候選label集合中預(yù)測出樣本的真實label。業(yè)內(nèi)一般的解法是學(xué)習(xí)樣本高質(zhì)量的表示,然后根據(jù)在特征空間中距離近的樣本更可能屬于同一類別這個假設(shè),實現(xiàn)標簽消歧。

然而,這種方法的問題在于,當label是一個不確定的集合而不是一個確定值時,這種不確定性也會對表示學(xué)習(xí)的過程造成負面影響。表示學(xué)習(xí)效果不好,又會對標簽消歧的效果造成負面影響。

為了解決這個問題,ICLR 2022的最佳論文提出了基于對比學(xué)習(xí)的PLL問題求解方法。利用對比學(xué)習(xí)提升表示學(xué)習(xí)的效果,再利用良好的表示對label進行消歧,消歧后的label又有助于進一步生成良好的樣本表征,形成良性循環(huán),提升整體效果。

這篇文章提出的Partial label learning with COntrastive label disambiguation (PiCO) framework主要包括利用對比學(xué)習(xí)提升表示生成質(zhì)量,以及基于聚類的label消歧兩個核心模塊。下面,我們走進這篇最佳論文,理解其背后的思想。

3PiCO核心點1—對比學(xué)習(xí)引入PLL

第一個核心點是為了提升PLL中的表示生成效果,作者將對比學(xué)習(xí)的方法引入到PLL問題中。對比學(xué)習(xí)在有監(jiān)督問題上已經(jīng)取得廣泛的應(yīng)用,但是在PLL問題上目前還沒有相關(guān)研究。將對比學(xué)習(xí)應(yīng)用到PLL的一個最主要的問題是正樣本對如何構(gòu)造。在有監(jiān)督學(xué)習(xí)中,每個樣本都有其對應(yīng)的確定性label,天然可以構(gòu)造出正樣本。而PLL問題中,每個樣本的label是不確定的,無法直接獲取正樣本對。

為了解決上述問題,本文提出利用分類器對樣本的預(yù)測結(jié)果作為樣本真實label(也就是偽標簽persudo label),根據(jù)這個label構(gòu)造正樣本對。在得到正樣本對后,利用MoCo對比學(xué)習(xí)框架進行表示學(xué)習(xí),將樣本的兩種view分別輸入兩個參數(shù)共享的Encoder,其中key側(cè)的Encoder使用動量更新的方式減小計算開銷。對比學(xué)習(xí)loss作為一個輔助任務(wù)和主任務(wù)聯(lián)合學(xué)習(xí)。對MoCo等對比學(xué)習(xí)框架不了解的同學(xué),可以參考我之前的文章:對比學(xué)習(xí)中的4種經(jīng)典訓(xùn)練模式。利用對比學(xué)習(xí),可以讓樣本在特征空間形成類簇,這也為后續(xù)的標簽消歧奠定了基礎(chǔ)。

2e652a6e-21c8-11ed-ba43-dac502259ad0.png

4PiCO核心點2—標簽消歧

本文采用了一種類似EM算法的思路實現(xiàn)標簽消歧。首先,對于每個類別維護一個embedding向量u,它可以視為類的類簇中心。對于每個樣本的label,在PLL中也用一個N維向量表示s,N代表類別數(shù)量,表示了該樣本屬于每個類別的概率。接下來為了實現(xiàn)標簽消歧,在訓(xùn)練過程中不斷更新s,更新方法是看樣本表示和哪個類別向量最近,就用滑動平均的方式對s的那一維進行更新,公式可以表示為:

2e78dd8e-21c8-11ed-ba43-dac502259ad0.png

相應(yīng)的,類別向量u也利用滑動平均的方式進行更新,公式如下:

2e83af52-21c8-11ed-ba43-dac502259ad0.png

通過這兩個步驟的迭代進行,逐步實驗標簽消歧。這其實和Kmean以及Kmeans++這種方法類似,本質(zhì)上就是一個聚類過程。從PiCO框架整體來看,對比學(xué)習(xí)提升表示學(xué)習(xí)效果,表示質(zhì)量的提升又促進了下游基于聚類的標簽消歧效果,標簽的確定性增加又進一步提升了表示生成的質(zhì)量,形成了良性循環(huán)。

5實驗結(jié)果

本文進行了大量實驗從多個角度驗證了PiCO解決PLL問題的效果。在樣本表示的學(xué)習(xí)上,從下面的t-SNE向量可視化分析圖可以看出,PiCO生成不用類別的向量表示非常清晰,類內(nèi)的內(nèi)聚性和類間的差異性相比其他方法都是更好的。

2e92e1a2-21c8-11ed-ba43-dac502259ad0.png

下面的實驗結(jié)果對比了PiCO和和其他方法在PLL問題上的效果,可以看出PiCO要比其他方法效果有非常顯著的提升。

2ea22838-21c8-11ed-ba43-dac502259ad0.png

6總結(jié)

本文介紹了ICLR 2022的最佳論文,在Partial Label Learning問題上的解決方法。通過這篇文章,核心是理解頂會最佳論文的設(shè)計思路,本文用的求解方法比較優(yōu)雅,背后的設(shè)計思路也非常清晰,背后的思考非常值得學(xué)習(xí)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • pll
    pll
    +關(guān)注

    關(guān)注

    6

    文章

    776

    瀏覽量

    135168
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8418

    瀏覽量

    132654

原文標題:ICLR2022最佳論文解讀:對比學(xué)習(xí)解決Partial Label Learning問題

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Raspberry Pi Pico 2 W 發(fā)布

    樹莓派官方今日宣布推出支持無線連接的新款 MCU(微控制器)主板 Raspberry Pi Pico 2 W,售價 7 美元, 較此前的有線版本高出 2 美元 。 ? ? Raspberry Pi
    的頭像 發(fā)表于 11-25 18:25 ?491次閱讀
    Raspberry Pi <b class='flag-5'>Pico</b> 2 W 發(fā)布

    Raspberry Pi Pico 2

    Raspberry Pi Pico 2顯著提升了性能,同時保持了與之前的Raspberry Pi Pico系列器件的兼容性。 Pico 2具有更高的內(nèi)核時鐘速度、雙倍內(nèi)存、更強大的Arm? 內(nèi)核
    的頭像 發(fā)表于 11-25 15:10 ?581次閱讀
    Raspberry Pi <b class='flag-5'>Pico</b> 2

    用于智能顯示的TI DLP? Pico?技術(shù)

    電子發(fā)燒友網(wǎng)站提供《用于智能顯示的TI DLP? Pico?技術(shù).pdf》資料免費下載
    發(fā)表于 08-31 10:12 ?0次下載
    用于智能顯示的TI DLP? <b class='flag-5'>Pico</b>?技術(shù)

    用于設(shè)備顯示的TI DLP? Pico?技術(shù)

    電子發(fā)燒友網(wǎng)站提供《用于設(shè)備顯示的TI DLP? Pico?技術(shù).pdf》資料免費下載
    發(fā)表于 08-31 10:07 ?0次下載
    用于設(shè)備顯示的TI DLP? <b class='flag-5'>Pico</b>?技術(shù)

    PLL1705/PLL1706雙通道PLL多時鐘發(fā)生器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《PLL1705/PLL1706雙通道PLL多時鐘發(fā)生器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-22 11:32 ?0次下載
    <b class='flag-5'>PLL</b>1705/<b class='flag-5'>PLL</b>1706雙通道<b class='flag-5'>PLL</b>多時鐘發(fā)生器數(shù)據(jù)表

    PICO推出旗下首款MR混合現(xiàn)實一體機PICO 4 Ultra

    8月20日,PICO震撼發(fā)布其首款MR(混合現(xiàn)實)一體機——PICO 4 Ultra,標志著該公司在混合現(xiàn)實技術(shù)領(lǐng)域的重大飛躍,為用戶解鎖了前所未有的沉浸式與個性化體驗新境界。
    的頭像 發(fā)表于 08-21 15:45 ?985次閱讀

    PLL是什么意思

    PLL是Phase Locked Loop的縮寫,中文譯作鎖相環(huán)。它是一種用于控制頻率和相位的電路,通過檢測和跟蹤輸入信號的頻率和相位,并將其轉(zhuǎn)換為一個穩(wěn)定的輸出信號,從而實現(xiàn)頻率和相位的同步與控制。以下是對PLL的詳細解析,包括其定義、分類、工作原理、作用以及在現(xiàn)代電子
    的頭像 發(fā)表于 08-16 17:03 ?3704次閱讀

    深度學(xué)習(xí)的基本原理與核心算法

    處理、語音識別等領(lǐng)域取得了革命性的突破。本文將詳細闡述深度學(xué)習(xí)的原理、核心算法以及實現(xiàn)方式,并通過一個具體的代碼實例進行說明。
    的頭像 發(fā)表于 07-04 11:44 ?2076次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機器學(xué)習(xí)對比

    在人工智能的浪潮中,機器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動力。它們各自以其獨特的方式推動著技術(shù)的進步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機器學(xué)習(xí)的范疇,但深度
    的頭像 發(fā)表于 07-01 11:40 ?1389次閱讀

    ESP32 Pico Kit使用5v管腳供電無法連接藍牙要怎么處理?

    我想自己做一個藍牙機械鍵盤,用ESP32做藍牙HID,在網(wǎng)上下載https://github.com/T-vK/ESP32-BLE-Keyboard,上傳到ESP32 Pico Kit上,這時候
    發(fā)表于 06-25 07:17

    使用PICO示波器配合PICO軟件的邏輯觸發(fā)功能

    介紹PICO示波器軟件提供了各種簡單和高級的觸發(fā)器,用于檢測和捕獲難以捉摸的信號。大多數(shù)類型的觸發(fā)器一次只能監(jiān)控一個信號。由于許多示波器有多個輸入(最多四個通道以及某些型號的擴展輸入和音頻輸入)因此
    的頭像 發(fā)表于 06-01 08:31 ?623次閱讀
    使用<b class='flag-5'>PICO</b>示波器配合<b class='flag-5'>PICO</b>軟件的邏輯觸發(fā)功能

    FPGA學(xué)習(xí)筆記-電源電壓

    通常FPGA中會有各種資源可以使用,而每種資源都需要有電源電壓支持。在單片機中,通常是使用同樣的電源電壓供電的,比如常見的5V、3.3V。而在FPGA中,一般需要:核心電壓、I/O口電壓、PLL電壓
    發(fā)表于 05-22 18:42

    Snap將AI和機器學(xué)習(xí)引入Snapchat

    Snap首席執(zhí)行官伊萬·斯皮格近日宣布,公司將加大投資力度,將人工智能和機器學(xué)習(xí)技術(shù)深度引入其主打社交應(yīng)用Snapchat,以進一步提升用戶吸引力。斯皮格直言,公司在機器學(xué)習(xí)領(lǐng)域已稍顯落后,這一狀況在一定程度上影響了其業(yè)務(wù)表現(xiàn)。
    的頭像 發(fā)表于 05-21 09:31 ?499次閱讀

    鎖相環(huán)PLL學(xué)習(xí)記錄

    鎖相環(huán) (PLL) 是電子系統(tǒng)中最通用、最靈活和最有價值的電路配置之一,因此在許多應(yīng)用中都有使用。它用于時鐘重定時和恢復(fù),作為頻率合成器和可調(diào)諧振蕩器,僅舉幾個例子。
    的頭像 發(fā)表于 02-17 14:07 ?784次閱讀
    鎖相環(huán)<b class='flag-5'>PLL</b><b class='flag-5'>學(xué)習(xí)</b>記錄

    數(shù)字PLL孤立頻失鎖是什么原因?又應(yīng)該怎么解決呢?

    數(shù)字PLL(相位鎖定環(huán))在應(yīng)用中遇到孤立頻失鎖的情況,可能由多種因素引起。
    的頭像 發(fā)表于 01-30 14:13 ?1661次閱讀