今天給大家介紹ICLR 2022最佳論文PICO: CONTRASTIVE LABEL DISAMBIGUATION FOR PARTIAL LABEL LEARNING,這篇文章解決的是Partial Label Learning(PLL)問題,即訓(xùn)練數(shù)據(jù)中一個圖像不是一個確定的label,而是一組可能的label集合,需要預(yù)測出每個樣本的真實label。
下載地址:https://openreview.net/pdf?id=EhYjZy6e1gJ
1什么是Partial Label Learning(PLL)
有監(jiān)督學(xué)習(xí)是最常見的一種機器學(xué)習(xí)問題,給定一個輸入樣本,預(yù)測該樣本的label是什么。Partial Label Learning(PLL)問題也是預(yù)測一個樣本對應(yīng)的label,但是和有監(jiān)督學(xué)習(xí)問題的差異是,PLL問題的訓(xùn)練數(shù)據(jù)中,一個輸入樣本對應(yīng)多個候選label,真正的label是候選label中的一個。
為什么會有PLL這樣的問題呢?因為在現(xiàn)實問題中,label來自于人工標注,而有的樣本人工標注比較困難,只標注一個label會造成噪聲較大的問題。例如下面的例子中,比較難區(qū)分這張狗對應(yīng)的類別是哈士奇、雪橇犬還是薩摩耶,強行讓人工標注成一個確定的label容易在數(shù)據(jù)中引入噪聲。PLL放寬了這種限制,在標注的label中可以引入一些不確定性,給一個樣本賦予多個候選label,模型學(xué)習(xí)從這些label中預(yù)測ground-truth對應(yīng)的那個label。
2PLL問題的難點
PLL的效果目前和有監(jiān)督學(xué)習(xí)還有一定差距。PLL問題的難點在于標簽消歧,也就是從候選label集合中預(yù)測出樣本的真實label。業(yè)內(nèi)一般的解法是學(xué)習(xí)樣本高質(zhì)量的表示,然后根據(jù)在特征空間中距離近的樣本更可能屬于同一類別這個假設(shè),實現(xiàn)標簽消歧。
然而,這種方法的問題在于,當label是一個不確定的集合而不是一個確定值時,這種不確定性也會對表示學(xué)習(xí)的過程造成負面影響。表示學(xué)習(xí)效果不好,又會對標簽消歧的效果造成負面影響。
為了解決這個問題,ICLR 2022的最佳論文提出了基于對比學(xué)習(xí)的PLL問題求解方法。利用對比學(xué)習(xí)提升表示學(xué)習(xí)的效果,再利用良好的表示對label進行消歧,消歧后的label又有助于進一步生成良好的樣本表征,形成良性循環(huán),提升整體效果。
這篇文章提出的Partial label learning with COntrastive label disambiguation (PiCO) framework主要包括利用對比學(xué)習(xí)提升表示生成質(zhì)量,以及基于聚類的label消歧兩個核心模塊。下面,我們走進這篇最佳論文,理解其背后的思想。
3PiCO核心點1—對比學(xué)習(xí)引入PLL
第一個核心點是為了提升PLL中的表示生成效果,作者將對比學(xué)習(xí)的方法引入到PLL問題中。對比學(xué)習(xí)在有監(jiān)督問題上已經(jīng)取得廣泛的應(yīng)用,但是在PLL問題上目前還沒有相關(guān)研究。將對比學(xué)習(xí)應(yīng)用到PLL的一個最主要的問題是正樣本對如何構(gòu)造。在有監(jiān)督學(xué)習(xí)中,每個樣本都有其對應(yīng)的確定性label,天然可以構(gòu)造出正樣本。而PLL問題中,每個樣本的label是不確定的,無法直接獲取正樣本對。
為了解決上述問題,本文提出利用分類器對樣本的預(yù)測結(jié)果作為樣本真實label(也就是偽標簽persudo label),根據(jù)這個label構(gòu)造正樣本對。在得到正樣本對后,利用MoCo對比學(xué)習(xí)框架進行表示學(xué)習(xí),將樣本的兩種view分別輸入兩個參數(shù)共享的Encoder,其中key側(cè)的Encoder使用動量更新的方式減小計算開銷。對比學(xué)習(xí)loss作為一個輔助任務(wù)和主任務(wù)聯(lián)合學(xué)習(xí)。對MoCo等對比學(xué)習(xí)框架不了解的同學(xué),可以參考我之前的文章:對比學(xué)習(xí)中的4種經(jīng)典訓(xùn)練模式。利用對比學(xué)習(xí),可以讓樣本在特征空間形成類簇,這也為后續(xù)的標簽消歧奠定了基礎(chǔ)。
4PiCO核心點2—標簽消歧
本文采用了一種類似EM算法的思路實現(xiàn)標簽消歧。首先,對于每個類別維護一個embedding向量u,它可以視為類的類簇中心。對于每個樣本的label,在PLL中也用一個N維向量表示s,N代表類別數(shù)量,表示了該樣本屬于每個類別的概率。接下來為了實現(xiàn)標簽消歧,在訓(xùn)練過程中不斷更新s,更新方法是看樣本表示和哪個類別向量最近,就用滑動平均的方式對s的那一維進行更新,公式可以表示為:
相應(yīng)的,類別向量u也利用滑動平均的方式進行更新,公式如下:
通過這兩個步驟的迭代進行,逐步實驗標簽消歧。這其實和Kmean以及Kmeans++這種方法類似,本質(zhì)上就是一個聚類過程。從PiCO框架整體來看,對比學(xué)習(xí)提升表示學(xué)習(xí)效果,表示質(zhì)量的提升又促進了下游基于聚類的標簽消歧效果,標簽的確定性增加又進一步提升了表示生成的質(zhì)量,形成了良性循環(huán)。
5實驗結(jié)果
本文進行了大量實驗從多個角度驗證了PiCO解決PLL問題的效果。在樣本表示的學(xué)習(xí)上,從下面的t-SNE向量可視化分析圖可以看出,PiCO生成不用類別的向量表示非常清晰,類內(nèi)的內(nèi)聚性和類間的差異性相比其他方法都是更好的。
下面的實驗結(jié)果對比了PiCO和和其他方法在PLL問題上的效果,可以看出PiCO要比其他方法效果有非常顯著的提升。
6總結(jié)
本文介紹了ICLR 2022的最佳論文,在Partial Label Learning問題上的解決方法。通過這篇文章,核心是理解頂會最佳論文的設(shè)計思路,本文用的求解方法比較優(yōu)雅,背后的設(shè)計思路也非常清晰,背后的思考非常值得學(xué)習(xí)。
審核編輯 :李倩
-
pll
+關(guān)注
關(guān)注
6文章
776瀏覽量
135168 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8418瀏覽量
132654
原文標題:ICLR2022最佳論文解讀:對比學(xué)習(xí)解決Partial Label Learning問題
文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論