0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

解耦表征所得出的因子是否真正獨立

電子工程師 ? 來源:fqj ? 2019-05-08 14:12 ? 次閱讀

而今,深度學(xué)習(xí)大行其道。

結(jié)果來看,它是能說會畫外加打游戲,但這是如何實現(xiàn)的?模型里的中間數(shù)據(jù)有什么意義?換句話說,模型訓(xùn)練中所生成的高維數(shù)據(jù)如何進行有意義的理解?

這離不開非監(jiān)督學(xué)習(xí)解耦表征(Unsupervised Learning of Disentangled Representations)。

一個在好奇心驅(qū)動的探索(curiosity driven exploration)、抽象推理(abstract reasoning)、視覺概念學(xué)習(xí)(visual concept learning )等方面早已用起來的方法。

但是目前,并未有什么方案可以統(tǒng)一衡量非監(jiān)督學(xué)習(xí)解耦表征的有效性和局限性。即,解耦表征所得出的因子是否真正獨立?某些解耦表征指標(biāo)是否的確代表解耦的有效程度?

為解決這一問題,F(xiàn)rancesco Locatello等人在“Challenging Common Assumptions in the Unsupervised Learning of Disentangled Representations ”(ICML 2019)一文中,對目前最佳的一些非監(jiān)督解耦表征模型做出了大規(guī)??蓮?fù)現(xiàn)評估,并指出了一些未來發(fā)展方向,造福業(yè)界人士。

該評估經(jīng)由7個不同數(shù)據(jù)集上超12000個模型得出,涵蓋了對業(yè)界最佳的解耦方法以及一些評估指標(biāo)的評測,不僅可復(fù)現(xiàn),而且該研究的代碼和10800個預(yù)訓(xùn)練好的模型都已開源在disentanglement_lib,研究者們也可以將自己的解耦模型在此進行統(tǒng)一評估,與其他解耦模型進行對比,非常棒。

啥是解耦

通俗來講,解耦就是將一個對象分解為各自獨立的因素。不同的因素控制不同的結(jié)果,一個因素只控制一個結(jié)果的改變。解耦表征,也就是找出對象特征里的可解釋因子,從而對高維的數(shù)據(jù)產(chǎn)生有意義的理解。

非監(jiān)督解耦認(rèn)為,現(xiàn)實世界的數(shù)據(jù)是由一些可解釋的獨立因子不同組合產(chǎn)生的,可以通過非監(jiān)督學(xué)習(xí)的方式找到這些獨立因子。如在Shapes3D數(shù)據(jù)集中,每個圖像由六個獨立因子控制,分別是:物體形狀、物體大小、相機角度、地板顏色、墻壁顏色,物體顏色。

解耦表征所得出的因子是否真正獨立

圖 | Shapes3D數(shù)據(jù)集的獨立真值因子可視化:地板顏色:上左;墻壁顏色:上中;物體顏色:上右;物體尺寸:下左;物體形狀:下中;相機角度:下右。

解耦表征希望捕捉到這些獨立因子,下圖中每個3D圖像數(shù)據(jù)是10維的數(shù)據(jù),用FactorVAE解耦模型(一種變分自編碼器variational autoencoders,即VAE的變種)對3D圖像進行解耦,企圖找出十維數(shù)據(jù)的每一維度信息,也即獨立控制因子,結(jié)果有些因子被成功分離,而有些因子仍然未被捕捉。上右和上中表明,模型成功分解了地板顏色,然而,下左一和下左二兩圖表明物體顏色和尺寸仍未被分解開來,物體的顏色和大小都在變化,說明控制的兩個因子并未獨立分解。

解耦表征所得出的因子是否真正獨立

圖 | 可視化用FactorVAE模型所學(xué)到的隱含維度信息。墻壁顏色、地板顏色、相機角度被成功分解(見上右一、上中、和下中);物體的形狀、尺寸、顏色還未被分解出來(見上左一和下左一、下左二)

本大型可復(fù)現(xiàn)研究的關(guān)鍵結(jié)論

為了理解高維數(shù)據(jù),目前已有大量的非監(jiān)督解耦模型。這些解耦模型一般基于變分自編碼器(variational autoencoders, VAE,一種非監(jiān)督生成模型,通過將數(shù)據(jù)分解出獨立隱含因子來進行數(shù)據(jù)的生成,也即將高維數(shù)據(jù)映射成低維數(shù)據(jù),并且低維數(shù)據(jù)的每一維度都獨立控制著該數(shù)據(jù)的某一個性質(zhì))衍變而來,同時研究者們也設(shè)計了一些度量指標(biāo)來衡量解耦水平,但實際上,并沒有一個大規(guī)模的可復(fù)現(xiàn)實驗來對這些模型及指標(biāo)做出統(tǒng)一的衡量。

為解決這一問題,F(xiàn)rancesco Locatello等人對六個現(xiàn)有最佳模型(BetaVAE,AnnealedVAE,F(xiàn)actorVAE,DIP-VAE I / II和Beta-TCVAE, 以上皆為變分自編碼器的變種)和六個解耦指標(biāo)(BetaVAE評分,F(xiàn)actorVAE評分,MIG,SAP,Modularity和DCI Disentanglement)的實際解耦的程度做了統(tǒng)一的可復(fù)現(xiàn)衡量實驗,通過7個數(shù)據(jù)集上12800個模型的訓(xùn)練,衡量模型和參數(shù)的實際效果,他們有了這樣的發(fā)現(xiàn):

1、無法證實解耦模型的確可以進行可靠的解耦。

解耦模型的結(jié)果,即所分析出的獨立因子并不是每次都確定,會隨著模型的改變而變化,也就是說,分析出的獨立因子并不是真正的唯一控制因子。解耦表征是非監(jiān)督的,如果沒有一些真值標(biāo)簽,其實無法衡量是否成功解耦。如想對解耦進行衡量,必須提前規(guī)定好數(shù)據(jù)集和模型的歸納偏好(Inductive Bias)。即,必須有假設(shè)才能知曉結(jié)果是否吻合假設(shè),如果什么假設(shè)都沒有,那就無法衡量結(jié)論好壞。

將不同解耦模型在同一個數(shù)據(jù)集上多次訓(xùn)練,只是每次隨機數(shù)不同,解耦指標(biāo)FactorsVAE分?jǐn)?shù)的分布跨度很大,即使同一個模型,僅僅隨機數(shù)不同,F(xiàn)actorsVAE分?jǐn)?shù)就會變化,并且該影響超過了正則化強度所能施加的影響。因此這種解耦表征的結(jié)果不固定,所解出的因子便難以稱之為獨立因子,畢竟我們設(shè)想現(xiàn)實世界中的對象是由確定因素以某種組合造成的。

解耦表征所得出的因子是否真正獨立

圖 | 不同模型在Cars3D數(shù)據(jù)集上FactorsVAE分?jǐn)?shù)的分布:左圖是不同分解模型的FactorsVAE分布;右圖是FactorVAE模型不同正則化強度的FactorsVAE分布。

2、解耦表征有益于下游任務(wù)(如分類任務(wù))也是無法證實的。

FactorVAE分?jǐn)?shù)和分類表現(xiàn)(基于Gradient Boosted Trees,GBT)并沒有什么相關(guān)性,也就是FactorVAE分?jǐn)?shù)高的解耦模型,利用模型解出的因子實現(xiàn)的分類任務(wù)表現(xiàn)也不一定就很好。

解耦表征所得出的因子是否真正獨立

圖 | 利用相應(yīng)解耦模型的下游分類任務(wù)在dSprites數(shù)據(jù)集上的表現(xiàn)

由此,他們得出了這樣一些見解:

1. 進行非監(jiān)督的解耦表征需設(shè)置歸納偏好。未來工作需要明確描述強加的歸納偏好并明確是否利用了顯性和隱性監(jiān)督。

2. 找到好的能適用多個數(shù)據(jù)集的非監(jiān)督模型歸納偏好非常關(guān)鍵。

3. 應(yīng)證明引入解耦表征舉措的具體實際益處。

4. 解耦模型效果應(yīng)該在多種數(shù)據(jù)集上具有可重復(fù)性。

開源解耦表征庫

該研究所用評估流程及方法、所用解耦模型(10800個,有一些模型關(guān)于Shapes3D不可用)、所采用的解耦衡量指標(biāo),以及一些幫助理解模型的可視化工具都開源在disentanglement_lib(https://github.com/google-research/disentanglement_lib)此庫優(yōu)點有三:

易復(fù)現(xiàn)。少于4個shell命令,disentanglement_lib即可重現(xiàn)評估所用的任何模型。另,雖所用參考模型所需算力非常之巨,但別怕,10800個預(yù)訓(xùn)練好的模型已奉上。

能修改??蓪嶒灧桨缚梢赃M行一些修改,驗證你自己的想法。

易擴展。該庫可實現(xiàn)公正統(tǒng)一的、可復(fù)現(xiàn)的,標(biāo)準(zhǔn)化的評估,可以輕松地將自己的新模型與參考模型對比。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 解耦
    +關(guān)注

    關(guān)注

    0

    文章

    40

    瀏覽量

    11907

原文標(biāo)題:快來吧!有個開源框架測試你的解耦表征

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    瑞薩電子與吉利汽車聯(lián)合舉辦汽車主控芯片軟硬能力提升訓(xùn)練營

    近日,由瑞薩電子與吉利汽車研究院聯(lián)合舉辦的“汽車主控芯片軟硬能力提升訓(xùn)練營”順利落幕。
    的頭像 發(fā)表于 12-09 10:50 ?279次閱讀

    AMC1303M2520所輸出的信號經(jīng)過STM32的DFSDM外設(shè)進行采集濾波后,得出的數(shù)據(jù)轉(zhuǎn)換成波形與實際波形不一致怎么解決?

    的DFSDM外設(shè)進行采集濾波后,所得出的數(shù)據(jù)轉(zhuǎn)換成波形與實際波形完全天壤之別,所以在此進行求助。 1.第一個問題是,我們計劃用AMC1303M2520來采集40KHZ的正弦信號的方案是否是可行的呢? 2.第二個問題是,我們目前在DFSDM中配置的是Sinc2階,25過采樣
    發(fā)表于 12-06 06:05

    非線性光與線性光的差別

    非線性光與線性光的不同 在電路中光的電路非常常見,光在電路中的作用是進行隔離并對光電進行轉(zhuǎn)換,光的種類當(dāng)中,包括線性光
    的頭像 發(fā)表于 11-16 10:28 ?396次閱讀

    EMB系統(tǒng)功能安全分析(3)

    EMB 系統(tǒng)失效判斷基于前面所述三路并行的安全機制,可實時檢測系統(tǒng)運行狀態(tài),探測系統(tǒng)故障,又由于該系統(tǒng)為四輪獨立制動,結(jié)合安全機制可引入四輪制動故障因子 λi來表征四輪故障狀態(tài),進行失效判斷。故障
    的頭像 發(fā)表于 10-16 14:31 ?390次閱讀
    EMB系統(tǒng)功能安全分析(3)

    粒子傳感器有哪些

    粒子傳感器是電氣火災(zāi)監(jiān)控探測器中的關(guān)鍵組成部分,它們通過探測由電纜、塑料等物質(zhì)在受熱分解時產(chǎn)生的粒子來實現(xiàn)火災(zāi)的極早期預(yù)警。以下是關(guān)于熱粒子傳感器的一些信息: 類型與特點 獨立式與非獨立
    的頭像 發(fā)表于 09-25 14:54 ?323次閱讀

    探索光:高速光與普通光的差異

    在現(xiàn)代電子設(shè)備中,光(光電耦合器)是不可或缺的重要元件。它通過光信號隔離電路,防止高電壓或高電流的干擾。然而,隨著電子技術(shù)的發(fā)展,對光的性能需求也在不斷提升。高速光的出現(xiàn),標(biāo)志著光
    的頭像 發(fā)表于 08-20 08:51 ?568次閱讀
    探索光<b class='flag-5'>耦</b>:高速光<b class='flag-5'>耦</b>與普通光<b class='flag-5'>耦</b>的差異

    不平衡電網(wǎng)下基于功率的PWM整流器控制策略研究

    當(dāng)三相輸入電壓不平衡時,在靜止坐標(biāo)系下進行分析,一般都忽略了電流的,應(yīng)用傳統(tǒng)比例諧振控制器時存在一個問題,即有功功率與無功功率的耦合嚴(yán)重。針對不平衡電網(wǎng)工況下PWM整流器有功及無功功率嚴(yán)重耦合
    的頭像 發(fā)表于 07-23 14:40 ?192次閱讀
    不平衡電網(wǎng)下基于功率<b class='flag-5'>解</b><b class='flag-5'>耦</b>的PWM整流器控制策略研究

    STM8是否可以一塊驅(qū)動24個光

    小弟今天想做一個24路繼電器的板子,本來是想用24個光 驅(qū)動三極管控制繼電器 ,但是想到STM8的驅(qū)動能力 ,是否STM8引腳 是否可以一塊驅(qū)動24個光。還有 在STM8上電的時候
    發(fā)表于 05-08 06:30

    實踐GoF的23種設(shè)計模式實現(xiàn):橋接模式

    也即,將抽象部分和實現(xiàn)部分進行,使得它們能夠各自往獨立的方向變化。
    的頭像 發(fā)表于 04-14 09:30 ?459次閱讀
    實踐GoF的23種設(shè)計模式實現(xiàn):橋接模式

    智能數(shù)采網(wǎng)關(guān)助力破解軟硬件難題

    不同需求提供可靠的數(shù)字化支持。 軟硬件是指將軟件和硬件進行分離,使得軟件和硬件能夠獨立設(shè)計、開發(fā)、測試和部署,從而提高系統(tǒng)的靈活性、可擴展性和可維護性。在工業(yè)控制領(lǐng)域,由于PLC(可編程邏輯控制器)產(chǎn)品品牌眾多,且通常
    的頭像 發(fā)表于 04-11 15:37 ?411次閱讀
    智能數(shù)采網(wǎng)關(guān)助力破解軟硬件<b class='flag-5'>解</b><b class='flag-5'>耦</b>難題

    817光和2501光區(qū)別 2501光可以代替pc817嗎

    817光(PC817)和2501光(PC2501)是兩種常見的光器件,它們在結(jié)構(gòu)、性能和應(yīng)用上有一些區(qū)別。 首先,817光和2501光
    的頭像 發(fā)表于 04-02 17:30 ?5343次閱讀

    電網(wǎng)列是什么意思?電網(wǎng)故障列裝置的作用與功能有哪些?

    一、電網(wǎng)列的概念電網(wǎng)列簡單來說,就是當(dāng)電力系統(tǒng)因為某些原因(比如設(shè)備故障或受到干擾)而失去穩(wěn)定,無法維持正常的同步運行時,為了防止事故擴大,系統(tǒng)會自動或手動地將電網(wǎng)分成兩個或多個獨立的部分。這樣
    的頭像 發(fā)表于 03-29 12:00 ?6578次閱讀
    電網(wǎng)<b class='flag-5'>解</b>列是什么意思?電網(wǎng)故障<b class='flag-5'>解</b>列裝置的作用與功能有哪些?

    正向光和反向光區(qū)別

    正向光和反向光區(qū)別? 正向光和反向光是電子元件中常見的兩種類型的光,它們在電氣隔離和信號傳輸方面有著不同的特性。本文將詳細(xì)介紹正向
    的頭像 發(fā)表于 02-02 10:08 ?1751次閱讀

    一種常見的設(shè)計

    在模塊劃分時,我們通常會考慮耦合,即盡量減少模塊間的交互,讓模塊間的接口盡量簡單。
    的頭像 發(fā)表于 01-17 10:05 ?574次閱讀
    一種常見的<b class='flag-5'>解</b><b class='flag-5'>耦</b>設(shè)計

    RAM的應(yīng)用-一種常見的設(shè)計

    在模塊劃分時,我們通常會考慮耦合,即盡量減少模塊間的交互,讓模塊間的接口盡量簡單。
    的頭像 發(fā)表于 01-13 17:14 ?690次閱讀
    RAM的應(yīng)用-一種常見的<b class='flag-5'>解</b><b class='flag-5'>耦</b>設(shè)計