0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探索GAN的景觀,并討論常見的陷阱和可重復(fù)性等問題

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-16 10:13 ? 次閱讀

隨著GAN越來越多的應(yīng)用到實(shí)際研究當(dāng)中,其技術(shù)中的缺陷與漏洞也隨之出現(xiàn)。從實(shí)際角度對(duì)GAN的當(dāng)前狀態(tài)進(jìn)行深入挖掘與理解就顯得格外重要。來自Google Brain的Karol Kurach等人重現(xiàn)了當(dāng)前的技術(shù)發(fā)展水平,探索GAN的景觀,并討論常見的陷阱和可重復(fù)性等問題。

從實(shí)際角度對(duì)GAN的當(dāng)前狀態(tài)進(jìn)行深入挖掘與理解對(duì)GAN的發(fā)展有著重要的意義。來自Google Brain的Karol Kurach等人重現(xiàn)了當(dāng)前的技術(shù)發(fā)展水平,探索GAN的景觀,并討論常見的陷阱和可重復(fù)性等問題。Lan Goodfellow等AI界大咖也對(duì)此成果表示贊同,并紛紛轉(zhuǎn)載。

深度生成模型可以應(yīng)用于學(xué)習(xí)目標(biāo)分布的任務(wù)。 他們最近在各種應(yīng)用程序中被利用,在自然圖像的背景下充分發(fā)揮其潛力。 生成對(duì)抗網(wǎng)絡(luò)(GAN)是以完全無監(jiān)督的方式學(xué)習(xí)這些模型的主要方法之一。 GAN框架可以被視為一個(gè)雙人游戲,其中第一個(gè)“玩家”,生成器(generator),正在學(xué)習(xí)將一些簡單的輸入分布(通常是標(biāo)準(zhǔn)的多元正態(tài)或均勻)轉(zhuǎn)換為圖像空間上的分布,這樣第二個(gè)“玩家”,鑒別器(discriminator),無法判斷樣本是屬于真實(shí)分布還是合成。 兩位“玩家”的目標(biāo)都是盡量減少自己的損失,而比賽的解決方案就是Nash均衡(equilibrium),任何“玩家”都不能單方面改善他們的損失。 還可以通過最小化模型分布和真實(shí)分布之間的統(tǒng)計(jì)差異來導(dǎo)出GAN框架。

訓(xùn)練GAN需要解決發(fā)生器和鑒別器參數(shù)的最小極大(nimimax)問題。 由于發(fā)生器和鑒別器通常都被參數(shù)化為深度卷積神經(jīng)網(wǎng)絡(luò),所以這種極小極大(minimax)問題在實(shí)踐中是非常困難的。 為此,提出了許多損失函數(shù),正則化和歸一化以及神經(jīng)結(jié)構(gòu)的方案來做選擇。 其中一些是基于理論見解得出的,而另一些則是實(shí)際考慮角度出發(fā)的。

在這項(xiàng)工作中,我們對(duì)這些方法進(jìn)行了全面的實(shí)證分析。我們首先定義GAN landscape—損失函數(shù)集,歸一化和正則化方案以及最常用的體系結(jié)構(gòu)。我們通過超參數(shù)優(yōu)化(hyperparameter optimization),在幾個(gè)現(xiàn)代大規(guī)模數(shù)據(jù)集以及高斯過程回歸(Gaussian Process regression)獲得的數(shù)據(jù)集上探索這個(gè)搜索空間。 通過分析損失函數(shù)的影響,我們得出結(jié)論,非飽和損失(non-saturating loss)在數(shù)據(jù)集、體系結(jié)構(gòu)和超參數(shù)之間足夠穩(wěn)定。然后,我們繼續(xù)分析各種歸一化和正則化方案以及不同的體系結(jié)構(gòu)的效果。我們表明,梯度抑制(gradient penaltyas)以及頻譜歸一化(spectral normalization)在高容量(high-capacity)結(jié)構(gòu)的背景下都是有用的。然后,我們發(fā)現(xiàn)人們可以進(jìn)一步受益于同時(shí)正規(guī)化和規(guī)范化。最后,我們討論了常見的陷阱,可重復(fù)性問題和實(shí)際考慮因素。

GAN Landscape

損失函數(shù)

令P表示目標(biāo)分布,Q表示模型分布。原始的GAN公式有兩種損失函數(shù):minimax GAN和非飽和(NS) GAN。前者,鑒別器最小化二分類問題的負(fù)對(duì)數(shù)似然(即樣本是真的還是假的),相當(dāng)于最小化P和Q之間的Jensen-Shannon(JS)偏差。后者,生成器最大化生成樣本是真實(shí)的概率。對(duì)應(yīng)的損失函數(shù)定義為:

在綜合考慮前人的研究后,我們考慮用最小平方損失(LS),相當(dāng)于最小化P和Q之間的Pearson卡方散度(divergence)。對(duì)應(yīng)的損失函數(shù)定義為:

鑒別器的歸一化和正則化

Gradient norm penalty

在訓(xùn)練點(diǎn)和生成的樣本之間的線性插值上評(píng)估梯度,作為最佳耦合的代理(proxy)。 還可以在數(shù)據(jù)流形周圍評(píng)估梯度損失,這促使鑒別器在該區(qū)域中成分段線性。梯度范數(shù)懲罰可以純粹被認(rèn)為是鑒別器的正則化器,并且它表明它可以改善其他損失的性能。計(jì)算梯度范數(shù)(gradient norms)意味著一個(gè)非平凡的運(yùn)行時(shí)間懲罰(penalty) - 基本上是運(yùn)行時(shí)間的兩倍。

鑒別器歸一化

從優(yōu)化角度(更有效的梯度流、更穩(wěn)定的優(yōu)化)以及從表示的角度來看,歸一化鑒別器是有用的 - 神經(jīng)網(wǎng)絡(luò)中層的表示豐富度取決于相應(yīng)權(quán)重的譜結(jié)構(gòu)矩陣。

從優(yōu)化角度來看,一些關(guān)于GAN的技術(shù)已經(jīng)成熟,例如: Batch normalization和Layer normalization (LN);從表示的角度來看,必須將神經(jīng)網(wǎng)絡(luò)視為(可能是非線性)映射的組合并分析它們的光譜特性(spectral properties)。特別地,為了使鑒別器成為有界線性算子,控制最大奇異值(maximum singular value)就可以了。

生成器和鑒別器機(jī)構(gòu)

我們?cè)谶@項(xiàng)研究中探索了兩類架構(gòu):深度卷積生成對(duì)抗網(wǎng)絡(luò)(DCGAN)和殘余網(wǎng)絡(luò)(ResNet)。ResNet19是一種架構(gòu),在生成器中有五個(gè)ResNet塊,在鑒別器中有六個(gè)ResNet塊,可以在128×128圖像上運(yùn)行。我們?cè)诿總€(gè)鑒別器塊中進(jìn)行下采樣,并且第一個(gè)塊不包含任何自定義更改。 每個(gè)ResNet塊由三個(gè)卷積層組成,這使得鑒別器總共有19層。 表3a和表3b總結(jié)了鑒別器和發(fā)生器的詳細(xì)參數(shù)。 通過這種設(shè)置,我們能夠重現(xiàn)并改進(jìn)當(dāng)前已有的最好結(jié)果。

評(píng)估方法

我們專注于幾個(gè)最近提出的非常適合圖像域的指標(biāo)。

Inception Score (IS)

IS提供了一種定量評(píng)估生成樣本質(zhì)量的方法。 包含有意義對(duì)象的樣本的條件標(biāo)簽分布應(yīng)該具有低熵,并且樣本的可變性應(yīng)該高。 IS可以表示為:

來自P和Q的樣本首先嵌入到特征空間(InceptionNet的特定層)中。 然后,假設(shè)嵌入數(shù)據(jù)遵循多元高斯分布,估計(jì)均值和協(xié)方差。 最后,計(jì)算這兩個(gè)高斯之間的Fréchet距離:

圖像質(zhì)量(MS-SSIM)和多樣性的多尺度結(jié)構(gòu)相似性

GAN中的一個(gè)關(guān)鍵問題是模式崩潰和模式丟失 - 無法捕獲模式,或者從給定模式生成樣本的多樣性較低。MS-SSIM得分用于測(cè)量兩個(gè)圖像的相似度,其中較高的MS-SSIM得分表示更相似的圖像。

數(shù)據(jù)集

我們考慮三個(gè)數(shù)據(jù)集,即CIFAR10,CELEBA-HQ-128和LSUN-BEDROOM。LSUN-BEDROOM數(shù)據(jù)集[包含300多萬張圖像。 我們將圖像隨機(jī)分成訓(xùn)練集和測(cè)試集,使用30588張圖像作為測(cè)試集。 其次,我們使用30k張圖像的CELEBA-HQ數(shù)據(jù)集,將3000個(gè)示例作為測(cè)試集,其余示例作為訓(xùn)練集。 最后,為了重現(xiàn)現(xiàn)有結(jié)果,我們還采用了CIFAR10數(shù)據(jù)集,其中包含70K張圖像(32x32x3),60000個(gè)訓(xùn)練實(shí)例和10000個(gè)測(cè)試實(shí)例。 CELEBA-HQ-128的基線FID評(píng)分為12.6,LSUN-BEDROOM為3.8,CIFAR10為5.19。

實(shí)驗(yàn)結(jié)果

損失函數(shù)的影響

非飽和(NS)損失在兩個(gè)數(shù)據(jù)集上都是穩(wěn)定的

Gradient penalty和光譜(spectral)歸一化提高了模型質(zhì)量。 從計(jì)算預(yù)算的角度來看(即,需要訓(xùn)練多少個(gè)模型以達(dá)到某個(gè)FID),光譜歸一化和Gradient penalty都比基線表現(xiàn)更好,但前者更有效。

Gradient penalty和譜歸一化(SN)都表現(xiàn)良好,應(yīng)該被認(rèn)為是可行的方法,而后者在計(jì)算成本上更好。 可惜的是,沒有人能完全解決穩(wěn)定性問題。

歸一化和正則化的影響

Gradient penalty加上光譜歸一化(SN)或?qū)託w一化(LN)大大提高了基線的性能

生成器和鑒別器結(jié)構(gòu)的影響

鑒別器和發(fā)生器結(jié)構(gòu)對(duì)非飽和GAN損失的影響。光譜歸一化和Gradient penalty可以幫助改進(jìn)非正則化基線。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 發(fā)生器
    +關(guān)注

    關(guān)注

    4

    文章

    1368

    瀏覽量

    61705
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1936

    瀏覽量

    73533
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1208

    瀏覽量

    24713

原文標(biāo)題:【GAN全局實(shí)用手冊(cè)】谷歌大腦最新研究,Goodfellow力薦

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    具有10MHz的重復(fù)性能的有源濾波器模塊LT1568

    DN324精密有源濾波器模塊,具有10MHz的重復(fù)性
    發(fā)表于 06-06 16:45

    PGA-SAR系統(tǒng)無法達(dá)到12比特級(jí)別的重復(fù)性時(shí),Δ-Σ系統(tǒng)會(huì)怎么樣呢?

    PGA-SAR系統(tǒng)如何才能達(dá)到12比特重復(fù)性性能?PGA-SAR系統(tǒng)無法達(dá)到12比特級(jí)別的重復(fù)性時(shí),Δ-Σ系統(tǒng)會(huì)怎么樣呢?Δ-Σ轉(zhuǎn)換器的過程增益如何?
    發(fā)表于 04-07 06:34

    測(cè)量系統(tǒng)的的重復(fù)性和重現(xiàn)性

    測(cè)量系統(tǒng)的的重復(fù)性和重現(xiàn)性:在MSA中的相當(dāng)重要的一部分是研究測(cè)量系統(tǒng)的重復(fù)性(Repeatability)和重現(xiàn)性(Reproducibility). 在六個(gè)西格瑪?shù)姆椒ㄕ撝? 也是每個(gè)項(xiàng)目都必須要完成的工作.
    發(fā)表于 08-16 13:14 ?17次下載

    相控陣探頭的重復(fù)性與可靠性

    相控陣探頭的重復(fù)性與可靠性 Over the past few years, new procedures involving phased array technology were
    發(fā)表于 03-20 10:45 ?24次下載

    選轉(zhuǎn)換器?考慮下時(shí)序、精確度和重復(fù)性以外的參考

    在您決定哪種轉(zhuǎn)換器最為適合于您的應(yīng)用時(shí),您可能會(huì)首先想到速度、精確度以及未來系統(tǒng)的重復(fù)性。好吧,這都沒問題,但請(qǐng)不要局限于這些顯而易見的東西。
    發(fā)表于 03-06 10:04 ?677次閱讀

    并行傳感器如何提高傾斜測(cè)量的精度和重復(fù)性

    并行傳感器如何提高傾斜測(cè)量的精度和重復(fù)性?具體的跟隨小編通過本文來詳細(xì)的了解下。
    的頭像 發(fā)表于 07-11 13:27 ?3380次閱讀

    基于賽靈思FPGA設(shè)計(jì)的整體時(shí)序具有完全重復(fù)性

    滿足設(shè)計(jì)的時(shí)序要求本身已非易事,而要實(shí)現(xiàn)某項(xiàng)設(shè)計(jì)的整體時(shí)序具有完全重復(fù)性有時(shí)候卻是不可能的任務(wù)。幸運(yùn)的是,設(shè)計(jì)人員可以借助有助于實(shí)現(xiàn)重復(fù)時(shí)序結(jié)果的設(shè)計(jì)流程概念。影響最大的四個(gè)方面
    發(fā)表于 11-24 19:07 ?797次閱讀

    微帶傳輸線PIM測(cè)試可重復(fù)性的問答詳解

    羅杰斯“微帶傳輸線無源互調(diào)(PIM)測(cè)試可重復(fù)性”技術(shù)講座已于6月10日上午10:00-12:00成功召開。以下是精選了一些網(wǎng)友所提出的問題及羅杰斯技術(shù)專家的解答,與您分享。網(wǎng)友提問:反轉(zhuǎn)銅箔和普通
    發(fā)表于 01-25 10:31 ?3次下載

    機(jī)器人技術(shù)的重復(fù)性和準(zhǔn)確性分析

    工業(yè)機(jī)器人具有許多度量或可測(cè)量的特征,這將直接影響機(jī)器人在執(zhí)行任務(wù)期間的效率。可測(cè)量特性主要指的是重復(fù)性和準(zhǔn)確性。
    發(fā)表于 09-17 14:47 ?2829次閱讀
    機(jī)器人技術(shù)的<b class='flag-5'>可</b><b class='flag-5'>重復(fù)性</b>和準(zhǔn)確性分析

    計(jì)量標(biāo)準(zhǔn)重復(fù)性的測(cè)量方法

    計(jì)量標(biāo)準(zhǔn)的重復(fù)性規(guī)定用測(cè)量結(jié)果的分散性來定量地表示,即用單次測(cè)量結(jié)果yi的實(shí)驗(yàn)標(biāo)準(zhǔn)差s(yi)來表示。當(dāng)測(cè)量結(jié)果由單次測(cè)量得到時(shí),它直接就是由重復(fù)性引入的不確定度分量。
    的頭像 發(fā)表于 11-12 14:19 ?2w次閱讀

    計(jì)量標(biāo)準(zhǔn)的重復(fù)性考核要求

    計(jì)量標(biāo)準(zhǔn)的重復(fù)性規(guī)定用測(cè)量結(jié)果的分散性來定量地表示,即用單次測(cè)量結(jié)果yi的實(shí)驗(yàn)標(biāo)準(zhǔn)差s(yi)來表示。當(dāng)測(cè)量結(jié)果由單次測(cè)量得到時(shí),它直接就是由重復(fù)性引入的不確定度分量。當(dāng)
    的頭像 發(fā)表于 03-18 10:21 ?3373次閱讀

    如何實(shí)現(xiàn)FPGA的重復(fù)性設(shè)計(jì)

    HDL 設(shè)計(jì) ? ? ? ? 具有非常高的資源利用率和頻率要求的設(shè)計(jì)要獲得重復(fù)的結(jié)果是一件最具挑戰(zhàn)性的事情,但是它們也是最需要重復(fù)結(jié)果的設(shè)計(jì)。獲得
    的頭像 發(fā)表于 02-09 03:05 ?829次閱讀

    計(jì)量標(biāo)準(zhǔn)的重復(fù)性考核要求

    在進(jìn)行重復(fù)性測(cè)量時(shí),相同的測(cè)量程序,相同的觀測(cè)者,使用相同的儀器,以及相同地點(diǎn)要求一般均能得到滿足而不會(huì)有任何問題。關(guān)鍵是如何理解“在相同的條件下”以及“在短時(shí)間內(nèi)重復(fù)測(cè)量”這兩條要求。
    的頭像 發(fā)表于 07-19 15:52 ?2361次閱讀
    計(jì)量標(biāo)準(zhǔn)的<b class='flag-5'>重復(fù)性</b>考核要求

    立儀科技光譜共焦應(yīng)用之金屬隔膜靜態(tài)重復(fù)性測(cè)量

    01|檢測(cè)需求:金屬隔膜重復(fù)性測(cè)量 ? 立儀科技光譜共焦應(yīng)用之金屬隔膜靜態(tài)重復(fù)性測(cè)量 02|檢測(cè)方式 為了保證精度,首先先用千分尺進(jìn)行測(cè)量,得出相應(yīng)的厚度數(shù)據(jù),在選擇合適的側(cè)頭,根據(jù)結(jié)果,我們現(xiàn)在立
    的頭像 發(fā)表于 08-09 14:33 ?270次閱讀
    立儀科技光譜共焦應(yīng)用之金屬隔膜靜態(tài)<b class='flag-5'>重復(fù)性</b>測(cè)量

    精密高壓開關(guān):實(shí)現(xiàn)安全、可靠性和重復(fù)性 (一)

    的模塊化開關(guān)系統(tǒng)如何以安全、可靠和高重復(fù)性,以滿足不斷提高的電壓水平下對(duì)精密開關(guān)的新需求,并同時(shí)討論改善測(cè)量性能與準(zhǔn)確度的方法。 目錄 對(duì)高壓開關(guān)的需求從何而來? 為什么是500 V? 模塊化測(cè)試系統(tǒng)在高壓應(yīng)用中的優(yōu)勢(shì) 安全、
    的頭像 發(fā)表于 12-05 11:53 ?136次閱讀