0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

全部代碼開源:StarGAN 在 TensorFlow上的簡單實現(xiàn)

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-03 10:40 ? 次閱讀

StarGAN 是去年 11 月由香港科技大學、新澤西大學和韓國大學等機構(gòu)的研究人員提出的一個圖像風格遷移模型,是一種可以在同一個模型中進行多個圖像領域之間的風格轉(zhuǎn)換的對抗生成方法。近日,有研究人員將 StarGAN 在 TensorFlow 上實現(xiàn)的全部代碼開源,相關論文獲 CVPR 2018 Oral。

看代碼之前,我們先來回顧一下 StarGAN 的原始論文。

StarGAN 對抗生成網(wǎng)絡實現(xiàn)多領域圖像變換

圖像到圖像轉(zhuǎn)換(image-to-image translation)這個任務是指改變給定圖像的某一方面,例如,將人的面部表情從微笑改變?yōu)榘櫭肌T谝肷蓪咕W(wǎng)絡(GAN)之后,這項任務有了顯著的改進,包括可以改變頭發(fā)顏色,改變風景圖像的季節(jié)等等。

給定來自兩個不同領域的訓練數(shù)據(jù),這些模型將學習如何將圖像從一個域轉(zhuǎn)換到另一個域。我們將屬性(attribute)定義為圖像中固有的有意義的特征,例如頭發(fā)顏色,性別或年齡等,并且將屬性值(attribute value)表示為屬性的一個特定值,例如頭發(fā)顏色的屬性值可以是黑色 / 金色 / 棕色,性別的屬性值是男性 / 女性。我們進一步將域(domain)表示為共享相同屬性值的一組圖像。例如,女性的圖像可以代表一個 domain,男性的圖像代表另一個 domain。

一些圖像數(shù)據(jù)集帶有多個標簽屬性。例如,CelebA 數(shù)據(jù)集包含 40 個與頭發(fā)顏色、性別和年齡等面部特征相關的標簽,RaFD 數(shù)據(jù)集有 8 個面部表情標簽,如 “高興”、“憤怒”、“悲傷” 等。這些設置使我們能夠執(zhí)行更有趣的任務,即多域圖像到圖像轉(zhuǎn)換(multi-domain image-to-image translation),即根據(jù)來自多個域的屬性改變圖像。

圖 1:通過從 RaFD 數(shù)據(jù)集學習遷移知識,應用到 CelebA 的多域圖像到圖像轉(zhuǎn)換結(jié)果。第一列和第六列顯示輸入圖像,其余列是產(chǎn)生的 StarGAN 圖像。注意,圖像是由一個單一模型網(wǎng)絡生成的,面部表情標簽如生氣、高興、恐懼是從 RaFD 學習的,而不是來自 CelebA。

在圖 1 中,前 5 列顯示了一個 CelebA 的圖像是如何根據(jù) 4 個域(“金發(fā)”、“性別”、“年齡” 和 “白皮膚”)進行轉(zhuǎn)換。我們可以進一步擴展到訓練來自不同數(shù)據(jù)集的多個域,例如聯(lián)合訓練 CelebA 和 RaFD 圖像,使用在 RaFD 上訓練的特征來改變 CelebA 圖像的面部表情,如圖 1 最右邊的列所示。

然而,現(xiàn)有模型在這種多域圖像轉(zhuǎn)換任務中既效率低,效果也不好。它們的低效性是因為在學習 k 個域之間的所有映射時,必須訓練 k(k-1)個生成器。圖 2 說明了如何訓練 12 個不同的生成器網(wǎng)絡以在 4 個不同的域中轉(zhuǎn)換圖像。

圖 2: StarGAN 模型與其他跨域模型的比較。(a)為處理多個域,應該在每兩個域之間都建立跨域模型。(b)StarGAN 用單個生成器學習多域之間的映射。該圖表示連接多個域的拓撲圖。

為了解決這類問題,我們提出了StarGAN,這是一個能夠?qū)W習多個域之間映射的生成對抗網(wǎng)絡。如圖 2(b) 所示,我們的模型接受多個域的訓練數(shù)據(jù),僅使用一個生成器就可以學習所有可用域之間的映射。

這個想法很簡單。我們的模型不是學習固定的轉(zhuǎn)換(例如,將黑頭發(fā)變成金色頭發(fā)),而是將圖像和域信息作為輸入,學習將輸入的圖像靈活地轉(zhuǎn)換為相應的域。我們使用一個標簽來表示域信息。在訓練過程中,我們隨機生成一個目標域標簽,并訓練模型將輸入圖像轉(zhuǎn)換為目標域。這樣,我們可以控制域標簽并在測試階段將圖像轉(zhuǎn)換為任何想要的域。

我們還介紹了一種簡單但有效的方法,通過在域標簽中添加一個掩碼向量(mask vector)來實現(xiàn)不同數(shù)據(jù)集域之間的聯(lián)合訓練。我們提出的方法可以確保模型忽略未知的標簽,并關注特定數(shù)據(jù)集提供的標簽。這樣,我模型就可以很好地完成任務,比如利用從 RaFD 中學到的特征合成 CelebA 圖像的面部表情,如圖 1 最右邊的列所示。據(jù)我們所知,這是第一個在不同的數(shù)據(jù)集上成功地完成多域圖像轉(zhuǎn)換的工作。

總結(jié)而言,這個研究的貢獻如下:

提出 StarGAN,這是一個新的生成對抗網(wǎng)絡,只使用一個生成器和一個鑒別器來學習多個域之間的映射,能有效地利用所有域的圖像進行訓練。

演示了如何通過使用 mask vector 來學習多個數(shù)據(jù)集之間的多域圖像轉(zhuǎn)換,使 StarGAN 能夠控制所有可用的域標簽。

使用 StarGAN 在面部屬性轉(zhuǎn)換和面部表情合成任務提供了定性和定量的結(jié)果,優(yōu)于 baseline 模型

圖 3:StarGAN 的概觀,包含兩個模塊:一個鑒別器 D 和一個生成器 G。(a)D 學習區(qū)分真實圖像和假圖像,并將真實圖像分類到相應的域。(b)G 接受圖像和目標域標簽作為輸入并生成假圖像。 (c)G 嘗試在給定原始域標簽的情況下,從假圖像中重建原始圖像。(d)G 嘗試生成與真實圖像非常像的假圖像,并通過 D 將其分類為目標域。

實驗結(jié)果

圖4:CelebA 數(shù)據(jù)集上面部屬性轉(zhuǎn)換的結(jié)果對凱勒巴數(shù)據(jù)集。第1列顯示輸入圖像,后4列顯示單個屬性轉(zhuǎn)換的結(jié)果,最右邊的列顯示多個屬性的轉(zhuǎn)換結(jié)果。H:頭發(fā)的顏色;G:性別;A:年齡

圖5:RaFD 數(shù)據(jù)集上面部表情合成的結(jié)果

圖6:StarGAN-SNG 和 StarGAN-JNT 在 CelebA 數(shù)據(jù)集上的面部表情合成結(jié)果。

TensorFlow模型的實現(xiàn)

要求:

Tensorflow 1.8

Python 3.6

> python download.py celebA

下載數(shù)據(jù)集

> python download.py celebA

訓練

python main.py --phase train

測試

python main.py --phase test

celebA 測試圖像和你想要的圖像同時運行

預訓練模型

下載celebA_checkpoint

結(jié)果 (128x128, wgan-gp)

女性

男性

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:【CVPR Oral】TensorFlow實現(xiàn)StarGAN代碼全部開源,1天訓練完

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    關于 TensorFlow

    的底層數(shù)據(jù)操作,你也可以自己寫一點c++代碼來豐富底層的操作。真正的可移植性(Portability)Tensorflow CPU和GPU運行,比如說可以運行在臺式機、服務器、手機
    發(fā)表于 03-30 19:57

    阿里云Kubernetes容器服務打造TensorFlow實驗室

    GPU的使用,同時支持最新的TensorFLow版本, 對于數(shù)據(jù)科學家來說既是復雜的,同時也是浪費精力的。阿里云的Kubernetes集群,您可以通過簡單的按鈕提交創(chuàng)建一套完整的
    發(fā)表于 05-10 10:24

    情地使用Tensorflow吧!

    Google Cloud ML服務,我們可以把TensorFlow應用代碼直接提交到云端運行,甚至可以把訓練好的模型直接部署,通過API就可以直接訪問,也得益于
    發(fā)表于 07-22 10:13

    TensorFlow是什么

    更長。TensorFlow 使這一切變得更加簡單快捷,從而縮短了想法到部署之間的實現(xiàn)時間。本教程中,你將學習如何利用 TensorFlow
    發(fā)表于 07-22 10:14

    TensorFlow實現(xiàn)簡單線性回歸

    本小節(jié)直接從 TensorFlow contrib 數(shù)據(jù)集加載數(shù)據(jù)。使用隨機梯度下降優(yōu)化器優(yōu)化單個訓練樣本的系數(shù)。實現(xiàn)簡單線性回歸的具體做法導入需要的所有軟件包: 神經(jīng)網(wǎng)絡中,所有的
    發(fā)表于 08-11 19:34

    TensorFlow實現(xiàn)多元線性回歸(超詳細)

    TensorFlow 實現(xiàn)簡單線性回歸的基礎,可通過權(quán)重和占位符的聲明中稍作修改來對相同
    發(fā)表于 08-11 19:35

    TensorFlow的特點和基本的操作方式

    Tensorflow是Google開源的深度學習框架,來自于Google Brain研究項目,Google第一代分布式機器學習框架DistBelief的基礎發(fā)展起來。
    發(fā)表于 11-23 09:56

    基于TensorFlow Micro代碼為何要這么實現(xiàn)

    Hello World是什么?基于TensorFlow Micro代碼為何要這么實現(xiàn)?
    發(fā)表于 11-10 07:48

    Ubuntu 18.04 for Arm運行的TensorFlow和PyTorch的Docker映像

    ,并做出優(yōu)化以實現(xiàn)盡可能高的性能。我們希望這些 Docker 鏡像和創(chuàng)建它們的方法對希望 AArch64 使用 TensorFlow 和 PyTorch 的人有所幫助。包括什么?構(gòu)
    發(fā)表于 10-14 14:25

    TensorFlow是什么?如何啟動并運行TensorFlow?

    TensorFlow 是一款用于數(shù)值計算的強大的開源軟件庫,特別適用于大規(guī)模機器學習的微調(diào)。 它的基本原理很簡單:首先在 Python 中定義要執(zhí)行的計算圖(例如圖 9-1),然后 Tenso
    的頭像 發(fā)表于 07-29 11:16 ?1.7w次閱讀

    TensorFlow都有哪些功能,大家是否都全部了解呢?

    ,AlphaGo 和 Google Cloud Vision 也是基于 TensorFlow 開發(fā)的。而且 TensorFlow開源的,你可以免費下載并立刻上手操作。
    的頭像 發(fā)表于 09-02 10:20 ?2.1w次閱讀

    開源機器學習平臺TensorFlow的更新內(nèi)容

    TensorFlow 2.2.0-rc0已發(fā)布,據(jù)官方介紹,TensorFlow 是一個采用數(shù)據(jù)流圖(data flow graphs),用于數(shù)值計算的開源軟件庫。
    的頭像 發(fā)表于 03-15 14:53 ?1977次閱讀

    如何在ESP32使用代碼運行TensorFlow模型?

    該項目使用在ESP32運行的TensorFlow Lite創(chuàng)建一個語音控制的機器人。它可以響應簡單的單字命令:“左”,“右”,“前進”和“后退”。
    的頭像 發(fā)表于 04-27 14:54 ?4824次閱讀

    tensorflow簡單的模型訓練

    本文中,我們將詳細介紹如何使用TensorFlow進行簡單的模型訓練。TensorFlow是一個開源的機器學習庫,廣泛用于各種機器學習任務
    的頭像 發(fā)表于 07-05 09:38 ?743次閱讀

    tensorflow和pytorch哪個更簡單?

    PyTorch更簡單。選擇TensorFlow還是PyTorch取決于您的具體需求和偏好。如果您需要一個易于使用、靈活且具有強大社區(qū)支持的框架,PyTorch可能是一個更好的選擇。如果您需要一個
    的頭像 發(fā)表于 07-05 09:45 ?940次閱讀