0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

“Image outpainting”能從一個(gè)圖像片段“推斷”出外延的部分補(bǔ)全成整個(gè)畫面

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-31 09:52 ? 次閱讀

圖像修復(fù)(Image inpainting)是一個(gè)已經(jīng)被廣泛研究的計(jì)算機(jī)視覺問題,即恢復(fù)圖像中缺失的部分。斯坦福大學(xué)CS230課程的Mark Sabini等人提出“Imageoutpainting”,比圖像修復(fù)更進(jìn)一步,能從一個(gè)圖像片段“推斷”出外延的部分,補(bǔ)全成整個(gè)畫面。這篇論文獲得了CS230期末poster的第一名,效果非常驚艷。

這是Painting Outside the Box: Image Outpainting這篇論文的代碼實(shí)現(xiàn)。這篇論文在吳恩達(dá)的斯坦福大學(xué)CS230課程中獲得了期末Poster的第一名。

圖像修復(fù)(Image inpainting)是一個(gè)已經(jīng)被廣泛研究的計(jì)算機(jī)視覺問題,涉及恢復(fù)圖像中缺失的部分。

目前最先進(jìn)的圖像修復(fù)方法方法包括Satoshi Iizuka等人在SIGGRAPH 2017提出的基于GAN的方法[1],以及NVIDIA的Guilin Liu等人提出的基于CNN的方法[2]。

在這個(gè)研究中,我們的目標(biāo)是將[1]的方法拓展到修復(fù)圖像之外的部分(outpainting),即補(bǔ)全超出圖像邊界的畫面。

通過遞歸地進(jìn)行outpainting,可以任意地?cái)U(kuò)展圖像。

問題描述和數(shù)據(jù)準(zhǔn)備

給定一幅 m × n 的源圖像,生成一幅 m × (n + 2k) 的圖像,其中

要解決的問題是:m=128,n=64,k=32

數(shù)據(jù)

baseline圖像:128×128的RGB城市圖像

數(shù)據(jù)集:Place365-Standard [3]

包含36500張256×256的RGB圖像,被降低采樣到128×128

100張圖像用于驗(yàn)證

Place365數(shù)據(jù)集中城市圖像的樣本

數(shù)據(jù)預(yù)處理:

給定圖像,標(biāo)準(zhǔn)化成 [0,1] →?

定義mask M:

定義補(bǔ)足的mask

計(jì)算

設(shè)

堆疊

輸出

方法

訓(xùn)練Pipeline:

使用與文獻(xiàn)[1]類似的DCGAN結(jié)構(gòu)(G,D);

給定Itr,進(jìn)行預(yù)處理來得到In和Ip;

運(yùn)行G(Ip)來得到outpainted的圖像Io;

在Io和ground-truthIn上運(yùn)行D;

訓(xùn)練Schedule:

用于調(diào)節(jié)G和D的三階段訓(xùn)練;

階段i:使用Adam(Ir=0.0001,β1=0.9,β2=0.999,ε=10-8)在迭代Ti中優(yōu)化損失(i);

在18:2:80的分片中選擇T1,T2,T3

α=0.0004控制MSE損失

后處理:

將Io重整化為[0,255]→

使用泊松克?。⊿eamless Cloning)來將進(jìn)行混合

模型

結(jié)構(gòu)

除了G和D的最后一層之外,每一層都是ReLU。G和D的輸出是Sigmoid函數(shù)。其中,η是伸縮因子(dilation factors)。

Outpainting

驗(yàn)證集中保留圖像樣本的修復(fù)結(jié)果,與原始ground-truth一起顯示。模型訓(xùn)練了100個(gè)時(shí)段(相當(dāng)于227,500次迭代),批量大小為16。

Places365的MSE損失

在Place365中訓(xùn)練MSE損失。不同階段的背景顏色是不同的。在階段3中,由于將聯(lián)合損失(joint loss)進(jìn)行了優(yōu)化,MSE損失有小幅度增長。

本地標(biāo)識符(Local Discriminator)

使用本地標(biāo)識符進(jìn)行訓(xùn)練,減少了垂直條帶并提高了色彩保真度,但是增加了artifact和訓(xùn)練時(shí)間。

擴(kuò)張(dilation)的影響

網(wǎng)絡(luò)的訓(xùn)練在城市圖像上過擬合了。在擴(kuò)張不足的情況下,由于接受域有限,網(wǎng)絡(luò)無法outpaint。

遞歸的outpainting

在擴(kuò)展和填充之后,可以將圖像輸入到網(wǎng)絡(luò)中。遞歸地將這個(gè)過程進(jìn)行重復(fù)操作,將圖像的寬度擴(kuò)大到3.5。正如期望的那樣,噪聲隨著連續(xù)迭代而混合。

結(jié)論

最終實(shí)現(xiàn)了圖像的outpainting;

三階段的訓(xùn)練有助于其穩(wěn)定性;

對于outpainting,擴(kuò)張卷積對充分的神經(jīng)元接受域至關(guān)重要

雖然會(huì)伴隨噪聲和誤差,但對outpainting進(jìn)行遞歸是可行的。

用Keras實(shí)現(xiàn)Image Outpainting

在代碼實(shí)現(xiàn)中,我們對256*256的圖像進(jìn)行了一些修改:

添加了Identity loss,即從生成的圖像到原始圖像

從訓(xùn)練數(shù)據(jù)中刪除了patches(訓(xùn)練pipeline)

用裁減(cropping)代替了掩膜(masking)(訓(xùn)練pipeline)

添加了卷積層

結(jié)果

模型用海灘的數(shù)據(jù)訓(xùn)練了200 epochs。

Recursive painting

用Keras實(shí)現(xiàn)Image Outpainting

1. 準(zhǔn)備數(shù)據(jù):

2. 構(gòu)建模型

要從頭開始構(gòu)建模型,你可以直接運(yùn)行’outpaint.ipynb',或

你可以下載訓(xùn)練完成模型,并將其移到“checkpoint/”,然后運(yùn)行它。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1084

    瀏覽量

    40470
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1698

    瀏覽量

    45994

原文標(biāo)題:吳恩達(dá)斯坦福CS230第一名:圖像超級補(bǔ)全,效果驚艷(附代碼)

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    《DNK210使用指南 -CanMV版 V1.0》第三十七章 image圖像對比實(shí)驗(yàn)

    圖像的差值的絕對值,并返回個(gè)image對象,返回的圖像中較暗的部分,即兩
    發(fā)表于 11-07 09:33

    五、畫面處理器

    割是個(gè)很好的選擇。例如工業(yè)處理控制及賭博時(shí)。畫面分割器有四分割、九分割、十六分割幾種,可以在臺監(jiān)視器上同時(shí)顯示4、9、16個(gè)攝像機(jī)的圖像,
    發(fā)表于 07-10 08:54

    數(shù)字圖像處理,Digital Image Processing

    數(shù)字圖像處理,Digital Image ProcessingIntroduction and Digital Image Fundamentals?What is an Image?
    發(fā)表于 06-18 07:49

    急求51單片機(jī)輸出pwm波的程序,能從一個(gè)I/O口輸出就行,之前找了很多都改不對

    急求51單片機(jī)輸出pwm波的程序,能從一個(gè)I/O口輸出就行,之前找了很多都改不對
    發(fā)表于 07-15 10:57

    GoldWave如何裁剪音樂片段

    ,如圖所示,第一個(gè)綠色的按鈕指的是從來開始播放,第二個(gè)按鈕指的是用鼠標(biāo)選定段聲波進(jìn)行播放。通過選擇不同的部分進(jìn)行試聽來選取你要的片段。如圖
    發(fā)表于 12-20 16:59

    怎么設(shè)計(jì)視頻圖像畫面分割器?

    ,設(shè)計(jì)中所使用的獨(dú)立的邏輯電路較多,有的甚至使用專用的DSP芯片去處理視頻畫面的分割。雖然可以滿足對視頻圖像數(shù)據(jù)處理速度的要求,但是還需要外加CPU去協(xié)調(diào)系統(tǒng)工作,使得整個(gè)系統(tǒng)仍顯得體積較大,而且系統(tǒng)
    發(fā)表于 09-25 07:29

    個(gè)能通過空間條件坐標(biāo)和隱變量生成圖像片、并合成完整圖片的網(wǎng)絡(luò)模型

    在前文的架構(gòu)圖中我們已經(jīng)看到它由生成器和判別器兩個(gè)網(wǎng)絡(luò)和兩套坐標(biāo)系統(tǒng)組成,其中包括了細(xì)粒度的局域圖像片坐標(biāo)系統(tǒng)和粗粒度的宏圖像片坐標(biāo)系統(tǒng)。整個(gè)過程中包含了三種
    的頭像 發(fā)表于 04-22 14:37 ?4297次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>能通過空間條件坐標(biāo)和隱變量生成<b class='flag-5'>圖像片</b>、并合成完整圖片的網(wǎng)絡(luò)模型

    Linux的源頭 從一個(gè)故事說起

    Linux的起源:從一個(gè)故事說起
    的頭像 發(fā)表于 01-13 16:38 ?1036次閱讀

    image圖像處理的PHP庫資料免費(fèi)下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是image圖像處理的PHP庫資料免費(fèi)下載。
    發(fā)表于 05-27 12:15 ?10次下載
    <b class='flag-5'>image</b><b class='flag-5'>圖像</b>處理的PHP庫資料免費(fèi)下載

    熟悉Sivarc的畫面規(guī)則,建立個(gè)程序塊與個(gè)畫面對象的鏈接

    3) 創(chuàng)建個(gè)精致屏,例如TP1200,插入個(gè)畫面,例如“根畫面”,輸入文字“西門子Siva
    的頭像 發(fā)表于 09-04 17:34 ?4530次閱讀
    熟悉Sivarc的<b class='flag-5'>畫面</b>規(guī)則,建立<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>程序塊與<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b><b class='flag-5'>畫面</b>對象的鏈接

    Halcon教程:Image、Regiong、XLD基礎(chǔ)

    讀取的3種方式: read_image( image,'filename') ? ? ? //image 是輸出對象,后面是輸入文件的路徑和名稱 讀取多圖:? 1,申明
    的頭像 發(fā)表于 01-07 11:52 ?5175次閱讀
    Halcon教程:<b class='flag-5'>Image</b>、Regiong、XLD基礎(chǔ)

    基于生成式對抗網(wǎng)絡(luò)的圖像補(bǔ)全方法

    圖像補(bǔ)全是數(shù)字圖像處理領(lǐng)域的重要研究方向,具有廣闊的應(yīng)用前景。提出了種基于生成式對抗網(wǎng)絡(luò)(GAN)的圖像
    發(fā)表于 05-19 14:38 ?14次下載

    從一個(gè)名為DDPM的模型說起

    DDPM模型,全稱Denoising Diffusion Probabilistic Model,可以說是現(xiàn)階段diffusion模型的開山鼻祖。不同于前輩GAN、VAE和flow等模型,diffusion模型的整體思路是通過種偏向于優(yōu)化的方式, 逐步從一
    的頭像 發(fā)表于 01-05 15:40 ?1744次閱讀

    20個(gè)解決日常問題的Python代碼片段!

    在本文中,將分享20 個(gè) Python 代碼片段,以幫助你應(yīng)對日常編程挑戰(zhàn)。你可能已經(jīng)知道其中片段,但有些其他片段對你來說可能是新的。趕
    的頭像 發(fā)表于 03-13 09:40 ?1001次閱讀

    半導(dǎo)體襯底和外延的區(qū)別分析

    作為半導(dǎo)體單晶材料制成的晶圓片,它既可以直接進(jìn)入晶圓制造流程,用于生產(chǎn)半導(dǎo)體器件;也可通過外延工藝加工,產(chǎn)出外延片。
    的頭像 發(fā)表于 04-24 12:26 ?3822次閱讀
    半導(dǎo)體襯底和<b class='flag-5'>外延</b>的區(qū)別分析