0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種新的算法StructureFlow重建新算法實現(xiàn)高性能圖像修復

nlfO_thejiangme ? 來源:lq ? 2019-10-01 16:36 ? 次閱讀

圖像修復技術(shù)對于眾多修圖軟件來說十分重要,在深度學習的幫助下圖像修復算法的功能越來越強大,甚至對于大幅度污損的照片也能輕松修復。但目前的很多算法在進行圖像修復時卻面臨著結(jié)構(gòu)重建問題或細節(jié)問題修復問題的困難,修復結(jié)果不盡如人意。

為了解決這一問題,來自北大、鵬城實驗室和騰訊的研究人員提出了一種新的算法StructureFlow,將圖像修復的過程分為邊緣保持的低頻結(jié)構(gòu)重建和基于結(jié)構(gòu)的高分辨率紋理重建,并利用流的方法充分利用未受損像素的信息實現(xiàn)有效的紋理補全和圖像修復。

圖像修復的主要目的在于為圖像中的有效區(qū)域和污損區(qū)域生成出視覺效果完整的結(jié)構(gòu)和細節(jié),用戶不僅可以利用這一技術(shù)修復圖像的缺失,還可以將它用于圖像編輯和物體去除等任務(wù)。圖像修復最大的難點在于生成正確完整的結(jié)構(gòu)和視覺效果較為真實的細節(jié)紋理。

已有的圖像修復方法

現(xiàn)存的方法主要可以分為兩大類——基于擴散的方法和基于圖像片的方法。

基于擴散的方法主要通過將領(lǐng)域的信息傳播到缺失的位置來實現(xiàn)紋理合成,然而這種方法只能處理一些較小的孔洞,對于較大范圍的結(jié)構(gòu)缺失則無法有效處理。

而基于圖像片的方法則不僅僅只利用缺失位置附近的像素點,這種方法可以有效利用更遠位置的信息來恢復缺失區(qū)域?;趫D像片的方法通過搜索與污損區(qū)域結(jié)構(gòu)相似的目標區(qū)域,并復制圖像片來重建缺失區(qū)域,這種方法可以為較大的缺失區(qū)域生成視覺效果真實紋理。這種方法一般基于雙線性相似性的方法來搜索合適的圖像片。

但基于片元的方法主要假設(shè)非污損區(qū)域包含了與污損區(qū)域語義相似的內(nèi)容,但如人臉檢測等任務(wù)中這種假設(shè)并不成立。這種方法在某些有重復性結(jié)構(gòu)的圖像中表現(xiàn)良好,但對于具有特殊結(jié)構(gòu)的圖像則無法有效處理。

近年來隨著深度學習的發(fā)展,很多方法將圖像修復問題視為一個條件生成問題,將污損圖像作為網(wǎng)絡(luò)輸入得到修復后的圖像?;谏疃葘W習方法的優(yōu)勢在于可以將圖像中的有效語義信息進行抽取,并生成新的圖像。

人們提出了包括基于自編碼器架構(gòu)、處理全局和局部內(nèi)容的判別器、構(gòu)建長程相關(guān)性、選擇性利用有效像素以及邊緣修復等方法來進行圖像修復但都存在著諸如長程相關(guān)性無法有效表示、邊緣信息無法有效攜帶紋理等問題,使得這些方法得到的結(jié)果都有這樣或那樣的不足。

StructureFlow

為了解決先前模型存在的問題,研究人員們提出了一種新穎的兩階段網(wǎng)絡(luò)模型倆實現(xiàn)高質(zhì)量的圖像修復。這一模型包含了兩個部分,分別是結(jié)構(gòu)生成器和紋理細節(jié)生成器。

研究人員認為圖像的修復過程是一個先生成有效結(jié)構(gòu)再補全真實細節(jié)的過程。所以網(wǎng)絡(luò)的第一部分用于生成有意義的結(jié)構(gòu),研究人員采用了保邊平滑后的圖像來表示圖像場景的全局結(jié)構(gòu)。

保邊平滑方法的主要目標在于移除圖像中的高頻紋理,同時保持銳利邊緣和低頻信息(這些信息是圖像結(jié)構(gòu)的主要組成部分)。利用保邊平滑后的圖像進行訓練,結(jié)構(gòu)重建器可以集中于恢復全局結(jié)構(gòu)而無需考慮細節(jié)和紋理的干擾。

在重建出缺失細節(jié)后,紋理生成器就可以基于重建出的結(jié)構(gòu)圖來合成高頻的細節(jié)了。由于圖像領(lǐng)域的相似結(jié)構(gòu)具有很強的相關(guān)性,所有未被污損的區(qū)域可以用于修復缺失區(qū)域的紋理。

雖然卷積網(wǎng)絡(luò)對于長程相關(guān)性建模比較困難,但研究人員提出了基于圖像外觀流(appearance flow,AF)的方法來從相似結(jié)構(gòu)區(qū)域采樣,為不同區(qū)域構(gòu)建清晰關(guān)系。此外研究人員還利用了高斯采樣代替了雙線性采樣來拓展了采樣操作的感受野,并引入了新的采樣正確性損失函數(shù)來訓練采樣過程,以此得到了性能較高的圖像修復模型。

實現(xiàn)細節(jié)

在結(jié)構(gòu)重建器中,研究人員將最小化生成的低頻結(jié)構(gòu)圖像與平滑后原圖間的誤差。第一階段的監(jiān)督信號主要來自于GT圖的平滑結(jié)果,使用了保邊平滑算法RTV來得到保持圖像主要結(jié)構(gòu)的圖片作為標簽。模型的主要結(jié)構(gòu)基于自編碼器架構(gòu)得到,添加了一系列殘差塊用于特征的優(yōu)化提取。Gs和Gt分別代表了第一階段的結(jié)構(gòu)生成器和第二階段的紋理生成器,而判別器則使用了類似于BicycleGAN的架構(gòu),利用了兩個不同尺度的PatchGAN來預測不同尺度生成圖像的真?zhèn)巍?/p>

值得一提的是,這一模型中使用了流的概念來將未受損區(qū)域的紋理信息賦予需要修復區(qū)域。但原始的AF方法是以一種非監(jiān)督的方法,網(wǎng)絡(luò)無法處理較大的運動和較差的局域最小值。

為了解決這一問題,研究人員提出了利用高斯采樣的方法來代替原先的雙線性采樣方法以擴展感受野,并提出了采樣正確性損失來約束可能的收斂結(jié)果。采樣過程通過輸入像素(特征)來計算梯度,如果感受野受限只能有少量像素參與計算。由于相鄰像素具有較強的相關(guān)性,所以較大的感受野有助于獲得較為正確和穩(wěn)定的梯度。雙線性采樣的感受野較小,不適合于長程相關(guān)性的采樣建模。而高斯相關(guān)性則可以在較大的感受野中進行采樣。下式中的權(quán)重aij便是可調(diào)整方差的高斯核。

而新提出的采樣正確性損失則用于衡量模型的采樣是否良好,并約束AF場的信息流動。在實際使用中,研究人員主要使用了VGG19層的特征來計基準特征和采樣特征之間的余弦距離,以判斷這一采樣是否合適。

實驗結(jié)果

研究人員分別在Place2,Celeba和Paris StreetView數(shù)據(jù)集上進行了實驗,并利用Irregular Masks數(shù)據(jù)集生成缺失污損的圖像。

利用客觀的SSIM,PSNR和FID進行客觀測評,同時也利用MTurk平臺進行了主觀質(zhì)量測試。下圖顯示了研究人員提出的方法與Contextual Attention(CA),Partial Convolution(PConv)和EdgeConnect等方法的比較。

下表中可以看到在多個數(shù)據(jù)集上本方法都獲得了明顯的指標提升。

研究人員還將這一算法用于圖像編輯任務(wù)中去,將圖中不希望出現(xiàn)的物體涂上掩膜,就可以修復出完整高質(zhì)量的清晰圖像。同時也可以在結(jié)構(gòu)圖上進行編輯為生成的圖像增加新的物體或內(nèi)容。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4624

    瀏覽量

    93110
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1088

    瀏覽量

    40515
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5510

    瀏覽量

    121338

原文標題:全局細節(jié)統(tǒng)統(tǒng)修復——StructureFlow重建新算法實現(xiàn)高性能圖像修復

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【「從算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+內(nèi)容簡介

    內(nèi)容簡介這是本深入解讀基礎(chǔ)算法及其電路設(shè)計,以打通算法研發(fā)到數(shù)字IC設(shè)計的實現(xiàn)屏障,以及指導芯片設(shè)計工程師從底層掌握復雜電路設(shè)計與優(yōu)化方法為目標的專業(yè)技術(shù)書。任何芯片(如WiFi芯片
    發(fā)表于 11-21 17:14

    【「從算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+介紹基礎(chǔ)硬件算法模塊

    作為嵌入式開發(fā)者往往比較關(guān)注硬件和軟件的協(xié)調(diào)。本書介紹了除法器,信號發(fā)生器,濾波器,分頻器等基本算法的電路實現(xiàn),雖然都是基礎(chǔ)內(nèi)容,但是也是最常用到的基本模塊。 隨著逆全球化趨勢的出現(xiàn),過去的研發(fā)
    發(fā)表于 11-21 17:05

    【「從算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+本介紹基礎(chǔ)硬件算法模塊實現(xiàn)的好書

    看下本書內(nèi)容簡介,然后再瀏覽下各個章節(jié)的內(nèi)容。 從簡介來看,本書也是關(guān)注最基礎(chǔ),最常用的那部分算法的電路實現(xiàn),比較貼合工程實踐,適合無基礎(chǔ)或者有定基礎(chǔ)的線工程人員閱讀。內(nèi)容選擇
    發(fā)表于 11-20 13:42

    Pure path studio內(nèi)能否自己創(chuàng)建個component,來實現(xiàn)特定的算法,例如LMS算法

    TLV320AIC3254EVM-K評估模塊, Pure path studio軟件開發(fā)環(huán)境。 問題:1.Pure path studio 內(nèi)能否自己創(chuàng)建個component,來實現(xiàn)特定的算法
    發(fā)表于 11-01 08:25

    抖動跟蹤不丟失 慧視圖像跟蹤板和自研算法強勢升級

    成都慧視開發(fā)的Viztra-HE030圖像處理板是采用了瑞芯微旗艦級高性能芯片RK3588,能夠憑借八核處理核心輸出至高6.0TOPS的算力,在算法的強力輔助下,能夠實現(xiàn)對目標的穩(wěn)定鎖
    的頭像 發(fā)表于 09-04 08:05 ?490次閱讀
    抖動跟蹤不丟失 慧視<b class='flag-5'>圖像</b>跟蹤板和自研<b class='flag-5'>算法</b>強勢升級

    圖像識別算法有哪幾種

    圖像識別算法是計算機視覺領(lǐng)域的核心技術(shù)之,它通過分析和處理圖像數(shù)據(jù),實現(xiàn)圖像中的目標、場景和
    的頭像 發(fā)表于 07-16 11:22 ?1212次閱讀

    圖像識別算法都有哪些方法

    圖像識別算法是計算機視覺領(lǐng)域的核心任務(wù)之,它涉及到從圖像中提取特征并進行分類、識別和分析的過程。隨著深度學習技術(shù)的不斷發(fā)展,圖像識別
    的頭像 發(fā)表于 07-16 11:14 ?5810次閱讀

    圖像識別算法的提升有哪些

    方法。 數(shù)據(jù)增強 數(shù)據(jù)增強是提高圖像識別算法性能一種有效方法。通過對訓練數(shù)據(jù)進行變換和擴展,可以增加數(shù)據(jù)的多樣性,提高模型的泛化能力。常見的數(shù)據(jù)增強方法包括: 2.1 旋轉(zhuǎn)、縮放、平
    的頭像 發(fā)表于 07-16 11:12 ?689次閱讀

    圖像識別算法的優(yōu)缺點有哪些

    圖像識別算法一種利用計算機視覺技術(shù)對圖像進行分析和理解的方法,它在許多領(lǐng)域都有廣泛的應(yīng)用,如自動駕駛、醫(yī)療診斷、安全監(jiān)控等。然而,圖像識別
    的頭像 發(fā)表于 07-16 11:09 ?1783次閱讀

    圖像識別算法的核心技術(shù)是什么

    圖像識別算法是計算機視覺領(lǐng)域的個重要研究方向,其目標是使計算機能夠像人類樣理解和識別圖像中的內(nèi)容。
    的頭像 發(fā)表于 07-16 11:02 ?689次閱讀

    opencv圖像識別有什么算法

    OpenCV(Open Source Computer Vision Library)是個開源的計算機視覺和機器學習軟件庫,提供了大量的圖像處理和計算機視覺相關(guān)的算法。以下是些常見
    的頭像 發(fā)表于 07-16 10:40 ?1138次閱讀

    基于FPGA的常見的圖像算法模塊總結(jié)

    意在給大家補充下基于FPGA的圖像算法基礎(chǔ),于是講解了下常見的圖像算法模塊,經(jīng)過個人的總結(jié),
    的頭像 發(fā)表于 04-28 11:45 ?628次閱讀
    基于FPGA的常見的<b class='flag-5'>圖像</b><b class='flag-5'>算法</b>模塊總結(jié)

    SAGE算法性能分析

    電子發(fā)燒友網(wǎng)站提供《SAGE算法性能分析.pdf》資料免費下載
    發(fā)表于 02-28 10:38 ?0次下載

    基于NeRF/Gaussian的全新SLAM算法

    基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數(shù),通過可微分渲染捕獲稠密的光度信息,具有高保真度。
    的頭像 發(fā)表于 01-26 10:48 ?678次閱讀
    基于NeRF/Gaussian的全新SLAM<b class='flag-5'>算法</b>

    Camera算法集成實現(xiàn)指南

    最常見的雙攝算法是雙攝景深算法或者叫雙攝背景虛化算法,除此之外,也有彩色+黑白用于增強夜拍效果的雙攝算法。單幀算法和多幀
    的頭像 發(fā)表于 01-25 15:12 ?2125次閱讀