0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于GAN先驗的退化感知特征插值人臉修復(fù)網(wǎng)絡(luò)

jf_pmFSk4VX ? 來源:GiantPandaCV ? 2023-02-23 11:43 ? 次閱讀

背景介紹

人臉修復(fù)是一種典型的ill-posed問題、可逆圖像修復(fù)問題,其解不唯一且必存在。高度退化和多退化的場景下,高質(zhì)量的人臉修復(fù)明顯更具有挑戰(zhàn)性。傳統(tǒng)深度學(xué)習(xí)方法利用成對的數(shù)據(jù)集訓(xùn)練模型從而獲得處理該退化問題的能力,這些普通范式雖然在全局人臉結(jié)構(gòu)上有不錯的效果,但是明顯在修復(fù)結(jié)果的細(xì)節(jié)豐富度上并不理想。

因此,近一兩年,頂會上出現(xiàn)了不少基于GAN先驗特征的人臉修復(fù)方法。這些方法通過將退化的人臉圖像編碼到訓(xùn)練好的GAN網(wǎng)絡(luò)的潛在空間中,利用隱藏在GAN網(wǎng)絡(luò)中豐富的圖像先驗知識,來獲得更好的人臉修復(fù)細(xì)節(jié)。但是,常見的GAN網(wǎng)絡(luò)的latent features維度并不高,這些特征的空間表達(dá)能力也不佳,難以完整捕獲退化人臉圖像的面部結(jié)構(gòu),造成恢復(fù)結(jié)果的身份信息與原圖并不一致,即方法結(jié)果的保真度較低。

為了進(jìn)一步、更完整得捕獲輸入退化圖像的面部特征,一些方法不僅將降質(zhì)人臉圖像編碼到潛空間中,而且還將外部特征(例如從降質(zhì)人臉圖像中提取的特征)與 GAN 先驗特征融合起來,以實現(xiàn)更好的身份一致性。然而,它們并沒有提供明確的降質(zhì)感知的特征融合設(shè)計,因此在面對不同的、多變的退化時,修復(fù)效果的魯棒性并不理想。

受最近對比學(xué)習(xí)范式的啟發(fā),作者團(tuán)隊首先提出一種無監(jiān)督的退化表征學(xué)習(xí)策略,旨在利用對比學(xué)習(xí)和視覺注意力的最新進(jìn)展,預(yù)訓(xùn)練一個退化表示編碼器(DRE)。DRE 提取輸入退化人臉圖像的退化表征,作為全局條件指導(dǎo)恢復(fù)過程。此外,作者還提出了一種新的退化感知特征插值(DAFI)模塊,可以根據(jù)退化表征動態(tài)融合 GAN 先驗特征和從退化人臉圖像中提取的特征。

作者團(tuán)隊進(jìn)一步提出了一種新的網(wǎng)絡(luò),以集成這些設(shè)計用于人臉修復(fù)任務(wù)。由于選擇和融合不同來源的特征的思路類似于制作 panini (帕尼尼,KFC早餐經(jīng)典食品)的方式,因此將這個網(wǎng)絡(luò)稱為 Panini-Net。該網(wǎng)絡(luò)可以根據(jù)退化程度動態(tài)調(diào)整融合的特征比例,以實現(xiàn)更好的修復(fù)性能。

方法介紹

下面將逐一介紹Panini-Net的各個模塊,最后將總結(jié)該方法的重點內(nèi)容。

ff4fc592-b329-11ed-bfe3-dac502259ad0.png

Panini-Net架構(gòu)圖。它由圖像特征提取模塊(Image Feature Extraction Module)、退化感知特征插值模塊組成(DAFI) 模塊,以預(yù)訓(xùn)練的 StyleGAN2 作為 GAN Prior 模塊 (GPM)。給定退化的人臉圖像作為輸入,圖像特征提取模塊提取特征,并預(yù)測latent code,該latent code可以從 GPM 中粗略地獲取類似的高質(zhì)量人臉。然后,使用 DAFI 塊逐步對特征做插值處理從而合并退化人臉圖像的有效結(jié)構(gòu)信息。預(yù)訓(xùn)練的退化表示編碼器 (DRE) 將退化表示編碼為向量,其可以被視為指導(dǎo) DAFI 塊進(jìn)行恢復(fù)的全局條件。

GAN Prior Module

Panini-Net采用預(yù)訓(xùn)練的StyleGAN2的生成器來作為GAN先驗?zāi)K,如上圖中所示,該模塊從一個可學(xué)習(xí)的常量特征開始,逐漸通過一系列的GAN blocks來生成分層的高質(zhì)量特征圖,從而將其配合退化感知特征插值模塊,通過動態(tài)的特征融合來矯正面部結(jié)構(gòu)。

Unsupervised Degradation Representation Learning for Degradation Representation

ff7ea22c-b329-11ed-bfe3-dac502259ad0.png

退化表示的無監(jiān)督退化表示學(xué)習(xí)策略。對于每次迭代,隨機(jī)生成一組新的退化參數(shù),并在兩個高質(zhì)量圖像上操作它們從而得到不同的新 HQ 圖像生成正例對。讓隊列中的歷史圖像成為反例,以鼓勵學(xué)習(xí)退化而不是內(nèi)容。

無監(jiān)督表征學(xué)習(xí)(Unsupervised Degradation Representation Learning )用于圖像修復(fù)(超分)其實不是一個比較新的idea,之前cvpr‘21的超分工作DASR,以及cvpr’22的AirNet都有類似的范式來作為方案的核心。不過在Panini-Net中,該部分還是挺不一樣的。

具體來說,如上圖所示,先在兩個不同的高質(zhì)量人臉圖像上應(yīng)用同一組退化參數(shù)來得到兩個內(nèi)容不同、退化模式不同的退化圖像,隨后利用MoCo范式來執(zhí)行對比學(xué)習(xí),所利用的約束也是常見的InfoNCE loss,從而鼓勵學(xué)習(xí)退化而不是內(nèi)容。cvpr‘21的超分工作DASR,以及cvpr’22的AirNet的論文名字:Unsupervised Degradation Representation Learning for Blind Super-Resolution (CVPR'21)All-in-one image restoration for unknown corruption (CVPR'22)

Degradation-aware Feature Interpolation (DAFI) block

ffa5d50e-b329-11ed-bfe3-dac502259ad0.png

退化感知特征插值 (DAFI) 塊,無監(jiān)督退化特征學(xué)習(xí)方式訓(xùn)練得到的encdoer從退化圖像中抽取出V_{DR}作為退化的判別表征,該表征可以作為一種“condition”來生成自適應(yīng)的channel-wise mask。可以從上圖中看出,mask由一個mlp子網(wǎng)絡(luò)和softmax來生成。這個mask 將用于動態(tài)特征插值從而輔助特征的融合。

在獲得退化的判別表征后,Panini-Net將其作為一個全局的退化“condition”從而指導(dǎo)退化修復(fù),具體來說,通過如上圖所示的mask,該mask的size為:,即channel-wise的形式。將每個mask元素用于對應(yīng)的融合特征通道的插值權(quán)重。通過如下插值公式,來利用該mask來靈活的動態(tài)融合不同特征:

其中表示channel-wise上的點積。

實驗分析&視覺效果對比

ffd90a0a-b329-11ed-bfe3-dac502259ad0.png

16xSR設(shè)定下的視覺對比圖,可以看到PaniniNet很好的修復(fù)了退化圖像的細(xì)節(jié)信息,保真度也非常不錯。

00083294-b32a-11ed-bfe3-dac502259ad0.png

消融實驗

作者在正文消融實驗部分重點探討了利用DAFI模塊作為fusion操作的增益,并對Panini-Net的關(guān)鍵超參做了剖析。對fusion操作的探討,主要是和直接利用concat+conv來fusion的常見操作做了對比,模型剖析部分則重點關(guān)注退化水平與插值比率的超參關(guān)系。

作者發(fā)現(xiàn)DAFI模塊可以更好的保留GAN先驗特征中的細(xì)節(jié)信息,而global condition guidance可以幫助DAFI更好的去fusion特征。當(dāng)退化嚴(yán)重時,Panini-Net可以動態(tài)增加GAN-Prior的使用比例。

結(jié)論

這篇論文重點關(guān)注如何更好的引入GAN Prior從而幫助人臉圖像修復(fù)問題,作者通過無監(jiān)督表征學(xué)習(xí)和結(jié)合mask策略的插值(特征融合)模塊來將GAN prior動態(tài)的引入到修復(fù)網(wǎng)絡(luò)中,實現(xiàn)了非常不錯的修復(fù)效果。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3646

    瀏覽量

    134657
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1943

    瀏覽量

    73585
  • 圖像編碼
    +關(guān)注

    關(guān)注

    0

    文章

    26

    瀏覽量

    8340

原文標(biāo)題:AAAI'22 | Panini-Net | 基于GAN先驗的退化感知特征插值人臉修復(fù)網(wǎng)絡(luò)

文章出處:【微信號:GiantPandaCV,微信公眾號:GiantPandaCV】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    基于貝葉斯分類器和徑向基函數(shù)(RBF)網(wǎng)絡(luò)融合的人臉識別方法的設(shè)計方案

    基于貝葉斯分類器和RBF神經(jīng)網(wǎng)絡(luò)融合的人臉識別方法的設(shè)計方案 本文基于人臉圖像分塊和奇異壓縮,進(jìn)行RBF 神經(jīng)網(wǎng)絡(luò)和貝葉斯分類器融合的設(shè)計
    發(fā)表于 10-23 10:03

    圖像的深淺特征應(yīng)用于人臉識別

    本文將HOG特征和PCANet網(wǎng)絡(luò)提取的特征進(jìn)行融合,不僅包含數(shù)據(jù)的淺層局部和數(shù)據(jù)分布信息,還包含深度判別性信息,在AR及Yale B人臉數(shù)據(jù)庫的實驗結(jié)果驗證了本文算法的有效性和魯棒性
    發(fā)表于 11-25 06:17

    GaN的極性特征測量及應(yīng)用

    GaN的極性特征測量及應(yīng)用: GaN 在(0001) 方向是一種極性極強(qiáng)的半導(dǎo)體材料,它具有極強(qiáng)的表面特征,是目前發(fā)現(xiàn)的最好的壓電材料,而GaN
    發(fā)表于 01-02 14:15 ?10次下載

    基于空間連續(xù)性方向的圖像修復(fù)算法

    基于空間連續(xù)性方向的圖像修復(fù)算法
    發(fā)表于 08-03 17:01 ?0次下載

    先驗置信傳播的圖像修復(fù)算法

    先驗置信傳播( priority-BP)算法很難在實際中達(dá)到實時處理的要求,計算效率也有很大的提升空間。針對先驗BP算法在圖像修復(fù)上的應(yīng)用,改進(jìn)算法主要在信息傳遞以及標(biāo)簽搜索方面提出改進(jìn)措施。在信息
    發(fā)表于 12-21 09:26 ?0次下載
    <b class='flag-5'>先驗</b>置信傳播的圖像<b class='flag-5'>修復(fù)</b>算法

    基于深度神經(jīng)網(wǎng)絡(luò)特征加權(quán)融合人臉識別方法DLWF

    針對目前難以提取到適合用于分類的人臉特征以及在非限條件下進(jìn)行人臉識別準(zhǔn)確率低的問題,提出了一種基于深度神經(jīng)網(wǎng)絡(luò)特征加權(quán)融合
    發(fā)表于 12-23 11:42 ?2次下載

    無線傳感網(wǎng)絡(luò)缺失估計方法

    ,提出了基于感知數(shù)據(jù)屬性的數(shù)據(jù)交織傳送策略。仿真結(jié)果表明,所提出的估計方法能有效估計無線傳感器網(wǎng)絡(luò)中的缺失,相比基于時空相關(guān)性的線性插值模型( LM)算法和傳統(tǒng)的最近鄰
    發(fā)表于 12-27 16:56 ?0次下載

    基于接收信號樣本協(xié)方差矩陣最小特征值分布的頻譜感知算法

    現(xiàn)有的頻譜感知算法中,能量檢測容易實現(xiàn),但檢測性能依賴噪聲功率?;陔S機(jī)矩陣?yán)碚摰念l譜感知算法巧妙地規(guī)避了噪聲不確定性對檢測性能帶來的影響,但大都采用的是最大特征值的近似分布規(guī)律,所得到閾值表達(dá)式
    發(fā)表于 01-16 10:54 ?0次下載

    基于先驗約束和統(tǒng)計的圖像修復(fù)算法

    匹配和算法的時效性兩個方面進(jìn)行改進(jìn),提出新的圖像修復(fù)算法。在樣本塊精確匹配方面,改進(jìn)算法對圖像進(jìn)行預(yù)處理以獲得圖像的先驗信息,并利用先驗信息約束算法偏移映射圖的初始化,從而轉(zhuǎn)變PatchMatch算法中對圖像偏移映射圖的全局隨機(jī)
    發(fā)表于 03-29 17:42 ?4次下載

    AlGaN和GaN HEMT在不同溫度下的退化規(guī)律及退化機(jī)理詳細(xì)說明

    基于溫度步進(jìn)應(yīng)力實驗,研究了 AlGaN /GaN HEMT 器件在不同溫度應(yīng)力下的退化規(guī)律及退化機(jī)理。實驗發(fā)現(xiàn): 在結(jié)溫為 139 ~ 200 ℃ 時,AlGaN /GaN HEMT
    發(fā)表于 06-23 08:00 ?5次下載
    AlGaN和<b class='flag-5'>GaN</b> HEMT在不同溫度下的<b class='flag-5'>退化</b>規(guī)律及<b class='flag-5'>退化</b>機(jī)理詳細(xì)說明

    一種結(jié)合邊緣信息的門卷積的人臉修復(fù)算法

    卷積在部分像素缺失下的精確局部特征描述能力,設(shè)計面向圖像修復(fù)的門卷積深度生成對抗網(wǎng)絡(luò)GAN)。該模型由邊緣連接生成對抗網(wǎng)絡(luò)和圖像
    發(fā)表于 04-02 15:21 ?7次下載
    一種結(jié)合邊緣信息的門卷積的<b class='flag-5'>人臉</b><b class='flag-5'>修復(fù)</b>算法

    基于GAN-inversion的圖像重構(gòu)過程

    筆者最近在集中時間學(xué)習(xí)對抗生成網(wǎng)絡(luò)GAN),特別是深度生成先驗進(jìn)行多用途圖像修復(fù)與處理,需要對圖像修復(fù)與處理經(jīng)典論文進(jìn)行回顧和精讀。
    的頭像 發(fā)表于 07-13 14:19 ?3021次閱讀

    基于矢量量化字典與雙解碼器的人臉修復(fù)網(wǎng)絡(luò)

    盡管生成式面部先驗和結(jié)構(gòu)化面部先驗最近已經(jīng)證明了可以生成高質(zhì)量的人臉修復(fù)結(jié)果,穩(wěn)定、可靠生成更細(xì)粒度的臉部細(xì)節(jié)仍然是一個具有挑戰(zhàn)性的問題。
    的頭像 發(fā)表于 03-08 09:50 ?1044次閱讀

    DCNN網(wǎng)絡(luò)結(jié)構(gòu) DCNN的人臉特征點檢測

    摘 要:在介紹人臉特征點檢測的理論知識的基礎(chǔ)上,提出了一種基于深層卷積神經(jīng)網(wǎng)絡(luò)(Deep ConvolutionalNeural Network,DCNN)解決人臉5點
    發(fā)表于 07-20 14:30 ?0次下載

    如何設(shè)計人臉識別的神經(jīng)網(wǎng)絡(luò)

    人臉識別技術(shù)是一種基于人臉特征信息進(jìn)行身份識別的技術(shù),廣泛應(yīng)用于安全監(jiān)控、身份認(rèn)證、智能門禁等領(lǐng)域。神經(jīng)網(wǎng)絡(luò)是實現(xiàn)人臉識別的關(guān)鍵技術(shù)之一,本
    的頭像 發(fā)表于 07-04 09:20 ?673次閱讀