0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Nirkin提出單編碼器 - 多解碼器網(wǎng)絡(luò)架構(gòu)和算法對(duì)換臉質(zhì)量的影響

lhl545545 ? 來源:EDA365 ? 作者:EDA365 ? 2020-09-14 10:49 ? 次閱讀

迪士尼新研究實(shí)現(xiàn)百萬像素圖像和視頻換臉,說不定未來大熒幕電影也會(huì)使用換臉技術(shù)了。

deepfakes 技術(shù)可以用于圖像和視頻換臉,但它能否用于大制作電影和電視節(jié)目中呢?迪士尼最新放出的一則視頻 demo 展示了這種可能性。

近日迪士尼在歐洲圖形學(xué)會(huì)透視研討會(huì)(EGSR)上發(fā)表研究,展示了首個(gè)百萬像素逼真換臉技術(shù)。

效果是不是還不錯(cuò)。這樣的效果雖然并不足以用于漫威電影,但它是換臉技術(shù)邁出的新一步。

來自迪士尼的研究者表示,這項(xiàng)技術(shù)的創(chuàng)新點(diǎn)在于能夠達(dá)到百萬像素質(zhì)量。百萬像素或許不再是高質(zhì)量圖像的代名詞,畢竟手機(jī)自帶攝像頭就能達(dá)到千萬像素。但是截至目前,換臉技術(shù)一直注重平滑的面部轉(zhuǎn)換,不注重提高像素。

你可能在手機(jī)上看到過效果好到爆炸的換臉視頻,但是如果把它們放在更大的屏幕上呈現(xiàn),就會(huì)出現(xiàn)很多瑕疵。研究者表示,他們用開源 deepfake 模型 DeepFakeLab 創(chuàng)建的視頻分辨率最高也只有 256*256 像素。相比之下,迪士尼新模型能夠讓視頻的分辨率提升到 1024*1024 像素。

那么,百萬像素?fù)Q臉是如何實(shí)現(xiàn)的呢?

首個(gè)百萬像素?fù)Q臉方法

迪士尼的這項(xiàng)研究發(fā)表在歐洲圖形學(xué)會(huì)透視研討會(huì)(EGSR)上,提出了一種在圖像和視頻中實(shí)現(xiàn)全自動(dòng)換臉的算法。據(jù)研究者稱,這是首個(gè)渲染百萬像素逼真結(jié)果的方法,且輸出結(jié)果具備時(shí)序一致性。

具體來說,該研究提出了一個(gè)漸進(jìn)式訓(xùn)練的多路 comb 網(wǎng)絡(luò),以及一種保持亮度和對(duì)比度的混合方法。

具體而言,雖然漸進(jìn)式訓(xùn)練能夠生成高分辨率圖像,但將架構(gòu)和訓(xùn)練數(shù)據(jù)擴(kuò)展至兩人以上可以使生成的表情具備更高的保真度。

此外,在將生成的表情合成到目標(biāo)人臉時(shí),研究者調(diào)整混合策略,以保持對(duì)比度和低頻光照。

最后,研究者在人臉關(guān)鍵點(diǎn)穩(wěn)定算法中融入了一種細(xì)化策略,以實(shí)現(xiàn)時(shí)序穩(wěn)定性,這對(duì)于處理高分辨率視頻來說至關(guān)重要。

在實(shí)驗(yàn)部分,研究者通過控制變量研究來驗(yàn)證該方法對(duì)換臉質(zhì)量的影響,并與流行的 SOTA 方法進(jìn)行了比較。

百萬像素分辨率下執(zhí)行逼真換臉的整體流程:

該流程包括如下四個(gè)步驟:

對(duì)于圖像 x_t,檢測人臉并定位人臉關(guān)鍵點(diǎn);

將人臉分辨率歸一化為 1024×1024,保存歸一化參數(shù)

將歸一化人臉饋入網(wǎng)絡(luò),并保存第 s 個(gè)解碼器的輸出 x?_s;

使用步驟 2 保存的歸一化參數(shù),在圖像 x?_s 上反轉(zhuǎn)圖像歸一化結(jié)果。最后,借助該研究提出的合成方法,將生成的圖像與圖像 x_t 混合。

而該流程中,最核心的組件無疑是模型本身了。該研究使用的單編碼器 - 多解碼器網(wǎng)絡(luò)架構(gòu):

此外,研究者還介紹了實(shí)現(xiàn)人臉關(guān)鍵點(diǎn)對(duì)齊和穩(wěn)定的方法,以確保換臉圖像的時(shí)序一致性,以及保持光照和對(duì)比度的圖像合成流程。此處不再贅述,詳情參見原論文。

與當(dāng)前 SOTA 方法的對(duì)比

該方法與 DeepFakes、DeepFaceLab 和 Nirkin 等人提出方法的換臉效果對(duì)比。從左到右依次為:目標(biāo)圖像、源圖像、該方法在 1024×1024 和 256×256 分辨率下的成像效果,以及其他三種方法的成像效果。

控制變量研究

研究者執(zhí)行以下四種實(shí)驗(yàn),來查看該研究提出的單編碼器 - 多解碼器網(wǎng)絡(luò)架構(gòu)和算法對(duì)換臉質(zhì)量的影響:

漸進(jìn)式訓(xùn)練 VS 一次性訓(xùn)練整個(gè)網(wǎng)絡(luò);

使用多路 comb 模型 VS 單獨(dú)的雙路模型;

該研究提出的保持對(duì)比度的多頻段合成方法 VS 泊松融合方法;

該研究中人臉關(guān)鍵點(diǎn)穩(wěn)定方法的影響。

為漸進(jìn)式訓(xùn)練與非漸進(jìn)式訓(xùn)練的成像效果對(duì)比,可以看出,漸進(jìn)式訓(xùn)練的成像效果優(yōu)于非漸進(jìn)式訓(xùn)練。

為使用多路 comb 模型與雙路模型的成像效果對(duì)比:

方法與泊松融合方法的成像效果對(duì)比。從圖中可以看出,該方法可以更好地保留目標(biāo)人臉的全局光照特征,而泊松融合方法導(dǎo)致人臉出現(xiàn)了某種「漂白」效果。

人臉關(guān)鍵點(diǎn)穩(wěn)定結(jié)果:

缺陷

盡管能夠以高分辨率進(jìn)行逼真的人臉轉(zhuǎn)換,但是迪士尼提出的這一方法仍然存在缺陷。例如,無法基于數(shù)據(jù)恰當(dāng)捕獲的表情和姿勢(shì),可能會(huì)導(dǎo)致不完善的生成結(jié)果,比如模糊和其它偽影。
責(zé)任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1144

    瀏覽量

    40827
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3655

    瀏覽量

    134875
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7102

    瀏覽量

    89282
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    編碼器的作用與信號(hào)轉(zhuǎn)換原理 編碼器解碼器的關(guān)系和作用

    編碼器的作用 編碼器是一種將信號(hào)從一種形式或格式轉(zhuǎn)換為另一種形式的設(shè)備。在數(shù)字系統(tǒng)中,編碼器通常用于將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),或者將一種數(shù)字信號(hào)格式轉(zhuǎn)換為另一種格式。編碼器的主要作用包
    的頭像 發(fā)表于 11-24 10:10 ?548次閱讀

    增量式編碼器圈和多圈怎么知道,如何分辯?

    增量式編碼器圈和多圈怎么知道,如何分辯? 編碼器特點(diǎn): ? 編碼器只能測量一圈內(nèi)的旋
    的頭像 發(fā)表于 10-21 09:42 ?489次閱讀
    增量式<b class='flag-5'>編碼器</b><b class='flag-5'>單</b>圈和多圈怎么知道,如何分辯?

    無線解碼器質(zhì)量標(biāo)準(zhǔn)是什么

    無線解碼器,作為現(xiàn)代通信系統(tǒng)中的關(guān)鍵組件,其質(zhì)量標(biāo)準(zhǔn)對(duì)于確保數(shù)據(jù)傳輸?shù)目煽啃浴踩院托手陵P(guān)重要。 1. 性能指標(biāo) 1.1 靈敏度 靈敏度是無線解碼器能夠接收到的最小信號(hào)強(qiáng)度。高靈敏度意味著
    的頭像 發(fā)表于 10-15 16:21 ?417次閱讀

    磁電編碼器和光電編碼器的區(qū)別

    磁電編碼器和光電編碼器是兩種不同類型的編碼器,它們?cè)谠?、結(jié)構(gòu)、性能和應(yīng)用領(lǐng)域上都有所不同。 磁電編碼器和光電編碼器的區(qū)別 1. 引言
    的頭像 發(fā)表于 10-12 09:54 ?1462次閱讀

    解碼器和控制區(qū)別是什么

    解碼器和控制在數(shù)字電子電路中扮演著不同的角色,它們之間的主要區(qū)別體現(xiàn)在功能和應(yīng)用場景上。 一、功能區(qū)別 解碼器 : 主要功能 :解碼器通常用于將
    的頭像 發(fā)表于 09-30 14:27 ?562次閱讀

    遙控解碼器怎么使用

    遙控解碼器是一種用于解碼和復(fù)制遙控信號(hào)的設(shè)備,它可以幫助用戶在遙控丟失或損壞的情況下,重新獲得對(duì)設(shè)備的控制。 遙控
    的頭像 發(fā)表于 09-30 14:23 ?1005次閱讀

    光柵解碼器四根信號(hào)線怎么接

    光柵解碼器是一種用于讀取光柵編碼器信號(hào)的設(shè)備,通常用于工業(yè)自動(dòng)化和機(jī)器人技術(shù)中。光柵編碼器是一種增量式或絕對(duì)式傳感,它可以提供位置、速度和方向信息。光柵
    的頭像 發(fā)表于 09-23 17:58 ?859次閱讀

    視頻編碼器解碼器的應(yīng)用方案

    視頻解碼器和視頻編碼器是數(shù)字信號(hào)處理中常用的設(shè)備,它們?cè)跀?shù)據(jù)的傳輸和轉(zhuǎn) 換中發(fā)揮著重要作用。概述與應(yīng)用 它是將模擬信號(hào)或數(shù)字信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的編碼設(shè)備,將輸入的視音頻信號(hào)源 進(jìn)行壓縮采集并轉(zhuǎn)換
    發(fā)表于 09-10 16:04 ?0次下載

    TVP5146M2高質(zhì)量芯片數(shù)字視頻解碼器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TVP5146M2高質(zhì)量芯片數(shù)字視頻解碼器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 07-09 11:35 ?0次下載
    TVP5146M2高<b class='flag-5'>質(zhì)量</b><b class='flag-5'>單</b>芯片數(shù)字視頻<b class='flag-5'>解碼器</b>數(shù)據(jù)表

    TVP5147高質(zhì)量、芯片數(shù)字視頻解碼器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TVP5147高質(zhì)量、芯片數(shù)字視頻解碼器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 07-09 11:34 ?0次下載
    TVP5147高<b class='flag-5'>質(zhì)量</b>、<b class='flag-5'>單</b>芯片數(shù)字視頻<b class='flag-5'>解碼器</b>數(shù)據(jù)表

    編碼器的原理和類型

    編碼器(Autoencoder, AE)是一種無監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型,它通過編碼器解碼器的組合,實(shí)現(xiàn)了對(duì)輸入數(shù)據(jù)的壓縮和重構(gòu)。自編碼器
    的頭像 發(fā)表于 07-09 11:25 ?1370次閱讀

    TVP5146高質(zhì)量、芯片數(shù)字視頻解碼器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TVP5146高質(zhì)量芯片數(shù)字視頻解碼器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 07-04 10:00 ?0次下載
    TVP5146高<b class='flag-5'>質(zhì)量</b>、<b class='flag-5'>單</b>芯片數(shù)字視頻<b class='flag-5'>解碼器</b>數(shù)據(jù)表

    TIR1000,TIR1000I編碼器解碼器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TIR1000,TIR1000I編碼器解碼器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 07-01 14:26 ?1次下載
    TIR1000,TIR1000I<b class='flag-5'>編碼器</b>和<b class='flag-5'>解碼器</b>數(shù)據(jù)表

    編碼器好壞怎么判斷,編碼器原理

    (Autoencoder),它是一種無監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型。自動(dòng)編碼器由兩部分組成:編碼器解碼器。編碼器負(fù)責(zé)將輸入數(shù)據(jù)轉(zhuǎn)換為低維表示,
    的頭像 發(fā)表于 01-23 10:58 ?1946次閱讀

    磁性編碼器和光電編碼器的比較

    伺服電機(jī)編碼器是一種關(guān)鍵的反饋裝置,用于測量和控制電機(jī)的轉(zhuǎn)速和位置。在選擇伺服電機(jī)編碼器時(shí),常常面臨一個(gè)選擇:使用磁電編碼器還是光電編碼器。接下來將從幾個(gè)關(guān)鍵方面比較這兩種類型的
    的頭像 發(fā)表于 01-18 10:29 ?3340次閱讀