0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

清華劉永進(jìn)提出APDrawingGAN ,GAN秒變肖像畫!

DPVg_AI_era ? 來源:lq ? 2019-06-15 09:26 ? 次閱讀

自動(dòng)地將人臉照片轉(zhuǎn)換為高質(zhì)量的藝術(shù)肖像畫具有重要的藝術(shù)價(jià)值和實(shí)用價(jià)值。清華大學(xué)劉永進(jìn)教授課題組對此提出APDrawingGAN,結(jié)果優(yōu)于目前已有方法。該項(xiàng)工作被CVPR 2019錄取為oral paper。

肖像畫是一種獨(dú)特的藝術(shù)形式,通常使用一組稀疏的連續(xù)圖形元素如線條來捕捉一個(gè)人的外表特征。

肖像畫通常是在人物面前或基于人物照片進(jìn)行創(chuàng)作的,其創(chuàng)作依賴于細(xì)致的觀察、分析和豐富的經(jīng)驗(yàn)。一幅好的肖像畫能很好地捕捉到人的個(gè)性和情感。

圖1. 一些人臉照片和對應(yīng)的藝術(shù)家畫的肖像線條畫。

然而,即使是受過專業(yè)訓(xùn)練的藝術(shù)家,完成一幅精致的肖像畫也需要很長時(shí)間。因此,自動(dòng)地將人臉照片轉(zhuǎn)換為高質(zhì)量的藝術(shù)肖像畫具有重要的藝術(shù)價(jià)值和實(shí)用價(jià)值。

清華劉永進(jìn)組提出APDrawing GAN

隨著深度學(xué)習(xí)的發(fā)展,使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像風(fēng)格轉(zhuǎn)換的神經(jīng)風(fēng)格轉(zhuǎn)換(NST)方法被提出。隨后,基于生成對抗網(wǎng)絡(luò)(GAN)的方法在圖像風(fēng)格轉(zhuǎn)換上實(shí)現(xiàn)了很好的效果。

但是,這些已有方法多數(shù)針對于生成信息較為豐富的風(fēng)格,如油畫,這些風(fēng)格的圖像中包含很多零碎的圖形元素(如筆觸),而對單個(gè)元素的質(zhì)量要求較低。也就是說,在這些風(fēng)格的圖像中,一些細(xì)節(jié)上的瑕疵會(huì)被忽視。

藝術(shù)肖像線條畫(Artistic Portrait Drawings,簡稱APDrawings)和已有工作研究的油畫肖像的風(fēng)格有很大的不同。它主要有5個(gè)特點(diǎn):

首先它是高度抽象的,只由少數(shù)稀疏、連續(xù)的圖形元素組成,因此瑕疵會(huì)比油畫中更明顯。

其次是具有強(qiáng)限制性,由于包含面部特征,APDrawings相比一般的風(fēng)格有更強(qiáng)的語義限制(因?yàn)槲覀儗θ四樅苁煜?,?huì)對人臉圖像中的瑕疵容忍度更低)。

具有多樣性,因?yàn)閷τ诓煌拿娌刻卣鳎囆g(shù)家繪制的方式是不同的(如眼睛和頭發(fā))。

藝術(shù)創(chuàng)作的模糊性,人工創(chuàng)作導(dǎo)致了一些面部特征的輪廓沒法被完全精準(zhǔn)的定位,這對基于像素對應(yīng)的方法是個(gè)很大的挑戰(zhàn)。

APDrawings的概念性,藝術(shù)家有時(shí)會(huì)在原圖沒有亮度變化的地方添加額外的概念性的線條,比如頭發(fā)區(qū)域中的白線和五官的輪廓線。因此,即使是頂尖的方法也難以產(chǎn)生好的藝術(shù)肖像畫結(jié)果。

APDrawingGAN和一般P圖、摳圖、濾鏡等工具的不同在于,一般的軟件對真實(shí)照片進(jìn)行美化得到更美觀或具有某種特點(diǎn)的真實(shí)照片,而APDrawingGAN生成的是非真實(shí)感的抽象藝術(shù)肖像畫,既能捕捉到照片特征又和真實(shí)照片觀感完全不同。并且我們生成的線條風(fēng)格的藝術(shù)肖像畫比一般的肖像畫(如卡通、鉛筆素描)具有更少的圖形元素,更抽象,因此也更有難度。下圖展示了我們方法和一般圖像處理工具的結(jié)果對比。

圖2. 我們的方法和一般圖像處理工具的處理結(jié)果的對比。人臉照片來源于免費(fèi)版權(quán)圖片網(wǎng)站Pixabay。

在CVPR2019上,清華大學(xué)計(jì)算機(jī)系劉永進(jìn)教授課題組提出了APDrawingGAN,為了更有效地學(xué)習(xí)不同面部區(qū)域的不同繪制風(fēng)格,我們的GAN模型包括幾個(gè)專門針對不同面部特征區(qū)域的局部網(wǎng)絡(luò),和一個(gè)用于捕捉整體特征的全局網(wǎng)絡(luò)。

論文地址:

https://cg.cs.tsinghua.edu.cn/papers/CVPR-2019-Drawing.pdf

APDrawingGAN的主要貢獻(xiàn)在于:

我們提出了一個(gè)層次化的GAN模型,可以有效地將人臉照片生成高質(zhì)量、富有表現(xiàn)力的藝術(shù)肖像線條畫。不僅如此,我們的方法對黑白線條分明的復(fù)雜發(fā)型繪制有更好的效果。

為了學(xué)習(xí)不同面部區(qū)域的不同繪制風(fēng)格,我們的模型將GAN的渲染輸出分為不同層次,每個(gè)層次被獨(dú)立的損失項(xiàng)控制。我們提出了一個(gè)針對藝術(shù)肖像畫的損失函數(shù),它包含四個(gè)損失項(xiàng):對抗損失、像素級損失、一種新的距離變換(DT)損失(用于學(xué)習(xí)藝術(shù)肖像畫中的線條筆畫)和一個(gè)局部變換損失(用于引導(dǎo)局部網(wǎng)絡(luò)保持面部特征)。

我們使用6655張人臉照片和非真實(shí)感渲染算法生成的結(jié)果進(jìn)行了預(yù)訓(xùn)練,構(gòu)建了一個(gè)包含140對高質(zhì)量正面人臉照片和對應(yīng)藝術(shù)肖像畫的APDrawings數(shù)據(jù)集,用于正式的訓(xùn)練和測試。

圖3. 我們提出的APDrawingGAN的結(jié)構(gòu)圖。左側(cè)為層次化生成器網(wǎng)絡(luò)的結(jié)構(gòu),右側(cè)為層次化鑒別器網(wǎng)絡(luò)的結(jié)構(gòu)。

在APDrawingGAN中,生成器網(wǎng)絡(luò)G和鑒別器網(wǎng)絡(luò)D都采用層次化的結(jié)構(gòu)。生成器網(wǎng)絡(luò)G用于將輸入照片轉(zhuǎn)換為藝術(shù)肖像畫,它包含6個(gè)局部生成器(對應(yīng)于左右眼、鼻子、嘴巴、頭發(fā)和背景),1個(gè)全局生成器和1個(gè)融合網(wǎng)絡(luò)。

局部生成器的作用是學(xué)習(xí)不同局部面部特征的繪制風(fēng)格。我們將所有局部生成器的輸出混合到一個(gè)圖像Ilocal中。局部生成器和全局生成器都采用U-Net結(jié)構(gòu)。

然后我們使用一個(gè)融合網(wǎng)絡(luò)將Ilocal和全局生成器的輸出Iglobal融合在一起,以獲得最終的生成圖。鑒別器網(wǎng)絡(luò)D用于判斷輸入圖像是否是真實(shí)的,即是否是藝術(shù)家畫的藝術(shù)肖像畫。

其中全局鑒別器對整個(gè)圖像進(jìn)行檢查,以判斷肖像畫的整體特征。而局部鑒別器對不同的局部面部區(qū)域進(jìn)行檢查,評估細(xì)節(jié)的質(zhì)量。局部鑒別器和全局鑒別器都采用PatchGAN的形式。

為了進(jìn)一步應(yīng)對線條的風(fēng)格和藝術(shù)家畫作中不完全精確定位的輪廓,我們提出了一個(gè)全新的距離變換(Distance transform,簡稱DT)損失來學(xué)習(xí)藝術(shù)肖像線條畫中的線條筆畫風(fēng)格。

我們前面提到,在藝術(shù)家的肖像畫中,線條和原圖有時(shí)不是精確對應(yīng)的,會(huì)有微小的錯(cuò)位,主要的原因有兩個(gè):

藝術(shù)家裸眼觀察,面部特征的輪廓有時(shí)無法被完全精準(zhǔn)地定位;

藝術(shù)家添加的線條有時(shí)是概念性的,不與原圖完全對應(yīng)(如頭發(fā)區(qū)域中的白線)。

因此僅使用L1損失是不足以應(yīng)對這種情況的——L1損失會(huì)懲罰即使是很微小的錯(cuò)位,但是對于較大的錯(cuò)位并不會(huì)更敏感。

于是我們提出一種新的損失來容忍這種細(xì)微的錯(cuò)位,而懲罰過大的錯(cuò)位。我們提出的這個(gè)DT損失是基于距離的,它計(jì)算的是藝術(shù)家肖像畫(Groundtruth)中每個(gè)線條上的像素到生成肖像畫中相同類型(黑或白)的最近像素的距離之和,和生成肖像畫到藝術(shù)家肖像畫的距離之和的總和。

DT損失對于微小的錯(cuò)位的懲罰是非常小的,但會(huì)真正懲罰那些過大的錯(cuò)位。我們使用了距離變換和倒角匹配(chamfermatching)來計(jì)算這個(gè)損失,公式如下:

倒角匹配距離:

距離變換損失:

其中表示兩幅肖像畫,表示距離變換,分別表示黑白線條檢測器,和分別表示人臉照片和對應(yīng)的藝術(shù)家肖像畫。

APDrawingGAN結(jié)果對比

圖4. APDrawingGAN在沒有對應(yīng)藝術(shù)家肖像畫的人臉照片上的測試結(jié)果。人臉照片來源于免費(fèi)版權(quán)圖片網(wǎng)站Pixabay。

圖5. APDrawingGAN與Gatys,CycleGAN和Pix2Pix方法在藝術(shù)肖像風(fēng)格化上的結(jié)果對比。其中紅色矩形標(biāo)出了CycleGAN和Pix2Pix方法結(jié)果中的一些明顯瑕疵。

圖6. APDrawingGAN與CNNMRF,DeepImageAnalogy和HeadshotPortrait方法在藝術(shù)肖像風(fēng)格化上的結(jié)果對比。

圖7. APDrawingGAN與現(xiàn)有風(fēng)格轉(zhuǎn)換方法的結(jié)果對比。

第一列是人臉照片,第二列是藝術(shù)家畫的肖像畫,第三列是一些方法需要的風(fēng)格參考圖,第四至九列是其他方法的結(jié)果,最后一列是我們方法的結(jié)果。

用戶研究(user study)結(jié)果統(tǒng)計(jì)。

73名參與者參與了用戶研究。用戶研究中,每位參與者每次從兩種算法生成的肖像畫中選擇一幅更接近藝術(shù)家肖像畫和圖像質(zhì)量更好的肖像畫,并對三種方法(CycleGAN、Pix2Pix和我們的方法)兩兩進(jìn)行了比較,由此我們得到了三種方法的排名。

表中給出了每種方法排名最好(1)、中間(2)和最差(3)的百分比。在71.39%的情況下我們的方法排名最好。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4774

    瀏覽量

    100891
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1947

    瀏覽量

    73677
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5507

    瀏覽量

    121272

原文標(biāo)題:GAN秒變肖像畫!清華劉永進(jìn)提出APDrawingGAN ,CVPR Oral(附微信小程序)

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    清華深研院思捷/港科大Kristiaan Neyts最新AEM封面文章:硫化物復(fù)合固態(tài)電解質(zhì)

    近日, 深圳清華大學(xué)研究院(清華深研院) 思捷 / 香港科技大學(xué) Kristiaan Neyts教授 團(tuán)隊(duì)在《Advanced Energy Materials》國際期刊上綜述研究了硫化物/聚合物
    的頭像 發(fā)表于 01-07 09:15 ?55次閱讀
    <b class='flag-5'>清華</b>深研院<b class='flag-5'>劉</b>思捷/港科大Kristiaan Neyts最新AEM封面文章:硫化物復(fù)合固態(tài)電解質(zhì)

    變頻變壓電源150KVA 460V380V 60hz變頻50hz 三進(jìn)三出

    ?變頻變壓電源:150KVA 460V380V 60Hz變頻50Hz 三進(jìn)三出技術(shù)解析? 在全球化日益加深的今天,電力設(shè)備作為連接各國經(jīng)濟(jì)與文化的紐帶,其重要性不言而喻。然而,不同國家和地區(qū)的電力
    的頭像 發(fā)表于 12-26 11:06 ?124次閱讀
    變頻變壓電源150KVA  460V<b class='flag-5'>變</b>380V 60hz變頻50hz 三<b class='flag-5'>進(jìn)</b>三出

    java小知識-納

    ()對比 System.currentTimeMillis()我們經(jīng)常使用,可以參考對比一下 看方法意思,一個(gè)是納,一個(gè)是毫秒,二者有關(guān)系嗎? 先看看單位換算:一=1000毫 1毫
    的頭像 發(fā)表于 11-26 11:11 ?170次閱讀

    字節(jié)跳動(dòng)與清華AIR成立聯(lián)合研究中心

    近日,清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)與字節(jié)跳動(dòng)共同宣布成立“可擴(kuò)展大模型智能技術(shù)聯(lián)合研究中心”(SIA Lab),并在清華大學(xué)舉行了隆重的成立儀式。
    的頭像 發(fā)表于 10-12 15:24 ?406次閱讀

    GaN有體二極管嗎?了解GaN的第三象限運(yùn)行

    電子發(fā)燒友網(wǎng)站提供《GaN有體二極管嗎?了解GaN的第三象限運(yùn)行.pdf》資料免費(fèi)下載
    發(fā)表于 09-19 12:55 ?6次下載
    <b class='flag-5'>GaN</b>有體二極管嗎?了解<b class='flag-5'>GaN</b>的第三象限運(yùn)行

    GaN應(yīng)用介紹

    電子發(fā)燒友網(wǎng)站提供《GaN應(yīng)用介紹.pdf》資料免費(fèi)下載
    發(fā)表于 09-12 09:55 ?0次下載
    <b class='flag-5'>GaN</b>應(yīng)用介紹

    GaN晶體管的應(yīng)用場景有哪些

    GaN(氮化鎵)晶體管,特別是GaN HEMT(高電子遷移率晶體管),近年來在多個(gè)領(lǐng)域展現(xiàn)出廣泛的應(yīng)用場景。其出色的高頻性能、高功率密度、高溫穩(wěn)定性以及低導(dǎo)通電阻等特性,使得GaN晶體管成為電力電子和高頻通信等領(lǐng)域的優(yōu)選器件。以
    的頭像 發(fā)表于 08-15 11:27 ?984次閱讀

    一本小冊子,咋就讓IT人水靈靈地「由IE」了?

    當(dāng)IT圈遇上MBTI,看「I人」如何「E人」!
    的頭像 發(fā)表于 08-12 14:28 ?1329次閱讀
    一本小冊子,咋就讓IT人水靈靈地「由I<b class='flag-5'>變</b>E」了?

    GaN MOSFET 器件結(jié)構(gòu)及原理

    GaN MOSFET(氮化鎵金屬氧化物半導(dǎo)體場效應(yīng)晶體管)是一種新型的功率器件,具有高功率密度、高效率和快速開關(guān)速度等優(yōu)點(diǎn)。與傳統(tǒng)的硅基MOSFET相比,GaN MOSFET具有更高的電子遷移率
    的頭像 發(fā)表于 07-14 11:39 ?1385次閱讀

    清華FPGA的開發(fā)軟件

    清華的FPGA除了官方提供的開發(fā)軟件,能用其它開發(fā)軟件進(jìn)行開發(fā)嗎? 官方的開發(fā)軟件安裝,挺麻煩啊。
    發(fā)表于 06-23 12:25

    世界首款!又是清華:類腦互補(bǔ)視覺芯片“天眸芯”

    近日,清華大學(xué)在類腦視覺感知芯片領(lǐng)域取得重要突破:清華大學(xué)依托精密儀器系的類腦計(jì)算研究中心施路平教授團(tuán)隊(duì),提出一種基于視覺原語的互補(bǔ)雙通路類腦視覺感知新范式,研制出世界首款類腦互補(bǔ)視覺芯片“天眸芯
    的頭像 發(fā)表于 06-04 08:36 ?437次閱讀
    世界首款!又是<b class='flag-5'>清華</b>:類腦互補(bǔ)視覺芯片“天眸芯”

    微軟運(yùn)用深度學(xué)習(xí)技術(shù)構(gòu)建多模態(tài)3D肖像模型,成就逼真虛擬肖像

    此項(xiàng)專利名為《多模態(tài)三維面部建模及追蹤,制作栩栩如生的虛擬肖像》。其系統(tǒng)包括處理器和存儲(chǔ)器系統(tǒng),前者負(fù)責(zé)收集初始數(shù)據(jù)(即面部初始模樣)以及多元數(shù)據(jù)信號(例如用戶聲波等音頻數(shù)據(jù)),再將兩者整合并進(jìn)行擬合處理。
    的頭像 發(fā)表于 04-24 15:24 ?325次閱讀

    谷歌發(fā)布VLOGGER AI模型,實(shí)現(xiàn)肖像朗讀音頻內(nèi)容

    具體來說,VLOGGER AI 采用一種適應(yīng)虛擬肖像的多模態(tài) Diffusion 模型,通過 MENTOR 數(shù)據(jù)庫進(jìn)行訓(xùn)練,涵蓋了超80萬個(gè)人物肖像及超過2200小時(shí)的視頻數(shù)據(jù)。得益于此,VLOGGER 可以生成各種族、各年齡段、穿著多樣、姿態(tài)各異的
    的頭像 發(fā)表于 03-19 14:27 ?809次閱讀

    功率GaN,炙手可熱的并購賽道?

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)繼去年英飛凌收購GaN Systems之后,2024年1月,另一家汽車芯片大廠瑞薩也收購了功率GaN公司Transphorm。 ? Transphorm在2022年
    的頭像 發(fā)表于 02-26 06:30 ?2477次閱讀
    功率<b class='flag-5'>GaN</b>,炙手可熱的并購賽道?

    首個(gè)在6英寸藍(lán)寶石襯底上的1700V GaN HEMTs器件發(fā)布

    近日,廣東致能科技團(tuán)隊(duì)與西安電子科技大學(xué)廣州研究院/廣州第三代半導(dǎo)體創(chuàng)新中心郝躍院士、張進(jìn)成教授團(tuán)隊(duì)等等合作攻關(guān),通過采用廣東致能科技有限公司的薄緩沖層AlGaN / GaN外延片,基于廣州第三代半導(dǎo)體創(chuàng)新中心中試平臺,成功在6英寸藍(lán)寶石襯底上實(shí)現(xiàn)了1700V
    的頭像 發(fā)表于 01-25 10:17 ?1171次閱讀
    首個(gè)在6英寸藍(lán)寶石襯底上的1700V <b class='flag-5'>GaN</b> HEMTs器件發(fā)布