0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一款基于GAN的AI修圖大師可以將你從這類工作中解放出來

DPVg_AI_era ? 來源:lq ? 2019-02-27 09:43 ? 次閱讀

作為一個(gè)設(shè)計(jì)師,是否整天因?yàn)榉爆嵖菰锏男迗D工作不勝其煩?現(xiàn)在,一款基于GAN的AI修圖大師可以將你從這類工作中解放出來。修輪廓、改表情、生發(fā)、加耳環(huán)、去眼鏡、補(bǔ)殘圖,你能想到的它都能一鍵搞定。

這可能是史上最牛的AI修圖大師。

在一張人臉圖片上畫上幾筆,比如說勾出一個(gè)眉毛的輪廓,它就能自動(dòng)把草圖修正成真實(shí)的圖片,即使你毫無藝術(shù)細(xì)胞,也沒關(guān)系,只要能夠大致表明想修哪里,剩下的活兒就都交給它好了。

這款工具由韓國電子與電信通訊研究所的Youngjoo Jo和Jongyoul Park開發(fā),它比一般的臉部圖片編輯工具或應(yīng)用程序更高級(jí),可以改變發(fā)型、把嚴(yán)肅臉改成笑臉,甚至可以加入原本沒有的配飾,比如耳環(huán)、耳釘?shù)?。還可以在一張被部分遮擋的面部圖像上生成完整的臉部圖像,還能把圖中的人戴的太陽鏡去掉等等。

來看看這款“AI修圖大師”的神奇效果:

改變臉部輪廓特征和瞳孔顏色

生發(fā)(劃重點(diǎn))、變笑臉、加頭飾,都不在話下

加個(gè)耳環(huán)、耳墜什么的,只要?jiǎng)澇龃笾挛恢镁托辛?/p>

強(qiáng)大的自動(dòng)補(bǔ)全功能

草繪秒變真人,畫風(fēng)夸張也沒問題

這款“神器”的開發(fā)者之一Youngjoo Jo表示:我們認(rèn)為這個(gè)程序可以讓設(shè)計(jì)師不用做那么多枯燥的勞動(dòng),讓他們把更多的精力集中在創(chuàng)造性的工作上,不過這并不是說只有設(shè)計(jì)師才能使用這款工具,用戶不需要具備設(shè)計(jì)上的專業(yè)知識(shí)。

機(jī)器學(xué)習(xí)研究人員Alex Champandard表示,這款工具與過去基于GAN的面部圖片編輯程序相比實(shí)現(xiàn)了一次重大進(jìn)步。

“當(dāng)你面對(duì)這樣的技術(shù)創(chuàng)新時(shí),不免會(huì)在激動(dòng)之余感到一絲害怕?!边@種工具將不可避免地改變?cè)O(shè)計(jì)師的日常工作節(jié)奏和內(nèi)容,但他并不認(rèn)為這類工具會(huì)讓設(shè)計(jì)師面臨失業(yè)。

“現(xiàn)在的一個(gè)重要問題是,我們接下來要怎樣做,才能讓這一工具更好地服務(wù)于那些工作內(nèi)容可能出現(xiàn)重大改變的人們?如何讓這款工具成為這些人的好幫手,而不是威脅?”

SC-FEGAN:基于神經(jīng)網(wǎng)絡(luò)的人臉圖像編輯系統(tǒng)

要達(dá)到這個(gè)神奇的效果,離不開SC-FEGAN。

SC-FEGAN是一種基于神經(jīng)網(wǎng)絡(luò)的人臉圖像編輯系統(tǒng),并提供了實(shí)現(xiàn)批量輸入數(shù)據(jù)的方法。該網(wǎng)絡(luò)可以端到端地進(jìn)行訓(xùn)練,并生成具有逼真紋理細(xì)節(jié)的高質(zhì)量合成圖像。

該研究成果由韓國團(tuán)隊(duì)發(fā)表于arXiv:

論文地址:

https://arxiv.org/pdf/1902.06838.pdf

訓(xùn)練數(shù)據(jù)

恰當(dāng)?shù)挠?xùn)練數(shù)據(jù)有助于提高網(wǎng)絡(luò)訓(xùn)練性能。

在訓(xùn)練本模型時(shí),作者在幾個(gè)預(yù)處理步驟之后使用CelebA-HQ數(shù)據(jù)集:

隨機(jī)選擇2組29000張圖像用于訓(xùn)練,1000張圖像用于測(cè)試;

在獲得草圖和顏色數(shù)據(jù)集之前,將圖像調(diào)整為512×512像素。

為了更好的表達(dá)人臉圖像中眼睛的復(fù)雜性,作者采用基于眼睛位置的free-from mask來訓(xùn)練網(wǎng)絡(luò)。

此外,還使用了free from mask和人臉分割GFC創(chuàng)建了適當(dāng)?shù)牟輬D域和顏色域。

這是非常關(guān)鍵的一步。因?yàn)樗沟孟到y(tǒng)能夠?yàn)槭掷L用戶輸入案例產(chǎn)生有說服力的結(jié)果。

網(wǎng)絡(luò)結(jié)構(gòu)

該網(wǎng)絡(luò)同樣也可以同時(shí)訓(xùn)練生成器和鑒別器。

生成器接收帶有用戶輸入的不完整圖像,在RGB通道中創(chuàng)建輸出圖像,并將輸出圖像的掩碼區(qū)域插入到不完整輸入圖像中,以創(chuàng)建完整圖像。

鑒別器接收完成的圖像或原始圖像(沒有掩蔽)以確定給定輸入是真實(shí)的還是假的。

在對(duì)抗訓(xùn)練中,識(shí)別器的額外用戶輸入也有助于提高性能。 此外,團(tuán)隊(duì)還發(fā)現(xiàn)與一般GAN損失不同的額外損失對(duì)于恢復(fù)大的擦除部分是有效的。

該網(wǎng)絡(luò)架構(gòu)如下圖所示:

圖注:SC-FEGAN的網(wǎng)絡(luò)架構(gòu)。除了輸入和輸出,LRN應(yīng)用于所有卷積層之后。使用tanh作為發(fā)生器輸出的激活函數(shù)。采用SN卷積層作為鑒別器。

生成器

生成器是基于U-net,所有卷積層使用3x3大小核的門控卷積。在除了其他soft gate之外的特征映射卷積層之后應(yīng)用局部信號(hào)歸一化(LRN)。LRN適用于除輸入層和輸出層之外的所有卷積層。

生成器的編碼器接收尺寸為512×512×9的輸入張量:具有在編輯時(shí)要被去除區(qū)域的不完整RGB通道圖像,描述被去除部分結(jié)構(gòu)的二進(jìn)制草圖、RGB顏色筆劃圖、二元掩模和噪音(如下圖所示)。

草圖和顏色域數(shù)據(jù)集以及批處理的輸入。我們使用HED邊緣檢測(cè)器提取草圖。使用GFC ,通過分割區(qū)域的中間顏色生成顏色圖。 網(wǎng)絡(luò)的輸入包括不完整的圖像、掩模、草圖、顏色和噪聲。

編碼器使用2個(gè)步幅內(nèi)核卷積對(duì)輸入進(jìn)行7次下采樣,然后在上采樣之前進(jìn)行擴(kuò)張卷積。

解碼器使用轉(zhuǎn)置的卷積進(jìn)行上采樣。然后,添加跳躍連接(skip connection)以允許與具有相同空間分辨率的先前層連接。

除了使用tanh函數(shù)的輸出層之外,我們?cè)诿恳粚又蠖际褂昧薼eaky ReLU激活函數(shù)。

總的來說,我們的發(fā)生器由16個(gè)卷積層組成,網(wǎng)絡(luò)的輸出是相同大小的輸入(512×512)的RGB圖像。

在將損失函數(shù)應(yīng)用于輸入圖像之前,用輸入圖像替換了掩模外部的圖像的剩余部分。這種替換允許發(fā)電機(jī)專門在編輯區(qū)域上進(jìn)行訓(xùn)練。發(fā)生器受到了PartialConv中引入的損失的訓(xùn)練:每像素?fù)p失、感知損失、風(fēng)格損失和總方差損失。還使用通用GAN損失函數(shù)。

鑒別器

該鑒別器有SNPatchGAN結(jié)構(gòu)。同時(shí),也使用3×3大小卷積內(nèi)核,并應(yīng)用了gradient penalty損失。還增加了額外的一項(xiàng),避免了鑒別器輸出patch的值接近于零。

總體損失函數(shù)如下:

其中,發(fā)生器用LG進(jìn)行訓(xùn)練,鑒別器用LD進(jìn)行訓(xùn)練。D(I)是鑒別器給定輸入I的輸出。

而當(dāng)編輯大面積區(qū)域時(shí),額外損失(如Lstyle和Lpercept)是非常關(guān)鍵的。

多種場景修圖俱佳,AI修圖大師大顯身手

那么,這款A(yù)I修圖大師的修圖結(jié)果如何呢?

首先將結(jié)果與Coarse-Refined net結(jié)構(gòu)和U-net結(jié)構(gòu)網(wǎng)絡(luò)進(jìn)行了比較。在測(cè)試Coarse-Refined net結(jié)構(gòu)時(shí),注意到細(xì)化階段模糊了輸出。而下圖便展示了在Coarse-Refined net上使用本文方法后的結(jié)果。

在U-net和Coarse-Refined net上使用本文方法后的結(jié)果

本文的系統(tǒng)不僅在上述細(xì)節(jié)方面,在大面積區(qū)域修改方面也是具有優(yōu)勢(shì)的。

有/沒有VGG損失的訓(xùn)練結(jié)果

在處理自由形狀遮掩情況時(shí),本文系統(tǒng)所產(chǎn)生的結(jié)果也較好。

與Celebf-HQ驗(yàn)證集上的Deepfillv1進(jìn)行定性比較

下圖顯示了使用草圖和顏色輸入的各種結(jié)果。實(shí)驗(yàn)結(jié)果表明,該系統(tǒng)能夠使用戶很直接地編輯人臉圖像的發(fā)型、臉型、眼睛、嘴巴等特征。

系統(tǒng)的面部圖像編輯結(jié)果。 它表明系統(tǒng)可以正確地改變面部的形狀和顏色。 還表明可以用于改變眼睛的顏色或擦除不必要的部分。 特別是右下角的兩個(gè)結(jié)果表明系統(tǒng)也可以用于新的發(fā)型修飾。

GAN生成的圖像結(jié)果通常顯示出對(duì)訓(xùn)練數(shù)據(jù)集的高度依賴性。在本研究中,研究人員將HED應(yīng)用于所有的區(qū)域,通過調(diào)度它來擴(kuò)展掩蔽區(qū)域,能夠獲得特殊的結(jié)果,產(chǎn)生面部圖像和耳環(huán)。

下圖顯示了這些有趣結(jié)果的選擇。這些例子表明,該網(wǎng)絡(luò)能夠?qū)W習(xí)小細(xì)節(jié),即使是很小的輸入也能產(chǎn)生合理的結(jié)果。

特別的結(jié)果

總結(jié)

本文提出了一種基于端到端可訓(xùn)練生成網(wǎng)絡(luò)的自由形狀掩模、草圖、顏色輸入的圖像編輯系統(tǒng)。

實(shí)驗(yàn)結(jié)果表明,與其他研究相比,該網(wǎng)絡(luò)架構(gòu)和損失功能顯著改善了修復(fù)效果。并在許多情況下顯示了各種成功和逼真的編輯結(jié)果。

該系統(tǒng)在一次性修復(fù)大面積區(qū)域方面表現(xiàn)極佳,使用者不需要費(fèi)力就可以產(chǎn)生高質(zhì)量和逼真的效果。

堪稱AI修圖大師!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4779

    瀏覽量

    101027
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1089

    瀏覽量

    40531
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1958

    瀏覽量

    73921

原文標(biāo)題:最強(qiáng)GAN修圖魔術(shù)師:美顏生發(fā)摘眼鏡、草繪秒變真人臉

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    光庭信息自動(dòng)駕駛系統(tǒng)亮相CES 2025

    自動(dòng)駕駛的魅力在于將人類從繁瑣的駕駛?cè)蝿?wù)解放出來,隨著 AI 大模型和大數(shù)據(jù)技術(shù)的突破,自動(dòng)駕駛技術(shù)的發(fā)展及實(shí)際應(yīng)用也成為 CES 2025 的重頭戲之。展會(huì)上,光庭信息自主研發(fā)的
    的頭像 發(fā)表于 01-13 14:23 ?147次閱讀

    柔性力量崛起:富唯智能協(xié)作機(jī)器人點(diǎn)亮食品飲料生產(chǎn)線

    富唯智能協(xié)作機(jī)器人在食品和飲料供應(yīng)鏈中廣泛應(yīng)用于包裝和機(jī)床管理等次級(jí)流程。協(xié)作機(jī)器人可以在潮濕的溫室、冷藏室、加熱爐等環(huán)境工作,將員工從重復(fù)性工作中
    的頭像 發(fā)表于 12-30 15:51 ?114次閱讀
    柔性力量崛起:富唯智能協(xié)作機(jī)器人點(diǎn)亮食品飲料生產(chǎn)線

    THS4521接在dac902之后輸出給tpa6211,從揚(yáng)聲器中放出來的聲音非常小怎么解決?

    電路如圖所示,THS4521接在dac902之后,然后輸出給tpa6211,但此時(shí),從揚(yáng)聲器中放出來的聲音非常小,后來我去掉ths4521這級(jí)之后,音量大小就有了很大改善,不知為何,求解
    發(fā)表于 11-07 08:22

    TLV320AI3101在錄音播放出來的聲音頻譜上可以明顯看出有斷篇和失真破音,怎么解決?

    你好,我們現(xiàn)在錄音播放出來的聲音頻譜上可以明顯看出有斷篇和失真破音的問題。在比較嘈雜的環(huán)境 錄音。 相關(guān)硬件接口如圖,問題出在寄存器配置嗎?這方面是菜鳥,請(qǐng)高手知道
    發(fā)表于 11-04 06:36

    將音頻文件放到SD卡,用DSP5509A將其讀取出來并發(fā)送給AIC23,為什么播放出來的音樂都是雜音?

    我將音頻文件放到SD卡,用DSP5509A將其讀取出來,并發(fā)送給AIC23,但是播放出來的音樂感覺全是雜音,請(qǐng)問是對(duì)AIC23的配置不對(duì)嗎?我放在SD卡的文件是MP3文件,比特率
    發(fā)表于 10-25 08:28

    lm4673功放出來的聲音很小,調(diào)節(jié)放大倍數(shù)的電阻聲音無明顯變化是怎么回事?

    請(qǐng)問lm4673功放出來的聲音很小,調(diào)節(jié)放大倍數(shù)的電阻聲音無明顯變化,調(diào)節(jié)隔直電容,聲音也沒有變大,這是怎么回事。lm4673在生產(chǎn)過程怎么提高良品率
    發(fā)表于 10-24 07:44

    求助,關(guān)于tpa3118音頻問題求解

    求助,求助,我一款播放器用了三個(gè)tpa3118功放ic,基本上是按照官方的參考設(shè)計(jì),但是出來的音頻怎么聽都不舒服,高頻有點(diǎn)刺耳,聲音太硬,低頻部分同樣播放首歌,同樣的這款芯片,另外的設(shè)備播
    發(fā)表于 10-22 07:38

    tpa3118做了個(gè)雙功放,功放出來有滋滋的底噪,怎么解決?

    我做了個(gè)雙功放,功放出來有滋滋的底噪,怎么弄都解決不了,求助大神
    發(fā)表于 10-21 08:05

    如何用5509A產(chǎn)生個(gè)白噪聲,經(jīng)AIC23播放出來然后再用AIC23采集這個(gè)聲音?

    怎樣用5509A產(chǎn)生個(gè)白噪聲,經(jīng)AIC23播放出來然后再用AIC23采集這個(gè)聲音
    發(fā)表于 10-15 06:26

    TAS5825m在未接喇叭的情況下,輸出音量加大后能聽到有聲音播放出來,怎么解決?

    目前我們?cè)谟肨AS5825m這顆功放,發(fā)現(xiàn)在未接喇叭的情況下,輸出音量加大后能聽到有聲音播放出來;請(qǐng)問有什么辦法可以杜絕或者改善此種現(xiàn)象嗎?
    發(fā)表于 09-30 07:31

    富唯智能協(xié)作機(jī)器人在食品飲料行業(yè)的柔性應(yīng)用

    富唯智能協(xié)作機(jī)器人在食品和飲料供應(yīng)鏈中廣泛應(yīng)用于包裝和機(jī)床管理等次級(jí)流程。協(xié)作機(jī)器人可以在潮濕的溫室、冷藏室、加熱爐等環(huán)境工作,將員工從重復(fù)性工作中
    的頭像 發(fā)表于 09-09 15:12 ?231次閱讀
    富唯智能協(xié)作機(jī)器人在食品飲料行業(yè)的柔性應(yīng)用

    Pura 70系列AI大師再上新!小藝AI擴(kuò)開啟魔幻新體驗(yàn)

    大師又驚喜更新了AI擴(kuò)功能,可以顯著拓寬照片視野,開啟全新的體驗(yàn)。 用戶只需在圖庫中選擇需
    的頭像 發(fā)表于 08-01 13:22 ?459次閱讀

    用LM358P和IRF631搭建了個(gè)恒流源,運(yùn)放出來的波形失真嚴(yán)重,為什么?

    是恒流源的原理,第二張圖片是我用Multisim仿真的波形,仿真結(jié)果是:運(yùn)放出來的波形失真嚴(yán)重,mos的源極電流也失真很嚴(yán)重,而且底部截止失真了,請(qǐng)問這是為什么?
    發(fā)表于 08-01 06:18

    協(xié)作機(jī)器人在食品和飲料中的的應(yīng)用

    富唯智能協(xié)作機(jī)器人在食品和飲料供應(yīng)鏈中廣泛應(yīng)用于包裝和機(jī)床管理等次級(jí)流程。協(xié)作機(jī)器人可以在潮濕的溫室、冷藏室、加熱爐等環(huán)境工作,將員工從重復(fù)性工作中
    的頭像 發(fā)表于 05-16 14:39 ?391次閱讀
    協(xié)作機(jī)器人在食品和飲料中的的應(yīng)用

    拿來就能用 | ESP AI音箱方案介紹

    機(jī)器人。該系統(tǒng)可以接收用戶的語音指令,將其展示在屏幕上,并調(diào)用OpenAIAPI進(jìn)行處理,生成相應(yīng)的回復(fù)?;貜?fù)將顯示在ESP-BOX屏幕上,然后播放出來。案例研究
    的頭像 發(fā)表于 03-21 08:03 ?697次閱讀
    拿來就能用 | ESP <b class='flag-5'>AI</b>音箱方案介紹