0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI畫的簡筆畫能到什么水平

人工智能與大數(shù)據(jù)技術(shù) ? 來源:金磊 ? 作者:金磊 ? 2020-12-25 11:13 ? 次閱讀

AI畫的簡筆畫能到什么水平?

給一張美國演員Rami Malek的照片,效果是這樣的。

是不是和原圖很逼近了?

再來看下輸入《老友記》合影的效果。

雖然人物眾多,但出來的簡筆畫效果,依舊還是能分清劇中的人物。

如果毛發(fā)特別濃密的人物照,AI還能hold得住嗎?

小姐姐“爆炸頭”的邊緣毛發(fā),也算得上是完美還原了。

再近距離一些的呢?來看“霉霉”(Taylor Swift)照片的效果。

可以說是相當?shù)募毠?jié)了,把發(fā)絲的層次感、光感,以及衣物的褶皺,都發(fā)揮的“淋漓盡致”。

……

這些就是出自一個叫ArtLine的AI的作品。

而且它在Reddit非?;鸨?,已經(jīng)達到了1100+的熱度。

如此惟妙惟肖的效果,你是不是認為又是GAN的功勞?

錯!

ArtLine完全沒有用到GAN:

也正因如此,ArtLine的效果真真兒的驚艷到了網(wǎng)友。

那么,它是如何做到的呢?

ArtLine背后的三大“法寶”

ArtLine的作者十分爽快地分享了其背后的三大技術(shù):

Self-Attention

Progressive Resizing

Generator Loss

接下來,一起逐一看下各個技術(shù)背后的細節(jié)內(nèi)容。

Self-Attention部分引用的技術(shù),出自兩年前GAN之父lan Goodfellow等人提出的研究。

等等,剛才不是還說“沒用到GAN”嗎?

作者對此的解釋是:

并沒有起到太大作用。

這項研究主要是在GAN生成中加入了注意力機制,同時將SNgan的思想引入到生成器當中。

所要解決的是傳統(tǒng)GAN自身存在的一些問題,例如:

使用小的卷積核很難發(fā)現(xiàn)圖像中的依賴關(guān)系

使用大的卷積核就會喪失卷積網(wǎng)絡參數(shù)與計算的效率

研究中核心的自注意力機制如下圖所示。

其中,f(x),g(x)和h(x)都是普通的1x1卷積,差別只在于輸出通道大小不同。

而后,將f(x)的輸出轉(zhuǎn)置,并和g(x)的輸出相乘,再經(jīng)過softmax歸一化,得到一個Attention Map。

得到Attention Map之后,和h(x)逐像素點相乘,得到自適應的注意力feature maps。

206cd116-4658-11eb-8b86-12bb97331649.png

從結(jié)果上來看,引入自注意力機制的效果,確實在FID和IS兩個性能指標下,得到了較好的效果。

ArtLine涉及到的第二個技術(shù)靈感,來自英偉達在2018年的一項研究。

20a9d660-4658-11eb-8b86-12bb97331649.png

這項研究主要提出了一種新的訓練對抗神經(jīng)網(wǎng)絡的方法。

核心思想是逐步訓練生成器和判別器:從低分辨率開始,隨著訓練進程推進,逐步增加新的層來提煉細節(jié)。

這種方法不僅加快了訓練速度并且更加穩(wěn)定,可以產(chǎn)生高質(zhì)量的圖像。

ArtLine所涉及到的最后一個技術(shù),是來自斯坦福大學李飛飛團隊在2016年提出的研究。

這項研究主要解決了實現(xiàn)的風格轉(zhuǎn)換,比較費時的問題。

風格轉(zhuǎn)換部分主要用了上面的網(wǎng)絡模型,這個模型可以分為兩部分:左側(cè)是圖像轉(zhuǎn)換網(wǎng)絡,而右側(cè)是損耗網(wǎng)絡。

其超分辨率重建也是采用上面的網(wǎng)絡模型,只是具體內(nèi)部的圖像轉(zhuǎn)換網(wǎng)絡部分稍有區(qū)別。

這個網(wǎng)絡與之前的研究相比,效果達到了相當?shù)乃?,但速度卻提升了百倍之多,達到3個數(shù)量級。

21dfa44c-4658-11eb-8b86-12bb97331649.png

關(guān)于作者

ArtLine的項目作者叫做Vijish Madhavan。

他在GitHub中坦言自己并非程序員出身,也道出了ArtLine目前存在的一些缺陷,例如處理像素低于500px的圖像時,效果并不理想等。

現(xiàn)在,ArtLine可以在線玩了!

感興趣的讀者,可以戳下方鏈接體驗一下。

Colab鏈接:

https://colab.research.google.com/github/vijishmadhavan/Light-Up/blob/master/ArtLine(Try_it_on_Colab).ipynb.ipynb)
https://colab.research.google.com/github/vijishmadhavan/Light-Up/blob/master/ArtLine.ipynb

GitHub項目地址:

https://github.com/vijishmadhavan/ArtLine

責任編輯:xj

原文標題:這個AI“大師級”簡筆畫水平,驚艷到了網(wǎng)友:竟然不用GAN

文章出處:【微信公眾號:人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30947

    瀏覽量

    269209
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1936

    瀏覽量

    73532

原文標題:這個AI“大師級”簡筆畫水平,驚艷到了網(wǎng)友:竟然不用GAN

文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    人類智慧水平AI即將到來,AI芯片已提前布局

    擁有人類智慧水平AI即將出現(xiàn),但不必恐懼,Altman認為這種AI對世界的影響遠沒有人們想象得那么嚴重。 ? 人類水平AI即將到來 ? 從
    的頭像 發(fā)表于 01-22 06:44 ?2608次閱讀

    請問adc3583的噪聲電平能到多少Vrms?

    請問adc3583的噪聲電平能到多少Vrms
    發(fā)表于 11-27 08:21

    DAC8718在單電源供電,雙電源供電下,輸出的模擬電壓最小能到多少?

    我想請教一下,DAC8718(7718)在單電源供電,雙電源供電,兩種方式下,輸出的模擬電壓最小能到多少? 我看規(guī)格書上: Note that the maximum output voltage
    發(fā)表于 11-22 07:49

    TAS5715頻響為什么只能到6K?

    為什么我們買的DEMO板 在測試頻響的時候只到6KHZ(-3DB),然后我們做的產(chǎn)品出來也是到6K,這是什么原因,我們做過一些測試,在進入PM1808之前的信號是到20K以上的,進了ADC,從5715出來后就只能到6K。
    發(fā)表于 11-04 06:58

    THS4631單位增益能到325M我的電路單位增益只能到10幾M?

    手冊上說THS4631單位增益能到325M我的電路單位增益只能到10幾M? GBW = 210M,我放大10倍結(jié)果10M的時候就衰減很厲害,怎么回事? 請專家指導,謝謝
    發(fā)表于 09-19 08:31

    請問LM2907進行頻壓轉(zhuǎn)換時,輸入頻率最高能到多少?

    請問LM2907進行頻壓轉(zhuǎn)換時,輸入頻率最高能到多少?數(shù)據(jù)手冊沒有看到相應數(shù)據(jù)。
    發(fā)表于 09-05 07:51

    云開發(fā)AI助手

    AI
    草帽王路飛
    發(fā)布于 :2024年07月22日 14:41:54

    李開復展望AI未來:2025年AI或超博士水平

    在6月29日舉辦的知乎第十屆鹽Club新知青年大會上,科技巨頭李開復,身兼零一萬物CEO和創(chuàng)新工場董事長雙重身份,發(fā)表了對人工智能(AI)未來的深度見解。他回顧了自己與AI相伴的40年歷程,并大膽預測,大模型技術(shù)的飛速進步將使AI
    的頭像 發(fā)表于 06-29 15:56 ?912次閱讀

    esp32的整體平均功耗能到多少?

    deep-sleep模式,rtc定時5s喚醒一次,每次就啟動ble 進行廣播并維持1s的等待連接。如果沒有就進入deep-sleep。 這種模式下,如果沒有連接的話,esp32的整體平均功耗能到多少?沒有用ulp。理論上應該是官方數(shù)據(jù)10uA,但是粗略測量會高很多。請問還需要怎么做嗎?
    發(fā)表于 06-26 07:52

    請問Esp32S3 lcd驅(qū)動器的pclk最大能到多少?

    Esp32 S3 lcd 驅(qū)動器的pclk最大能到多少?
    發(fā)表于 06-06 08:30

    智譜AI劉江:5-10年內(nèi)AGI會達到普通人水平

    在2024亞馬遜云科技中國峰會上,智譜AI首席生態(tài)官劉江發(fā)表了引人注目的觀點。他預測,在未來的5至10年內(nèi),AGI(通用人工智能)的發(fā)展將達到普通人的水平,這將是“我們這一代人遇到的最大的技術(shù)突破”。
    的頭像 發(fā)表于 05-31 10:33 ?733次閱讀

    英飛凌單片機現(xiàn)在最高溫度能到多少度?

    你好,英飛凌單片機現(xiàn)在最高溫度能到多少度?我目前查到的是175℃,這個數(shù)字準確嗎?是否有更高的溫度的MCU?
    發(fā)表于 05-22 08:30

    微軟新品發(fā)布會:運用AI技術(shù)提升用戶生產(chǎn)力,推出全新Windows 11圖應用

    有消息稱,Windows Latest報道,此次發(fā)布會上微軟可能將發(fā)布新版Windows 11圖應用。該款應用將搭載NPU(神經(jīng)網(wǎng)絡處理單元),以提供多樣性的AI功能。
    的頭像 發(fā)表于 03-08 14:13 ?684次閱讀

    PSOC6支持的屏幕分辨率最大能到600*600嗎?

    現(xiàn)在PSOC6支持的屏幕分辨率最大能到600*600嗎?
    發(fā)表于 02-19 08:24

    OpenAI CEO稱人類水平AI即將出現(xiàn)

    OpenAI首席執(zhí)行官山姆·奧特曼(Sam Altman)近日表示,達到人類水平的人工智能(AI)即將出現(xiàn),但他認為這種技術(shù)對世界的影響可能遠沒有人們想象的那么大。
    的頭像 發(fā)表于 01-17 14:59 ?841次閱讀