0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Nvidia Research開發(fā)的深度學(xué)習(xí)模型,輕松地將粗糙的涂鴉變成照片級(jí)的寫實(shí)杰作

jmiy_worldofai ? 來(lái)源:lp ? 2019-03-22 14:19 ? 次閱讀

一個(gè)新手畫家可能會(huì)用畫筆在畫布上畫畫,目的是創(chuàng)作一幅壯美的日落景觀圖——崎嶇的、白雪覆蓋的山峰倒映在清澈的湖泊中——但最終畫出來(lái)的只不過(guò)是一些看起來(lái)更像多色墨水點(diǎn)的東西。

但是,由 Nvidia Research 開發(fā)的深度學(xué)習(xí)模型卻恰恰相反:它可以輕松地將粗糙的涂鴉變成照片級(jí)的寫實(shí)杰作。該工具利用生成的對(duì)抗網(wǎng)絡(luò)(GANs)將語(yǔ)意分割圖轉(zhuǎn)換為逼真的圖像。

這款使用該模型的交互式應(yīng)用程序,輕輕松松地就達(dá)到了后印象派畫家的水平,它被命名為 GauGAN。

后印象派畫家 Paul Gauguin 畫了幾幅自畫像,包括這幅自 1885 年起就收藏在 Kimbell 藝術(shù)博物館的作品(照片來(lái)自 Wikimedia Commons)。

GauGAN 可以為從建筑師、城市規(guī)劃者到景觀設(shè)計(jì)師和游戲開發(fā)商的每個(gè)人提供一個(gè)強(qiáng)大的工具來(lái)創(chuàng)建虛擬世界。有了一個(gè)能夠理解現(xiàn)實(shí)世界的人工智能,這些專業(yè)人員可以更好地設(shè)計(jì)出想要的原型,并快速改變它們。

NVIDIA 應(yīng)用深度學(xué)習(xí)研究院副總裁 Bryan Catanzaro 說(shuō):「用簡(jiǎn)單的草圖進(jìn)行頭腦風(fēng)暴設(shè)計(jì)要容易得多,而且這項(xiàng)技術(shù)能夠?qū)⒉輬D轉(zhuǎn)換成高度逼真的圖像?!?/p>

Catanzaro 將 GauGAN 背后的技術(shù)比作「智能畫筆」,它可以在粗略的語(yǔ)意分割圖(即顯示場(chǎng)景中對(duì)象位置的高級(jí)輪廓)中填充細(xì)節(jié)。

GauGAN 使用戶可以畫出語(yǔ)意分割圖,并合成自己需要的場(chǎng)景,其中,這些分割圖都需要相應(yīng)的標(biāo)簽,如天空、大?;蛘哐?/p>

經(jīng)過(guò) 100 萬(wàn)張圖片的訓(xùn)練,深度學(xué)習(xí)模型通過(guò)結(jié)果來(lái)填充景觀:在池塘中畫畫,附近的元素如樹木和巖石將在水中映射。將一個(gè)段標(biāo)簽從「草地」換成「雪」,整個(gè)圖像將變?yōu)槎緢?chǎng)景,原來(lái)枝繁葉茂的樹木則變成了不毛之地。

Catanzaro 說(shuō):「這就像一幅彩色的圖畫,描繪了一棵樹在哪里,太陽(yáng)在哪里,天空在哪里?!谷缓螅?a href="http://www.wenjunhu.com/tags/神經(jīng)網(wǎng)絡(luò)/" target="_blank">神經(jīng)網(wǎng)絡(luò)能夠根據(jù)對(duì)真實(shí)圖像的了解,填充所有細(xì)節(jié)和紋理,以及反射、陰影和顏色。

由于 GANs 是由一對(duì)網(wǎng)絡(luò)——生成器和對(duì)抗器組成的,因此,盡管缺乏對(duì)真實(shí)世界的了解,但它仍然可以生成讓人滿意的圖像。生成器創(chuàng)建圖像并呈現(xiàn)給對(duì)抗器。對(duì)抗器在真實(shí)圖像上訓(xùn)練后,反饋給生成器如何逐素提高合成圖像的真實(shí)性。

經(jīng)過(guò)對(duì)真實(shí)圖像的訓(xùn)練后,對(duì)抗器知道真實(shí)的池塘和湖泊是包含反射的——因此生成器學(xué)會(huì)了創(chuàng)造令人驚嘆的逼真圖像。

該工具還允許用戶添加樣式過(guò)濾器,更改生成的圖像以適應(yīng)特定畫家的風(fēng)格,或?qū)⑷臻g場(chǎng)景更改為日落場(chǎng)景。

Catanzaro 說(shuō):「這項(xiàng)技術(shù)不僅僅是將其他圖像拼接在一起或者剪切和粘貼紋理,它實(shí)際上是合成新的圖像,這和藝術(shù)家創(chuàng)造新東西的方法非常相似。」

雖然 GauGAN 應(yīng)用程序?qū)W⒂陉懙?、海洋和天空等自然元素,但底層的神?jīng)網(wǎng)絡(luò)也有能力填充其他景觀特征,包括建筑物、道路和人等。

關(guān)于 GauGAN 的研究論文已被 6 月的 CVPR 會(huì)議評(píng)為 Oral 論文——而獲得這一殊榮的論文不到提交論文總數(shù)的 5%。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5063

    瀏覽量

    103436
  • 人工智能
    +關(guān)注

    關(guān)注

    1793

    文章

    47536

    瀏覽量

    239370
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5511

    瀏覽量

    121362

原文標(biāo)題:涂鴉秒變真實(shí)風(fēng)景,NVIDIA GauGAN讓你也可以擁有天才之筆!

文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Triton編譯器在機(jī)器學(xué)習(xí)中的應(yīng)用

    1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務(wù)平臺(tái)的一部分,它負(fù)責(zé)深度學(xué)習(xí)模型轉(zhuǎn)換為優(yōu)化的格式,以便
    的頭像 發(fā)表于 12-24 18:13 ?461次閱讀

    深度學(xué)習(xí)模型的魯棒性優(yōu)化

    深度學(xué)習(xí)模型的魯棒性優(yōu)化是一個(gè)復(fù)雜但至關(guān)重要的任務(wù),它涉及多個(gè)方面的技術(shù)和策略。以下是一些關(guān)鍵的優(yōu)化方法: 一、數(shù)據(jù)預(yù)處理與增強(qiáng) 數(shù)據(jù)清洗 :去除數(shù)據(jù)中的噪聲和異常值,這是提高模型魯棒
    的頭像 發(fā)表于 11-11 10:25 ?337次閱讀

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU在深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識(shí)別 圖像識(shí)別是深度學(xué)習(xí)
    的頭像 發(fā)表于 10-27 11:13 ?444次閱讀

    FPGA加速深度學(xué)習(xí)模型的案例

    FPGA(現(xiàn)場(chǎng)可編程門陣列)加速深度學(xué)習(xí)模型是當(dāng)前硬件加速領(lǐng)域的一個(gè)熱門研究方向。以下是一些FPGA加速深度學(xué)習(xí)
    的頭像 發(fā)表于 10-25 09:22 ?306次閱讀

    AI大模型深度學(xué)習(xí)的關(guān)系

    AI大模型深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進(jìn),相輔相成。以下是對(duì)兩者關(guān)系的介紹: 一、深度學(xué)習(xí)是AI大
    的頭像 發(fā)表于 10-23 15:25 ?1048次閱讀

    FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?

    ,F(xiàn)PGA 也需要不斷適應(yīng)和改進(jìn)。研究人員和開發(fā)致力于針對(duì) FPGA 的特點(diǎn)對(duì)深度學(xué)習(xí)算法進(jìn)行優(yōu)化,例如探索更高效的模型壓縮方法、量化技
    發(fā)表于 09-27 20:53

    深度學(xué)習(xí)模型有哪些應(yīng)用場(chǎng)景

    深度學(xué)習(xí)模型作為人工智能領(lǐng)域的重要分支,已經(jīng)在多個(gè)應(yīng)用場(chǎng)景中展現(xiàn)出其巨大的潛力和價(jià)值。這些應(yīng)用不僅改變了我們的日常生活,還推動(dòng)了科技進(jìn)步和產(chǎn)業(yè)升級(jí)。以下詳細(xì)探討
    的頭像 發(fā)表于 07-16 18:25 ?2137次閱讀

    深度學(xué)習(xí)模型量化方法

    深度學(xué)習(xí)模型量化是一種重要的模型輕量化技術(shù),旨在通過(guò)減少網(wǎng)絡(luò)參數(shù)的比特寬度來(lái)減小模型大小和加速推理過(guò)程,同時(shí)盡量保持
    的頭像 發(fā)表于 07-15 11:01 ?521次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>模型</b>量化方法

    深度學(xué)習(xí)中的模型權(quán)重

    深度學(xué)習(xí)這一充滿無(wú)限可能性的領(lǐng)域中,模型權(quán)重(Weights)作為其核心組成部分,扮演著至關(guān)重要的角色。它們不僅是模型學(xué)習(xí)的基石,更是
    的頭像 發(fā)表于 07-04 11:49 ?1648次閱讀

    深度學(xué)習(xí)模型訓(xùn)練過(guò)程詳解

    深度學(xué)習(xí)模型訓(xùn)練是一個(gè)復(fù)雜且關(guān)鍵的過(guò)程,它涉及大量的數(shù)據(jù)、計(jì)算資源和精心設(shè)計(jì)的算法。訓(xùn)練一個(gè)深度學(xué)習(xí)模型
    的頭像 發(fā)表于 07-01 16:13 ?1418次閱讀

    深度學(xué)習(xí)模型優(yōu)化與調(diào)試方法

    深度學(xué)習(xí)模型在訓(xùn)練過(guò)程中,往往會(huì)遇到各種問題和挑戰(zhàn),如過(guò)擬合、欠擬合、梯度消失或爆炸等。因此,對(duì)深度學(xué)習(xí)
    的頭像 發(fā)表于 07-01 11:41 ?922次閱讀

    NVIDIA全球數(shù)百萬(wàn)開發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開發(fā)

    來(lái)自 AI 生態(tài)系統(tǒng)各個(gè)領(lǐng)域的 150 余家合作伙伴嵌入了 NIM 推理微服務(wù),企業(yè)級(jí) AI 應(yīng)用的部署時(shí)間從數(shù)周縮短至幾分鐘 NVIDIA 開發(fā)者計(jì)劃會(huì)員可免費(fèi)使用 NIM 來(lái)進(jìn)行
    的頭像 發(fā)表于 06-03 18:21 ?1059次閱讀

    NVIDIA NIM 革命性地改變模型部署,全球數(shù)百萬(wàn)開發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開發(fā)

    來(lái)自 AI 生態(tài)系統(tǒng)各個(gè)領(lǐng)域的 150 余家合作伙伴嵌入了 NIM 推理微服務(wù),企業(yè)級(jí) AI 應(yīng)用的部署時(shí)間從數(shù)周縮短至幾分鐘 NVIDIA 開發(fā)者計(jì)劃會(huì)員可免費(fèi)使用 NIM 來(lái)進(jìn)行
    發(fā)表于 06-03 09:12 ?246次閱讀
    <b class='flag-5'>NVIDIA</b> NIM 革命性地改變<b class='flag-5'>模型</b>部署,<b class='flag-5'>將</b>全球數(shù)百萬(wàn)<b class='flag-5'>開發(fā)</b>者轉(zhuǎn)變?yōu)樯墒?AI <b class='flag-5'>開發(fā)</b>者

    NVIDIA TAO工具套件功能與恩智浦eIQ機(jī)器學(xué)習(xí)開發(fā)環(huán)境的集成

    恩智浦半導(dǎo)體宣布與NVIDIA合作,NVIDIA經(jīng)過(guò)訓(xùn)練的人工智能模型通過(guò)eIQ機(jī)器學(xué)習(xí)開發(fā)環(huán)
    的頭像 發(fā)表于 03-22 09:11 ?994次閱讀

    FPGA在深度學(xué)習(xí)應(yīng)用中或取代GPU

    AI 框架模型映射到硬件架構(gòu)。 Larzul 的公司 Mipsology 希望通過(guò) Zebra 來(lái)彌合這一差距。Zebra 是一種軟件平臺(tái),開發(fā)者可以輕松
    發(fā)表于 03-21 15:19