0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

麻省理工學(xué)院和IBM的團隊推出“GANpaint Studio”自動生成逼真的攝影圖像

DPVg_AI_era ? 來源:lq ? 2019-07-07 07:36 ? 次閱讀

MIT開發(fā)的GANpaint工具可以輕松修圖,允許用戶上傳任何照片進(jìn)行編輯,而不會破壞其原始細(xì)節(jié)。除了幫助藝術(shù)家和設(shè)計師快速調(diào)整視覺效果外,研究人員表示,這項工作可能有助于計算機科學(xué)家識別“虛假”圖像。

當(dāng)我們還沉浸在GauGAN憑借幾根線條,就讓草圖秒變風(fēng)景照的黑科技之時,MIT也帶來了一項類似的黑科技。

自從GAN誕生以來,一次一次創(chuàng)造著奇跡:填充紋理、變臉易容。但這一次,這款名叫GANpaint的神器,簡單幾筆就能成畫。

麻省理工學(xué)院和IBM的團隊推出“GANpaint Studio”,允許用戶上傳任何照片,然后對照片進(jìn)行創(chuàng)作,例如更改對象的大小或者添加全新的項目(如樹木和建筑物),接下來這個系統(tǒng)可以自動生成逼真的攝影圖像。

除了幫助藝術(shù)家和設(shè)計師快速調(diào)整視覺效果外,研究人員表示,這項工作還可能有助于計算機科學(xué)家識別“虛假”圖像。

也難怪網(wǎng)友驚呼:“以后拆樓都不用費勁了!”

那么這款神器如何操作呢?先奉上傳送門:

http://gandissect.res.ibm.com/ganpaint.html?project=churchoutdoor&layer=layer4

首先,在界面下方選擇底圖;其次,在左側(cè)選擇一個對象,如“草”、“門”、“天空”等等;然后選擇要進(jìn)行的操作,例如“繪畫”、“刪除”等;最后,只需要在圖片中想要更改的區(qū)域涂抹幾筆即可。

“現(xiàn)在的機器學(xué)習(xí)系統(tǒng)就是黑盒子,我們并不總是知道如何改進(jìn),有點像你小時候通過拍打舊電視機來修正圖像不能顯示的bug?!闭撐闹饕髡摺⒙槭±砉W(xué)院計算機科學(xué)與人工科學(xué)博士生David Bau說。他將該項目描述為計算機科學(xué)家首次能夠?qū)嶋H“用神經(jīng)元繪制神經(jīng)網(wǎng)絡(luò)”。

設(shè)計師的福報

項目領(lǐng)導(dǎo)人、麻省理工學(xué)院教授Antonio Torralba認(rèn)為該項目具有巨大的潛在應(yīng)用。設(shè)計師和藝術(shù)家可以使用它來更快地調(diào)整視覺效果。想象一下,一位導(dǎo)演拍完戲后發(fā)現(xiàn),背景中少一個對劇情很重要的道具!這個時候GANpaint Studio就可以來大顯身手了。

通過分析需要刪除的“人造”單元,GANpaint Studio還可用于改進(jìn)和調(diào)試正在開發(fā)的其他GAN。除此之外,它還可以幫助研究人員更好地理解神經(jīng)網(wǎng)絡(luò)及其底層結(jié)構(gòu)。

一個意外的發(fā)現(xiàn)是系統(tǒng)實際上似乎已經(jīng)學(xué)習(xí)了一些關(guān)于對象之間關(guān)系的簡單規(guī)則。它自己會通過某種方式,知道什么東西應(yīng)該出現(xiàn)在什么地方,不應(yīng)該出現(xiàn)在不屬于它的地方(例如天空中不應(yīng)該出現(xiàn)窗戶)。

在不同的環(huán)境中,它可以創(chuàng)造出不同的視覺效果。例如,假設(shè)圖像中有兩個不同的建筑物,我們需要為這兩個建筑物添加兩個門,GANpaint Studio并不會粗暴的復(fù)制兩個相同的門上去,而是會添加兩扇不一樣的門。

“所有繪圖應(yīng)用程序都將遵循用戶指令,但如果用戶命令將對象放在不合理的位置,我們可能決定不繪制任何內(nèi)容”Torralba說?!斑@是一個具有強烈個性的繪圖工具,它打開了一個窗口,讓我們了解GAN如何學(xué)會代表視覺世界。”

“這項工作確實簡直令人興奮,讓我們直接看到GAN學(xué)習(xí)東西的方式,開始看起來有點像常識認(rèn)知?!狈姨m阿爾托大學(xué)副教授Jaakko Lehtinen說,“我認(rèn)為這種能力是擁有可以在人類世界中發(fā)揮作用的自主系統(tǒng)的關(guān)鍵基石,這種系統(tǒng)是無限的,復(fù)雜的,不斷變化的?!?/p>

找出“假”圖像

該團隊的目標(biāo)是讓人們更好地控制 GAN 網(wǎng)絡(luò)。但是他們認(rèn)識到,隨著性能的增加,濫用的可能性非??膳?,試想一下將這些技術(shù)用在醫(yī)療照片上將會多么的可怕!論文共同作者朱俊彥表示,他相信更好地了解 GAN,包括 GAN 所犯的錯誤,這將有助于研究人員更好地消除假冒的照片。

“你需要先了解你的對手才能防御它,”CSAIL的博士后朱俊彥說?!斑@種理解可能有助于我們更輕松地檢測假圖像?!?/p>

為了開發(fā)該系統(tǒng),研究團隊首先確定了GAN內(nèi)部與特定類型的對象(如樹木)相關(guān)的單元。然后,單獨測試這些單元,看看是否擺脫它們會導(dǎo)致某些物體消失或出現(xiàn)。重要的是,他們還確定了導(dǎo)致視覺錯誤(工件)的單元,并努力將其移除以提高圖像的整體質(zhì)量。

IBM的研究科學(xué)家Hendrik Strobelt說:“每當(dāng)GAN產(chǎn)生非常不切實際的圖像時,這些錯誤的原因以前就是一個謎。但現(xiàn)在我們發(fā)現(xiàn)這些錯誤是由特定的神經(jīng)元觸發(fā)的,那么就可以先停掉這個神經(jīng)元,以提高圖像的質(zhì)量?!?/p>

“這個系統(tǒng)為更好地理解GAN模型打開了一扇大門,這將有助于我們對GAN進(jìn)行任何類型的研究,”Lehtinen說。

GANpaint憑什么如此神奇?

生成對抗網(wǎng)絡(luò)(GANs)最近在許多實際應(yīng)用中取得了令人印象深刻的結(jié)果,并且隨著樣本質(zhì)量和訓(xùn)練穩(wěn)定性的提高,出現(xiàn)了許多GAN的變體。然而,對GAN的可視化和理解在很大程度上是缺失的。

因此,來自MIT、香港中文大學(xué)、IBM等學(xué)校/機構(gòu)的David Bau、朱俊彥、Joshua B.Tenenbaum、周博磊等人發(fā)表論文,并在文中提出了GANpaint這款工具。他們將于下個月在洛杉磯舉行的SIGGRAPH會議上發(fā)表演講。

在這項工作中,研究人員提出了一個分析框架來在單元、對象和場景級別可視化和理解GAN:

首先,用基于分段的網(wǎng)絡(luò)剖分方法識別一組與對象概念密切相關(guān)的可解釋單元;

然后,通過測量“干預(yù)”的能力來量化可解釋單位的因果效應(yīng);

最后,通過將發(fā)現(xiàn)的對象概念插入到新圖像中,以此來檢查這些單元與其周圍環(huán)境之間的關(guān)系。

研究人員的主要目標(biāo)是分析如何通過GAN生成器的內(nèi)部表征,來對“樹”等對象進(jìn)行編碼:

通過剖析(dissection)來表征單元

使用干預(yù)(intervention)測量因果關(guān)系

實驗結(jié)果

工作人員研究了在LSUN場景數(shù)據(jù)集上訓(xùn)練的三種Progressive GAN的變體。為了對生成的圖像進(jìn)行分割,我們使用一個最近的模型 (Xiao et al., 2018) 在ADE20K場景數(shù)據(jù)集上訓(xùn)練。

該模型可以將輸入圖像分割為336個物體類,29個大物體和25個材質(zhì)類。為了進(jìn)一步識別專門用于對象部件的單元,我們將每個對象類c擴展為另外的對象部件類ct,cb,cl和cr,分別表示連接組件的邊界框的頂部,底部,左半部分或右半部分。。

診斷和改進(jìn)GANS

框架不僅可以揭示GAN是如何成功地生成真實圖像的,也可以分析結(jié)果失敗的原因。

如圖8所示,圖8a顯示了幾個注釋單元,負(fù)責(zé)GAN結(jié)果中的visual artifacts;圖8b顯示了artifacts被成功移除,并且自由像素保持不變的改進(jìn)的生成結(jié)果。

圖8: (a)兩個負(fù)責(zé)GAN結(jié)果中 visual artifacts的示例單元??偣灿?0個單元。通過消融這些單元,我們可以修復(fù)(b)中的artifacts,并顯著提高(c)中的視覺質(zhì)量。

通過消融定位因果單元

圖9:測量在會議室圖像訓(xùn)練的GAN中消融單元的效果

如圖10所示,雖然可以在會議室圖像中很好地移除窗戶,但是在其他場景中刪除窗戶則比較困難。

圖10:比較在五個場景類別訓(xùn)練的GAN中消融20個窗戶單位的效果。

通過插入表征上下文關(guān)系

也可以通過強制單元和插入這些功能到場景中的特定位置來學(xué)習(xí)GAN的操作。圖11顯示了在教堂場景中插入20層門單元的效果。

圖11:通過在表示中的一個像素處將20個causal units設(shè)置為固定的高值來插入 door units。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1084

    瀏覽量

    40463
  • MIT
    MIT
    +關(guān)注

    關(guān)注

    3

    文章

    253

    瀏覽量

    23396
  • 計算機科學(xué)
    +關(guān)注

    關(guān)注

    1

    文章

    144

    瀏覽量

    11361

原文標(biāo)題:暴力解剖GAN!MIT、港中文團隊GANpaint,一筆成畫不是夢

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    麻省理工學(xué)院打造人工智能應(yīng)用Shelley寫小說

    邪惡小丑、不死寵物、幽靈旅館……美國新英格蘭恐怖小說作家史蒂芬·金(Stephen King)憑借著這些恐怖場景讓我們恐懼了幾十年。如今麻省理工學(xué)院(MIT)的一個團隊可能會引起人們的注意,甚至?xí)屓蚰切┛植佬≌f作家也“脊背發(fā)涼”。
    的頭像 發(fā)表于 11-09 09:33 ?9925次閱讀

    ADI公司與麻省理工學(xué)院合作研發(fā)用于病人監(jiān)護(hù)的醫(yī)療技術(shù)

    ADI公司供應(yīng)商及醫(yī)療設(shè)備行業(yè)的長期供應(yīng)商,近日宣布與麻省理工學(xué)院(MIT)合作研發(fā)用于新一代病人監(jiān)護(hù)設(shè)備的技術(shù)。
    發(fā)表于 06-03 15:41 ?743次閱讀

    麻省理工學(xué)院開發(fā)了一個名為MapLite的框架,允許在缺乏3D地圖的道路上進(jìn)行操作

    自動駕駛汽車中普遍存在的一個問題是,為了安全導(dǎo)航,他們需要手動標(biāo)記的3D地圖。 現(xiàn)在麻省理工學(xué)院研究突破將改變這一點。即使在鄉(xiāng)村道路上,麻省理工學(xué)院的系統(tǒng)也可以使用GPS和傳感器數(shù)據(jù)進(jìn)行自動
    發(fā)表于 05-16 09:37 ?1647次閱讀

    麻省理工學(xué)院探索如何使用VR/MR技術(shù),成立高級VR技術(shù)中心

    VR技術(shù)對人們?nèi)粘I町a(chǎn)生的影響越來越大。麻省理工學(xué)院Open Learning(開放學(xué)習(xí))副總裁Sanjay Sarma與比較媒介研究/協(xié)作項目以及計算機科學(xué)和AI實驗室教授D. Fox
    發(fā)表于 12-02 09:12 ?2193次閱讀

    麻省理工學(xué)院發(fā)布了你獵豹小型四足機器人 最終不被人所控制

    本月早些時候,麻省理工學(xué)院(MIT)發(fā)布了其迷你獵豹(Mini Cheetah)的新視頻,這是來自麻省理工學(xué)院仿生機器人實驗室的小型四足機器人。該實驗室負(fù)責(zé)人、機械工程教授桑巴·金(Sangbae Kim)日前接受采訪,談了許多關(guān)于迷你獵豹設(shè)計以及機器人未來發(fā)展需要面對的
    發(fā)表于 03-21 14:29 ?1637次閱讀

    谷歌聯(lián)手麻省理工學(xué)院研究冷聚變 進(jìn)展才得以發(fā)布

    冷聚變研究迎來了一個重要拐點:谷歌聯(lián)手麻省理工學(xué)院等研究團隊決定再度發(fā)起對于“冷聚變”的研究,該研究的系列進(jìn)展已經(jīng)得以發(fā)布。
    的頭像 發(fā)表于 05-29 14:12 ?3803次閱讀

    麻省理工學(xué)院開發(fā)低成本傳感器手套 成本僅為10美元

    麻省理工學(xué)院通過配備550個壓力傳感器的低成本針織手套收集人類感知數(shù)據(jù)。
    的頭像 發(fā)表于 06-03 15:49 ?3531次閱讀

    麻省理工學(xué)院的電路分析與電子線路的學(xué)習(xí)課件資料免費下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是麻省理工學(xué)院的電路分析與電子線路的學(xué)習(xí)課件資料免費下載。
    發(fā)表于 06-24 08:00 ?0次下載
    <b class='flag-5'>麻省理工學(xué)院</b>的電路分析與電子線路的學(xué)習(xí)課件資料免費下載

    谷歌和麻省理工學(xué)院的計算機基礎(chǔ)數(shù)學(xué)教程免費下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是谷歌和麻省理工學(xué)院的計算機基礎(chǔ)數(shù)學(xué)教程免費下載
    發(fā)表于 11-18 08:00 ?1次下載

    麻省理工學(xué)院研究團隊開發(fā)出了一款線性機器人

    麻省理工學(xué)院的趙選賀教授團隊就開發(fā)出了一款線性機器人,它既能降低腦血管手術(shù)的風(fēng)險,讓患者在90分鐘的黃金時間內(nèi)得到及時治療,同時又能為醫(yī)生提供更高效更安全的治療場景。
    發(fā)表于 04-20 10:49 ?597次閱讀

    麻省理工學(xué)院開發(fā)新系統(tǒng),通過肌肉信號控制機器人

    麻省理工學(xué)院的研究人員創(chuàng)造了一個新的系統(tǒng),能讓我們更接近于人與機器人的無縫協(xié)作。這套系統(tǒng)被稱為 "行為-A-Bot"。
    發(fā)表于 04-29 10:08 ?892次閱讀

    麻省理工學(xué)院關(guān)于電磁脈沖的新實驗

    麻省理工學(xué)院關(guān)于電磁脈沖的新實驗
    發(fā)表于 04-19 10:16 ?6次下載

    基于麻省理工學(xué)院的磁鐵為商業(yè)聚變發(fā)電提供了可行的途徑

    Commonwealth Fusion Systems (CFS) 和麻省理工學(xué)院的等離子體科學(xué)與聚變中心 (PSFC) 披露了對磁場強度為 20 特斯拉的高溫超導(dǎo) (HTS) 磁體的成功測試
    發(fā)表于 08-03 16:50 ?1061次閱讀
    基于<b class='flag-5'>麻省理工學(xué)院</b>的磁鐵為商業(yè)聚變發(fā)電提供了可行的途徑

    美國麻省理工學(xué)院和加州理工學(xué)院:研發(fā)可吞咽傳感器助力監(jiān)測胃腸道健康

    傳感新品 【美國麻省理工學(xué)院和加州理工學(xué)院:研發(fā)可吞咽傳感器助力監(jiān)測胃腸道健康】 美國麻省理工學(xué)院和加州理工學(xué)院的工程師們展示了一種可吞咽傳感器,當(dāng)通過消化道時,可以監(jiān)測其位置,從而幫
    的頭像 發(fā)表于 02-21 01:17 ?904次閱讀

    麻省理工學(xué)院推出新型機器人訓(xùn)練模型

    近日,據(jù)TechCrunch報道,麻省理工學(xué)院的研究團隊展示了一種創(chuàng)新的機器人訓(xùn)練模型,該模型突破了傳統(tǒng)模仿學(xué)習(xí)方法的局限,不再依賴標(biāo)準(zhǔn)數(shù)據(jù)集,而是借鑒了大型語言模型(LLM)如GPT-4等所使用的大規(guī)模信息處理方式,為機器人學(xué)習(xí)新技能開辟了全新的道路。
    的頭像 發(fā)表于 11-04 14:56 ?494次閱讀