久久99国产亚洲高清观看首页,大香中文字幕伊人久热大人妻,欧洲av色欲无码综合网

筆者最近在集中時(shí)間學(xué)習(xí)對(duì)抗生成網(wǎng)絡(luò)（GAN），特別是深度生成先驗(yàn)進(jìn)行多用途圖像修復(fù)與處理，需要對(duì)圖像修復(fù)與處理經(jīng)典論文進(jìn)行回顧和精讀。

將從圖像修復(fù)與處理的經(jīng)典之作DGP《Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation》開始，重啟精讀之路。

DGP提出了一種挖掘GAN中圖像先驗(yàn)的方式，在多個(gè)任務(wù)上揭示了GAN作為一種通用圖像先驗(yàn)的潛力。

論文提出了同時(shí)插值隱變量和生成器的漸變式圖像反演方法，可以應(yīng)用于復(fù)雜圖片的對(duì)抗防御，在實(shí)驗(yàn)中DGP所展現(xiàn)出的強(qiáng)大的像素間空間關(guān)系模擬能力也十分有趣。

Deep generative prior的圖像復(fù)原效果

01深度生成先驗(yàn)

深度圖像先驗(yàn)DIP僅依靠輸入圖像的統(tǒng)計(jì)信息，無(wú)法應(yīng)用于需要更一般的圖像統(tǒng)計(jì)信息的任務(wù)，如圖像上色和圖像編輯。

我們更感興趣的是研究一種更通用的圖像先驗(yàn)，即在大規(guī)模自然圖像上訓(xùn)練的GAN生成器用于圖像合成。具體來說，是一個(gè)基于GAN-inversion的圖像重構(gòu)過程。

在實(shí)踐中，僅僅通過優(yōu)化隱向量z難以準(zhǔn)確重建ImageNet這樣的復(fù)雜真實(shí)圖像。訓(xùn)練GAN的數(shù)據(jù)集（ImageNet）本身是自然圖片中很少的一部分，GAN受限于有限的模型性能和mode collapse，其模擬的圖片分布與訓(xùn)練集圖片分布也存在鴻溝。

即使存在以上限制，GAN仍然學(xué)習(xí)了豐富的圖片信息，為了利用這些信息并且實(shí)現(xiàn)精確重建，我們讓生成器online地適應(yīng)于每張目標(biāo)圖片，即聯(lián)合優(yōu)化隱向量z和生成器參數(shù)。

我們將此新的目標(biāo)稱為深度生成先驗(yàn)（DGP），DGP顯著提高了圖像重構(gòu)的效果。設(shè)計(jì)合適的距離度量和優(yōu)化策略非常關(guān)鍵，在重建過程中，生成器原始的生成先驗(yàn)被修改了，輸出真實(shí)自然圖像的能力可能會(huì)下降。

02判別器指引的漸進(jìn)式重建

從 latent space Z 中隨機(jī)抽取幾百個(gè)候選的初始 latent code，并選擇在度量L下重構(gòu)效果最好的一個(gè)。

在GAN重建中，傳統(tǒng)的距離度量方法是 MSE 或 Perceptual loss。優(yōu)化生成器參數(shù)時(shí)，將這些傳統(tǒng)距離度量用在圖像恢復(fù)如上色任務(wù)中，常常無(wú)法準(zhǔn)確恢復(fù)顏色，并且重建過程中圖像會(huì)變得模糊，需要設(shè)計(jì)更好的優(yōu)化方式來保留生成器的原有信息。

我們?cè)谠摴ぷ髦羞x擇使用與生成器對(duì)應(yīng)的判別器來作為距離度量。與Perceptual loss所采用的VGGNet不同，判別器并非在一個(gè)第三方的任務(wù)上訓(xùn)練，而是在預(yù)訓(xùn)練時(shí)就與生成器高度耦合，它天然地適用于調(diào)整生成器的輸出分布。

使用這種基于判別器的距離度量時(shí)，重建的過程更加自然和真實(shí)，最終顏色恢復(fù)的效果也更好。

其中D（x， i）代表以x作為輸入時(shí)判別器第i個(gè)block輸出的特征

雖然改進(jìn)的距離度量帶來了更好的效果，但是圖像復(fù)原的結(jié)果仍存在非自然痕跡，因?yàn)樯善髟卺槍?duì)目標(biāo)圖片優(yōu)化時(shí)，淺層參數(shù)匹配好圖片整體布局之前，深層參數(shù)就開始匹配細(xì)節(jié)紋理了。

上面的蘋果圖是幾種訓(xùn)練策略的對(duì)比，從三行效果可以看出，有的蘋果在訓(xùn)練初期沒被染上色后期還是沒被染上色，我們把這種現(xiàn)象稱作“信息滯留”。

對(duì)策就是：使用漸進(jìn)式重建的策略，即在微調(diào)生成器時(shí)，先優(yōu)化淺層，再逐漸過渡到深層，讓重建過程“先整體后局部”。

與非漸進(jìn)策略相比，這種漸進(jìn)策略更好地保留了缺失語(yǔ)義和現(xiàn)有語(yǔ)義之間的一致性。

03重建結(jié)果

使用BigGAN模型，基于ImageNet進(jìn)行訓(xùn)練，使用ImageNet驗(yàn)證集中的1000張圖像進(jìn)行實(shí)驗(yàn)，取每類的第一張，相比于其他方法，DGP取得了非常高的PSNR和SSIM，視覺上的重建誤差幾乎難以察覺。

04實(shí)驗(yàn)

因?yàn)镚AN刻畫了自然圖像的先驗(yàn)，因此可以完成很多的任務(wù)：比如上色、補(bǔ)全、超分辨率等等，還能進(jìn)行圖像處理。下面放一些效果圖。

圖像上色

使用ResNet50上的分類精度作為定量評(píng)估結(jié)果，下列方法的精度分別為 51.5%， 56.2%， 56.0%， 62.8%。

圖像補(bǔ)全

超分辨率

靈活性

隨機(jī)擾動(dòng)

總結(jié)

GAN作為圖像領(lǐng)域最強(qiáng)大的生成式模型之一，學(xué)習(xí)到了豐富的自然圖像流形，可以對(duì)自然圖像的恢復(fù)和編輯帶來巨大幫助。

利用好大規(guī)模預(yù)訓(xùn)練模型的能力是深度學(xué)習(xí)目前各個(gè)領(lǐng)域的流行前沿，可以減少對(duì)訓(xùn)練數(shù)據(jù)的需求，整合相近的研究領(lǐng)域。

未來更強(qiáng)大的生成式模型，將帶來更具實(shí)際應(yīng)用價(jià)值的圖像恢復(fù)和編輯應(yīng)用，有望在更廣泛的領(lǐng)域落地

原文標(biāo)題：深度學(xué)習(xí)論文精讀［GAN］：利用深度生成先驗(yàn)進(jìn)行多用途圖像修復(fù)與處理

文章出處：【微信公眾號(hào)：深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯：彭靜

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

GaN

GaN

+關(guān)注

關(guān)注
19

文章
1952

瀏覽量
73881
生成器

生成器

+關(guān)注

關(guān)注
7

文章
319

瀏覽量
21073
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5511

瀏覽量
121382

原文標(biāo)題：深度學(xué)習(xí)論文精讀[GAN]：利用深度生成先驗(yàn)進(jìn)行多用途圖像修復(fù)與處理

文章出處：【微信號(hào)：zenRRan，微信公眾號(hào)：深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

基于相變材料的可重構(gòu)超構(gòu)表面用于圖像處理

光學(xué)超構(gòu)表面（metasurface）實(shí)現(xiàn)了在亞波長(zhǎng)尺度內(nèi)的模擬計(jì)算和圖像處理，并具備更低的功耗、更快的速度。雖然人們已經(jīng)展示了各種圖像處理超構(gòu)表面，但大多數(shù)考慮的器件都是靜態(tài)的，缺乏可重構(gòu)性。然而

發(fā)表于 11-13 10:24 ?393次閱讀

基于相變材料的可<b class='flag-5'>重構(gòu)</b>超構(gòu)表面用于<b class='flag-5'>圖像</b>處理

GaN有體二極管嗎?了解GaN的第三象限運(yùn)行

電子發(fā)燒友網(wǎng)站提供《GaN有體二極管嗎?了解GaN的第三象限運(yùn)行.pdf》資料免費(fèi)下載

發(fā)表于 09-19 12:55 ?6次下載

<b class='flag-5'>GaN</b>有體二極管嗎?了解<b class='flag-5'>GaN</b>的第三象限運(yùn)行

GaN應(yīng)用介紹

電子發(fā)燒友網(wǎng)站提供《GaN應(yīng)用介紹.pdf》資料免費(fèi)下載

發(fā)表于 09-12 09:55 ?0次下載

GaN晶體管的應(yīng)用場(chǎng)景有哪些

GaN（氮化鎵）晶體管，特別是GaN HEMT（高電子遷移率晶體管），近年來在多個(gè)領(lǐng)域展現(xiàn)出廣泛的應(yīng)用場(chǎng)景。其出色的高頻性能、高功率密度、高溫穩(wěn)定性以及低導(dǎo)通電阻等特性，使得GaN晶體管成為電力電子和高頻通信等領(lǐng)域的優(yōu)選器件。以

發(fā)表于 08-15 11:27 ?1022次閱讀

「重構(gòu)：改善既有代碼的設(shè)計(jì)」實(shí)戰(zhàn)篇

背景在軟件開發(fā)的世界里，代碼重構(gòu)是提升項(xiàng)目質(zhì)量、適應(yīng)業(yè)務(wù)變化的關(guān)鍵步驟。最近，我重新翻閱了《重構(gòu)：改善既有代碼的設(shè)計(jì) 第二版》，這本書不僅重新點(diǎn)燃了我對(duì)重構(gòu)的熱情，還深化了我的理解：重構(gòu)

發(fā)表于 08-14 10:42 ?302次閱讀

圖像檢測(cè)和圖像識(shí)別的原理、方法及應(yīng)用場(chǎng)景

的目標(biāo)物體的過程。它的目標(biāo)是確定圖像中是否存在特定的物體，并在圖像中找到這些物體的位置，通常以矩形框的形式表示。 1.2 圖像識(shí)別圖像識(shí)別

發(fā)表于 07-16 11:19 ?4756次閱讀

圖像識(shí)別技術(shù)的原理是什么

值化、濾波、邊緣檢測(cè)等操作。這些操作可以提高圖像的質(zhì)量，減少噪聲，突出圖像的特征，為后續(xù)的特征提取和分類器設(shè)計(jì)提供基礎(chǔ)。 1.1 去噪去噪是去除圖像中的噪聲，提高圖像質(zhì)量的

發(fā)表于 07-16 10:46 ?1273次閱讀

GaN MOSFET 器件結(jié)構(gòu)及原理

GaN MOSFET（氮化鎵金屬氧化物半導(dǎo)體場(chǎng)效應(yīng)晶體管）是一種新型的功率器件，具有高功率密度、高效率和快速開關(guān)速度等優(yōu)點(diǎn)。與傳統(tǒng)的硅基MOSFET相比，GaN MOSFET具有更高的電子遷移率

發(fā)表于 07-14 11:39 ?1480次閱讀

CGD為電機(jī)控制帶來GaN優(yōu)勢(shì)

評(píng)估套件具有 Qorvo 的高性能無(wú)刷直流 / 永磁同步電機(jī)控制器 / 驅(qū)動(dòng)器和 CGD 易于使用的 ICeGaN GaN 功率 IC 的性能 ? 英國(guó)劍橋 - Cambridge GaN

發(fā)表于 06-07 17:22 ?1773次閱讀

STDRIVEG600驅(qū)動(dòng)GAN逆變器,在某一拍出現(xiàn)控制信號(hào)丟失，導(dǎo)致電機(jī)電流跌落的原因？

STDRIVEG600驅(qū)動(dòng)GAN逆變器時(shí)候，在某一拍出現(xiàn)控制信號(hào)丟失，導(dǎo)致電機(jī)電流出現(xiàn)跌落情況上圖紫色的是電機(jī)電流，青色的是上管的PWM給定信號(hào)，黃色的是經(jīng)過了GAN開關(guān)管驅(qū)動(dòng)

發(fā)表于 03-13 06:14

功率GaN的多種技術(shù)路線簡(jiǎn)析

電子發(fā)燒友網(wǎng)報(bào)道（文/梁浩斌）功率GaN的大規(guī)模應(yīng)用，其實(shí)也只有六七年的歷史，從2018手機(jī)快速充電器上才正式吹響了普及的號(hào)角。目前，從晶體管來看，功率GaN主要的產(chǎn)品是HEMT（高電子遷移率晶體管

發(fā)表于 02-28 00:13 ?2957次閱讀

圖像編碼常見的編碼方式和處理過程

圖像編碼是將圖像數(shù)據(jù)轉(zhuǎn)換為數(shù)字形式的過程，通常通過壓縮圖像數(shù)據(jù)以便于存儲(chǔ)和傳輸。圖像編碼的主要目標(biāo)是在盡可能減少數(shù)據(jù)量的同時(shí)，保持

發(fā)表于 02-26 14:32 ?1.2w次閱讀

功率GaN，炙手可熱的并購(gòu)賽道？

? 電子發(fā)燒友網(wǎng)報(bào)道（文/梁浩斌）繼去年英飛凌收購(gòu)GaN Systems之后，2024年1月，另一家汽車芯片大廠瑞薩也收購(gòu)了功率GaN公司Transphorm。 ? Transphorm在2022年

發(fā)表于 02-26 06:30 ?2497次閱讀

關(guān)于數(shù)字圖像處理的常用技巧

圖像生成采集處理過程中都會(huì)不同程度的引入各種噪聲，因此會(huì)導(dǎo)致圖像的質(zhì)量變差。從而影響對(duì)圖像的識(shí)別。所以必須要對(duì)圖像進(jìn)行濾波，所以必須對(duì)

發(fā)表于 02-19 09:27 ?983次閱讀

相機(jī)圖像處理過程詳解

指的是專門用來處理感光件信號(hào)并生成最終圖像的硬件，通常會(huì)作為一個(gè)模塊集成到片上系統(tǒng)。

發(fā)表于 01-22 11:21 ?2031次閱讀