0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

生成對抗網絡 vs 圖像水印,去除效果理想

WpOh_rgznai100 ? 來源:YXQ ? 2019-06-26 14:01 ? 次閱讀

當前互聯(lián)網飛速發(fā)展,越來越多的公司、組織和個人都選擇在網上展示和分享圖像。為了保護圖像版權,大家都會選擇在圖像上打上透明或者半透明的水印。隨著水印被廣泛地使用,針對水印的各種處理技術也在不斷發(fā)展,如何有效去除圖像上的水印引發(fā)了越來越多人的研究興趣。

今天的文章中,我們會介紹一種更為強大的水印去除器。這次我們借助生成對抗網絡來實現(xiàn),進一步提升水印去除器的性能,從而達到更為理想的去除效果。

生成對抗網絡的前世今生

生成對抗網絡(Generative Adversarial Networks,GAN),是由Ian Goodfellow等人在2014年首次提出。一般來說,生成對抗網絡由兩部分組成:生成器(Generator)和判別器(Discriminator)。生成器通過接收輸入數(shù)據,學習訓練數(shù)據的分布來生成目標數(shù)據。判別器通常是一個二分類模型,用來判別生成器生成數(shù)據的真假性。

我們可以將生成器和判別器看作互相對抗的雙方,生成器的目的是令生成的數(shù)據盡可能的真實,讓判別器無法區(qū)分真假;而判別器的目的是盡可能地識別出生成器生成的數(shù)據。在生成對抗網絡的訓練過程中,上面的對抗場景會持續(xù)進行,生成器和判別器的能力都得到了不斷提升。訓練的過程可以用如下公式表示:

其中G和D分別表示生成器和判別器,x為真實數(shù)據,z是生成器的輸入數(shù)據。最后訓練結束我們就可以使用生成器來生成以假亂真的數(shù)據。一個直觀的生成對抗網絡結構如下圖所示。

生成對抗網絡近些年被大量應用于計算機視覺領域,根據具體應用不同可以分為圖像生成和圖像轉換兩種類型的任務。圖像生成可以看成是一種學后聯(lián)想任務,其中的代表是圖像自動生成模型(DCGAN),網絡結構如下圖所示。這類任務只給出我們希望生成的目標圖像,此時生成器的輸入是服從某一分布的噪聲,通過和判別器的對抗訓練,將其轉換成目標圖像的數(shù)據分布。

圖像轉換可以看成是一種目標引導任務,其中的代表是圖像超分辨率模型(SRGAN),SRGAN的網絡結構如下圖所示。這類任務除了給出我們希望生成的目標圖像外,還會給出轉換前的原始圖像,此時生成器的輸入變?yōu)樵紙D像,生成器在和判別器的對抗訓練過程中還要同時保證生成的圖像和目標圖像盡可能的相近。

生成對抗網絡的發(fā)展非常迅速,近些年出現(xiàn)了各式各樣GAN的變種,例如在訓練上優(yōu)化的WGAN和LSGAN,通過對輸入添加條件限制來引導學習過程的Conditional GAN,圖像生成任務中的BigGAN和StyleGAN,圖像轉換任務中的Pixel2Pixel和CycleGAN等等。期待未來生成對抗網絡在計算機視覺領域給我們帶來更多的驚喜。

生成對抗網絡vs圖像水印

上一節(jié)中我們介紹了生成對抗網絡的核心思想和一些應用,現(xiàn)在我們嘗試將生成對抗網絡用于圖像的水印去除。去水印的目的是將帶水印的圖像轉變?yōu)闊o水印的圖像,這本質上也是一種圖像轉換任務。

因此生成器的輸入為帶水印的圖像,輸出為無水印的圖像;而判別器用于識別結果到底是原始真實的無水印圖像,還是經過生成器生成的無水印圖像。通過兩者之間不斷的對抗訓練,生成器生成的無水印圖像變得足夠“以假亂真”,從而達到理想的去水印效果。

在實際的實踐過程中,我們還做了一系列優(yōu)化改進。下面我們分別介紹生成器和判別器的具體結構以及訓練細節(jié)。在生成器的選擇上,我們繼續(xù)使用U-net網絡結構,U-net通過在輸入和輸出之間添加跳躍連接,融合了低層級特征和高層級特征。與直接的編解碼器結構相比,能夠保留更多的圖像背景信息,保證去除水印后的圖像的真實性。

在判別器方面,我們使用了基于區(qū)域判別的全卷積網絡。與傳統(tǒng)的判別器直接輸出整張圖像的真假結果不同,我們通過對圖像區(qū)域級別的判別,可以更好地對圖像上的無水印和有水印部分進行區(qū)分。

此外,我們采用了Conditional GAN的思想,判別器在對原始真實的無水印圖像和生成器生成的無水印圖像進行區(qū)分的時候會加入帶水印圖像的條件信息,從而進一步提升生成器和判別器的學習性能。生成器和判別器的具體結構和細節(jié)如下圖所示。

生成器生成的無水印圖像除了要令判別器分辨不了真假之外,還需要保證和真實的無水印圖像盡可能接近。為此我們組合一范數(shù)損失(L1 Loss)和感知損失(Perceptual Loss)作為內容損失,在生成器和判別器對抗的過程中加入訓練。最終的損失函數(shù)為

其中的條件對抗損失為

最終我們使用生成器作為水印去除器實現(xiàn)圖像上的水印去除。為了對比和單一全卷積網絡實現(xiàn)的水印去除器的效果,我們可視化了一些去水印結果,左列是輸入的水印區(qū)域,中間列是單一全卷積網絡得到的無水印區(qū)域,右列是生成對抗網絡得到的無水印區(qū)域。從可視化的結果可以看出,經過對抗訓練后的生成器對水印的去除效果更優(yōu)。

寫在最后

圖像水印去除問題吸引了越來越多人的研究興趣,本篇文章介紹了如何利用生成對抗網絡來實現(xiàn)水印自動去除。去水印研究的目的是為了驗證水印的魯棒性,更好地提升水印的反去除能力。如何設計一種AI去不掉的水印是一個極具挑戰(zhàn)的問題,接下來我們會在這方面做一些嘗試,希望能夠為版權保護盡一份力。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 水印
    +關注

    關注

    0

    文章

    26

    瀏覽量

    11648
  • GaN
    GaN
    +關注

    關注

    19

    文章

    1944

    瀏覽量

    73623

原文標題:基于GAN的圖像水印去除器,效果堪比PS高手

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    借助谷歌Gemini和Imagen模型生成高質量圖像

    以獲得卓越的視覺效果。這個過程并不止于此;一旦圖像生成,Imagen 2 可以進一步優(yōu)化以滿足特定需求,從而創(chuàng)建一個強大的工作流程,用于制作頂級視覺內容。
    的頭像 發(fā)表于 01-03 10:38 ?315次閱讀
    借助谷歌Gemini和Imagen模型<b class='flag-5'>生成</b>高質量<b class='flag-5'>圖像</b>

    用TMS2812控制ADS1298進行肌電采集,將相同的程序燒寫到flash中后再進行采集時效果理想,為什么?

    我用TMS2812控制ADS1298進行肌電采集,連接仿真器下采集的肌電信號較好,但如果將相同的程序燒寫到flash中后再進行采集時,效果就不怎么理想,想知道是為什么會,仿真器和燒寫下的采集圖像見附件,請大神幫忙解答,萬分感謝
    發(fā)表于 01-03 07:34

    Freepik攜手Magnific AI推出AI圖像生成

    近日,設計資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這一里程碑式的發(fā)布標志著AI圖像創(chuàng)作領域邁入了一個全新的高度
    的頭像 發(fā)表于 08-30 16:23 ?1146次閱讀

    請問LM311能準確的交截生成對應的PWM波形嗎?

    UC3825, TLV3501輸入正是100k的正弦波 輸入負是100kHz的鋸齒波 二者交截生成PWM波形 請問LM311能準確的交截生成對應的PWM波形嗎 之前使用UC3525里面自帶的比較器做的,LM311能達到這樣的速度嗎
    發(fā)表于 08-06 07:46

    OpenAI承認正研發(fā)ChatGPT文本水印

    的識別效果并不理想。而且因為多重顧慮OpenAI尚未正式發(fā)布這項工具。 據悉,OpenAI的這個識別工具本質上是在文字中創(chuàng)建一個不可見的水印;但是只專注于檢測來自 ChatGPT生成
    的頭像 發(fā)表于 08-05 15:56 ?971次閱讀

    生成對抗網絡(GANs)的原理與應用案例

    生成對抗網絡(Generative Adversarial Networks,GANs)是一種由蒙特利爾大學的Ian Goodfellow等人在2014年提出的深度學習算法。GANs通過構建兩個
    的頭像 發(fā)表于 07-09 11:34 ?1097次閱讀

    人工神經網絡模型的分類有哪些

    詳細介紹人工神經網絡的分類,包括前饋神經網絡、卷積神經網絡、循環(huán)神經網絡、深度神經網絡生成對抗
    的頭像 發(fā)表于 07-05 09:13 ?1259次閱讀

    神經網絡架構有哪些

    識別、語音識別、自然語言處理等多個領域。本文將對幾種主要的神經網絡架構進行詳細介紹,包括前饋神經網絡、循環(huán)神經網絡、卷積神經網絡、生成對抗
    的頭像 發(fā)表于 07-01 14:16 ?730次閱讀

    鴻蒙ArkTS聲明式開發(fā):跨平臺支持列表【圖像效果】 通用屬性

    設置組件的模糊、陰影、球面效果以及設置圖片的圖像效果。
    的頭像 發(fā)表于 06-04 16:34 ?678次閱讀
    鴻蒙ArkTS聲明式開發(fā):跨平臺支持列表【<b class='flag-5'>圖像</b><b class='flag-5'>效果</b>】 通用屬性

    OpenAI發(fā)布圖像檢測分類器,可區(qū)分AI生成圖像與實拍照片

    據OpenAI介紹,初步測試結果表明,該分類器在辨別非AI生成圖像與DALL·E 3生成圖像時,成功率高達近98%,僅有不到0.5%的非AI圖像
    的頭像 發(fā)表于 05-09 09:57 ?474次閱讀

    思科完成對Isovalent的收購

    全球領先的網絡技術公司思科(Cisco)近日宣布,已完成對開源云原生網絡與安全領域的佼佼者Isovalent的收購。
    的頭像 發(fā)表于 05-06 10:41 ?644次閱讀

    深度學習生成對抗網絡(GAN)全解析

    GANs真正的能力來源于它們遵循的對抗訓練模式。生成器的權重是基于判別器的損失所學習到的。因此,生成器被它生成圖像所推動著進行訓練,很難知
    發(fā)表于 03-29 14:42 ?4623次閱讀
    深度學習<b class='flag-5'>生成對抗</b><b class='flag-5'>網絡</b>(GAN)全解析

    KOALA人工智能圖像生成模型問世

    近日,韓國科學團隊宣布研發(fā)出名為 KOALA 的新型人工智能圖像生成模型,該模型在速度和質量上均實現(xiàn)了顯著突破。KOALA 能夠在短短 2 秒內生成高質量圖片,同時大幅降低了對硬件的需求,為
    的頭像 發(fā)表于 03-05 10:46 ?798次閱讀

    鴻蒙開發(fā)圖形圖像——@ohos.effectKit (圖像效果)

    圖像效果提供處理圖像的一些基礎能力,包括對當前圖像的亮度調節(jié)、模糊化、灰度調節(jié)、智能取色等。 該模塊提供以下圖像
    的頭像 發(fā)表于 02-22 16:08 ?421次閱讀
    鴻蒙開發(fā)圖形<b class='flag-5'>圖像</b>——@ohos.effectKit (<b class='flag-5'>圖像</b><b class='flag-5'>效果</b>)

    生成式人工智能和感知式人工智能的區(qū)別

    生成新的內容和信息的人工智能系統(tǒng)。這些系統(tǒng)能夠利用已有的數(shù)據和知識來生成全新的內容,如圖片、音樂、文本等。生成式人工智能通?;谏疃葘W習技術,如生成對抗
    的頭像 發(fā)表于 02-19 16:43 ?1795次閱讀