0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種基于GAN的圖到圖轉(zhuǎn)換方法,可以檢測出圖片中的敏感區(qū)域

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-07-25 09:20 ? 次閱讀

編者按:如今,社交網(wǎng)絡將全球各地的人們緊密聯(lián)系在了一起,雖然這確實帶來了極大的便利,但它也成了不良信息的發(fā)育土壤,比如散布黃圖。月前,F(xiàn)acebook曾向用戶征集裸照,用于訓練模型以屏蔽和用戶相關(guān)的不雅照片,此舉引發(fā)巨大社會反響。而近期,巴西名校里約熱內(nèi)盧天主教大學的幾位研究人員開發(fā)了一個自動給裸露人體穿上比基尼的模型:把別人脫下的衣服,一件件穿了回去。

現(xiàn)在,借助互聯(lián)網(wǎng)的可訪問性和信息的廣泛傳播性,人們獲取各種內(nèi)容的簡易程度堪稱前所未有。雖然這帶來了不少好處,但也暴露了一個事實——部分用戶的隱私信息正在被大肆傳播,比如個人不雅照。

當然,我們不排除社交網(wǎng)絡上存在愿意暴露自己身體的網(wǎng)友,但在缺乏管制和約束的環(huán)境下,一些未經(jīng)本人同意,甚至本人都不知道的圖像也會出現(xiàn)在網(wǎng)絡中,給當事人造成惡劣影響。雖然各國成人信息監(jiān)管由來已久,但這些審查工作至今都還是簡單的二元分類:“忽略”,還是“不忽略”?在這種情況下,受害者的權(quán)益沒法得到保障。

更有甚者,據(jù)澳大利亞伯內(nèi)特的一項統(tǒng)計顯示,92.2%的受訪男孩和62.1%的受訪女孩在18歲以前就已經(jīng)在網(wǎng)上接觸過色情內(nèi)容,首次接觸的中位年齡只有14歲。這些流傳于社交網(wǎng)絡的不良信息正在荼毒我們的下一代,而審查機制不合理(全年齡環(huán)境下)是一個主因。

在這篇論文中,研究人員介紹了一種新的成人信息審查方法:用自動過濾敏感內(nèi)容取代檢測、排除已識別內(nèi)容。他們開發(fā)了一種基于GAN的圖到圖轉(zhuǎn)換方法,可以檢測出圖片中的敏感區(qū)域,在覆蓋它們的同時保留其語義。

簡單來講,就是用穿衣服取代打馬賽克,模型不用學會識別什么是胸部,什么是臀部,它只需要學會判斷哪里是敏感部位,只要這些部位是裸的,它就可以生成符合形狀的布料。

具體方法

因為目標是把裸女轉(zhuǎn)成穿著比基尼女郎,首先,研究人員從網(wǎng)上抓取了兩類圖像:***女性(X)和穿著比基尼的女性(Y)。他們對圖像進行了過濾,一張臉只保留一張圖,這是訓練模型所使用的數(shù)據(jù)集(數(shù)據(jù)集會公開,但由于雙盲評審,鏈接被隱去)。

在摘要中,他們稱即便數(shù)據(jù)集很小,模型的效果也很理想。所以把數(shù)據(jù)集進一步分為訓練集(90%)和測試集(10%)后,對于圖像X,他們有1044張訓練圖像和117張測試圖像;對于圖像Y,他們有921張訓練圖像和103張測試圖像。

圖像到圖像轉(zhuǎn)換是一類經(jīng)典計算機視覺問題,按照一般方法,研究人員需要對齊訓練集圖像,讓模型學習輸入圖像和輸出圖像之間的映射。但在這個問題下找到成對圖像基本是不可能的,他們沒有那個條件去找一千多個模特專門拍攝。如上圖所示,最終他們受Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks這篇論文啟發(fā),用對抗訓練學習域之間的真實映射。

具體而言,這個框架由兩個映射生成器(G:X→Y、F:Y→X)和兩個判別器(DX、DY)組成:

生成器G:把真實裸女圖像{x}轉(zhuǎn)成比基尼女郎偽圖{y?};

生成器F:把真實比基尼女郎圖像{y}轉(zhuǎn)成裸女偽圖{x?};

判別器DX:區(qū)分裸女真圖{x}和裸女偽圖{F (y)} = {x?};

判別器DY:區(qū)分比基尼女郎真圖{y}和比基尼女郎偽圖{y?}。

訓練完成后,生成器就能生成能騙過判別器的圖像,也就是為裸女“穿”上衣服。模型使用的是LSGANs的損失函數(shù),因為它比原始GAN的函數(shù)更穩(wěn)健,具體細節(jié)論文中有明確寫明,此處不再介紹。

實驗結(jié)果

研究人員在實驗中測試了不同架構(gòu)生成器的效果,用的模型分別是ResNet和U-Net,他們也測試了不同深度對判別器的影響。下圖是模型在原數(shù)據(jù)集上的效果:第一行是裸女原圖,第二行是ResNet生成器的結(jié)果,第三行是U-Net生成器結(jié)果。

可以發(fā)現(xiàn),雖然使用U-Net生成器的模型(第三行)為敏感部位打上了“馬賽克”,但它們整體上失真嚴重,不能被視為“比基尼”。而使用ResNet生成器的模型效果更好,比基尼更美觀,覆蓋范圍也更準確,圖像質(zhì)量更高。

在訓練過程中,研究人員發(fā)現(xiàn)模型有時會試圖在圖像主體(人)和圖像背景間建立聯(lián)系,這顯然是誤入歧途。因此他們用Mask R-CNN截取任務輪廓,制作了一個空白背景數(shù)據(jù)集重新訓練模型。從理論上來講,通過使用“無背景”圖像,神經(jīng)網(wǎng)絡可以更專注于當前任務,而不受嘈雜的背景影響。

如上圖所示,無背景下,兩個模型的結(jié)果比之前好了一點,但相比U-Net生成器,ResNet生成器還是顯示出了明顯的優(yōu)勢。此外,他們還對模型的穩(wěn)健性進行了測試:輸入一張比基尼女郎圖后,生成器F輸出了和原圖非常相近的圖像,并沒有做太多更改——這意味著模型在沒有胸部、臀部語義認知的情況下,真正學會了識別敏感區(qū)域。

小結(jié)

看罷全文,相信有讀者會提出質(zhì)疑:近幾年學界發(fā)表了不少去馬賽克的成果,這種技術(shù)和打馬賽克又有多大區(qū)別?

總的來說,區(qū)別還是很明顯的,至少比基尼女郎比馬賽克更美觀,從某種程度上來說也更少兒皆宜。再者說,不用考慮超分辨率去馬賽克,整個模型是一體的,既然生成器G可以生成逼真比基尼女郎圖像,同理,生成器F也能把比基尼給“脫”了,這在論文中有圖文介紹,所以想還原不是沒有辦法。

但需要注意的是,這種技術(shù)的本意是改進現(xiàn)有成人信息審查機制,讓更多不該看到這類信息的人沒有機會接觸不良信息,尤其是青少年和兒童。這也保護了不雅照泄露者的權(quán)益,避免網(wǎng)絡傳播給他們造成二次傷害。從根本上說,它無法真正制止犯罪和侵權(quán),但它能反映一種進步。

如果要說缺點,除了圖像質(zhì)量不高,論文作者給的圖像測試也不具典型性,因為侵權(quán)圖像涉及大量偷拍內(nèi)容,而論文中的裸女照片都像模特擺拍,因此數(shù)據(jù)集還有待擴充。此外,數(shù)據(jù)集中也應該增加男性內(nèi)容。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1085

    瀏覽量

    40490
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1943

    瀏覽量

    73585
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1208

    瀏覽量

    24725

原文標題:用GAN過濾圖像敏感區(qū)域:為裸女“穿”上比基尼

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    GaN可靠性的測試

    客戶將把GaN用于電源轉(zhuǎn)換,因此,硬開關(guān)轉(zhuǎn)換個與應用相關(guān)的基本事件。較之預燒板合格標準,這產(chǎn)生了迥然不同的應力,如白皮書中3、
    發(fā)表于 09-10 14:48

    基于Qualcomm FastCv的邊緣檢測算法詳解

    目標、背景和區(qū)域之間,所以,它是圖像分割所依賴的最重要的依據(jù)。由于邊緣是位置的標志,對灰度的變化不敏感,,因此,邊緣也是圖像匹配的重要的特征。邊緣檢測區(qū)域劃分是圖像分割的兩
    發(fā)表于 09-21 11:45

    請問LABVIEW是否可以繪制如附件圖片中所示的矢量強度

    請問LABVIEW是否可以繪制如附件圖片中所示的矢量強度,用顏色代表不同像素點矢量的大小,圖上的箭頭顯示像素點上矢量的方向?
    發(fā)表于 12-16 00:19

    一種先分割后分類的兩階段同步端端缺陷檢測方法

    作者:SFXiang首發(fā):AI算法修煉營本文是一種端的先分割后分類的表面缺陷檢測方法。主要的創(chuàng)新點在于如何將兩類任務更好地進行同步學習,本文首先平衡分割損失和分類損失,然后對負樣本
    發(fā)表于 07-24 11:01

    GaN HEMT可靠性測試:為什么業(yè)界無法就一種測試標準達成共識

    GaN功率轉(zhuǎn)換器件的文件,但它僅建立了測試這些器件的開關(guān)可靠性的方法。 硅MOSFET與氮化鎵HEMT的開關(guān)特性。圖片由富士通提供克萊斯勒,福特和通用汽車在1990年代成立了汽車電子協(xié)
    發(fā)表于 09-23 10:46

    一種基于Haar小波變換的彩色圖像人臉檢測方法

    本文提出了一種基于 Haar 小波變換的彩色圖像人臉檢測方法。首先進行彩色空間的變換,檢測出圖像中的膚色區(qū)域;利用Adaboost 算法訓練
    發(fā)表于 08-29 09:37 ?16次下載

    bmp圖片轉(zhuǎn)換為PCB的軟件

    bmp圖片轉(zhuǎn)換為PCB的軟件 BMP是一種與硬件設備無關(guān)的圖像文件格式,使用非常廣。它采用位映射存儲格式,除了圖像深度可選以外,不采用其他任何壓縮,因此
    發(fā)表于 03-29 13:51 ?146次下載

    敏感檢測電路

    敏感檢測電路
    發(fā)表于 07-09 11:54 ?697次閱讀
    <b class='flag-5'>敏感</b>頭<b class='flag-5'>檢測</b>電路<b class='flag-5'>圖</b>

    一種基于圖像處理的雙目視覺校準方法

    雙目視覺是利用機器視覺進行障礙物檢測的研究熱點。針對雙目視頻不同步,導致立體匹配不精準的問題,提出了一種基于圖像處理的雙目校準算法。算法首先根據(jù)道路的先驗特征模型,建立視覺校準的敏感區(qū)域,以減小
    發(fā)表于 12-18 16:26 ?34次下載

    一種改進的線段分割檢測算法

    針對監(jiān)控視頻中的電線桿遮擋問題,提出一種改進的線段分割檢測(LSD)算法。將RGB圖像進行雙邊濾波,并將濾波后的圖像轉(zhuǎn)換到HSV空間,在HSV彩色空間內(nèi)利用矢量求導方法計算彩色圖像的梯
    發(fā)表于 01-25 15:11 ?1次下載
    <b class='flag-5'>一種</b>改進的線段分割<b class='flag-5'>檢測</b>算法

    一種新的圖像局部模糊區(qū)域檢測方法

    針對當前相關(guān)圖像模糊測量方法不能有效檢測紋理平坦清晰區(qū)域的問題,提出一種新的圖像局部模糊區(qū)域檢測
    發(fā)表于 02-05 14:00 ?2次下載

    未來蘋果AirPods或?qū)崿F(xiàn)檢測手勢

    蘋果正在研究如何讓AirPods對手勢做出反應,擁有更多的觸摸敏感區(qū)域,甚至配備物理按鍵或滾輪。
    發(fā)表于 11-03 10:12 ?435次閱讀

    基于特征融合的小尺寸人臉檢測方法

    人臉檢測是指從輸入圖片或視頻中找到人臉的精確位置并確定其大小。為了應對尺度多樣性特別是小尺寸人臉給人臉檢測任務帶來的困難,文中提岀一種新的基于特征
    發(fā)表于 05-29 14:17 ?10次下載

    航空電子設計之“單粒子翻轉(zhuǎn)”問題

    單粒子效應是一種瞬態(tài)效應,指某個特定的高能粒子穿過電路敏感區(qū)域所引起的電路故障,這個故障可能是可恢復的或是永久性的。
    發(fā)表于 07-13 11:23 ?4618次閱讀

    視覺檢測可以食品中檢測出毛發(fā)嗎

    。那么,視覺檢測可以在食品中檢測出毛發(fā)嗎? 先說結(jié)論,視覺檢測可以在食品中檢測出毛發(fā)的。 視覺
    的頭像 發(fā)表于 09-02 13:54 ?266次閱讀