0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

開源鑒黃AI新鮮出爐:代碼+預訓練模型,附手把手入門教學

jmiy_worldofai ? 來源:YXQ ? 2019-04-16 16:40 ? 次閱讀

要入門機器學習,一個自己感興趣又有豐富數(shù)據(jù)的領域再好不過了。

今天我們就來學習用Keras構建模型,識別NSFW圖片,俗稱造個鑒黃AI。

資源來自一名印度小哥Praneeth Bedapudi,涉及圖像分類和目標檢測兩個科目。他在GitHub上最新發(fā)布了NudeNet項目,包含代碼和兩個預訓練模型:負責識別露不露的圖像分類模型和負責找出關鍵部位(以便打碼)的目標檢測模型。

圖像分類模型很簡單,能區(qū)分兩個類別:nude和safe,也就是露和不露,堪比經典的hotdog/not hotdog。

目標檢測模型則能檢測6個類別:不分性別的腹部、臀部,和區(qū)分了性別的不可描述部位。

資源鏈接全在文末,我們先來學習一番。

圖像分類從數(shù)據(jù)集開始

構建一個圖像二分類模型,需要數(shù)據(jù)集當然也要包含兩類圖像。所以,第一項任務就是分別搜集露的圖片(nude)和不露的圖片(safe)。

不安全的nude圖片來自三處:

一是用RipMe從website scrolller下載,這些圖片來自Reddit論壇的各種NSFW板塊;

圖片來源:https://scrolller.com/nsfw(打開請慎重)

下載工具:https://github.com/RipMeApp/ripme

二是P站的縮略圖。引入這些縮略圖是為了平衡圖片質量——上邊的的Reddit圖片質量太高了,而一個鑒黃AI,在現(xiàn)實中遇到的圖片大多是渣品質,這就需要分辨率很低的縮略圖來平衡。

三是之前廣為流傳的同類數(shù)據(jù)集,來自alexkimxyz。

原數(shù)據(jù)集的5個類別,被映射到現(xiàn)在的兩類之中。hentai和porn屬于nude,而drawings、neutral和sexy屬于safe。

搜集好數(shù)據(jù)之后,進行標準化和去重:

#Resizingandremovingduplicatesmogrify-geometryx320*fdupes-rdN./

最終得到的不安全圖片1,78,601張P站圖片、1,21,644張Reddit圖片和1,30,266張前輩數(shù)據(jù)集圖片。

安全的圖片則有三個來源,一是alexkimxyz數(shù)據(jù)集中的普通圖片;二是Facebook資料;三是Reddit論壇上那些老少皆宜的板塊。

為什么已經有了現(xiàn)成的數(shù)據(jù)集,還需要去后兩個來源抓取呢?

因為小哥發(fā)現(xiàn),前輩收集的安全圖片,有很多根本就不包含人。用這樣的數(shù)據(jù)訓練,模型很可能學到錯誤的特征,沒學會判斷“露不露”,直接變成了一個“有沒有人”分類器。

最終得到的安全圖片中,有68,948張來自Facebook資料、98,359張來自前輩數(shù)據(jù)集、55,137張來自Reddit。

數(shù)據(jù)收集完畢,接下來要進行數(shù)據(jù)增強。這里用的是Augmentor和Keras自帶的fit_generator。

Augmentor地址:https://github.com/mdbloice/Augmentor

使用的代碼如下:

#Randomrotation,flips,zoom,distortion,contrast,skewandbrightnesspipeline.rotate(probability=0.2,max_left_rotation=20,max_right_rotation=20)pipeline.flip_left_right(probability=0.4)pipeline.flip_top_bottom(probability=0.8)pipeline.zoom(probability=0.2,min_factor=1.1,max_factor=1.5)pipeline.random_distortion(probability=0.2,grid_width=4,grid_height=4,magnitude=8)pipeline.random_brightness(probability=0.2,min_factor=0.5,max_factor=3)pipeline.random_color(probability=0.2,min_factor=0.5,max_factor=3)pipeline.random_contrast(probability=0.2,min_factor=0.5,max_factor=3)pipeline.skew(probability=0.2,magnitude=0.4)

訓練與評估

小哥為這個任務選擇了谷歌出品的Xception模型,直接從Keras使用,輸入256x256尺寸的圖片,批次大小設為32。

而訓練的設備,是從vast.ai租來的云服務器,帶一塊GTX 1080Ti顯卡。

Keras提供的圖像分類模型有個問題:不帶正則化。所以,還要用下面的代碼,為每一層加上正則化(dropout或L2)。

#Forl2forlayerinmodel.layers:layer.W_regularizer=l2(..)#OrfordropoutadddropoutbetweenthefullyconnectedlayersandredefinethemodelusingfunctionalAPI.

使用SGD with momentum訓練,模型可以在alexkimxyz數(shù)據(jù)集上收斂到0.9347的準確率。

訓練完成后,他選擇了Towards Data Science之前構建的一個測試集來測試模型性能。

測試集:https://drive.google.com/drive/folders/18SY4oyZgTD_dh8-dc0wmsl1GvMsA7woY

測試成績如下:

目標檢測還是從數(shù)據(jù)集開始

訓練目標檢測模型需要的數(shù)據(jù)集,和圖片分類可不一樣。分類只需要圖片和類別,而目標檢測需要的,是用邊界框標注了某樣東西位置的圖片。

因此,上邊講過的數(shù)據(jù)集不能用了,新科目的數(shù)據(jù)集來自Jae Jin的團隊,包含5789張圖片,各種標注的分布如下:

其實也就是模型能檢測出的六類目標。

數(shù)據(jù)集沒有公開,作者在這里:https://github.com/Kadantte

有了數(shù)據(jù),還是要做一些圖像增強工作,隨機加入一些模糊、翻轉。使用的工具是albumentations:

https://github.com/albu/albumentations

訓練與評估

這里的檢測模型,選擇的是FAIR推出的RetinaNet,它使用焦點損失(交叉熵損失的一種變體)來增強一階目標檢測的性能。

檢測模型的基干使用了ResNet-101,在測試集上的成績如下:

除了用來指出某個部位究竟出現(xiàn)在了圖中什么位置之外,這個模型其實還可以當成分類器來用:

如果在圖中檢測到了BUTTOCKS_EXPOSED、*_GENETALIA_EXPOSED、F_BREAST_EXPOSED這四類,就可以判定圖片NSFW,如果沒有,這張圖就是安全的。

所以,也可以用分類器的測試集來檢測這個模型的性能。

得到的成績,比純粹的分類器好不少:

當然,目標檢測更適合實現(xiàn)的功能,是打碼。比如說見到一張NSFW圖片,它就可以根據(jù)檢測到的關鍵部位,自動遮擋:

預訓練模型怎么用?

如果你想先用預訓練模型看看效果,可以按照下面的安裝指南來:

安裝:

pipinstallnudenetorpipinstallgit+https://github.com/bedapudi6788/NudeNet

使用分類器:

fromnudenetimportNudeClassifier

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31316

    瀏覽量

    269660
  • 開源
    +關注

    關注

    3

    文章

    3383

    瀏覽量

    42607

原文標題:開源鑒黃AI新鮮出爐:代碼+預訓練模型,還附手把手入門教

文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    手把手教你學單片機之AVR入門視頻教程

    `手把手教你學單片機之AVR入門視頻教程AVR單片機軟硬件設計視頻教程-入門篇本視頻是 力天電子 尹延輝 錄制的 詳情請登 力天電子第01講-單片機及其開發(fā)工具簡介_手把手教你學單片機
    發(fā)表于 03-02 11:04

    力天手把手教你學ARM入門代碼

    力天手把手教你學ARM入門代碼
    發(fā)表于 08-12 20:26

    【原創(chuàng)】小草手把手教你LabVIEW視頻系列匯總帖(12.22更新)

    為了讓大家更好的查找小草手把手教你LabVIEW視頻教學系列,小編特為大家匯總如下:【視頻教學】小草手把手LabVIEW編程—LED滾動屏【視頻教學
    發(fā)表于 12-08 10:10

    手把手教你設計人工智能芯片及系統(tǒng)--(全階設計教程+AI芯片F(xiàn)PGA實現(xiàn)+開發(fā)板)

    核心RTL代碼、工具鏈代碼、測試代碼等;手把手教學手把手
    發(fā)表于 07-19 11:54

    手把手教你SIMULINK代碼生成

    FrancisZhao:專欄文章列表以及一些說明?zhuanlan.zhihu.comFrancisZhao:手把手教你代碼生成(下):SIMULINK代碼生成?zhuanlan.zhihu.com
    發(fā)表于 08-18 06:03

    手把手教你安裝Quartus II

    本章手把手把地教你如何安裝 Quartus II 軟件 ,并將它激活 。此外 還有USB -Blaster下載器的驅動安裝步驟 。
    發(fā)表于 09-18 14:55 ?9次下載

    DSP開發(fā)軟件及工具介紹--力天手把手教你學DSP之入門

    DSP開發(fā)軟件及工具介紹--力天手把手教你學DSP之入門
    發(fā)表于 10-20 14:50 ?18次下載
    DSP開發(fā)軟件及工具介紹--力天<b class='flag-5'>手把手</b>教你學DSP之<b class='flag-5'>入門</b>篇

    手把手教學Ansoft-Maxwell-工程仿真實例

    手把手教學Ansoft-Maxwell-工程仿真實例
    發(fā)表于 01-18 16:06 ?33次下載

    手把手教你如何開始DSP編程

    手把手教你如何開始DSP編程。
    發(fā)表于 04-09 11:54 ?12次下載
    <b class='flag-5'>手把手</b>教你如何開始DSP編程

    手把手教你學LabVIEW視覺設計

    手把手教你學LabVIEW視覺設計手把手教你學LabVIEW視覺設計手把手教你學LabVIEW視覺設計手把手教你學LabVIEW視覺設計手把手
    發(fā)表于 03-06 01:41 ?3162次閱讀

    手把手教你開關電源PCB排板

    手把手教你開關電源PCB排板(新型電源技術)-分享一下開關電源PCB排板的基本要點及分析,以及例子講解。絕對的手把手
    發(fā)表于 09-18 12:27 ?58次下載
    <b class='flag-5'>手把手</b>教你開關電源PCB排板

    51單片機手把手教學(二)—— 點亮 LED 燈(GPIO 操作)

    本文章 來自原創(chuàng)專欄《51單片機手把手教學》,講解如何使用 Keil uVision 構建 51單片機 程序,發(fā)布文章并 會持續(xù)為已發(fā)布文章添加新內容! 每篇文章都經過了精打細磨!↓↓↓通過下方
    發(fā)表于 11-17 16:06 ?8次下載
    51單片機<b class='flag-5'>手把手</b><b class='flag-5'>教學</b>(二)—— 點亮 LED 燈(GPIO 操作)

    51單片機手把手教學 (一)—— 開發(fā)環(huán)境搭建

    51單片機手把手教學 (一)—— 點亮第一個LED燈文章目錄51單片機手把手教學 (一)—— 點亮第一個LED燈一、寫在前面二、下載開發(fā)工具,燒錄工具一、寫在前面51單片機一般指傳統(tǒng)8
    發(fā)表于 11-23 16:20 ?8次下載
    51單片機<b class='flag-5'>手把手</b><b class='flag-5'>教學</b> (一)—— 開發(fā)環(huán)境搭建

    什么是訓練 AI 模型?

    訓練 AI 模型是為了完成特定任務而在大型數(shù)據(jù)集上訓練的深度學習模型。這些
    的頭像 發(fā)表于 04-04 01:45 ?1500次閱讀

    手把手教你學FPGA仿真

    電子發(fā)燒友網(wǎng)站提供《手把手教你學FPGA仿真.pdf》資料免費下載
    發(fā)表于 10-19 09:17 ?2次下載
    <b class='flag-5'>手把手</b>教你學FPGA仿真