0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

簡(jiǎn)單好上手的圖像分類(lèi)教程!

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-05-31 16:36 ? 次閱讀

今天,Google AI再次放出大招,推出一個(gè)專(zhuān)注于機(jī)器學(xué)習(xí)實(shí)踐的“交互式課程”,第一門(mén)是圖像分類(lèi)機(jī)器學(xué)習(xí)實(shí)踐,已有超過(guò)10000名谷歌員工使用這個(gè)教程構(gòu)建了自己的圖像分類(lèi)器。內(nèi)容簡(jiǎn)明易上手,不妨來(lái)試。

幾個(gè)月前,Google AI教育項(xiàng)目放出大福利,將內(nèi)部機(jī)器學(xué)習(xí)速成課程(MLCC)免費(fèi)開(kāi)放給所有人,以幫助更多開(kāi)發(fā)人員學(xué)習(xí)和使用機(jī)器學(xué)習(xí)。

今天,Google AI再次放出大招,推出一個(gè)專(zhuān)注于機(jī)器學(xué)習(xí)實(shí)踐的“交互式課程”。公開(kāi)的第一門(mén)課程是谷歌AI團(tuán)隊(duì)與圖像模型方面的專(zhuān)家合作開(kāi)發(fā)的圖像分類(lèi)機(jī)器學(xué)習(xí)實(shí)踐。

這個(gè)動(dòng)手實(shí)踐課程包含視頻、文檔和交互式編程練習(xí),分步講解谷歌最先進(jìn)的圖像分類(lèi)模型是如何開(kāi)發(fā)出來(lái)的。這一圖像分類(lèi)模型已經(jīng)在Google相冊(cè)的搜索功能中應(yīng)用。迄今為止,已經(jīng)有超過(guò)10000名谷歌員工使用這個(gè)實(shí)踐指南來(lái)訓(xùn)練自己的圖像分類(lèi)器,識(shí)別照片上的貓和狗。

在這個(gè)交互式課程中,首先,你將了解圖像分類(lèi)是如何工作的,學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的構(gòu)建模塊。然后,你將從頭開(kāi)始構(gòu)建一個(gè)CNN,了解如何防止過(guò)擬合,并利用預(yù)訓(xùn)練的模型進(jìn)行特征提取和微調(diào)。

機(jī)器學(xué)習(xí)實(shí)踐:圖像分類(lèi)

學(xué)習(xí)本課程,你將了解谷歌state-of-the-art的圖像分類(lèi)模型是如何開(kāi)發(fā)出來(lái)的,該模型被用于在Google Photos中進(jìn)行搜索。這是一個(gè)關(guān)于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的速成課程,在學(xué)習(xí)過(guò)程中,你將自己構(gòu)建一個(gè)圖像分類(lèi)器來(lái)區(qū)分貓的照片和狗的照片。

預(yù)計(jì)完成時(shí)間:90~120 分鐘

先修要求

已學(xué)完谷歌機(jī)器學(xué)習(xí)速成課程,或有機(jī)器學(xué)習(xí)基本原理相關(guān)的經(jīng)驗(yàn)。

精通編程基礎(chǔ)知識(shí),并有一些Python編程的經(jīng)驗(yàn)

在2013年5月,谷歌發(fā)布了對(duì)個(gè)人照片進(jìn)行搜索的功能,用戶(hù)能夠根據(jù)照片中的對(duì)象在自己的相冊(cè)中檢索相應(yīng)的照片。

在相冊(cè)中搜索包含暹邏貓的照片

這一功能后來(lái)在2015年被Google Photos中,被廣泛認(rèn)為具有顛覆性的影響。這證明了計(jì)算機(jī)視覺(jué)軟件可以按照人類(lèi)的標(biāo)準(zhǔn)對(duì)圖像進(jìn)行分類(lèi),其價(jià)值包括:

用戶(hù)不再需要用“beach”之類(lèi)的標(biāo)簽手工地對(duì)照片內(nèi)容進(jìn)行分類(lèi),當(dāng)需要管理幾千張圖片時(shí),這一任務(wù)會(huì)變得非常繁瑣。

用戶(hù)可以用新的方式來(lái)探索他們的相冊(cè),使用搜索詞來(lái)定位他們可能從未標(biāo)記過(guò)的對(duì)象的照片。例如,他們可以搜索“棕櫚樹(shù)”,將所有背景中有棕櫚樹(shù)的度假照片放在一起。

軟件可能會(huì)“看到”用戶(hù)自己可能無(wú)法察覺(jué)的分類(lèi)差別(例如,區(qū)分暹羅貓和阿比西尼亞貓),有效地增加了用戶(hù)的專(zhuān)業(yè)知識(shí)。

圖像分類(lèi)是如何工作的

圖像分類(lèi)是一個(gè)有監(jiān)督的學(xué)習(xí)問(wèn)題:定義一組目標(biāo)類(lèi)(即圖像中需要識(shí)別的對(duì)象),并使用已標(biāo)記的示例照片來(lái)訓(xùn)練一個(gè)模型來(lái)識(shí)別目標(biāo)。早期的計(jì)算機(jī)視覺(jué)模型依賴(lài)于原始的像素?cái)?shù)據(jù)作為模型的輸入。

然而,如下圖所示,僅原始的像素?cái)?shù)據(jù)并不能提供足夠穩(wěn)定的表示,以包含圖像中捕獲的無(wú)數(shù)個(gè)對(duì)象的細(xì)微變化。對(duì)象的位置、對(duì)象背后的背景、周?chē)墓饩€(xiàn)、相機(jī)的角度和相機(jī)的焦點(diǎn)在原始像素?cái)?shù)據(jù)中都可能產(chǎn)生波動(dòng);這些差異是非常重要的,它們不能通過(guò)對(duì)像素RGB值的加權(quán)平均來(lái)校正。

左:不同姿勢(shì)、不同背景和光照條件的照片中,貓都可以被識(shí)別出來(lái);右:用平均像素?cái)?shù)據(jù)來(lái)解釋這種變化無(wú)法產(chǎn)生任何有意義的信息

為了更靈活地對(duì)對(duì)象進(jìn)行建模,經(jīng)典的計(jì)算機(jī)視覺(jué)模型添加了來(lái)自像素?cái)?shù)據(jù)的新特性,比如顏色直方圖、紋理和形狀。但這種方法的缺點(diǎn)是使特性工程變成了一種負(fù)擔(dān),因?yàn)樾枰{(diào)整的輸入太多了。比如對(duì)于一個(gè)貓的分類(lèi)器,哪種顏色最重要?形狀的定義靈活度應(yīng)該多大?由于特征需要非常精確地調(diào)整,構(gòu)建一個(gè)穩(wěn)定的模型非常具有挑戰(zhàn)性,而且模型精度也會(huì)受到影響。

卷積神經(jīng)網(wǎng)絡(luò)

構(gòu)建圖像分類(lèi)模型的一個(gè)突破是發(fā)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)(CNN)可以用來(lái)逐步地提取圖像內(nèi)容的更高層的表示。CNN不是預(yù)先處理數(shù)據(jù)以獲得紋理、形狀等特征,而是將圖像的原始像素?cái)?shù)據(jù)作為輸入,并“學(xué)習(xí)”如何提取這些特征,最終推斷它們構(gòu)成的對(duì)象。

o4YBAFsPtHmAaTplAAGo0ECzBWc757.gif

首先,CNN接受到一個(gè)輸入特征圖:一個(gè)三維矩陣,其中前兩個(gè)維度的大小對(duì)應(yīng)于像素圖像的長(zhǎng)度和寬度。第三個(gè)維度的大小為3(對(duì)應(yīng)于彩色圖像的3個(gè)通道:紅、綠和藍(lán))。CNN包含許多個(gè)模塊,每個(gè)模塊執(zhí)行三個(gè)操作。

CNN部分接下來(lái)分別講解卷積、ReLU、Pooling和全連接層。接下來(lái)兩節(jié)是“防止過(guò)擬合”和“利用預(yù)訓(xùn)練的模型”,并提供三個(gè)練習(xí):

練習(xí)1:為貓-狗分類(lèi)(Cat-vs-Dog Classification)建立一個(gè)卷積神經(jīng)網(wǎng)絡(luò)

在這個(gè)練習(xí)中,你將得到動(dòng)手建一個(gè)卷積神經(jīng)網(wǎng)絡(luò)的實(shí)戰(zhàn)經(jīng)驗(yàn),從頭開(kāi)始建立一個(gè)圖像分類(lèi)器來(lái)區(qū)分貓的照片和狗的照片。

練習(xí)2:防止過(guò)擬合

在這個(gè)練習(xí)中,你將進(jìn)一步改進(jìn)練習(xí)1中構(gòu)建的貓狗分類(lèi)CNN模型,運(yùn)用數(shù)據(jù)增強(qiáng)和dropout 正則化。

練習(xí)3:特征提取和微調(diào)

在這個(gè)練習(xí)中,你將對(duì)谷歌的初始 Inception v3 模型進(jìn)行特征提取和fine-tuning,以使你的貓狗分類(lèi)模型達(dá)到更高精度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:10000+谷歌員工學(xué)過(guò)的谷歌內(nèi)部圖像分類(lèi)課程公開(kāi)了!

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于多通道分類(lèi)合成的SAR圖像分類(lèi)研究

    【作者】:李長(zhǎng)春;冒亞明;孫灝;慎利;【來(lái)源】:《計(jì)算機(jī)與現(xiàn)代化》2010年03期【摘要】:SAR具有全天時(shí)、全天候工作能力,且能夠提供高分辨率圖像數(shù)據(jù)。SAR圖像分類(lèi)是SAR圖像處理
    發(fā)表于 04-23 11:52

    區(qū)分圖像分類(lèi)方法是什么

    區(qū)分圖像分類(lèi)方法
    發(fā)表于 05-07 09:37

    Edge Impulse的分類(lèi)模型淺析

    就Edge Impulse的三大模型之一的分類(lèi)模型進(jìn)行淺析。針對(duì)于圖像分類(lèi)識(shí)別模型,讀者可參考OpenMv或樹(shù)莓派等主流圖像識(shí)別單片機(jī)系統(tǒng)的現(xiàn)有歷程,容易
    發(fā)表于 12-20 06:51

    分享一下單片機(jī)和PLC哪個(gè)更好上手

    關(guān)注我,每天學(xué)習(xí)堅(jiān)持學(xué)習(xí)一點(diǎn)點(diǎn),你很快就會(huì)有進(jìn)步哦!今天我們來(lái)分享一下單片機(jī)和PLC哪個(gè)更好上手,小小電工與你一起進(jìn)步我是雄飛電氣小棟,今天很高興認(rèn)識(shí)大家?。。?!其實(shí)在自動(dòng)化領(lǐng)域,很多人都會(huì)玩單片機(jī)
    發(fā)表于 02-16 06:54

    一種新的圖像定位和分類(lèi)系統(tǒng)實(shí)現(xiàn)方案

    首先簡(jiǎn)單介紹了圖像定位和分類(lèi)系統(tǒng)的基本概念。然后分析了幾種圖像定位和分類(lèi)系統(tǒng)的實(shí)現(xiàn)方式與性能。在此基礎(chǔ)上,提出了一種新型
    發(fā)表于 07-30 16:29 ?25次下載

    基于Brushlet和RBF網(wǎng)絡(luò)的SAR圖像分類(lèi)

    針對(duì)SAR圖像紋理特征豐富的特點(diǎn),本文提出一種新的SAR圖像分類(lèi)方法:通過(guò)提取Brushlet變換的能量及相位信息作為SAR圖像的紋理特征,然后輸入徑向基函數(shù)RBF網(wǎng)絡(luò)對(duì)
    發(fā)表于 12-18 16:20 ?20次下載

    圖像分類(lèi)的方法之深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)

    圖像分類(lèi),顧名思義,是一個(gè)輸入圖像,輸出對(duì)該圖像內(nèi)容分類(lèi)的描述的問(wèn)題。它是計(jì)算機(jī)視覺(jué)的核心,實(shí)際應(yīng)用廣泛。
    發(fā)表于 09-28 19:43 ?0次下載

    基于顯著性檢測(cè)的圖像分類(lèi)算法

    針對(duì)傳統(tǒng)的圖像分類(lèi)方法對(duì)整個(gè)圖像不分等級(jí)處理以及缺乏高層認(rèn)知的問(wèn)題,提出了一種基于顯著性檢測(cè)的圖像分類(lèi)方法。首先,利用視覺(jué)注意模型進(jìn)行顯著性
    發(fā)表于 01-04 13:47 ?0次下載

    Google圖像分類(lèi)速成ML實(shí)戰(zhàn)課程

    近日,Google推出了一門(mén)機(jī)器學(xué)習(xí)課程——Machine Learning Practica,主要是針對(duì)那些已經(jīng)有機(jī)器學(xué)習(xí)基礎(chǔ),希望上手實(shí)踐的學(xué)生。此次的課程是圖像分類(lèi),其他的實(shí)戰(zhàn)課程在后期會(huì)陸續(xù)上線(xiàn)。
    的頭像 發(fā)表于 06-01 10:01 ?3655次閱讀

    相機(jī)圖像質(zhì)量的分類(lèi)及應(yīng)用

    的,哪些又不能調(diào)的,所以本文主要是從概念上簡(jiǎn)單介紹下圖像質(zhì)量,包括成像產(chǎn)品的分類(lèi)、不同成像產(chǎn)品圖像質(zhì)量的要求、以及成像系統(tǒng)的介紹,希望對(duì)剛?cè)胄械男』锇槟苡兴鶐椭梢约由钜幌聦?duì)
    的頭像 發(fā)表于 07-06 09:26 ?2316次閱讀

    圖像分類(lèi)任務(wù)的各種tricks

    計(jì)算機(jī)視覺(jué)主要問(wèn)題有圖像分類(lèi)、目標(biāo)檢測(cè)和圖像分割等。針對(duì)圖像分類(lèi)任務(wù),提升準(zhǔn)確率的方法路線(xiàn)有兩條,一個(gè)是模型的修改,另一個(gè)是各種數(shù)據(jù)處理和訓(xùn)
    的頭像 發(fā)表于 09-14 16:42 ?1171次閱讀

    如何區(qū)分圖像分類(lèi)和目標(biāo)檢測(cè)技術(shù)

    目標(biāo)檢測(cè)的問(wèn)題定義是確定目標(biāo)在給定圖像中的位置,如目標(biāo)定位,以及每個(gè)目標(biāo)屬于哪個(gè)類(lèi)別,即目標(biāo)分類(lèi)簡(jiǎn)單地說(shuō),目標(biāo)檢測(cè)是一種圖像分類(lèi)技術(shù),除了
    發(fā)表于 07-11 12:50 ?522次閱讀

    TinyML變得簡(jiǎn)單圖像分類(lèi)

    電子發(fā)燒友網(wǎng)站提供《TinyML變得簡(jiǎn)單圖像分類(lèi).zip》資料免費(fèi)下載
    發(fā)表于 07-13 10:04 ?1次下載
    TinyML變得<b class='flag-5'>簡(jiǎn)單</b>:<b class='flag-5'>圖像</b><b class='flag-5'>分類(lèi)</b>

    CNN圖像分類(lèi)策略

    在深度學(xué)習(xí)出現(xiàn)之前,自然圖像中的對(duì)象識(shí)別過(guò)程相當(dāng)粗暴簡(jiǎn)單:定義一組關(guān)鍵視覺(jué)特征(“單詞”),識(shí)別每個(gè)視覺(jué)特征在圖像中的存在頻率(“包”),然后根據(jù)這些數(shù)字對(duì)圖像進(jìn)行
    發(fā)表于 12-25 11:36 ?296次閱讀
    CNN<b class='flag-5'>圖像</b><b class='flag-5'>分類(lèi)</b>策略

    計(jì)算機(jī)視覺(jué)怎么給圖像分類(lèi)

    圖像分類(lèi)是計(jì)算機(jī)視覺(jué)領(lǐng)域中的一項(xiàng)核心任務(wù),其目標(biāo)是將輸入的圖像自動(dòng)分配到預(yù)定義的類(lèi)別集合中。這一過(guò)程涉及圖像的特征提取、特征表示以及分類(lèi)器的
    的頭像 發(fā)表于 07-08 17:06 ?697次閱讀