0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像分類中的一個(gè)常見問題

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-07-11 09:16 ? 次閱讀

編者按:本文作者Pete Warden是Jetpac公司的CTO,主要研究領(lǐng)域是數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)。在本文中,他結(jié)合自己的工作經(jīng)歷,發(fā)現(xiàn)了在圖像分類中的一個(gè)常見問題,即模型的不實(shí)用性。針對該問題他提出了自己的想法。以下是論智對原文的編譯。

幾天前,曾經(jīng)和我合作過的Plant Village團(tuán)隊(duì)在開發(fā)一款移動(dòng)APP時(shí)發(fā)現(xiàn),這款圖像識別器可以檢測植物病害,如下圖所示,性能不錯(cuò)。

但是當(dāng)攝像頭指向電腦鍵盤時(shí),這款A(yù)PP仍然認(rèn)為它是被損壞的糧食。

計(jì)算機(jī)視覺研究者來說,這種結(jié)果并不罕見,但是對大多數(shù)人來說還是有些出乎意料的。所以本文將研究這種情況為什么會(huì)發(fā)生,以及我們應(yīng)該如何應(yīng)對。

人類可以準(zhǔn)確分辨身邊的任何物體,所以我們自然就希望機(jī)器能擁有同樣的能力。但是大多數(shù)模型都只在非常有限的目標(biāo)物體上進(jìn)行了訓(xùn)練,例如原始ImageNet競賽中只涵蓋了1000種物品類別。重要的是,訓(xùn)練過程中假設(shè)模型所看到的每個(gè)樣本都是目標(biāo)物體之一,而預(yù)測結(jié)果必須是已有種類中的一種。模型不能回答:“我不知道”,并且也沒有這樣的訓(xùn)練數(shù)據(jù)讓它學(xué)會(huì)這種回答。事實(shí)上這是符合研究設(shè)置的,但是一旦應(yīng)用到現(xiàn)實(shí)中就會(huì)出現(xiàn)問題。

當(dāng)我在Jetpac工作時(shí),想要說服客戶我們的產(chǎn)品——AlexNet是一項(xiàng)創(chuàng)新型產(chǎn)品都非常困難,因?yàn)槊看挝覀儼袲emo給客戶看的時(shí)候,他們都會(huì)對著自己的臉,模型就會(huì)判斷這是“氧氣罩”或者“安全帶”這種奇怪的東西。這是因?yàn)樵贗mageNet競賽類別中沒有關(guān)于人臉的標(biāo)簽,但是大多數(shù)關(guān)于面罩或安全帶的標(biāo)簽都含有人臉。甚至當(dāng)我們將手機(jī)對著盤子時(shí),APP會(huì)將其認(rèn)成“馬桶圈”,也是非常尷尬了。這是因?yàn)樵谠镜念悇e中沒有“盤子”,與圖片最相近的就是馬桶。

所以我不禁想到了“開放的世界”和“封閉的世界”的問題。模型在訓(xùn)練和評估的時(shí)候通常都是假設(shè)面對的物體屬于有限的類別中,但是當(dāng)它們走出實(shí)驗(yàn)室,這種假設(shè)就不成立了,用戶們會(huì)根據(jù)隨機(jī)物體對它們的性能表現(xiàn)進(jìn)行評價(jià),不管該物體是不是訓(xùn)練集中的。

所以這一問題應(yīng)該如何解決呢?

不幸的是,目前還沒有一種簡單完美的解決方法,但是可以通過其他方案對這一問題稍稍改進(jìn)。最直接的方法就是在訓(xùn)練數(shù)據(jù)中加入“未知”一類,或者直接對具體物體開設(shè)新的分類。具體來說應(yīng)該考慮以下幾個(gè)問題:

類別中應(yīng)該包含怎樣的樣本?現(xiàn)實(shí)世界中有無數(shù)符合含有目標(biāo)物體的圖片,你應(yīng)該如何選擇?

在“未知”類別中還需要設(shè)立多少不同的物體種類?

當(dāng)“未知物品”和已有類別很像時(shí),應(yīng)該怎么做?例如你想在ImageNet的1000個(gè)類別中加入一個(gè)狗狗的種類,但是它看起來和未知種類的狗狗很像。

未知種類中,各類樣本的訓(xùn)練數(shù)據(jù)比例應(yīng)該如何分配?

最后一點(diǎn)確實(shí)是個(gè)更重要的問題,從圖像分類網(wǎng)絡(luò)中得到的預(yù)測值并不是概率,它們假設(shè)看到任意特殊類別物體的概率和訓(xùn)練數(shù)據(jù)中的類別相同。如果你將一種含有企鵝的動(dòng)物分類器用在亞馬遜雨林中,你也會(huì)遇到同樣的問題。即使分類器有美國城市中常見的狗狗種類,稀有品種在ImageNet訓(xùn)練數(shù)據(jù)中出現(xiàn)的次數(shù)也會(huì)比在狗狗公園中出現(xiàn)的頻率高。通常的解決方法是弄清楚你將在檢測過程中遇到的具體先驗(yàn)概率是什么,然后用它們將校準(zhǔn)值應(yīng)用于網(wǎng)絡(luò)輸出,以獲得更接近真實(shí)概率的東西。

解決實(shí)際應(yīng)用中此類問題的主要思想就是限制模型的使用場景,這樣對目標(biāo)物體的預(yù)測假設(shè)就會(huì)匹配訓(xùn)練數(shù)據(jù)。一種直接的方法是進(jìn)行產(chǎn)品設(shè)計(jì),你可以在用戶界面設(shè)計(jì)一個(gè)引導(dǎo)人們將設(shè)備對準(zhǔn)目標(biāo)物體后,再開啟運(yùn)行分類器。

再復(fù)雜一點(diǎn)的話,你可以設(shè)計(jì)一個(gè)單獨(dú)的圖像分類器,試著確定主要圖像分類器沒有關(guān)注的條件。這和創(chuàng)建一個(gè)單獨(dú)的“未知”分類不同,因?yàn)樗淖饔弥饕愃朴谝粋€(gè)在詳細(xì)模型之前的過濾器。在開頭的植物病害問題上,操作環(huán)境非常明顯,可以很輕易地訓(xùn)練模型辨別枝葉和其他照片。這和門控模型能判斷出圖像是否在不支持場景中拍攝非常相似。這個(gè)門控模型會(huì)在完整的圖像分類器之前運(yùn)行,如果它沒有檢測到看起來像植物的東西,就會(huì)做出錯(cuò)誤消息的提示,表明沒有找到植物。

那些讓你拍攝信用卡或者進(jìn)行光學(xué)字符識別的應(yīng)用經(jīng)常會(huì)將屏幕上方向指引和檢測是否有模糊或偏移的模型結(jié)合起來,引導(dǎo)用戶拍攝能成功識別的照片,有時(shí)會(huì)在交互頁面上添加簡單的問題,例如“這里有樹葉嗎”。

也許這篇文章不能提供一個(gè)令人滿意的答案,但是這也反映了,機(jī)器學(xué)習(xí)一旦走出了研究問題的限制,就很容易達(dá)不到用戶所期望的效果。人們對一個(gè)目標(biāo)物體往往存在很多常識性理解和外界知識,而我們在傳統(tǒng)分類任務(wù)中并不能將這些因素考慮在內(nèi)。為了達(dá)到用戶希望看到的效果,我們必須設(shè)計(jì)一款能讓模型全面地了解世界的系統(tǒng),并基于該系統(tǒng)做出正確的決策,而不僅僅是輸出一個(gè)結(jié)果。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 分類器
    +關(guān)注

    關(guān)注

    0

    文章

    152

    瀏覽量

    13217
  • 圖像分類
    +關(guān)注

    關(guān)注

    0

    文章

    93

    瀏覽量

    11945
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8438

    瀏覽量

    132970

原文標(biāo)題:當(dāng)圖像分類器走出實(shí)驗(yàn)室,碰到未知物體怎么辦?

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    90個(gè)電氣技術(shù)常見問題及解答

    90個(gè)電氣技術(shù)常見問題及解答
    的頭像 發(fā)表于 11-26 09:11 ?3.5w次閱讀

    Protel使用常見問題及解答

    Protel使用常見問題及解答
    發(fā)表于 04-14 09:27

    FPGA邏輯設(shè)計(jì)常見問題有哪些

    圖像采集系統(tǒng)的結(jié)構(gòu)及工作原理是什么FPGA邏輯設(shè)計(jì)常見問題有哪些
    發(fā)表于 04-29 06:18

    STM32串口的常見問題有哪些?

    STM32串口的常見問題有哪些?
    發(fā)表于 02-18 08:00

    Protel使用常見問題及解答

    Protel使用常見問題及解答 、如何將個(gè)原理圖中的部分加到另
    發(fā)表于 07-02 12:08 ?765次閱讀

    分析RF電路設(shè)計(jì)常見問題

    分析RF電路設(shè)計(jì)常見問題,感興趣的小伙伴們可以瞧瞧。
    發(fā)表于 09-18 17:15 ?0次下載

    Protel使用常見問題及解答

    Protel使用常見問題及解答,下來看看。
    發(fā)表于 01-16 16:36 ?0次下載

    基于495個(gè)C語言常見問題

    基于495個(gè)C語言常見問題
    發(fā)表于 10-13 10:18 ?2次下載
    基于495<b class='flag-5'>個(gè)</b>C語言<b class='flag-5'>常見問題</b>集

    機(jī)器學(xué)習(xí)應(yīng)用常見問題分類問題你了解多少

    分類問題是機(jī)器學(xué)習(xí)應(yīng)用常見問題,而二分類問題是其中的典型,例如垃圾郵件的識別。本文基于UCI機(jī)器學(xué)習(xí)數(shù)據(jù)庫的銀行營銷數(shù)據(jù)集,從對數(shù)據(jù)集
    的頭像 發(fā)表于 03-29 16:40 ?1.5w次閱讀
    機(jī)器學(xué)習(xí)應(yīng)用<b class='flag-5'>中</b>的<b class='flag-5'>常見問題</b><b class='flag-5'>分類</b>問題你了解多少

    電氣二次常見問題有哪些_40個(gè)電氣二次常見問題盤點(diǎn)

    本文主要介紹的是電氣二次常見問題,首先介紹了電氣二次原理圖,其次盤點(diǎn)了40個(gè)電氣二次常見問題,具體的跟隨小編起來了解下。
    發(fā)表于 05-31 16:51 ?5420次閱讀
    電氣二次<b class='flag-5'>常見問題</b>有哪些_40<b class='flag-5'>個(gè)</b>電氣二次<b class='flag-5'>常見問題</b>盤點(diǎn)

    labview有哪些常見問題?labview三個(gè)常見問題和解決方法概述

    本文檔的主要內(nèi)容詳細(xì)介紹的是labview有哪些常見問題?labview三個(gè)常見問題和解決方法概述三個(gè)常見問題是:1.labview在運(yùn)行后
    發(fā)表于 09-18 18:53 ?0次下載

    隔離信號和電源的4個(gè)常見問題

    隔離信號和電源的4個(gè)常見問題
    發(fā)表于 10-28 12:00 ?1次下載
    隔離信號和電源的4<b class='flag-5'>個(gè)</b><b class='flag-5'>常見問題</b>

    互聯(lián)車輛如何處理數(shù)據(jù):3個(gè)常見問題

    互聯(lián)車輛如何處理數(shù)據(jù):3個(gè)常見問題
    發(fā)表于 10-31 08:23 ?0次下載
    互聯(lián)車輛如何處理數(shù)據(jù):3<b class='flag-5'>個(gè)</b><b class='flag-5'>常見問題</b>

    伺服線束生產(chǎn)加工過程常見問題

    在上期的《伺服線束常見問題總結(jié)干貨》,我們詳細(xì)闡述了關(guān)于規(guī)格選型、工況環(huán)境、現(xiàn)場布線、生產(chǎn)加工和材料等五個(gè)方面的
    的頭像 發(fā)表于 12-05 10:57 ?1669次閱讀

    PCB設(shè)計(jì)常見問題有哪些?

    站式PCBA智造廠家今天為大家講講PCB設(shè)計(jì)常見問題有哪些?PCB設(shè)計(jì)布局時(shí)容易出現(xiàn)的五大常見問題。在電子產(chǎn)品的開發(fā)過程,PCB(P
    的頭像 發(fā)表于 05-23 09:13 ?957次閱讀
    PCB設(shè)計(jì)<b class='flag-5'>中</b>的<b class='flag-5'>常見問題</b>有哪些?