0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一篇看懂圖像分類基礎知識

新機器視覺 ? 來源:新機器視覺 ? 2023-02-10 15:02 ? 次閱讀

?

基礎知識

1.具體領域劃分

(1)多類別圖像分類

(2)細粒度圖像分類

(3)多標簽圖像分類

(4)弱監(jiān)督與無監(jiān)督圖像分類

(5)零樣本圖像分類

2.圖像分類問題的3層境界

fa75dddc-a90f-11ed-bfe3-dac502259ad0.png

多類別圖像分類在不同物種的層次上識別,往往具有較大的類間方差,而類內則具有較小的類內誤差。

fab804f0-a90f-11ed-bfe3-dac502259ad0.png

細粒度圖像分類具有更加相似的外觀和特征,導致數(shù)據(jù)間的類內差異較大,分類難度也更高。

fae5327c-a90f-11ed-bfe3-dac502259ad0.png

實例級分類可以看做是一個識別問題,比如人臉識別。

fb0e6cfa-a90f-11ed-bfe3-dac502259ad0.png

3.傳統(tǒng)圖像分類關鍵問題

(1)數(shù)據(jù)預處理 (2)圖像特征 (3)分類模型

分為兩種: 手工特征+分類器、從數(shù)據(jù)自動學習特征

fb2d4a8a-a90f-11ed-bfe3-dac502259ad0.png

4.常用的圖像分類數(shù)據(jù)集

(1) MNIST數(shù)據(jù)集:

發(fā)布于1998年,60000張圖,10類,分布均勻,數(shù)據(jù)集中的”hello world”

fb421f28-a90f-11ed-bfe3-dac502259ad0.png

在票據(jù)等圖像中裁剪出數(shù)字,將其放在20 * 20像素的框中,并保持了長寬比率,然后放在28* 28的背景中。

(2) CIFAR10

MNIST的彩色增強版,60000張圖片,大小32 * 32,10類,均勻分布,都是真實圖片而不是手稿等,圖中只有一個主體目標,可以有部分遮擋,但是必須可辨識。

fb54644e-a90f-11ed-bfe3-dac502259ad0.png

(3) CIFAR100

更加細粒度的CIFAR10,共100類,被分成20個超類。

每小類包含600個圖像,其中有500個訓練圖像和100個測試圖像。每個圖像都帶有一個“精細”標簽(它所屬的類)和一個粗糙的標簽(它所屬的超類)

fb8e3412-a90f-11ed-bfe3-dac502259ad0.pngfba073c0-a90f-11ed-bfe3-dac502259ad0.png

(4) PASCAL

來源于2005-2012的PASCAL Visual Object Classes(VOC項目),20類,來源于圖片社交網(wǎng)站flickr,總共9963張圖,24640個標注目標。

fbbec0f0-a90f-11ed-bfe3-dac502259ad0.png

2005年主要用于目標檢測,從2007年開始引進了圖像分割的標注和人體結構布局的標注,2010年開始引進了行為分類標注。

fbe2051a-a90f-11ed-bfe3-dac502259ad0.png

(5)ImageNet數(shù)據(jù)集

包含21841個類別,14197122張圖片,百萬標注框

fc2a1620-a90f-11ed-bfe3-dac502259ad0.png

5 評估指標

(1)正負樣本

計標簽為正樣本,分類為正樣本的數(shù)目為True Positive,簡稱TP,標簽為正樣本,分類為負樣本的數(shù)目為「False Negative」,簡稱FN,標簽為負樣本,分類為正樣本的數(shù)目為「False Positive」,簡稱FP,標簽為負樣本,分類為負樣本的數(shù)目為「True Negative」,簡稱TN。

fc5070d6-a90f-11ed-bfe3-dac502259ad0.png

(2)精確率、召回率、F1值

精度(查準率): 被判定為正樣本的測試樣本中,真正的正樣本所占的比例

fc67a724-a90f-11ed-bfe3-dac502259ad0.png

召回率(查全率): 被判定為正樣本的正樣本占全部正樣本的比例

fc78e3fe-a90f-11ed-bfe3-dac502259ad0.png

F1-score是綜合考慮了精度與召回率,其值越大模型越好。

fc862ea6-a90f-11ed-bfe3-dac502259ad0.png

(3)PR曲線

精度與召回率是一對相互矛盾的指標,召回率增加,精度下降,曲線與坐標值面積越大,性能越好,對正負樣本不均衡敏感。

fc96e91c-a90f-11ed-bfe3-dac502259ad0.png

(4)ROC曲線與AUC

fca523ec-a90f-11ed-bfe3-dac502259ad0.png

橫坐標(假陽率)FPR=FP/(FR+TN) 正類中實際負實例占所有負實例的比例。

縱坐標(正陽率) TPR=TP/(TP+FN) 正類中實際正實例占所有正實例的比例。

正負樣本的分布變化,ROC曲線保持不變,對正負樣本不均衡問題不敏感。

AUC(Area Under Curve): ROC曲線下的面積,表示隨機挑選一個正樣本以及一個負樣本,分類器會對正樣本給出的預測值高于負樣本的概率。

(5)混淆矩陣

多矩陣分類模型各個類別之間的分類情況。

對于k分類問題,混淆矩陣為k*k的矩陣,元素Cij表示第i類樣本被分類器判定為第j類的數(shù)量。

fcba9bfa-a90f-11ed-bfe3-dac502259ad0.png

主對角線的元素之和為正確分類的樣本數(shù),其他位置元素之和為錯誤分類的樣本數(shù)。對角線之和值越大,正確率越高。

混淆矩陣可以很清晰的反映出各類別之間的錯分概率,越好的分類器對角線上的值更大。

fcccaa66-a90f-11ed-bfe3-dac502259ad0.png

(6)0-1損失

只看分類的對錯,當標簽與與類別相等時,loss為0,否則為1。

fcf9e814-a90f-11ed-bfe3-dac502259ad0.png

這個是真實的優(yōu)化目標,但是無法求導和優(yōu)化,只有理論意義。

(7)熵與交叉熵(cross entropy)

熵表示熱力學系統(tǒng)的無序程序,在信息學中用于表示信息多少,不確定性越大,概率越低,則信息越多,熵越高。

fd0be9f6-a90f-11ed-bfe3-dac502259ad0.png

熵是概率的單調遞減的函數(shù)。

fd26764a-a90f-11ed-bfe3-dac502259ad0.png

(8)KL散度

用于估計兩個分布p和q的相似性

fd380888-a90f-11ed-bfe3-dac502259ad0.png

如果p是一個已知的分布(標簽),則-l(p,p)是一個常數(shù),此時KL散度與交叉熵l(p,q)只有一個常數(shù)的差異。

KL散度的特性是大于等于0,當且僅當兩個分布完全相同時等于0。

fd47ab58-a90f-11ed-bfe3-dac502259ad0.png

審核編輯 :李倩


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3277

    瀏覽量

    48964
  • 圖像分類
    +關注

    關注

    0

    文章

    90

    瀏覽量

    11942
  • 數(shù)據(jù)集

    關注

    4

    文章

    1208

    瀏覽量

    24747

原文標題:小白必讀!一篇看懂圖像分類基礎知識

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    鴻蒙移植必備的基礎知識

    的腳本:腳本就是把命令寫在個文件里MakefileGCC編譯命令1.3 芯片相關知識能閱讀芯片手冊(英文)移植最小系統(tǒng)時,涉及的手冊內容不多能看懂硬件原理圖移植最小系統(tǒng)時,涉及的原理圖內容不多2. 驅動程序
    發(fā)表于 07-01 06:35

    鐵的基礎知識及鐵的分類

    鐵的基礎知識及鐵的分類 生鐵是指把鐵礦石4放到高爐中冶煉5而成的產(chǎn)品,也叫“銑鐵”。生鐵是高爐產(chǎn)品,可分為6普通生鐵和合金生
    發(fā)表于 12-24 11:16 ?1.4w次閱讀
    鐵的<b class='flag-5'>基礎知識</b>及鐵的<b class='flag-5'>分類</b>

    電感基礎知識大全

    電感基礎知識大全 電感的分類按 電感形式 分類:固定電感、可變電感。按導磁體性質分類:空芯線圈、鐵氧體線圈
    發(fā)表于 07-29 19:05 ?6270次閱讀
    電感<b class='flag-5'>基礎知識</b>大全

    半導體基礎知識(詳細

    半導體基礎知識(詳細) 2.1.1 概念   根據(jù)物體導電能力(電阻率)的不同,來劃分導體、絕緣體和半導體。 1.
    發(fā)表于 11-09 16:06 ?2.9w次閱讀
    半導體<b class='flag-5'>基礎知識</b>(詳細<b class='flag-5'>篇</b>)

    HIFI耳機基礎知識入門

    HIFI耳機基礎知識入門 、耳機是如何分類的? 1、按換能原理(Transducer)分
    發(fā)表于 02-02 11:48 ?3064次閱讀

    電源的分類和相關基礎知識

    電源的分類和相關基礎知識 1、交流穩(wěn)壓電源的分類及其特點:
    發(fā)表于 03-08 10:03 ?497次閱讀

    FPGA開發(fā)經(jīng)驗與技巧_基礎知識學習(1)

    FLC1301T00 基礎知識學習希望會對朋友們的學習有幫助!
    發(fā)表于 12-16 15:27 ?3次下載

    電阻基礎知識

    電阻基礎知識比較詳細,分類清楚,適合初學者有個比較全面的了解
    發(fā)表于 01-11 14:55 ?0次下載

    手機基礎知識--維修

    手機基礎知識--維修。都是些簡單的手機維修方面的東西,希望對大家有所幫助。
    發(fā)表于 06-20 16:09 ?12次下載

    三菱PLC分類及型號的基礎知識

    三菱PLC分類及型號的基礎知識
    發(fā)表于 01-02 16:20 ?2次下載

    117電子基礎知識文章大全

    本文檔的主要內容詳細介紹的是117電子基礎知識文章大全。包括了:74系列集成電路的分類及區(qū)別,CMOS集成電路的工作原理,LED數(shù)碼管的識別,MOS場效應管,PTC元件簡介,TTL與COMS的區(qū)別,TL431的簡介,保險絲的基
    發(fā)表于 06-02 08:00 ?7次下載
    117<b class='flag-5'>篇</b>電子<b class='flag-5'>基礎知識</b>文章大全

    了解下機器學習中的基礎知識

    ,那么機器學習的基礎知識都有哪些呢?本文給大家列舉下機器學習的基礎知識。 (1)準確率的概念,準確率就是分類模型預測準確的比例。 (2)AUC(曲線下面積)則是
    的頭像 發(fā)表于 03-31 17:08 ?3829次閱讀

    開關電源基礎知識

    開關電源基礎知識(核達中遠通電源技術有限公司上市)-介紹了開關電源、基礎知識、分類與調制方式
    發(fā)表于 09-29 11:00 ?66次下載
    開關電源<b class='flag-5'>基礎知識</b>

    圖像處理基礎知識及OpenCV入門函數(shù)

    圖像基礎知識** 圖像都是由像素(pixel)構成的,即圖像中的小方格,這些小方格都有個明確的位置和被分配的色彩數(shù)值,而這些
    的頭像 發(fā)表于 02-08 15:57 ?881次閱讀
    <b class='flag-5'>圖像</b>處理<b class='flag-5'>基礎知識</b>及OpenCV入門函數(shù)

    圖像處理基礎知識 1

    直都在這里分享計算機基礎知識,比如計算機組成原理、數(shù)據(jù)結構與算法、計算機網(wǎng)絡和操作系統(tǒng)等。 不過偶爾我也想寫下其他的話題,今天就想和你聊聊圖像處理的相關
    的頭像 發(fā)表于 02-08 17:08 ?838次閱讀
    <b class='flag-5'>圖像</b>處理<b class='flag-5'>基礎知識</b> 1