基于深度學(xué)習(xí)的目標(biāo)檢測方法

目標(biāo)檢測是計算機(jī)視覺領(lǐng)域的重要研究方向. 傳統(tǒng)的目標(biāo)檢測方法在特征設(shè)計上花費(fèi)了大量時間, 且手工設(shè)計的特征對于目標(biāo)多樣性的問題并沒有好的魯棒性, 深度學(xué)習(xí)技術(shù)逐漸成為近年來計算機(jī)視覺領(lǐng)域的突破口. 為此, 對現(xiàn)有的基礎(chǔ)神經(jīng)網(wǎng)絡(luò)進(jìn)行研究, 采用經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)VGGNet作為基礎(chǔ)網(wǎng)絡(luò), 添加部分深層網(wǎng)絡(luò), 結(jié)合SSD (single shot multibox detector)算法構(gòu)建網(wǎng)絡(luò)框架. 針對模型訓(xùn)練中出現(xiàn)的正負(fù)樣本不均衡問題, 根據(jù)困難樣本挖掘原理, 在原有的損失函數(shù)中引入調(diào)制因子, 將背景部分視為簡單樣本, 減小背景損失在置信損失中的占比, 使得模型收斂更快速, 模型訓(xùn)練更充分, 從而提高復(fù)雜背景下的目標(biāo)檢測精度. 同時, 通過構(gòu)建特征金字塔和融合多層特征圖的方式, 實(shí)現(xiàn)對低層特征圖的語義信息融合增強(qiáng), 以提高對小目標(biāo)檢測的精度, 從而提高整體的檢測精度. 仿真實(shí)驗(yàn)結(jié)果表明, 所提出的目標(biāo)檢測算法(feature fusion based SSD, FF-SSD)在復(fù)雜背景下對各種目標(biāo)均可取得較高的檢測精度.

關(guān)鍵詞

目標(biāo)檢測????深度學(xué)習(xí)????SSD算法????復(fù)雜背景????困難樣本????特征融合? ?

?引言

復(fù)雜背景下的目標(biāo)檢測是計算機(jī)視覺領(lǐng)域中一個十分重要的課題. 傳統(tǒng)的目標(biāo)檢測方法面臨以下兩個問題: 一是基于滑動窗口的區(qū)域選擇策略容易產(chǎn)生窗口冗余; 二是手工設(shè)計的特征對于目標(biāo)多樣性的變化并沒有好的魯棒性. 因此, 基于深度學(xué)習(xí)的目標(biāo)檢測方法開始受到人們的廣泛關(guān)注. 深度學(xué)習(xí)方法能克服傳統(tǒng)人工選取特征的缺點(diǎn), 自適應(yīng)地學(xué)習(xí)表征目標(biāo)的最佳特征, 且抗干擾性能優(yōu)異, 可以有效提高目標(biāo)識別的準(zhǔn)確性和魯棒性[1].

在深度學(xué)習(xí)目標(biāo)檢測模型中, 具有代表性的是Girshick等[2]提出的一系列目標(biāo)檢測算法, 其開山之作是R-CNN (region-convolutional neural network). 針對R-CNN訓(xùn)練時間過長的問題, Girshick[3]又提出了Fast R-CNN. 與R-CNN類似, Fast R-CNN依然采用selective search[4]生成候選區(qū)域, 但是, 與R-CNN提取出所有候選區(qū)域并使用SVM分類的方法不同, Fast R-CNN在整張圖片上使用CNN, 然后使用特征映射提取感興趣區(qū)域(region of interest, RoI); 同時, 利用反向傳播網(wǎng)絡(luò)進(jìn)行分類和回歸. 該方法不僅檢測速度快, 而且具有RoI集中層和全連接層, 使得模型可求導(dǎo), 更容易訓(xùn)練. Ren等[5]又提出了Fast R-CNN的升級版本Faster R-CNN算法. Faster R-CNN是第一個真正意義上端到端的、準(zhǔn)實(shí)時的深度學(xué)習(xí)目標(biāo)檢測算法. Faster R-CNN最大的創(chuàng)新點(diǎn)在于設(shè)計了候選區(qū)域生成網(wǎng)絡(luò)(region proposal network, RPN), 并設(shè)計了anchor機(jī)制. 從R-CNN到Fast R-CNN再到Faster R-CNN, 候選區(qū)域生成、特征提取、候選目標(biāo)確認(rèn)以及邊界框坐標(biāo)回歸被逐漸統(tǒng)一到同一個網(wǎng)絡(luò)框架中.

同樣是基于深度學(xué)習(xí)的目標(biāo)檢測方法, 另一個發(fā)展分支是基于回歸的目標(biāo)檢測方法. 華盛頓大學(xué)的Redmon等[6]提出了YOLO (you only look once)算法, 其核心思想是使用整張圖像作為網(wǎng)絡(luò)輸入, 直接在輸出層中輸出邊界框的位置及其所屬的類別. 它的訓(xùn)練和檢測均在單獨(dú)的網(wǎng)絡(luò)中進(jìn)行, 取得了較好的實(shí)時檢測效果. YOLO方法舍棄了區(qū)域備選框階段, 加快了速度, 但是定位和分類精度較低, 尤其對小目標(biāo)以及比較密集的目標(biāo)群檢測效果不夠理想, 召回率較低. 2017年, Redmon等[7]又提出了具有檢測速度更快、檢測精度更高和穩(wěn)健性更強(qiáng)的YOLO v2. Ju等[8]則以YOLO v3[9]為基礎(chǔ), 提出了一種改進(jìn)的多尺度目標(biāo)檢測算法, PASCAL VOC和KITTI數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果均表明了該算法的有效性. 針對現(xiàn)有網(wǎng)絡(luò)模型在實(shí)時性方面存在的不足, He等[10]提出了實(shí)時的目標(biāo)檢測模型TF-YOLO (tiny fast YOLO), 仿真結(jié)果表明, 該算法在多種設(shè)備上都可實(shí)現(xiàn)實(shí)時目標(biāo)檢測.

針對YOLO算法定位精度低的問題, Liu等[11]提出了SSD算法, 該算法先根據(jù)錨點(diǎn)(anchor)提取備選框, 然后再進(jìn)行分類. SSD算法將YOLO的回歸思想與Faster R-CNN的錨點(diǎn)機(jī)制相結(jié)合, 一次即可完成網(wǎng)絡(luò)訓(xùn)練, 并且定位精度和分類精度相比YOLO都有大幅度提高. Bosquet等[12]提出了一種基于改進(jìn)SSD模型的SAR (synthetic aperture radar)目標(biāo)檢測算法, 仿真結(jié)果表明, 該算法可以實(shí)現(xiàn)復(fù)雜背景下SAR目標(biāo)的檢測.

盡管SSD算法在特定數(shù)據(jù)集上已經(jīng)取得了較高的準(zhǔn)確率和較好的實(shí)時性, 但是, 該算法損失函數(shù)的設(shè)計未考慮正負(fù)樣本不均衡所帶來的問題, 也存在因網(wǎng)絡(luò)結(jié)構(gòu)的缺陷而引起的小目標(biāo)檢測精度不高的問題. 針對模型中出現(xiàn)的正負(fù)樣本失衡問題, 本文基于困難樣本挖掘原理, 在損失函數(shù)中引入調(diào)制因子; 針對因低層語義信息缺乏所導(dǎo)致的小目標(biāo)檢測結(jié)果欠佳的問題, 采取多層特征融合的結(jié)構(gòu)加以解決, 即進(jìn)行預(yù)測之前先進(jìn)行淺層特征圖的融合, 增強(qiáng)其低層的語義信息, 以期能夠提高小目標(biāo)的檢測精度.

1 網(wǎng)絡(luò)模型

1.1

SSD網(wǎng)絡(luò)結(jié)構(gòu)

本文檢測模型以傳統(tǒng)的基礎(chǔ)網(wǎng)絡(luò)VGG16 (visual geometry group)為基礎(chǔ), 并添加深層卷積網(wǎng)絡(luò)而構(gòu)成. 前部分淺層網(wǎng)絡(luò)采用卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征[10], 包括輸入層、卷積層和下采樣層; 后部分深層網(wǎng)絡(luò)用卷積層代替原始的全連接層. 卷積層尺寸逐層遞減, 分類和定位回歸在多尺度特征圖上完成.

1.2

先驗(yàn)框設(shè)計

SSD網(wǎng)絡(luò)能夠識別多個物體, 其核心是預(yù)測固定集合的類別分?jǐn)?shù)和位置偏移, 并使用應(yīng)用于特征映射的小卷積濾波器的默認(rèn)邊界框. SSD借鑒了Faster R-CNN中anchor的理念[5], 在特征圖上通過卷積計算產(chǎn)生若干覆蓋全圖的候選區(qū)域, 形成了先驗(yàn)框機(jī)制. 通過為每個單元設(shè)置尺度或者長寬比不同的先驗(yàn)框(預(yù)測的邊界框是以這些先驗(yàn)框?yàn)榛鶞?zhǔn)的偏移系數(shù)), 在一定程度上減少了訓(xùn)練難度. 對于每個單元的每個先驗(yàn)框, 都輸出一套獨(dú)立的檢測值, 其對應(yīng)的邊界框由兩部分描述: 第1部分是各個類別的置信度; 第2部分是邊界框的位置, 包含4個值(cx,cy,w,h), 分別表示邊界框的中心坐標(biāo)以及寬和高. 由于先驗(yàn)框在模型訓(xùn)練之前就已確定, 很難與真實(shí)的標(biāo)注區(qū)域完全重合. 為解決此問題, SSD算法使用位置回歸層來輸出4個位置校正參數(shù)(dx,dy,dw,dh). 先驗(yàn)框經(jīng)過適當(dāng)變換后, 便能與真實(shí)的標(biāo)注區(qū)域基本吻合.

1.3

引入調(diào)制因子的損失函數(shù)

損失函數(shù)用來計算模型預(yù)測值與真實(shí)值的不一致程度. 對于樣本集合(x,?y), 本文采用多任務(wù)損失函數(shù)(multi-task loss function), 可以在損失函數(shù)中完成置信度判別和位置回歸, 兩者加權(quán)求和, 得到最終的損失函數(shù)[11], 即

(1) ? ?

(2) ? ?

(3) ? ?

SSD算法在損失計算中, 所有的候選框可以分為正樣本和負(fù)樣本兩類, 即在所有的先驗(yàn)框中, 與每個標(biāo)注框有最大重疊率的被視為正樣本, 或者是與標(biāo)注框的重疊大于某一閾值時, 被視為正樣本, 其他為負(fù)樣本. 然而, 在大多數(shù)圖像中, 目標(biāo)所占的比例通常遠(yuǎn)小于背景所占比例. 盡管人們對閾值選擇以及正負(fù)樣本的判斷標(biāo)準(zhǔn)有所放松, 但是仍然存在正負(fù)樣本不均衡的問題, 也就是“類別失衡”?[13]. 負(fù)樣本過多時, 容易造成負(fù)樣本損失占比過大, 進(jìn)而導(dǎo)致正樣本的誤差損失被忽略, 不利于模型的收斂.

為解決上述問題, 本文首先將所有的待訓(xùn)練先驗(yàn)框進(jìn)行排序, 按照置信度得分情況從大到小排列, 取前四分之一為正樣本, 其余為負(fù)樣本, 以減少負(fù)樣本比重; 然后, 在原損失函數(shù)中引入調(diào)制因子, 增加困難樣本對參數(shù)的貢獻(xiàn)值.

對于二分類的邏輯回歸問題, 損失函數(shù)為

(4) ? ?

其中:?p∈(0,1)且Lce∈(0,+∞), 它代表預(yù)測框相對于標(biāo)注框的置信度.?p越大,?Lce越小, 說明所訓(xùn)練的樣本越容易, 該樣本越容易被正確識別, 從而對損失值的貢獻(xiàn)也越小; 反之,?p越小,?Lce?越大, 說明所訓(xùn)練的樣本越困難, 該樣本越不容易被正確識別, 從而對損失值的貢獻(xiàn)也越大. 由于大量背景樣本都是容易樣本, 這些樣本疊加, 損失值之和較大, 就有可能造成“類別失衡”. 因此, 可將(1?p) 作為調(diào)制因子, 加入到原有的交叉熵?fù)p失函數(shù)中. 原有的損失函數(shù)[14]變?yōu)?/p>

(5) ? ?

當(dāng)樣本為容易樣本時,?(1?p) 越小, 損失值會在原基礎(chǔ)上進(jìn)一步被降低, 該分類越容易, 被降低的程度也越大; 相反, 當(dāng)樣本為困難樣本時,?(1?p) 越大, 分類越困難, 也有可能被誤判, 這時的調(diào)制因子相應(yīng)較大, 損失值在一定程度上會被保持. 如此便實(shí)現(xiàn)了困難樣本的挖掘.

對于多分類問題, 仍然采用交叉熵?fù)p失函數(shù), 區(qū)別在于p的取值不再由sigmod激活函數(shù)的輸出值所定義, 而是采用softmax函數(shù)來定義該變量, 這時p為某一類的回歸結(jié)果, 即

(6) ? ?

1.4?

引入調(diào)制因子后前向傳播函數(shù)和反向傳播函數(shù)的推導(dǎo)

為了讓引入調(diào)制因子后的損失函數(shù)能夠替換原有的損失函數(shù), 下面進(jìn)行損失函數(shù)的前向和反向傳播推導(dǎo). 損失函數(shù)的前向傳播計算公式如下:

(7) ? ?

令t表示目標(biāo)的類別(t∈[0,20]), 則損失函數(shù)為

(8) ? ?

(9) ? ?

下面計算?有

(10) ? ?

(11) ? ?

將式(10)代入(11), 可得

(12) ? ?

將式(10)和(12)代入(9), 可得

(13) ? ?

2 多層特征融合

SSD網(wǎng)絡(luò)參與分類和定位回歸的是多層特征圖, 這些特征圖呈金字塔結(jié)構(gòu). 下面先簡單介紹特征金字塔和圖像反卷積, 進(jìn)而給出本文所設(shè)計的多層特征融合模型.

2.1

圖像金字塔與特征金字塔

在目標(biāo)檢測中, 經(jīng)常遇到多尺度問題, 通常采用圖像金字塔[15]和特征金字塔[16-17]的方法. 特征金字塔是由圖像金字塔發(fā)展而來, 它利用卷積特性, 在提取特征的同時也減小了圖像尺寸. 一個卷積神經(jīng)網(wǎng)絡(luò)在不同的特征層, 其語義信息是不同的[18]. 特征金字塔中每一層特征都有豐富的語義信息, 但是, 如果使用金字塔中的全部特征圖, 無疑會加大運(yùn)算量, 并且產(chǎn)生較多冗余信息. 經(jīng)過對特征圖的分析, 實(shí)驗(yàn)確定使用conv4-3之后的部分特征層用于目標(biāo)檢測.

2.2

圖像反卷積

不同卷積層的特征圖有著不同的尺寸, 因此, 在進(jìn)行特征融合之前, 需要對相融合的特征圖進(jìn)行尺寸變換, 這就需要用到反卷積結(jié)構(gòu)[19]. 反卷積, 可以簡單理解為卷積的逆過程. 即卷積層的反向傳播就是反卷積的前向傳播, 卷積層的前向傳播就是反卷積的反向傳播.

2.3

多層特征融合結(jié)構(gòu)

SSD網(wǎng)絡(luò)分別在conv4??3至conv11的6層特征圖上進(jìn)行分類回歸, 即使用conv4??3、conv7、conv8??2、conv9??2、conv10??2和conv11??2這6層特征圖進(jìn)行檢測, 較大的特征圖用來檢測相對較小的目標(biāo), 而較小的特征圖負(fù)責(zé)檢測較大的目標(biāo)[11].

通過對卷積層可視化結(jié)構(gòu)圖可以看出: 特征層conv3??3由于深度較淺, 邊緣信息以及非目標(biāo)干擾信息較為明顯; conv4??3和conv5??3兩層特征圖, 除了有大致的輪廓信息以外, 還包含了更多的抽象語義信息; 對于更深的conv8??2和conv9??2特征層, 基本的輪廓信息以及細(xì)節(jié)信息都丟失了, 這對于小目標(biāo)的檢測效果不是很明顯. 如果加以融合, 則不僅增加了計算量, 而且對于融合后所帶來的信息增益并不明顯.

綜上, 針對SSD僅利用少量淺層特征圖來檢測目標(biāo), 缺少足夠的語義信息所導(dǎo)致的小目標(biāo)檢測精度低的問題, 本文提取并融合淺層特征圖, 加強(qiáng)淺層特征圖的語義信息, 即選取conv4??3到conv7之間的特征圖進(jìn)行特征融合, 多層特征融合結(jié)構(gòu)如圖 1所示.

圖 1?多層特征融合結(jié)構(gòu)

特征圖的融合方式主要有兩種: 通道級聯(lián)和同位置元素相加[20]. 通道級聯(lián)法增加了原有的通道數(shù), 即描述圖像本身的特征數(shù)(通道數(shù))增加了, 而每一特征下的信息沒有增加. 同位置元素相加法將所對應(yīng)的特征圖相加, 再進(jìn)行下一步的卷積操作. 該方法并未改變圖像的維度, 只是增加了每一維下的信息量, 這對最終的圖像分類顯然是有益的. 此外, 同位置元素相加法所需要的內(nèi)存和參數(shù)量小于通道級聯(lián)法, 故計算量也小于通道級聯(lián)法. 所以, 本文選擇同位置元素相加法進(jìn)行特征圖融合.

3 仿真實(shí)驗(yàn)

3.1

實(shí)驗(yàn)數(shù)據(jù)集

本文采用PASCAL VOC數(shù)據(jù)集(VOC2007和VOC2012)[21-22]進(jìn)行訓(xùn)練和測試, 該數(shù)據(jù)集組成為: 目標(biāo)真值區(qū)域、類別標(biāo)簽、包含目標(biāo)的圖像、標(biāo)注像素類別和標(biāo)注像素所屬的物體. 該數(shù)據(jù)集總共分4個大類: vehicle、household、animal和person, 共計21個小類(包括1個背景類). 實(shí)驗(yàn)統(tǒng)一圖片規(guī)格為300×300.

3.2

檢測模型評價指標(biāo)

在對目標(biāo)檢測模型進(jìn)行分析評價中, 本文使用公共評價指標(biāo): 平均精確度均值(mean average precision, mAP)對模型進(jìn)行評價[23]. 下面先給出準(zhǔn)確率(precision)和召回率(recall)的定義, 進(jìn)而給出mAP的定義.

準(zhǔn)確率是指在所有正樣本中, 正確目標(biāo)所占的比例, 衡量的是查準(zhǔn)率; 召回率是指在所有真實(shí)的目標(biāo)中, 被模型正確檢測出來的目標(biāo)所占的比例, 衡量的是查全率. 其計算公式分別為

(14) ? ?

(15) ? ?

其中: TP為模型正確檢測的目標(biāo)個數(shù), FP為模型錯誤檢測的目標(biāo)個數(shù), FN為模型漏檢的正確目標(biāo)個數(shù).

以召回率為橫坐標(biāo), 以準(zhǔn)確率為縱坐標(biāo), 二者形成的曲線稱為p-r曲線, 用來顯示檢測模型在準(zhǔn)確率與召回率之間的平衡.?p-r曲線下的面積為該類別的平均精度(average precision, AP). 在多類別分類中, 通過求取各個類別AP的均值來計算模型整體的檢測性能指標(biāo), 其計算方法如下:

(16) ? ?

(17) ? ?

其中:?c為目標(biāo)檢測的類別數(shù), APii為第i類目標(biāo)的平均精確度.

3.3

實(shí)驗(yàn)結(jié)果與分析

為加快網(wǎng)絡(luò)模型的收斂速度并提升網(wǎng)絡(luò)性能, 本文將已訓(xùn)練好的VGG16作為預(yù)訓(xùn)練模型, 后續(xù)目標(biāo)檢測只需在其基礎(chǔ)上進(jìn)行微調(diào)訓(xùn)練即可. 本文采用隨機(jī)梯度下降法進(jìn)行模型優(yōu)化, 設(shè)定初始學(xué)習(xí)速率為0.001, 權(quán)值衰減為0.000 5, 動量為0.9;卷積核大小為3×3, IOU設(shè)置為0.5;采用Pytorch深度學(xué)習(xí)框架, Python版本為Anaconda 3.6, 實(shí)驗(yàn)統(tǒng)一圖片規(guī)格為300××300.

表 1給出了Fast R-CNN[3]、Faster R-CNN[5]、YOLO[6]、YOLO v3[9]、SSD300[11]、DSSD321[20]以及本文算法的目標(biāo)檢測精度.

表 1?不同目標(biāo)檢測算法檢測結(jié)果對比

本文算法以VGGNet為基礎(chǔ)網(wǎng)絡(luò), 其在檢測精度方面較Fast R-CNN、Faster R-CNN、YOLO、YOLO v3和SSD300均有優(yōu)勢, 但是對比基礎(chǔ)網(wǎng)絡(luò)為ResNet-101的DSSD算法而言, 精度稍有下降. 主要原因是, VGGNet網(wǎng)絡(luò)較淺, 而ResNet-101是非常深的網(wǎng)絡(luò), 網(wǎng)絡(luò)越深, 目標(biāo)特征越能夠更好地被提取出來, 因此檢測精度越高.

除了檢測精度外, 時間復(fù)雜度也是算法設(shè)計時需要考慮的問題. 因Fast R-CNN、Faster R-CNN、YOLO、SSD300、DSSD321算法的運(yùn)行平臺與本文算法不同, 所以本文用基礎(chǔ)網(wǎng)絡(luò)的層數(shù)、基礎(chǔ)網(wǎng)絡(luò)所占內(nèi)存的大小(網(wǎng)絡(luò)參數(shù))和預(yù)測框的數(shù)量來衡量不同算法的時間復(fù)雜度. GoogleNet[24]、VGGNet[25]、DarkNet-53[7]和ResNet-101[26]的層數(shù)分別為22層、19層、53層和101層, 它們所占的內(nèi)存分別為99.8 M、82.1 M、30.8 M和170 M.

一般而言, 層數(shù)越多, 所占內(nèi)存越大, 預(yù)測框數(shù)量越多, 則認(rèn)為算法的時間復(fù)雜度越高. 從表 1和上述基礎(chǔ)網(wǎng)絡(luò)參數(shù)可以看出, YOLO算法中基礎(chǔ)網(wǎng)絡(luò)的層數(shù)和所占內(nèi)存略高于VGGNet, 但是預(yù)測框數(shù)量較少, 所以其計算復(fù)雜度較低. YOLO v3使用的基礎(chǔ)網(wǎng)絡(luò)是DarkNet53, 其性能可以與最先進(jìn)的分類器媲美, 但是因DarkNet53需要更少的浮點(diǎn)運(yùn)算, 所以時間復(fù)雜度較低. Fast R-CNN、Faster R-CNN、SSD300和本文算法都使用VGGNet作為基礎(chǔ)網(wǎng)絡(luò), Faster R-CNN的預(yù)測框數(shù)量相對較少, 所以時間復(fù)雜度也較低. Fast R-CNN采用的是選擇性搜索算法, 其計算復(fù)雜度要高于采用候選框生成算法的Faster R-CNN. DSSD算法所使用的基礎(chǔ)網(wǎng)絡(luò)ResNet-101的層數(shù)遠(yuǎn)多于本文所采用的VGGNet, 所占用的內(nèi)存高出87.9 MB, 在預(yù)測框的數(shù)量上, DSSD網(wǎng)絡(luò)比本文算法多8 348個, 因此, DSSD算法計算復(fù)雜度最高.

圖 2給出了不同算法在20個種類的測試集上的目標(biāo)檢測結(jié)果. 從實(shí)驗(yàn)結(jié)果可以看出, 本文算法對于bicycle、bus、car、cat、dog、horse、motorbike、train這8類目標(biāo)檢測效果較好, 都已達(dá)到了85 %以上.

圖 2?VOC2007上各類別檢測結(jié)果對比

綜合表 1和圖 2可以看出, 本文算法在多數(shù)類別上的檢測精度均能獲得較好表現(xiàn), 尤其是對于bicycle、bus、car、person等復(fù)雜背景下的目標(biāo), 相比于SSD網(wǎng)絡(luò)提升較為明顯, mAP分別提高了5.4 %、7.3 %、3.5 %、4 %. 但相比于DSSD網(wǎng)絡(luò)在bird、bottle、cow、table、sofa、TV這些類別上, 檢測精度稍有下降, 其原因可能是基礎(chǔ)網(wǎng)絡(luò)的不同而導(dǎo)致的特征提取信息不足.

為驗(yàn)證本文算法對不同大小目標(biāo)的檢測精度, 實(shí)驗(yàn)中隨機(jī)選取100張圖片, 其中包含198個目標(biāo), 將其分為大、中、小三類. 由于該網(wǎng)絡(luò)的輸入圖像尺寸為300××300, 將圖像中的檢測目標(biāo)按照其面積占圖像總面積的比例分為三類: 目標(biāo)面積占圖像總面積5 %以下的認(rèn)為是小目標(biāo), 目標(biāo)面積占圖像面積5 %?～～?25 %的是中等目標(biāo), 目標(biāo)面積占圖像總面積20 %以上的是大目標(biāo).?表 2給出了SSD算法和本文算法的檢測結(jié)果(其中: A方法為SSD算法, B方法為本文算法).

表 2?隨機(jī)檢測結(jié)果對比

由表 2可知, 本文算法對于不同尺寸的目標(biāo)檢測精度均有不同程度的提高, 尤其是對于小目標(biāo)的檢測率由原來的47.1 %增加到58.3 %.

圖 3給出了不同情況下的目標(biāo)檢測結(jié)果, 可以看出, 本文算法對小目標(biāo)的檢測、存在遮擋物的檢測以及在云霧天氣和夜間的檢測都有不錯的效果.

圖 3?不同條件下的目標(biāo)檢測結(jié)果

4 結(jié)論

針對正負(fù)樣本不均衡所導(dǎo)致的低分類精度等問題, 本文在原SSD算法的損失函數(shù)中引入調(diào)制因子, 減小簡單樣本的損失權(quán)值, 增加困難樣本的損失值所占比重, 以達(dá)到提高復(fù)雜背景下目標(biāo)檢測精度的目的. 同時, 調(diào)制因子的引入可以減少原模型交叉熵?fù)p失函數(shù)浪費(fèi)在容易樣本上的計算力, 使得損失函數(shù)可以更快地跳過原有容易樣本的簡單數(shù)據(jù), 更快地進(jìn)入后面困難樣本的計算, 從而加快訓(xùn)練階段的收斂速度. 其次, 針對因網(wǎng)絡(luò)結(jié)構(gòu)的缺陷而引起的小目標(biāo)檢測精度欠佳問題, 本文采取一種基于特征金字塔的多層特征檢測結(jié)構(gòu), 以增強(qiáng)用于檢測小目標(biāo)的淺層特征圖語義信息. 實(shí)驗(yàn)結(jié)果表明, 本文算法在多種類別目標(biāo)的檢測精度上都較SSD算法有了不同程度的提高, 尤其是在小目標(biāo)檢測識別方面, 檢測精度顯著提高.

編輯:黃飛

閱讀全文

SSD(115270) SSD(115270)
計算機(jī)視覺(45543) 計算機(jī)視覺(45543)
深度學(xué)習(xí)(119798) 深度學(xué)習(xí)(119798)

深度學(xué)習(xí)中的YOLOv2-Tiny目標(biāo)檢測算法詳細(xì)設(shè)計

近年來，以卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，DNN）為代表的深度學(xué)習(xí)算法在許多計算機(jī)視覺任務(wù)上取得了巨大突破，如圖像分類、目標(biāo)檢測、畫質(zhì)增強(qiáng)等［1-2］。然而

2020-11-30 14:01:46

10735

基于深度學(xué)習(xí)的三維點(diǎn)云配準(zhǔn)方法

基于深度學(xué)習(xí)的三維點(diǎn)云配準(zhǔn)方法成為研究的主流，并隨之誕生了DeepVCP、DGR、Predator等著名的方法。

2022-11-29 11:41:24

1338

深度學(xué)習(xí)實(shí)現(xiàn)目標(biāo)檢測俄羅斯總統(tǒng)***對沙特王儲攤的“友好攤手”瞬間

CV：2108足球世界杯—深度學(xué)習(xí)實(shí)現(xiàn)目標(biāo)檢測俄羅斯總統(tǒng)***對沙特王儲攤的“友好攤手”瞬間—東道主俄羅斯5-0完勝沙特

2018-12-21 10:31:24

目標(biāo)檢測實(shí)戰(zhàn)

深度學(xué)習(xí)目標(biāo)檢測系列：faster RCNN實(shí)現(xiàn)附python源碼

2019-08-29 08:49:13

CV：基于深度學(xué)習(xí)實(shí)現(xiàn)目標(biāo)檢測之GUI界面產(chǎn)品設(shè)計并實(shí)現(xiàn)圖片識別、視頻識別、攝像頭識別

CV：基于深度學(xué)習(xí)實(shí)現(xiàn)目標(biāo)檢測之GUI界面產(chǎn)品設(shè)計并實(shí)現(xiàn)圖片識別、視頻識別、攝像頭識別

2018-12-21 10:31:47

Labview深度學(xué)習(xí)tensorflow人工智能目標(biāo)檢測-教學(xué)貼【連載】

本帖最后由 wcl86 于 2021-6-3 16:23 編輯應(yīng)廣大學(xué)員要求，現(xiàn)開通Labview深度學(xué)習(xí)tensorflow人工智能目標(biāo)檢測-教學(xué)貼，有需要的學(xué)員，可以收藏本貼，接下來會

2021-05-28 11:58:52

MATLAB的行人目標(biāo)檢測的方法有哪些？

MATLAB的行人目標(biāo)檢測的方法有哪些，就是主要的方法，基于背景的，基于目標(biāo)的，還有其他的。都有哪些？

2023-08-23 16:30:20

Nanopi深度學(xué)習(xí)之路(1)深度學(xué)習(xí)框架分析

著手，使用Nanopi2部署已訓(xùn)練好的檢測模型，例如硅谷電視劇的 Not Hotdog 檢測器應(yīng)用，會在復(fù)雜的深度學(xué)習(xí)歷程中有些成就感。目前已有幾十種流行的深度學(xué)習(xí)算法庫，參考網(wǎng)址：https

2018-06-04 22:32:12

【HarmonyOS HiSpark AI Camera】基于深度學(xué)習(xí)的目標(biāo)檢測系統(tǒng)設(shè)計

項(xiàng)目名稱：基于深度學(xué)習(xí)的目標(biāo)檢測系統(tǒng)設(shè)計試用計劃：嘗試在硬件平臺實(shí)現(xiàn)對Yolo卷積神經(jīng)網(wǎng)絡(luò)的加速運(yùn)算，期望提出的方法能夠使目標(biāo)檢測技術(shù)更便捷，運(yùn)用領(lǐng)域更廣泛。針對課題的研究一是研究基于開發(fā)板低功耗

2020-09-25 10:11:49

全網(wǎng)唯一一套labview深度學(xué)習(xí)教程：tensorflow+目標(biāo)檢測：龍哥教你學(xué)視覺—LabVIEW深度學(xué)習(xí)教程

`【新課上線】tensorflow+目標(biāo)檢測：龍哥教你學(xué)視覺—LabVIEW深度學(xué)習(xí)教程（強(qiáng)推）課程目標(biāo)：1、讓沒有任何python，tensorflow基礎(chǔ)的學(xué)員學(xué)習(xí)到如何搭建深度學(xué)習(xí)訓(xùn)練平臺。2

2020-08-10 10:38:12

吳恩達(dá)深度學(xué)習(xí)

吳恩達(dá)深度學(xué)習(xí) 第三課第三周 目標(biāo)檢測

2020-05-28 09:03:14

基于深度學(xué)習(xí)的異常檢測的研究方法

ABSTRACT1.基于深度學(xué)習(xí)的異常檢測的研究方法進(jìn)行結(jié)構(gòu)化和全面的概述2.回顧這些方法在各個領(lǐng)域這個中的應(yīng)用情況，并評估他們的有效性。3.根據(jù)基本假設(shè)和采用的方法將最先進(jìn)的深度異常檢測技術(shù)分為

2021-07-12 06:36:22

基于深度學(xué)習(xí)的異常檢測的研究方法

異常檢測的深度學(xué)習(xí)研究綜述原文：arXiv:1901.03407摘要異常檢測是一個重要的問題，在不同的研究領(lǐng)域和應(yīng)用領(lǐng)域都得到了很好的研究。本文的研究目的有兩個：首先，我們對基于深度學(xué)習(xí)的異常檢測

2021-07-12 07:10:19

如何利用OpenCV去實(shí)現(xiàn)一種輕量級目標(biāo)破檢測模型呢

講的是 NanoDet，后續(xù)可能會跟上NanoDet的相關(guān)文章2020年，在深度學(xué)習(xí)目標(biāo)檢測領(lǐng)域誕生了yolov4,yolov5和nanodet這些優(yōu)秀的檢測模型，有許多的微信公眾號報道這些算法模型。深度學(xué)習(xí)目標(biāo)

2022-09-21 16:48:46

遷移學(xué)習(xí)

經(jīng)典機(jī)器學(xué)習(xí)算法介紹章節(jié)目標(biāo)：機(jī)器學(xué)習(xí)是人工智能的重要技術(shù)之一，詳細(xì)了解機(jī)器學(xué)習(xí)的原理、機(jī)制和方法，為學(xué)習(xí)深度學(xué)習(xí)與遷移學(xué)習(xí)打下堅實(shí)的基礎(chǔ)。二、深度學(xué)習(xí)簡介與經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)介紹神經(jīng)網(wǎng)絡(luò)簡介神經(jīng)網(wǎng)絡(luò)組件簡介

2022-04-21 15:15:11

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：13-03 不同目標(biāo)檢測算法的精度對比

傳感器激光雷達(dá)檢測算法

Mr_haohao發(fā)布于 2022-09-23 09:24:22

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：13-07 目標(biāo)檢測行業(yè)應(yīng)用現(xiàn)狀-ADAS

傳感器激光雷達(dá)adasada

Mr_haohao發(fā)布于 2022-09-23 09:25:06

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：12-6 MTCNN模型（PNet、RNet、ONet

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:25:52

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：13-02 不同目標(biāo)檢測算法的優(yōu)缺點(diǎn)對比

傳感器激光雷達(dá)檢測算法

Mr_haohao發(fā)布于 2022-09-23 09:26:33

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：13-04 常見目標(biāo)檢測研究對象與數(shù)據(jù)集

傳感器激光雷達(dá)數(shù)據(jù)集

Mr_haohao發(fā)布于 2022-09-23 09:27:10

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：13-08 目標(biāo)檢測行業(yè)應(yīng)用現(xiàn)狀-文本檢測

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:27:49

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：12-3 MTCNN數(shù)據(jù)打包（PNet、RNet、ON

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:28:45

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：13-01 one-stage s two-stage

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:29:28

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：12-2 MTCNN數(shù)據(jù)打包（PNet、RNet、ON

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:30:26

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：11-3 人臉檢測+關(guān)鍵點(diǎn)多任務(wù)網(wǎng)絡(luò)數(shù)據(jù)集介紹

傳感器激光雷達(dá)數(shù)據(jù)集

Mr_haohao發(fā)布于 2022-09-23 09:31:02

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：12-4 MTCNN模型訓(xùn)練介紹

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:31:37

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：10-05 EAST文本檢測模型測試腳本編程實(shí)例

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:32:23

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：11-1 多任務(wù)網(wǎng)絡(luò)業(yè)務(wù)場景綜述】

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:32:58

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：09-12 其他檢測模型方法介紹

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:33:43

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：09-07 SegLink模型

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:34:26

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：09-06 EAST模型

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:35:07

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：10-02 ICDAR數(shù)據(jù)集介紹、標(biāo)注格式、下載等

傳感器激光雷達(dá)數(shù)據(jù)集

Mr_haohao發(fā)布于 2022-09-23 09:35:50

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：10-03 EAST文本檢測框架環(huán)境搭建

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:36:31

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：09-02 CTPN模型

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:37:09

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：09-04 FTSN模型

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:37:50

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：09-01 文本檢測算法原理介紹

傳感器激光雷達(dá)檢測算法

Mr_haohao發(fā)布于 2022-09-23 09:38:32

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：08-06 Yolo3檢測模型的測試介紹及編程實(shí)例

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:39:22

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：08-03 YOLO3DarkNet框架介紹和環(huán)境搭建

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:40:09

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：06-12 自己動手編程實(shí)現(xiàn)Faster RCNN模型

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:40:58

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：07-02 Yolo2算法（1）

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:41:40

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：07-03 Yolo2算法（2）

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:42:23

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：07-05 Yolo3算法

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:43:04

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：08-02 COCO數(shù)據(jù)集介紹、標(biāo)注格式、下載腳本等

傳感器激光雷達(dá)數(shù)據(jù)集

Mr_haohao發(fā)布于 2022-09-23 09:43:42

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：06-09 Faster RCNN目標(biāo)檢測框架配置修改

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:44:43

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：07-04 Yolo9000算法

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:45:19

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：06-10 Faster RCNN目標(biāo)檢測模型訓(xùn)練及其

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:46:06

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：06-11 利用Faster RCNN測試腳本進(jìn)行模型

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:46:46

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：06-08 Faster RCNN目標(biāo)檢測框架訓(xùn)練腳本

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:47:35

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：06-06 Faster RCNN目標(biāo)檢測環(huán)境搭建實(shí)操

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:48:15

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：06-05 Faster RCNN目標(biāo)檢測模型環(huán)境搭建

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:48:58

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：06-02 Kitti數(shù)據(jù)集介紹、標(biāo)注格式、下載等

傳感器激光雷達(dá)數(shù)據(jù)集

Mr_haohao發(fā)布于 2022-09-23 09:49:42

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：06-03 Kitti數(shù)據(jù)集類別提取編程實(shí)現(xiàn)

傳感器激光雷達(dá)數(shù)據(jù)集

Mr_haohao發(fā)布于 2022-09-23 09:50:29

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：05-03 SPPNet介紹

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:51:11

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：05-05 HyperNet、RFCN介紹

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:51:57

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：05-07 Cascade RCNN、CoupleNe

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:52:42

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：05-06 Light-Head RCNN、Mask-

傳感器激光雷達(dá)ASK

Mr_haohao發(fā)布于 2022-09-23 09:53:24

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：04-09 Caffe-SSD框架訓(xùn)練腳本講解+實(shí)操

傳感器激光SSD雷達(dá)SD

Mr_haohao發(fā)布于 2022-09-23 09:54:19

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：04-11 Caffe-SSD框架測試結(jié)果可視化與人臉

傳感器激光SSD雷達(dá)SD可視化

Mr_haohao發(fā)布于 2022-09-23 09:55:06

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：04-07 Caffe-SSD人臉檢測模型訓(xùn)練實(shí)操講解

傳感器激光SSD雷達(dá)SD

Mr_haohao發(fā)布于 2022-09-23 09:55:59

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：04-08 Caffe-SSD框架主干網(wǎng)絡(luò)腳本講解+實(shí)

傳感器激光SSD雷達(dá)SD

Mr_haohao發(fā)布于 2022-09-23 09:56:50

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：05-02 RCNN介紹

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:57:34

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：03-04 FSSD、RSSD算法

傳感器激光SSD雷達(dá)SD

Mr_haohao發(fā)布于 2022-09-23 09:58:12

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：04-03 Wider Face數(shù)據(jù)集介紹

傳感器激光雷達(dá)數(shù)據(jù)集

Mr_haohao發(fā)布于 2022-09-23 09:58:49

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：05-01 Faseter-Rcnn系列介紹

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 09:59:24

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：04-05 使用Caffe-SSD打包Wider Fa

傳感器激光SSD雷達(dá)SD

Mr_haohao發(fā)布于 2022-09-23 10:00:04

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：03-03 DSSD、DSOD算法

傳感器激光SSD雷達(dá)DSOSD

Mr_haohao發(fā)布于 2022-09-23 10:00:46

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：03-01 SSD系列算法介紹（主干網(wǎng)絡(luò)、多尺度Fea

傳感器激光SSD雷達(dá)SD

Mr_haohao發(fā)布于 2022-09-23 10:01:27

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：02-01 目標(biāo)檢測問題定義

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 10:02:04

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：02-05 常見傳統(tǒng)目標(biāo)檢測方法-HOG+SM（行人檢

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 10:02:40

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：02-08 Two-stage基本介紹，流程與常見算法

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 10:03:16

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：02-12 One-stage與Two-stage優(yōu)缺

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 10:03:52

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：02-07 常見傳統(tǒng)目標(biāo)檢測方法-Sofe-NMS（非

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 10:04:33

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：02-03 傳統(tǒng)目標(biāo)檢測方法基本流程

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 10:05:08

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：02-04 常見傳統(tǒng)目標(biāo)檢測方法-iola-Jones

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 10:05:49

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：02-06 常見傳統(tǒng)目標(biāo)檢測方法-DPM（物體檢測）

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 10:06:24

#硬聲創(chuàng)作季基于激光雷達(dá)數(shù)據(jù)的深度學(xué)習(xí)目標(biāo)檢測方法：02-10 One-stage基本介紹、流程與常見算法

傳感器激光雷達(dá)

Mr_haohao發(fā)布于 2022-09-23 10:06:58

基于深度學(xué)習(xí)的圖片中商品參數(shù)識別方法

計算機(jī)計算性能的提升使得深度學(xué)習(xí)成為了可能．作為計算機(jī)視覺領(lǐng)域的重要發(fā)展方向之一的目標(biāo)檢測也開始結(jié)合深度學(xué)習(xí)方法并廣泛應(yīng)用于各行各業(yè)，受限于網(wǎng)絡(luò)的復(fù)雜度和檢測算法的設(shè)計。目標(biāo)檢測的速度和精度成為

2017-12-15 10:15:02

基于深度自編碼網(wǎng)絡(luò)的慢速移動目標(biāo)檢測

自編碼網(wǎng)絡(luò)算法，在時頻域提取針對目標(biāo)的深度抽象信息進(jìn)行目標(biāo)檢測，以準(zhǔn)確感知環(huán)境變化。仿真結(jié)果表明，與支持向量機(jī)、超限學(xué)習(xí)機(jī)和后向傳播神經(jīng)網(wǎng)絡(luò)等傳統(tǒng)機(jī)器學(xué)習(xí)相比，該方法可以有效感知環(huán)境變化，具有較高的魯棒性和

2018-03-29 11:29:40

人工智能深度學(xué)習(xí)目標(biāo)檢測的詳細(xì)資料免費(fèi)下載

　本文檔的主要內(nèi)容詳細(xì)介紹的是人工智能深度學(xué)習(xí)目標(biāo)檢測的詳細(xì)資料包括了：RCNN，F(xiàn)ast RCNN ，F(xiàn)aster RCNN ，YOLO，SSD

2018-08-08 17:55:14

基于深度學(xué)習(xí)模型的點(diǎn)云目標(biāo)檢測及ROS實(shí)現(xiàn)

近年來，隨著深度學(xué)習(xí)在圖像視覺領(lǐng)域的發(fā)展，一類基于單純的深度學(xué)習(xí)模型的點(diǎn)云目標(biāo)檢測方法被提出和應(yīng)用，本文將詳細(xì)介紹其中一種模型——SqueezeSeg，并且使用ROS實(shí)現(xiàn)該模型的實(shí)時目標(biāo)檢測。

2018-11-05 16:47:29

17181

如何使用深度學(xué)習(xí)進(jìn)行視頻行人目標(biāo)檢測

近年來，隨著深度學(xué)習(xí)在計算機(jī)視覺領(lǐng)域的廣泛應(yīng)用，基于深度學(xué)習(xí)的視頻運(yùn)動目標(biāo)檢測受到廣大學(xué)者的青睞。這種方法的基本原理是利用大量目標(biāo)樣本數(shù)據(jù)訓(xùn)練一個基于深度神經(jīng)網(wǎng)絡(luò)的分類器，然后通過分類器在線檢測目標(biāo)

2018-11-19 16:01:44

探究深度學(xué)習(xí)在目標(biāo)視覺檢測中的應(yīng)用與展望

目標(biāo)視覺檢測是計算機(jī)視覺領(lǐng)域的一個重要問題，在視頻監(jiān)控、自主駕駛、人機(jī)交互等方面具有重要的研究意義和應(yīng)用價值.近年來，深度學(xué)習(xí)在圖像分類研究中取得了突破性進(jìn)展，也帶動著目標(biāo)視覺檢測取得突飛猛進(jìn)的發(fā)展。

2019-01-13 10:59:23

5482

GitHub nanodet開源移動端實(shí)時的Anchor-free檢測模型，上線僅兩天Star量已經(jīng)超過200

目標(biāo)檢測一直是計算機(jī)視覺領(lǐng)域的一大難題，其目標(biāo)是找出圖像中的所有感興趣區(qū)域，并確定這些區(qū)域的位置和類別。目標(biāo)檢測中的深度學(xué)習(xí)方法已經(jīng)發(fā)展了很多年，并出現(xiàn)了不同類型的檢測方法。目前，深度學(xué)習(xí)目標(biāo)檢測

2020-12-03 16:06:40

2179

一種基于深度學(xué)習(xí)的焊點(diǎn)位置檢測方法

大及魯棒性差的問題，提出一種基于深度學(xué)習(xí)的焊點(diǎn)位置檢測方法。引入 Mobilenetv2的卷積結(jié)構(gòu)代替 YOLOV2的卷積層，并借鑒YOLOⅴ2的細(xì)粒度特征的方法，解決YOLOⅴ模型參數(shù)較多的問題。采用 Glou loss對模型的損失函數(shù)進(jìn)行改進(jìn)，利用K- means聚類算法得到適合焊

2021-03-17 11:18:01

基于深度學(xué)習(xí)的顯著性目標(biāo)檢測的數(shù)據(jù)集和評估準(zhǔn)則

介紹并給出了顯著性圖，同時對三種類型方法進(jìn)行了定性分析比較;然后簡單介紹了基于深度學(xué)習(xí)的顯著性目標(biāo)檢測常用的欻據(jù)集和評估準(zhǔn)則;接著對所提基于深度學(xué)習(xí)的昰著性目標(biāo)檢測方法在多個數(shù)據(jù)集上進(jìn)行了性能比較，包括定量比較、

2021-04-01 14:58:13

一種基于深度學(xué)習(xí)的船舶檢測方法

針對復(fù)雜海情下需要對不同大小及種類的船舶進(jìn)行檢測的問題，提岀一種基于深度學(xué)習(xí)的船舶檢測方法，該方法主要針對區(qū)域全卷積網(wǎng)絡(luò)（R-FCN）進(jìn)行改進(jìn)。首先選取 Resnet50網(wǎng)絡(luò)用于自動提取特征，并將

2021-04-13 10:50:09

解析在目標(biāo)檢測中怎么解決小目標(biāo)的問題？

導(dǎo)讀本文介紹了一些小目標(biāo)物體檢測的方法和思路。在深度學(xué)習(xí)目標(biāo)檢測中，特別是人臉檢測中，由于分辨率低、圖像模糊、信息少、噪聲多，小目標(biāo)和小人臉的檢測一直是一個實(shí)用和常見的難點(diǎn)問題。然而，在過去幾年

2021-04-26 14:13:58

5926

基于深度學(xué)習(xí)的目標(biāo)檢測算法

整體框架 目標(biāo)檢測算法主要包括：【兩階段】目標(biāo)檢測算法、【多階段】目標(biāo)檢測算法、【單階段】目標(biāo)檢測算法什么是兩階段目標(biāo)檢測算法，與單階段目標(biāo)檢測有什么區(qū)別？兩階段目標(biāo)檢測算法因需要進(jìn)行兩階

2021-04-30 10:22:04

10070

OpenCV使用深度學(xué)習(xí)做邊緣檢測的流程

導(dǎo)讀分析了Canny的優(yōu)劣，并給出了OpenCV使用深度學(xué)習(xí)做邊緣檢測的流程。在這篇文章中，我們將學(xué)習(xí)如何在OpenCV中使用基于深度學(xué)習(xí)的邊緣檢測，它比目前流行的canny邊緣檢測器更精

2021-05-08 11:05:30

1923

基于深度學(xué)習(xí)的目標(biāo)檢測研究綜述

基于深度學(xué)習(xí)的目標(biāo)檢測研究綜述來源：《電子學(xué)報》?，作者羅會蘭等摘要：?目標(biāo)檢測是計算機(jī)視覺領(lǐng)域內(nèi)的熱點(diǎn)課題，在機(jī)器人導(dǎo)航、智能視頻監(jiān)控及航天航空等領(lǐng)域都有廣泛的應(yīng)用.本文首先綜述了目標(biāo)檢測

2022-01-06 09:14:58

1702

基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測研究

檢測并獲得更好的性能是一項(xiàng)重要的研究。首先回顧和介紹了幾類經(jīng)典的目標(biāo)檢測算法;然后將深度學(xué)習(xí)算法的產(chǎn)生過程作為切入點(diǎn)，以系統(tǒng)的方式全面概述了各種目標(biāo)檢測方法;最后針對目標(biāo)檢測和深度學(xué)習(xí)算法面臨的重大挑戰(zhàn)，討論了一些未來的方向，以促進(jìn)深度學(xué)習(xí)對目標(biāo)檢測的研究。

2022-02-11 08:51:11

1144

基于深度學(xué)習(xí)的三種目標(biāo)檢測方法

目標(biāo)檢測是計算機(jī)視覺的一個非常重要的核心方向，它的主要任務(wù)目標(biāo)定位和目標(biāo)分類。

2022-04-06 14:56:38

6269

基于深度學(xué)習(xí)的小樣本墻壁缺陷目標(biāo)檢測及分類

近年來，無需人工干預(yù)的深度學(xué)習(xí)已經(jīng)成為缺陷圖像檢測與分類的一種主流方法。本文針對室內(nèi)墻壁缺陷缺檢測中數(shù)據(jù)集大多是小樣本的問題，提出了相關(guān)的深度學(xué)習(xí)研究方法。首先，自制墻壁表面缺陷數(shù)據(jù)集（Wall

2022-04-24 09:44:16

深度學(xué)習(xí)在目標(biāo)檢測中的應(yīng)用

R-CNN 算法在 2014 年提出，可以說是歷史性的算法，將深度學(xué)習(xí)應(yīng)用于目標(biāo)檢測領(lǐng)域，相較于之前的目標(biāo)檢測方法，提升多達(dá) 30% 以上

2022-10-31 10:08:05

1143

基于MobileNet的多目標(biāo)跟蹤深度學(xué)習(xí)算法

針對深度學(xué)習(xí)算法在多目標(biāo)跟蹤中的實(shí)時性問題, 提出一種基于MobileNet的多目標(biāo)跟蹤算法. 借助于MobileNet深度可分離卷積能夠?qū)?b class="flag-6" style="color: red">深度網(wǎng)絡(luò)模型進(jìn)行壓縮的原理, 將YOLOv3主干網(wǎng)絡(luò)替換

2022-11-09 10:23:30

736

基于深度學(xué)習(xí)的復(fù)雜背景下目標(biāo)檢測

目標(biāo)檢測是計算機(jī)視覺領(lǐng)域的重要研究方向. 傳統(tǒng)的目標(biāo)檢測方法在特征設(shè)計上花費(fèi)了大量時間, 且手工設(shè)計的特征對于目標(biāo)多樣性的問題并沒有好的魯棒性, 深度學(xué)習(xí)技術(shù)逐漸成為近年來計算機(jī)視覺領(lǐng)域的突破口

2022-12-01 10:00:01

534

簡述深度學(xué)習(xí)的基準(zhǔn)目標(biāo)檢測及其衍生算法

基于深度學(xué)習(xí)的目標(biāo)檢測方法根據(jù)有無區(qū)域提案階段劃分為區(qū)域提案檢測模型和單階段檢測模型

2023-02-27 15:31:49

814

基于強(qiáng)化學(xué)習(xí)的目標(biāo)檢測算法案例

摘要：基于強(qiáng)化學(xué)習(xí)的目標(biāo)檢測算法在檢測過程中通常采用預(yù)定義搜索行為，其產(chǎn)生的候選區(qū)域形狀和尺寸變化單一，導(dǎo)致目標(biāo)檢測精確度較低。為此，在基于深度強(qiáng)化學(xué)習(xí)的視覺目標(biāo)檢測算法基礎(chǔ)上，提出聯(lián)合回歸與深度

2023-07-19 14:35:02

基于深度學(xué)習(xí)的道路小目標(biāo)檢測優(yōu)化方法

在使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取時，不同的網(wǎng)絡(luò)深度對應(yīng)不同層次的特征。低層特征的分辨率更高，像素更豐富，包含更多的細(xì)節(jié)信息和位置信息，對于目標(biāo)的定位有極大幫助，但包含的語義信息較少。

2023-11-07 12:33:14

284

深度學(xué)習(xí)在植物病害目標(biāo)檢測研究進(jìn)展

植物病害準(zhǔn)確檢測與識別是其早期診斷與智能監(jiān)測的關(guān)鍵，是病蟲害精準(zhǔn)化防治與信息化管理的核心。深度學(xué)習(xí)應(yīng)用于植物病害檢測與識別中，可以克服傳統(tǒng)診斷方法的弊端，大幅提升病害檢測與識別的準(zhǔn)確率，引起了廣泛

2023-11-20 17:19:42

247

已全部加載完成

搜索歷史

基于深度學(xué)習(xí)的目標(biāo)檢測方法

評論