今天我們不說計算機視覺基礎知識,接下來說說AAAI2019一篇比較新穎的Paper,其是中科院自動化所和京東AI研究院聯(lián)合的結果,在Wider Face數(shù)據(jù)集中達到了較高的水準,比arxiv2019_VIM-FD的更好一些。
Improved SRN
人臉檢測作為計算機視覺中的一個長期存在的問題,由于其實際應用,近幾十年來一直受到人們的關注。
隨著人臉檢測基準數(shù)據(jù)集的廣泛應用,近年來各種算法都取得了很大的進展。其中,Selective Refinement Network(SRN)人臉檢測器有選擇地將分類和回歸操作引入到anchor-based的人臉檢測器中,以減少假陽性同時提高定位精度。此外,它還設計了一個感受野增強塊,以提供更多樣化的感受野。
為了進一步提高SRN的性能,通過大量的實驗,開發(fā)了現(xiàn)有的一些技術,包括新的數(shù)據(jù)增強策略、改進的backbone network、MS COCO預訓練、解耦分類模塊(decoupled classification module)、分割分支和壓縮激勵塊(Squeeze-and-Excitation block)。
其中,一些技術帶來了性能改進,因此,將這些有用的技術結合在一起,提出了一種改進的SRN人臉檢測器,并在廣泛使用的人臉檢測基準的人臉數(shù)據(jù)集上獲得了最佳的性能。
人臉檢測其實比較簡單,就是將圖像輸入算法框架中,最終返回輸入圖像中目標人臉的bounding box。
Review of Baseline
接下來,我們先簡要回顧Selective Refinement Network(SRN)。如下圖1所示,它包括選擇性兩步分類(STC)、選擇性兩步回歸(STR)和感受野增強(RFE),這三個模塊的詳細說明如下。
圖1 SRN。它包括選擇性兩步分類(STC)、選擇性兩步回歸(STR)和感受野增強(RFE)。
01
S T C
對于單級檢測器,大量的正負樣本比的anchor(例如,大約有300k個anchor,SRN中的正/負比約為0.006%)導致了相當多的假陽性。因此,它需要另一個階段,如RPN過濾掉一些負樣本。選擇性兩步分類是從RefineDet繼承而來的,有效地拒絕了大量的負樣本anchor,緩解了類不平衡問題。
STC作用于淺層Feature Map上,來過濾掉大部分比驕傲容易區(qū)分的負樣本,來減少搜索空間。
02
S T R
像Cascade RCNN這樣的多步回歸可以提高Bounding Box位置的準確性,特別是在一些具有挑戰(zhàn)性的場景中,例如MS COCO風格的評估指標。然而,將多步回歸應用于人臉檢測任務中,如果不仔細考慮,可能會影響檢測結果。
STR作用于高層Feature Map上,用來粗略調(diào)整anchor的尺度、位置(類似于RefineDet中ARM的回歸任務),并進一步為高層Feature Map上的回歸器提供refined后的anchor位置初始化(類似于RefineDet中ODM的回歸任務)。
03
R F E
當前網(wǎng)絡通常都具有square感受野,這影響了對不同高寬比目標的檢測。為了解決這個問題,SRN設計了一個感受野增強(RFE),在預測類和位置之前,將特征的感受野多樣化,這有助于在某些極端姿勢中很好地捕捉到人臉。
-
算法
+關注
關注
23文章
4623瀏覽量
93104 -
人臉識別
+關注
關注
76文章
4014瀏覽量
82083
原文標題:重磅!目前最強性能的人臉檢測算法(Wider Face Dataset)
文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論