0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

GA-RPN:Region Proposal by Guided Anchoring 引導錨點的建議區(qū)域網(wǎng)絡

jf_96884364 ? 來源:代碼的路 ? 作者:代碼的路 ? 2023-01-12 09:32 ? 次閱讀

原文鏈接

論文地址:https://arxiv.org/pdf/1901.03278.pdf

代碼地址:GitHub - open-mmlab/mmdetection: OpenMMLab Detection Toolbox and Benchmark

1.RPN

RPN即Region Proposal Network,是用RON來選擇感興趣區(qū)域的,即proposal extraction。例如,如果一個區(qū)域的p>0.5,則認為這個區(qū)域中可能是80個類別中的某一類,具體是哪一類現(xiàn)在還不清楚。到此為止,網(wǎng)絡只需要把這些可能含有物體的區(qū)域選取出來就可以了,這些被選取出來的區(qū)域又叫做ROI(Region of Interests),即感興趣的區(qū)域。當然RPN同時也會在feature map上框定這些ROI感興趣區(qū)域的大致位置,即輸出Bounding Box。

RPN詳細介紹:https://mp.weixin.qq.com/s/VXgbJPVoZKjcaZjuNwgh-A

2.Guided Anchoring

通常用(x,y,w,h)來描述一個anchor,即中心點坐標和寬高。文章將anchor的分布用條件概率來表示,公式為:

p(x,y,w,h|I)=p(x,y|I)p(w,h|x,y,I)

兩個條件概率的分布,代表給定圖像特征之后anchor的 中心點概率分布 ,和給定圖像特征和中心點之后的 形狀概率分布 。這樣看來,原來我們所獲取anchor的方法就可以看成上述條件概率分布的一個特例,即p(x,y|I)是均勻分布而p(w,h|x,y,I)是沖激函數(shù)。

根據(jù)上面的公式,anchor的生成過程可以分解為兩個步驟,anchor位置預測和形狀預測。

論文中用到的方法如下:

這個框架就是在原始的RPN的特征圖基礎上,采用兩個分值分別預測anchor的位置和形狀,然后再結(jié)合到一起得到anchor。之后采用一個Feature Adaption模塊進行anchor特征的調(diào)整,得到新的特征圖供之后的預測使用(anchor的分類和回歸)。整個方法可以端到端訓練,而且相比之前只是增加了3個1×1 conv 和一個3×3 deformable conv,帶來的模型參數(shù)量變化很小。

(1)位置預測

位置預測分支的目標是預測哪些區(qū)域應該作為中心點來生成anchor,也是一個二分類問題,但是不同于RPN的分類,我們并不是預測每個點是前景還是背景,而是預測是不是物體中心。

我們將整個feature map的區(qū)域分為物體中心區(qū)域、外圍區(qū)域和忽略區(qū)域,大致思路就是將groundtruth 框的中心一小塊對應在feature map上的區(qū)域標為物體中心區(qū)域,在訓練的時候作為 正樣本 ,其余區(qū)域按照離中心的距離標為忽略或者 負樣本 。最后通過選擇對應概率值高于預定閾值的位置來確定可能存在對象活動的區(qū)域。F1 對輸入的特征圖使用 1×1 的卷積,得到與 F1 相同分辨率的輸出,N_L 得到輸出的每個位置的值表示原圖I上對應位置出現(xiàn)物體的可能性,也就是概率圖,最后通過選擇對應概率值高于預定閾值的位置來確定可能存在對象活動的區(qū)域。

通過位置預測,我們可以篩選出一小部分區(qū)域作為anchor的候選中心點位置,使得anchor數(shù)量大大降低。這樣在最后我們就可以只針對有anchor的地方進行計算。

(2)形狀預測

形狀預測分支是目標是給定anchor中心點,預測最佳的長和寬,這是一個回歸問題。

采用1×1的卷積網(wǎng)絡 N_s 輸入 F_1,輸出與 F_1 尺寸相同的2通道的特征圖,每個通道分別代表 dw 和 dh,表示每個位置可能的最好的 anchor 尺寸。雖然我們的預測目標是 w 和 h,但是直接預測這兩個數(shù)字不穩(wěn)定,因為范圍很大,所以將空間近似 [0,1000] 映射到了 [-1,1] 中,公式為:

w=\\sigma \\times s \\times e^{dw},w=\\sigma \\times s \\times e^{dh}

其中 s 是步幅,σ 是經(jīng)驗因子,實驗中取 σ=8。實驗中產(chǎn)生 dw,dh 的雙通道映射,通過這個方程實現(xiàn)了逐像素轉(zhuǎn)換。文章中直接用 IOU 作為監(jiān)督來學習 w 和 h。

對于 anchor 和 ground truth 匹配問題,傳統(tǒng) RPN 都是直接計算 anchor 和所有 ground truth 的 IOU,然后將anchor 匹配給 IOU 最大的那個 ground truth,但是現(xiàn)在由于我們的改進,anchor 的 w 和 h 都是不確定的,是一個需要預測的變量。文中將這個 anchor 和某個 ground truth 的 IOU 表示為:

vIOU(a_{wh},gt)=\\max_{w>0,h>0}IOU_{normal}(a_{wh},gt)

我們不可能把所有可能的 w 和 h 遍歷一遍求 IOU 的最大值,文中采用了9組可能的 w 和 h 作為樣本,近似效果已經(jīng)足夠。

到這里我們就可以生成 anchor 了。這時所生成的 anchor 就是稀疏而且每個位置不一樣的。實驗可得此時的平均 recall 已經(jīng)超過普通的 RPN 了,僅僅是增加了兩個 conv。

(3)特征精調(diào)模塊

由于每個位置的形狀不同,大的anchor對應較大感受野,小的anchor對應小的感受野。所以不能像之前基于anchor的方法那樣直接對feature map進行卷積來預測,而是要對feature map進行feature adaptation。作者利用可變形卷積(deformable convolution)的思想,根據(jù)形狀對各個位置單獨進行轉(zhuǎn)換。

方法就是把anchor的形狀信息直接融入到特征圖當中,得到新的特征圖去適應每個位置anchor的形狀。這里就利用了上述的3×3的可變形卷積進行對原始特征圖的修正,可變形卷積的變化量是通過anchor的w和h經(jīng)過一個1×1 conv得到的。

f'_i=N_t(f_i,w_i,h_i)

其中,fi 是第 i 個位置的特征,(wi, hi) 是對應的 anchor 形狀。NT 通過 3×3 的變形卷積實現(xiàn)。首先通過形狀預測分支預測偏移字段 offset field,然后對帶偏移的原始 feature map 做變形卷積獲得 adapted features。之后進一步做分類和 bounding box 回歸。

通過這樣的操作,達到了讓 feature 的有效范圍和 anchor 形狀更加接近的目的,同一個 conv 的不同位置也可以代表不同形狀大小的 anchor 了。

文中實驗結(jié)果示例:

學習更多編程知識,請關注我的公眾號:

[代碼的路]

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4773

    瀏覽量

    100889
  • 代碼
    +關注

    關注

    30

    文章

    4801

    瀏覽量

    68731
收藏 人收藏

    評論

    相關推薦

    和普威視DF3000重區(qū)域視頻安全防范系統(tǒng)

    和普威視重點區(qū)域視頻安全防范系統(tǒng)(以下簡稱DF3000),是集用戶管理、視頻監(jiān)控、二三維電子地圖、人車物目標識別、區(qū)域智能管控于一身的綜合性安全防范平臺。系統(tǒng)從實際業(yè)務需求出發(fā),結(jié)合音視頻技術(shù)、深度學習技術(shù)、網(wǎng)絡通信技術(shù)和軟件平
    的頭像 發(fā)表于 01-06 15:22 ?53次閱讀
    和普威視DF3000重<b class='flag-5'>點</b><b class='flag-5'>區(qū)域</b>視頻安全防范系統(tǒng)

    激光焊接技術(shù)在焊接醫(yī)療引導管的工藝應用

    的激光束照射在工件接縫處,使材料在微小區(qū)域內(nèi)迅速熔化并形成焊接接頭。相較于傳統(tǒng)焊接方式,激光焊接機具有高精度、高效率、高質(zhì)量焊縫等特點,特別適用于薄壁材料和精密零件的焊接。 激光焊接技術(shù)在焊接醫(yī)療引導管的工藝具體
    的頭像 發(fā)表于 11-15 15:56 ?152次閱讀
    激光焊接技術(shù)在焊接醫(yī)療<b class='flag-5'>引導</b>管的工藝應用

    “中國芯”產(chǎn)業(yè)的十年歷程和國內(nèi)集成電路區(qū)域發(fā)展研究(下篇)

    ”“區(qū)域內(nèi)部擴張型遷移”“政府引導基金驅(qū)動”等特點,并分析面臨的主要問題,同時提出在新發(fā)展格局下我國集成電路產(chǎn)業(yè)區(qū)域發(fā)展的相關建議。一、我國集成電路產(chǎn)業(yè)
    的頭像 發(fā)表于 10-30 08:08 ?531次閱讀
    “中國芯”產(chǎn)業(yè)的十年歷程和國內(nèi)集成電路<b class='flag-5'>區(qū)域</b>發(fā)展研究(下篇)

    VL53L1CB TOF開發(fā)(2)----多區(qū)域掃描模式

    , FoV)為多個感興趣區(qū)域Region of Interest, ROI),并對每個區(qū)域分別進行測距,為需要廣域監(jiān)控和多目標檢測的應用提供了理想的解決方案。 在多區(qū)域掃描模式下,
    的頭像 發(fā)表于 10-09 10:38 ?1132次閱讀
    VL53L1CB TOF開發(fā)(2)----多<b class='flag-5'>區(qū)域</b>掃描模式

    AWR294x主引導加載程序和輔助引導加載程序

    電子發(fā)燒友網(wǎng)站提供《AWR294x主引導加載程序和輔助引導加載程序.pdf》資料免費下載
    發(fā)表于 09-06 09:47 ?0次下載
    AWR294x主<b class='flag-5'>引導</b>加載程序和輔助<b class='flag-5'>引導</b>加載程序

    GA-Z77-DS3H主板電路圖

    技嘉GA-Z77-DS3H主板電路圖583304 GA-Z77-DS3H-R10.pdf
    發(fā)表于 07-29 13:18 ?11次下載

    SM2082GA單通道LED線性恒流控制芯片中文手冊

    SM2082GA鉦銘科LED驅(qū)動芯片規(guī)格書
    發(fā)表于 07-13 13:00 ?3次下載

    UWB-AOA單點數(shù)字鑰匙與雷達

    創(chuàng)始人&CEO都延星表示,全跡ONE與CCC、ICCE等數(shù)字鑰匙標準兼容。在標準的TOF測距過程中,AOA可自動獲取UWB鑰匙的角度+距離,即單次TOF可完成
    的頭像 發(fā)表于 07-11 17:18 ?524次閱讀
    UWB-AOA單<b class='flag-5'>錨</b>點數(shù)字鑰匙與雷達

    激光焊接視覺定位引導方法

    激光焊接是一種高效、精確的焊接技術(shù),廣泛應用于汽車制造、航空航天、電子產(chǎn)品等領域。隨著工業(yè)自動化和智能化的發(fā)展,激光焊接的精度和效率需求日益增加。在此背景下,視覺定位引導技術(shù)成為提升激光焊接質(zhì)量
    的頭像 發(fā)表于 05-28 10:34 ?537次閱讀
    激光焊接視覺定位<b class='flag-5'>引導</b>方法

    鴻蒙ArkUI開發(fā):常用布局【相對布局】

    相對布局可以讓子元素指定兄弟元素或父容器作為,基于做位置布局
    的頭像 發(fā)表于 05-14 20:50 ?615次閱讀
    鴻蒙ArkUI開發(fā):常用布局【相對布局】

    Microsoft Azure墨西哥區(qū)域正式發(fā)布(GA)!

    Azure是全球三大公有云中第一家上線墨西哥區(qū)域的云平臺!
    的頭像 發(fā)表于 05-13 10:27 ?395次閱讀

    訊維通信技術(shù)在跨區(qū)域企業(yè)通信網(wǎng)絡整合中的應用案例

    訊維通信技術(shù)在跨區(qū)域企業(yè)通信網(wǎng)絡整合中展現(xiàn)出卓越的應用效果。以下是具體的應用案例: 某大型跨國企業(yè),因業(yè)務擴展需要,需要在全球范圍內(nèi)整合其通信網(wǎng)絡。該企業(yè)面臨著地域分散、網(wǎng)絡結(jié)構(gòu)復雜、
    的頭像 發(fā)表于 04-19 16:30 ?466次閱讀

    如何為你的應用選擇UWB的拓撲結(jié)構(gòu)?

    要了解UWB系統(tǒng),您需要理解和標簽這兩個術(shù)語。通常就是固定的UWB設備。標簽通常是指移動的UWB設備。
    的頭像 發(fā)表于 04-13 11:48 ?975次閱讀
    如何為你的應用選擇UWB的拓撲結(jié)構(gòu)?

    stm32H705xb jlink調(diào)試不穩(wěn)定怎么解決?

    */ MPU_InitStruct.Enable = MPU_REGION_ENABLE; MPU_InitStruct.BaseAddress = 0x24000000; //區(qū)域基地
    發(fā)表于 04-10 07:28

    華為公開兒童行為引導專利

    其摘要內(nèi)容指出,該方法首先識別兒童不良行為并進行初次引導;隨后針對不良行為發(fā)生次數(shù)及初次引導后改善情況開展進一步引導;根據(jù)每個孩子的不良行為特性與接收成效來精確判定最合適的引導時機,制
    的頭像 發(fā)表于 01-17 09:54 ?540次閱讀
    華為公開兒童行為<b class='flag-5'>引導</b>專利