0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

COCO單模型測試取得新紀(jì)錄:60.6 AP

新機(jī)器視覺 ? 來源:新智元 ? 作者:袁路 ? 2021-06-23 16:02 ? 次閱讀

隨著注意力機(jī)制在自然語言處理和計(jì)算機(jī)視覺等多個(gè)人工智能領(lǐng)域風(fēng)靡,計(jì)算機(jī)視覺領(lǐng)域刷榜之爭可謂是進(jìn)入白熱化階段。

近期大量工作刷新現(xiàn)有各項(xiàng)任務(wù)SOTA:前腳谷歌剛在圖像識別ImageNet上準(zhǔn)確度超過90,緊接著微軟又在目標(biāo)檢測COCO上AP超過60。

在一篇CVPR 2021 論文中,來自微軟的研究者提出多重注意力機(jī)制統(tǒng)一目標(biāo)檢測頭方法Dynamic Head, 可插拔特性提高多種目標(biāo)檢測框架的性能。

在Transformer骨干和額外數(shù)據(jù)加持下,COCO單模型測試取得新紀(jì)錄:60.6 AP。

方法概述

本文首先對現(xiàn)有目標(biāo)檢測頭的改進(jìn)工作進(jìn)行了總結(jié),發(fā)現(xiàn)近期方法主要通過三個(gè)不同的角度出發(fā)進(jìn)行目標(biāo)檢測性能的提升:

尺度感知:目標(biāo)尺度的差異對應(yīng)了不同尺度的特征,改進(jìn)不同級的表達(dá)能力可以有效提升目標(biāo)檢測器的尺度感知能力;

空間位置:不相似目標(biāo)形狀的不同幾何變換對應(yīng)了特征的不同空間位置,改進(jìn)不同空間位置的表達(dá)能力可以有效提升目標(biāo)檢測器的空間位置感知能力;

多任務(wù):目標(biāo)表達(dá)與任務(wù)的多樣性對應(yīng)了不同通道特征,改進(jìn)不同通道的表達(dá)能力可以有效提升目標(biāo)檢測的任務(wù)感知能力。

本文提出一種新穎的動態(tài)頭框架,它采用多注意力機(jī)制將不同的目標(biāo)檢測頭進(jìn)行統(tǒng)一。

通過特征層次之間的注意力機(jī)制用于尺度感知,空間位置之間的注意力機(jī)制用于空間感知,輸出通道內(nèi)的注意力機(jī)制用于任務(wù)感知,該方法可以在不增加計(jì)算量的情況顯著提升模型目標(biāo)檢測頭的表達(dá)能力。

為了達(dá)成以上目的,本文對特征金字塔進(jìn)行重構(gòu),將不同層級的特征統(tǒng)一到一個(gè)3D張量,并發(fā)現(xiàn)在不同維度引入注意力機(jī)制可以提高對尺度,空間位置和多任務(wù)的感知能力。

因此上述方向可以統(tǒng)一到一個(gè)高效注意力學(xué)習(xí)問題中。本文也是首個(gè)嘗試采用多注意力機(jī)制將三個(gè)維度組合構(gòu)建統(tǒng)一頭并最大化其性能的工作。

作者將注意力函數(shù)轉(zhuǎn)換為三個(gè)序列子注意力函數(shù)來解決傳統(tǒng)注意力函數(shù)在高維度導(dǎo)致計(jì)算量激增的問題。

每個(gè)注意力函數(shù)僅聚焦一個(gè)維度:基于SE模塊的尺度自注意函數(shù)π_L, 基于可變形卷積的空間自注意函數(shù)π_S 和 基于動態(tài)ReLU激活函數(shù)的多任務(wù)的自注意函數(shù)π_C。

作者將三種自注意函數(shù)進(jìn)行堆疊,形成一個(gè)可輕易插拔的模塊DyHead,并將其應(yīng)用于多種目標(biāo)檢測框架中。

實(shí)驗(yàn)結(jié)果

作者首先分析了的計(jì)算效率。當(dāng)采用6個(gè)模塊時(shí),模型性能提升達(dá)到最大,而計(jì)算量提升相比骨干網(wǎng)絡(luò)可以忽略。

作者將DyHead集成到不同檢測器進(jìn)行性能對比,發(fā)現(xiàn)所提DyHead可以一致性提升所有主流目標(biāo)檢測器性能:1.2~3.2AP,展示了優(yōu)異的可插拔擴(kuò)展性能。

在與其他目標(biāo)檢測方法的對比中,所提方案以較大的優(yōu)勢超越了流行方案。相比僅采用多尺度尋覽的方法,所提方案僅需2x訓(xùn)練即可取得新的SOTA指標(biāo)52.3AP。相對于谷歌提出的EfficientDet與SpineNet,所提方法訓(xùn)練時(shí)間更少(僅1/20);

當(dāng)同時(shí)采用多尺度訓(xùn)練與測試時(shí),所提方法取得了新的SOTA指標(biāo)54.0AP,以1.3AP指標(biāo)優(yōu)于此前最佳。

當(dāng)引入更優(yōu)異的Transformer骨干網(wǎng)絡(luò)、以及通過類似于谷歌自我學(xué)習(xí)方法生成的額外偽框的ImageNet數(shù)據(jù)后,所提方案取得了COCO新的記錄:60.6 AP,成為首個(gè)超過60的單模型方法。

責(zé)任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:刷新記錄! CVPR2021全新目標(biāo)檢測機(jī)制達(dá)到SOTA!

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    JCMsuite—單模光纖傳播模式

    所需參數(shù)的詳細(xì)描述。 下圖顯示了兩個(gè)計(jì)算本征模的電場的z分量(對數(shù)尺度下)。兩者都屬于相同的有效折射率,屬于雙重簡并。特征值存儲在文件eigenvalues.jcm中。 之后彎曲單模光纖教程會說明如何計(jì)算彎曲單模光纖的基本傳播模式。
    發(fā)表于 01-09 08:57

    光纖單模 雙模怎么看

    要區(qū)分光纖是單模還是雙模(通常所說的“雙?!惫饫w實(shí)際上是指多模光纖),可以通過以下幾種方法: 一、顏色區(qū)分 單模光纖:通常用黃色表示,其接頭和保護(hù)套為藍(lán)色。 多模光纖:一般用橙色或灰色來表示,接頭
    的頭像 發(fā)表于 11-14 09:56 ?3221次閱讀

    NVIDIA文本嵌入模型NV-Embed的精度基準(zhǔn)

    NVIDIA 的最新嵌入模型 NV-Embed —— 以 69.32 的分?jǐn)?shù)創(chuàng)下了嵌入準(zhǔn)確率的新紀(jì)錄海量文本嵌入基準(zhǔn)測試(MTEB)涵蓋 56 項(xiàng)嵌入任務(wù)。
    的頭像 發(fā)表于 08-23 16:54 ?2021次閱讀
    NVIDIA文本嵌入<b class='flag-5'>模型</b>NV-Embed的精度基準(zhǔn)

    如何解決單模光模塊使用多模光纖的問題

    單模光模塊和多模光模塊是兩種不同類型的光模塊,它們在光纖通信系統(tǒng)中有著不同的應(yīng)用場景。 單模光模塊和多模光模塊的定義 單模光模塊和多模光模塊都是光纖通信系統(tǒng)中的關(guān)鍵組件,它們的主要區(qū)別在于所
    的頭像 發(fā)表于 08-23 09:47 ?1303次閱讀

    單模單纖與單模雙纖的哪個(gè)穩(wěn)定?

    單模單纖與單模雙纖是兩種常見的光纖通信方式,它們在穩(wěn)定性、傳輸距離、成本等方面存在一定的差異。 一、單模單纖與單模雙纖的基本概念 1.1 單模
    的頭像 發(fā)表于 08-08 17:03 ?1094次閱讀

    單模單纖與單模雙纖的優(yōu)缺點(diǎn)是什么

    單模單纖和單模雙纖是光纖通信系統(tǒng)中的兩種常見配置方式。它們在光纖通信系統(tǒng)中有著各自的優(yōu)缺點(diǎn)。 一、單模單纖 定義 單模單纖是指在光纖通信系統(tǒng)中,只使用一根
    的頭像 發(fā)表于 08-08 17:01 ?1795次閱讀

    單模鎧裝光纜與室外單模光纜區(qū)別

    單模鎧裝光纜與室外單模光纜在多個(gè)方面存在顯著區(qū)別,以下是對兩者區(qū)別的詳細(xì)分析: 一、外觀與結(jié)構(gòu) 外觀顏色:單模鎧裝光纜一般是黑色的,而室外單模光纜通常是黃色的。這種顏色差異有助于在實(shí)際
    的頭像 發(fā)表于 07-29 10:04 ?593次閱讀

    如何不用wifi_station_scan() 取得當(dāng)前已經(jīng)連線AP的BSSID?

    請問如何不用 wifi_station_scan() 取得當(dāng)前已經(jīng)連線 AP 的 BSSID? 使用 wifi_station_scan() 會造成當(dāng)前連線出現(xiàn)斷線等問題,是否有其他不影響連線的取得方式?
    發(fā)表于 07-12 15:25

    如何使用AP525測試泰凌硬件的音頻指標(biāo)(二)— AP525測試平臺介紹

    本章節(jié)將以AP525為例,介紹儀器硬件接口及AP測試軟件界面及常規(guī)的序列測試操作流程,熟悉本章節(jié)后將以泰凌TLSR9518A EVB作為DUT測試
    發(fā)表于 06-26 09:32 ?951次閱讀
    如何使用<b class='flag-5'>AP</b>525<b class='flag-5'>測試</b>泰凌硬件的音頻指標(biāo)(二)— <b class='flag-5'>AP</b>525<b class='flag-5'>測試</b>平臺介紹

    ESP8266 STA+AP模式下丟包如何解決?

    AT命令模式下ESP8266 STA+AP模式下,發(fā)送數(shù)據(jù)(at命令發(fā)送 上位機(jī)發(fā)送modbus命令詢問13個(gè)寄存器每秒發(fā)送一次,ESP8266做出回應(yīng)),經(jīng)過測試發(fā)送成功率在95%;但如果在
    發(fā)表于 06-26 06:25

    單模光纖的衰減特性是什么水平

    單模光纖是一種光傳輸介質(zhì),具有較低的衰減特性。在本文中,我們將詳細(xì)討論單模光纖的衰減水平、原因以及如何減少衰減。 一、單模光纖衰減特性概述 單模光纖衰減指的是光信號傳輸過程中由于各種原
    的頭像 發(fā)表于 04-09 17:08 ?875次閱讀

    多模光纖和單模光纖能混用嗎為什么

    多模光纖和單模光纖能混用。光纖通信的快速發(fā)展背后離不開多模光纖和單模光纖的卓越性能。多模光纖通常用于短距離通信,而單模光纖則適合長距離傳輸。本文將著重討論多模光纖與單模光纖的混合使用的
    的頭像 發(fā)表于 04-07 17:08 ?5510次閱讀

    什么是單模光纖和多模光纖的區(qū)別

    單模光纖和多模光纖是光纖通信中常用的兩種光纖類型。它們在構(gòu)造、傳輸特性和應(yīng)用領(lǐng)域上都有所不同。下面將詳細(xì)介紹單模光纖和多模光纖的區(qū)別。 首先,單模光纖和多模光纖的構(gòu)造有所不同。單模光纖
    的頭像 發(fā)表于 04-07 17:05 ?975次閱讀

    單模光纖1550nm衰減為多少

    單模光纖是一種傳輸光信號的重要工具,其起到傳輸、擴(kuò)展和調(diào)制光信號的作用。1550nm是單模光纖常用的工作波長之一,通過單模光纖傳輸信號時(shí),會發(fā)生一定的衰減。本文將詳細(xì)討論單模光纖155
    的頭像 發(fā)表于 04-03 17:37 ?2418次閱讀

    單模光纖能用多模光模塊嗎為什么

    單模光纖和多模光纖是兩種不同的光纖傳輸方式。單模光纖通常用于長距離傳輸和高速傳輸,而多模光纖則主要用于短距離傳輸。由于它們之間存在一些差異,因此不能直接使用多模光模塊進(jìn)行單模光纖的傳輸。 首先,
    的頭像 發(fā)表于 04-03 16:50 ?3449次閱讀