0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究人員共同提出了一種面向目標(biāo)檢測任務(wù)的新模塊Res2Net

DPVg_AI_era ? 來源:lp ? 2019-04-08 09:26 ? 次閱讀

近日,南開大學(xué)、牛津大學(xué)和加州大學(xué)默塞德分校的研究人員共同提出了一種面向目標(biāo)檢測任務(wù)的新模塊Res2Net,新模塊可以和現(xiàn)有其他優(yōu)秀模塊輕松整合,在不增加計(jì)算負(fù)載量的情況下,在ImageNet、CIFAR-100等數(shù)據(jù)集上的測試性能超過了ResNet。

2015年,由何愷明等四位華人所提出的ResNet一戰(zhàn)成名,可極快的加速神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。

而近日,由南開大學(xué)、牛津大學(xué)和加州大學(xué)默塞德分校的研究人員共同提出的Res2Net,可以和現(xiàn)有其他優(yōu)秀模塊輕松整合:在不增加計(jì)算負(fù)載量的情況下,在ImageNet、CIFAR-100等數(shù)據(jù)集上的測試性能超過了ResNet。

論文地址:

https://arxiv.org/pdf/1904.01169.pdf

關(guān)于代表性計(jì)算機(jī)視覺任務(wù)的進(jìn)一步消融研究和實(shí)驗(yàn)結(jié)果,即目標(biāo)檢測,類激活 mapping和顯著目標(biāo)檢測,進(jìn)一步驗(yàn)證了Res2Net相對(duì)于現(xiàn)有技術(shù)的基線方法的優(yōu)越性。

面向視覺任務(wù)的多尺度表示對(duì)于目標(biāo)檢測、語義分割和顯著目標(biāo)檢測任務(wù)具有重大意義。通過CNN新模塊Res2Net,能夠?qū)崿F(xiàn)與比以往優(yōu)秀的基于CNNbackbone的模型(如ResNet,ResNeXt和DLA)更好的性能表現(xiàn)。

Res2Net:計(jì)算負(fù)載不增加,特征提取能力更強(qiáng)大

在多個(gè)尺度上表示特征對(duì)于許多視覺任務(wù)非常重要。卷積神經(jīng)網(wǎng)絡(luò)(CNN) backbone 的最新進(jìn)展不斷展示出更強(qiáng)的多尺度表示能力,從而在廣泛的應(yīng)用中實(shí)現(xiàn)一致的性能提升。然而,大多數(shù)現(xiàn)有方法以分層方式(layer-wise)表示多尺度特征。

在本文中,研究人員在一個(gè)單個(gè)殘差塊內(nèi)構(gòu)造分層的殘差類連接,為CNN提出了一種新的構(gòu)建模塊,即Res2Net——以更細(xì)粒度(granular level)表示多尺度特征,并增加每個(gè)網(wǎng)絡(luò)層的感受野(receptive fields)范圍。

上圖中,左側(cè)為CNN網(wǎng)絡(luò)架構(gòu)的基本構(gòu)成,右側(cè)為本文新提出的Res2Net模塊。新模塊具備更強(qiáng)的多規(guī)模特征提取能力,但計(jì)算負(fù)載量與左側(cè)架構(gòu)類似。具體而言,新模塊用一個(gè)較小的3×3過濾器取代了過濾器組,同時(shí)可以將不同的過濾器組以層級(jí)殘差式風(fēng)格連接。模塊內(nèi)部的連接形式與殘差網(wǎng)絡(luò)(ResNet)類似,故命名為Res2Net。

與其他現(xiàn)有模塊的整合

本文所提出的Res2Net模塊可以融合到最先進(jìn)的backbone CNN模型中,例如ResNet,ResNeXt和DLA。研究人員在所有這些模型上評(píng)估 Res2Net 模塊,并在廣泛使用的數(shù)據(jù)集(例如CIFAR-100和ImageNet)上展示相對(duì)于基線模型的一致性能提升。

由于單獨(dú)的Res2Net模塊對(duì)于整體網(wǎng)絡(luò)結(jié)構(gòu)沒有特定的要求,Res2Net模塊的多尺度表示能力也和CNN的分層特征聚合模型彼此獨(dú)立,所以可以很容易地將Res2Net模塊集成到現(xiàn)有的其他優(yōu)秀CNN模型中。比如ResNet,ResNeXt 和DLA 等。集成后的模型可稱為Res2Net,Res2NeXt,和Res2Net-DLA。

Res2Net模塊性能及測試結(jié)果

ImageNet數(shù)據(jù)集測試結(jié)果

ImageNet數(shù)據(jù)集Top1和Top5測試結(jié)果

Res2Net-50在ImageNet數(shù)據(jù)集不同規(guī)模測試錯(cuò)誤率結(jié)果。其中參數(shù)w為過濾器寬度,s為scale

CIFAR-100數(shù)據(jù)集測試結(jié)果

CIFAR-100數(shù)據(jù)集Top1錯(cuò)誤率,以及模型大小

CIFAR-100數(shù)據(jù)集不同模型大小下的檢測準(zhǔn)確率

ResNet-50和Res2Net-50的類激活映射可視化對(duì)比

ResNet-101 和Res2Net-101的語義分割結(jié)果的可視化對(duì)比

ResNet-50 和Res2Net-50的顯著目標(biāo)檢測結(jié)果對(duì)比(圖7)

結(jié)論及未來方向

Res2Net結(jié)構(gòu)簡單,性能優(yōu)秀,可以進(jìn)一步探索CNN在更細(xì)粒度級(jí)別的多尺度表示能力。 Res2Net揭示了一個(gè)新的維度,即“尺度”(Scale),除了深度,寬度和基數(shù)的現(xiàn)有維度之外,“規(guī)?!笔且粋€(gè)必不可少的更有效的因素。

Res2Net模塊可以很容易地與現(xiàn)有的最新模塊整合。對(duì)CIFAR100和ImageNet基準(zhǔn)測試的圖像分類結(jié)果表明,使用Res2Net模塊的網(wǎng)絡(luò)始終在與對(duì)手的競爭中表現(xiàn)出更優(yōu)秀的性能,這些對(duì)手包括ResNet,ResNeXt,DLA等。

Res2Net性能上的優(yōu)越性已經(jīng)在幾個(gè)具有代表性的計(jì)算機(jī)視覺任務(wù)體現(xiàn)出來,包括類激活映射,對(duì)象檢測和顯著對(duì)象檢測等。多尺度表示對(duì)于未來開拓更廣泛的應(yīng)用領(lǐng)域至關(guān)重要。

本文相關(guān)源代碼將在論文被收稿后公開發(fā)布。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:超越ResNet:南開提出Res2Net,不增計(jì)算負(fù)載,性能全面升級(jí)!

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    美國普渡大學(xué)和哈佛大學(xué)的研究人員出了項(xiàng)新發(fā)明 新...

    據(jù)物理學(xué)家組織網(wǎng)報(bào)道,美國普渡大學(xué)和哈佛大學(xué)的研究人員出了項(xiàng)極為應(yīng)景的新發(fā)明:一種外形如同顆圣誕樹
    發(fā)表于 02-03 20:30

    一種基于圖像平移的目標(biāo)檢測框架

    集。本文提出了一種基于圖像平移的目標(biāo)檢測框架,以解決在不利條件下目標(biāo)檢測精度下降的問題。我們
    發(fā)表于 08-31 07:43

    一種專門用于檢測目標(biāo)的框架Dilated Module

    1. 介紹本文提出一種專門用于檢測目標(biāo)的框架,框架結(jié)構(gòu)如下圖:我們探索了可以提高小目標(biāo)檢測能力
    發(fā)表于 11-04 11:14

    一種改進(jìn)運(yùn)動(dòng)目標(biāo)檢測算法的研究與應(yīng)用

    針對(duì)運(yùn)動(dòng)目標(biāo)檢測中場景的混亂多變和干擾的復(fù)雜多樣的問題,提出了一種魯棒而有效的運(yùn)動(dòng)目標(biāo)檢測方法。
    發(fā)表于 02-22 15:01 ?3次下載

    研究人員提出了一種柔性可拉伸擴(kuò)展的多功能集成傳感器陣列

    研究人員提出了一種柔性可拉伸擴(kuò)展的多功能集成傳感器陣列,成功將電子皮膚的探測能力擴(kuò)展到7,實(shí)現(xiàn)溫度、濕度、紫外光、磁、應(yīng)變、壓力和接近等多種外界刺激的實(shí)時(shí)同步監(jiān)測。
    的頭像 發(fā)表于 01-24 15:15 ?7269次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b><b class='flag-5'>一種</b>柔性可拉伸擴(kuò)展的多功能集成傳感器陣列

    實(shí)驗(yàn)室的最新工作——Res2Net,一種目標(biāo)檢測任務(wù)中新的Backbone網(wǎng)絡(luò)模塊

    因此,多尺度的特征在傳統(tǒng)方法和深度學(xué)習(xí)里面都得到了廣泛應(yīng)用。通常我們需要采用個(gè)大感受野的特征提取器來獲得不同尺度的特征描述,而卷積神經(jīng)網(wǎng)絡(luò)通過堆卷積層可以很自然的由粗到細(xì)多尺度的提取特征。如何設(shè)計(jì)更高效的網(wǎng)絡(luò)結(jié)構(gòu)是提升卷積神經(jīng)網(wǎng)絡(luò)性能的關(guān)鍵。
    的頭像 發(fā)表于 04-08 14:33 ?8610次閱讀
    實(shí)驗(yàn)室的最新工作——<b class='flag-5'>Res2Net</b>,<b class='flag-5'>一種</b>在<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b><b class='flag-5'>任務(wù)</b>中新的Backbone網(wǎng)絡(luò)<b class='flag-5'>模塊</b>

    以色列研究人員開發(fā)出了一種能夠識(shí)別不同刺激的新型傳感系統(tǒng)

    據(jù)麥姆斯咨詢報(bào)道,海法以色列理工學(xué)院的研究人員開發(fā)出了一種能夠識(shí)別并區(qū)分不同刺激的創(chuàng)新型傳感系統(tǒng)。該系統(tǒng)基于折紙藝術(shù),結(jié)合了以色列理工學(xué)院開發(fā)的智能墨水材料。
    發(fā)表于 05-21 08:45 ?918次閱讀

    研究人員提出了系列新的點(diǎn)云處理模塊

    為了探索這些問題的解決辦法、來自倫敦大學(xué)學(xué)院的研究人員提出了系列新的點(diǎn)云處理模塊,從效率、信息共享和點(diǎn)云卷積操作等方面進(jìn)行了研究,得到了
    的頭像 發(fā)表于 08-02 14:44 ?3080次閱讀
    <b class='flag-5'>研究人員</b>們<b class='flag-5'>提出了</b><b class='flag-5'>一</b>系列新的點(diǎn)云處理<b class='flag-5'>模塊</b>

    JD和OPPO的研究人員提出了一種姿勢引導(dǎo)的時(shí)尚圖像生成模型

    研究人員的主要目的在于訓(xùn)練個(gè)生成模型,將模特在當(dāng)前姿勢上的圖像遷移到其他的目標(biāo)姿勢上去,實(shí)現(xiàn)對(duì)于衣著等商品的全面展示。
    的頭像 發(fā)表于 08-02 14:50 ?2569次閱讀

    Facebook的研究人員提出了Mesh R-CNN模型

    研究目標(biāo)是通過單張圖像輸入,對(duì)圖像中的物體進(jìn)行檢測、獲取不同物體的類別、掩膜和對(duì)應(yīng)的三維網(wǎng)格,并對(duì)真實(shí)世界中的復(fù)雜模型進(jìn)行有效處理。在2
    的頭像 發(fā)表于 08-02 15:51 ?3911次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>Mesh R-CNN模型

    普渡大學(xué)的研究人員正在開發(fā)一種綜合醫(yī)療傳感平臺(tái)

    普渡大學(xué)的研究人員正在開發(fā)一種綜合生物傳感平臺(tái),旨在比現(xiàn)有方法更快,更便宜地檢測和監(jiān)測蚊媒疾病,以幫助預(yù)防病毒爆發(fā)及其破壞性影響。
    發(fā)表于 10-25 09:19 ?906次閱讀

    研究人員出了一種新的基于深度學(xué)習(xí)的策略

    蘇黎世聯(lián)邦理工學(xué)院的研究人員最近推出了一種新的基于深度學(xué)習(xí)的策略,該策略可以在不需要大量真實(shí)數(shù)據(jù)的情況下在機(jī)器人中實(shí)現(xiàn)觸覺傳感。在arXiv上預(yù)先發(fā)表的篇論文中概述了他們的方法,該方
    的頭像 發(fā)表于 03-26 15:47 ?2625次閱讀

    研究人員提出了個(gè)名為CommPlan的框架

    使用CommPlan,開發(fā)人員首先使用數(shù)據(jù),領(lǐng)域?qū)I(yè)知識(shí)和學(xué)習(xí)算法指定五個(gè)模塊-任務(wù)模型,通信功能,通信成本模型,人員響應(yīng)模型和人員可選動(dòng)作
    的頭像 發(fā)表于 04-09 14:30 ?2186次閱讀

    馬來西亞研究人員提出一種評(píng)估光伏模塊不同冷卻系統(tǒng)有效性的新方法

    馬來西亞多媒體大學(xué)研究人員發(fā)表的篇新論文提供了一種評(píng)估光伏模塊不同冷卻系統(tǒng)有效性的新方法。所提出的技術(shù)依賴于在附加冷卻的情況下測量
    發(fā)表于 04-17 15:47 ?731次閱讀

    MIT研究人員提出了一種制造軟氣動(dòng)執(zhí)行器的新方法

    麻省理工學(xué)院 (MIT) 的研究人員創(chuàng)造了一種新的制造技術(shù),可以制造出更具成本效益的軟氣動(dòng)執(zhí)行器。
    的頭像 發(fā)表于 05-06 16:38 ?1665次閱讀
    MIT<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b><b class='flag-5'>一種</b>制造軟氣動(dòng)執(zhí)行器的新方法