0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度視覺團(tuán)隊在全球最大規(guī)模目標(biāo)檢測競賽,中國團(tuán)隊從全球450多支參賽隊伍中脫穎而出

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-09-14 08:40 ? 次閱讀

在Google主辦的最大規(guī)模開放圖像目標(biāo)檢測競賽中,中國團(tuán)隊再次獲得冠軍。獲獎技術(shù)采用了FPN,cascade-rcnn等最新的檢測算法,并面向復(fù)雜實際場景數(shù)據(jù)集對算法進(jìn)行了改進(jìn),模型性能實現(xiàn)了大幅提升。

眼睛是人類接觸外部世界的第一感官,對于機(jī)器而言,計算機(jī)視覺技術(shù)就是它們的“眼睛”。近日,百度視覺團(tuán)隊在全球最大規(guī)模目標(biāo)檢測競賽Google AI Open Images-Object Detection Track中從全球450多支參賽隊伍中脫穎而出,獲得世界第一,并在ECCV 2018上進(jìn)行分享。

Google AI Open Images-Object Detection Track是大規(guī)模目標(biāo)檢測任務(wù)的權(quán)威挑戰(zhàn)賽事,由Google AI Research舉辦,賽事遵循 PASCAL VOC、ImageNet和COCO等賽事傳統(tǒng),但數(shù)據(jù)規(guī)模遠(yuǎn)大于這些賽事。

Open Images V4數(shù)據(jù)集

據(jù)介紹,大賽采用Google今年5月份發(fā)布的Open Images V4數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集,包含超過170萬的圖片數(shù)據(jù),500個類別以及超過1200萬物體框,數(shù)據(jù)沒有完全精細(xì)標(biāo)注,屬于弱監(jiān)督任務(wù),框選類別數(shù)目不均衡且有非常廣泛的類別分布,這更符合實際情況,也意味著參加競賽的團(tuán)隊需要考慮到類別的分布,而不能統(tǒng)一對所有類別做處理,因此更具挑戰(zhàn)性。這項賽事有助于復(fù)雜模型的研究,同時對評估不同檢測模型的性能有積極的促進(jìn)作用。下圖為Open Image V4 與 MS COCO 和 ImageNet 檢測任務(wù)數(shù)據(jù)對比情況。

Open Image V4 與 MS COCO及ImageNet 檢測數(shù)據(jù)對比情況

與傳統(tǒng)的檢測數(shù)據(jù)集合相比,該賽事除了數(shù)據(jù)規(guī)模大、更真實之外,還存在一系列的挑戰(zhàn)。具體來說,主要集中在以下三個方面:

數(shù)據(jù)分布不均衡:最少的類別框選只有14個,而最多的類別框選超過了140w,數(shù)據(jù)分布嚴(yán)重不均衡。

類別框數(shù)量分布

漏標(biāo)框:很多圖片存在只標(biāo)注主體類別,其他小物體或者非目標(biāo)物體沒有標(biāo)注出來。

漏標(biāo)注圖片舉例

尺度變化大:大部分物體框只占整個圖片的0.1以下,而有些框選卻占了整個圖片區(qū)域。如圖所示,Open Image V4集合存在更多的小物體,參賽者也會在檢測數(shù)據(jù)中遇到更大的挑戰(zhàn)。

框尺度大小分布對比

解決方案

在比賽過程中百度視覺團(tuán)隊采用了不同復(fù)雜度、不同骨架網(wǎng)絡(luò)進(jìn)行模型的訓(xùn)練,并對這些模型進(jìn)行融合。從整體方案框架來看,可分為Fast R-CNN和Faster R-CNN兩種不同的訓(xùn)練模式。Fast R-CNN版本是該團(tuán)隊研發(fā)的一套PaddlePaddle版本,在此基礎(chǔ)上Faster R-CNN加入了 FPN、Deformable、Cascade等最新的檢測算法,模型性能實現(xiàn)了大幅度的提升。

整體方案框架流程圖

骨架網(wǎng)絡(luò)為ResNet-101 的Fast R-CNN,模型收斂后可以達(dá)到0.481,在測試階段加入Soft NMS以及 Multi-Scale Testing策略,可以達(dá)到0.508。研究人員也嘗試了其他骨架網(wǎng)絡(luò)(dpn98,Inception-v4,Se-ResNext101),并把不同骨架網(wǎng)絡(luò)的檢測算法融合到一起,最終mAP可以達(dá)到0.546。在Proposal采樣階段,團(tuán)隊使用在不同位置進(jìn)行不同尺度的候選框生成,然后對這些框選進(jìn)行分類以及調(diào)整他們的位置。

Faster R-CNN: 采用這種框架可以達(dá)到略高于Fast R-CNN,mAP為0.495。在測試階段使用Soft NMS以及 Multi-Scale Testing策略后,性能達(dá)到0.525。

Deformable Convolutional Networks使用Soft NMS以及 Multi-Scale Testing策略前后,性能分別達(dá)到0.528及0.559。

Deformable Cascade R-CNN : 使用Soft NMS以及 Multi-Scale Testing策略前后,性能分別可以達(dá)到0.581和0.590.

簡言之,在Fast R-CNN框架下,該團(tuán)隊采用了不同的骨架網(wǎng)絡(luò)進(jìn)行訓(xùn)練,而在Faster R-CNN框架下只使用了ResNet101這種骨架網(wǎng)絡(luò)進(jìn)行訓(xùn)練。在訓(xùn)練過程中,還通過不同的策略有效解決了各種技術(shù)問題。詳情如下:

動態(tài)采樣

Google Open Images V4 數(shù)據(jù)集大概有170w圖片,1220w框選,500個類別信息。最大的類別框選超過了140w,最小的類別只有14個框選,如果簡單使用所有的圖片及框選,需要幾十天才能進(jìn)行模型訓(xùn)練,而且很難訓(xùn)練出來一個無偏的模型。因此,需要在訓(xùn)練過程中進(jìn)行動態(tài)采樣,如果樣本數(shù)量多則減少采樣概率,而樣本數(shù)量少則增加采樣概率。研究人員分別進(jìn)行全集數(shù)據(jù)訓(xùn)練、固定框選子集訓(xùn)練、動態(tài)采樣模型訓(xùn)練三種策略進(jìn)行。

全集數(shù)據(jù)訓(xùn)練:按照主辦方提供數(shù)據(jù)進(jìn)行訓(xùn)練,mAP達(dá)到0.50。

固定框選子集訓(xùn)練:線下固定對每個類別最多選擇1000個框,mAP達(dá)到0.53。

動態(tài)采樣模型訓(xùn)練:對每個GPU、每個Epoch采用線上動態(tài)采樣,每次采集的數(shù)據(jù)都不同,輪數(shù)達(dá)到一定數(shù)目后,整個全集的數(shù)據(jù)都能參與整體訓(xùn)練。最后mAp達(dá)到0.56。

動態(tài)采樣策略

FPN

基于訓(xùn)練數(shù)據(jù)集的分析,研究人員發(fā)現(xiàn)其中500個類別的尺度有很大的差異。因此他們將FPN引入到檢測模型中,即利用多尺度多層次金字塔結(jié)構(gòu)構(gòu)建特征金字塔網(wǎng)絡(luò)。在實驗中,他們以ResNet101作為骨干網(wǎng)絡(luò),在不同階段的最后一層添加了自頂向下的側(cè)連接。自頂向下的過程是向上采樣進(jìn)行的,水平連接是將上采樣的結(jié)果與自底向上生成的相同大小的feature map合并。融合后,對每個融合結(jié)果進(jìn)行3*3卷積以消除上采樣的混疊效應(yīng)。值得注意的是,F(xiàn)PN應(yīng)該嵌入到RPN網(wǎng)絡(luò)中,以生成不同的尺度特征并整合為RPN網(wǎng)絡(luò)的輸入。最終,引入FPN后的mAP可達(dá)到0.528。

Deformable Convolution Networks

該團(tuán)隊采用可變形卷積神經(jīng)網(wǎng)絡(luò)增強(qiáng)了CNNs的建模能力??勺冃尉矸e網(wǎng)絡(luò)的思想是在不需要額外監(jiān)督的情況下,通過對目標(biāo)任務(wù)的學(xué)習(xí),在空間采樣點(diǎn)上增加額外的偏移量模塊。同時將可變形卷積網(wǎng)絡(luò)應(yīng)用于以ResNet101作為骨架網(wǎng)絡(luò)的Faster R-CNN架構(gòu),并在ResNet101的res5a、5b、5c層之后應(yīng)用可變形卷積層,并將ROI Pooling層改進(jìn)為可變形位置敏感ROI Pooling層??勺冃尉矸e網(wǎng)絡(luò)的mAP性能為0.552。

Cascade R-CNN

比賽中,該團(tuán)隊使用級聯(lián)的R-CNN來訓(xùn)練檢測模型。除訓(xùn)練基本模型外,還使用包含五個尺度特征金字塔網(wǎng)絡(luò)(FPN)和3個尺度anchors的RPN網(wǎng)絡(luò)。此外,他們還訓(xùn)練了一個針對全類模型中表現(xiàn)最差的150類的小類模型,并對這150類的模型別進(jìn)行評估。得出的結(jié)論是,500類模型的MAP為0.477,而用150類單模型訓(xùn)練結(jié)果替換500類的后150類的結(jié)果,則模型的MAP提升為0.498。使用以上方法進(jìn)行訓(xùn)練的單尺度模型的性能為0.573。

Testing Tricks

在后處理階段,團(tuán)隊使Soft NMS和多尺度測試的方法。用Soft NMS的方法代替NMS后,在不同模型上有0.5-1.3點(diǎn)的改進(jìn),而Multi-Scale Testing在不同模型上則有0.6-2個點(diǎn)的提升。

模型融合

對于每個模型,該團(tuán)隊在NMS后預(yù)測邊界框。來自不同模型的預(yù)測框則使用一個改進(jìn)版的NMS進(jìn)行合并,具體如下:

給每個模型一個0~1之間的標(biāo)量權(quán)重。所有的權(quán)重總和為1;

從每個模型得到邊界框的置信分?jǐn)?shù)乘以它對應(yīng)的權(quán)重;

合并從所有模型得到的預(yù)測框并使用NMS,此外,除此之外,研究人員采用不同模型的分?jǐn)?shù)疊加的方式代替只保留最高分模型,在這個步驟中IOU閾值為0.5。

其實,不論是在學(xué)術(shù)圈還是工業(yè)界,大規(guī)模目標(biāo)檢測都是計算機(jī)視覺極為重要的基礎(chǔ)技術(shù)。通過這一技術(shù),軟硬件應(yīng)用產(chǎn)品可以深度定位圖片中的物體位置以及類別,并用于新零售、通用多物品識別等場景。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2277

    瀏覽量

    90623
  • 計算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1700

    瀏覽量

    46074

原文標(biāo)題:【ECCV 2018】谷歌AI超大規(guī)模圖像競賽,中國團(tuán)隊獲目標(biāo)檢測冠軍

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    芯華章持續(xù)助力EDA精英挑戰(zhàn)賽

    日前,2024中國研究生創(chuàng)“芯”大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA競賽)決賽南京江北新區(qū)舉辦。今年EDA競賽首次升級為國賽,全國超過
    的頭像 發(fā)表于 12-17 15:47 ?352次閱讀

    力合微榮膺2024“絲路”智能量測生態(tài)開發(fā)大賽二等獎,創(chuàng)新技術(shù)助力電力系統(tǒng)智能化發(fā)展

    的方向發(fā)展,加速“軟件定義”的配用電生態(tài)建設(shè)。在這場高水平的競技舞臺上,力合微公司的技術(shù)團(tuán)隊憑借卓越的技術(shù)實力,眾多參賽隊伍脫穎而出,“
    的頭像 發(fā)表于 11-28 15:13 ?428次閱讀
    力合微榮膺2024“絲路”智能量測生態(tài)開發(fā)大賽二等獎,創(chuàng)新技術(shù)助力電力系統(tǒng)智能化發(fā)展

    螞蟻數(shù)科與浙大團(tuán)隊榮獲NeurIPS競賽冠軍

    近日,機(jī)器學(xué)習(xí)領(lǐng)域的頂級國際會議NeurIPS的特設(shè)競賽,螞蟻數(shù)科旗下的摩斯聯(lián)合浙江大學(xué)計算機(jī)體系結(jié)構(gòu)實驗室陳文智、魏成坤團(tuán)隊組成的“Morse ARCLab”
    的頭像 發(fā)表于 11-26 10:27 ?303次閱讀

    冠軍說|第二屆OpenHarmony競賽訓(xùn)練營冠軍團(tuán)隊專訪

    剛剛結(jié)束的第三屆OpenHarmony技術(shù)大會上 今年的OpenHarmony競賽訓(xùn)練營獲獎團(tuán)隊 舉行了星光熠熠的頒獎儀式 10月11日,經(jīng)過激烈的現(xiàn)場決賽角逐共有10個賽隊脫穎而出
    發(fā)表于 10-28 17:11

    AMD贊助FIRST機(jī)器人競賽團(tuán)隊

    AMD 2024 賽季贊助了 FIRST 機(jī)器人競賽團(tuán)隊。FIRST 機(jī)器人競賽旨在教導(dǎo)
    的頭像 發(fā)表于 09-18 09:45 ?486次閱讀

    NVIDIA為AI城市挑戰(zhàn)賽構(gòu)建合成數(shù)據(jù)集

    一年一的 AI 城市挑戰(zhàn)賽,來自世界各地的數(shù)參賽隊伍
    的頭像 發(fā)表于 09-09 10:04 ?529次閱讀

    百度聯(lián)合英偉達(dá)舉辦全球規(guī)模最大智能體大賽

    近日,科技巨頭百度宣布了一項激動人心的合作計劃:將與英偉達(dá)聯(lián)合舉辦“百度搜索·文心智能體創(chuàng)新大賽”。此次大賽聚焦于“智能體應(yīng)用”的創(chuàng)新與發(fā)展,旨在攜手廣大開發(fā)者,文心智能體平臺上共同打造高質(zhì)量、具備廣泛分發(fā)潛力且能夠?qū)崿F(xiàn)盈利的
    的頭像 發(fā)表于 09-02 15:43 ?380次閱讀

    2024年“瑞薩杯”信息科技前沿專題賽頒獎典禮圓滿落幕

    為“物聯(lián)網(wǎng)+數(shù)字經(jīng)濟(jì)”,采用開放性競賽方式。本次競賽共設(shè)兩輪參賽輪次,分別命題。初賽圍繞“非圖形圖像的信息處理及測控技術(shù)”,共收到來自全國各地高校221
    的頭像 發(fā)表于 08-30 17:27 ?373次閱讀

    TPU編程競賽|第十九屆研電賽“算能杯”總決賽圓滿落幕!

    參賽隊伍脫穎而出!>獲獎名單在為期兩天的評審和答辯后,9日上午,8優(yōu)秀的隊伍答辯環(huán)節(jié)
    的頭像 發(fā)表于 08-30 13:08 ?411次閱讀
    TPU編程<b class='flag-5'>競賽</b>|第十九屆研電賽“算能杯”總決賽圓滿落幕!

    TPU編程競賽系列|第八屆集創(chuàng)賽”算能杯”精彩收官!

    8月21日上午,第八屆全國大學(xué)生集成電路創(chuàng)新創(chuàng)業(yè)大賽(以下簡稱”集創(chuàng)賽”)全國總決賽頒獎典禮煙臺舉行。本屆集創(chuàng)賽總決賽”算能杯”共十八支隊伍脫穎而出,展示了他們智能技術(shù)領(lǐng)域的創(chuàng)新能
    的頭像 發(fā)表于 08-30 13:08 ?421次閱讀
    TPU編程<b class='flag-5'>競賽</b>系列|第八屆集創(chuàng)賽”算能杯”精彩收官!

    愛立信交互式5G+解決方案榮獲2024 MWC三等獎

    ? GSMA-中國電信Open Gateway編程馬拉松總決賽近日2024 MWC上海圓滿落幕。經(jīng)過多輪激烈角逐,愛立信團(tuán)隊以交互式5G+解決方案:X-Calling69
    的頭像 發(fā)表于 07-03 15:08 ?1.3w次閱讀

    華為ICT大賽2023-2024全球總決賽獲獎名單揭曉

    、2000多所院校、17萬余名學(xué)生報名參賽,經(jīng)過國家賽、區(qū)域賽層層選拔,最終來自49個國家和地區(qū)的160隊伍、470多名選手脫穎而出,進(jìn)入全球
    的頭像 發(fā)表于 05-28 17:14 ?464次閱讀
    華為ICT大賽2023-2024<b class='flag-5'>全球</b>總決賽獲獎名單揭曉

    智能嵌入式系統(tǒng)設(shè)計大賽--龍芯2K500先鋒板

    智能嵌入式系統(tǒng)設(shè)計大賽是依托IEEE國際元計算大會(IEEE ICMC)舉辦的一場挑戰(zhàn)競賽。 本次比賽致力于推動國產(chǎn)化人工智能平臺的發(fā)展,培養(yǎng)學(xué)生嵌入式人工智能的系統(tǒng)設(shè)計能力。 本屆比賽要求參賽隊伍
    發(fā)表于 05-14 21:15

    百度智能云與全球知名咨詢服務(wù)機(jī)構(gòu)畢馬威簽署戰(zhàn)略合作協(xié)議

    近日,首屆“百度智能云GENERATE全球生態(tài)大會”上,百度智能云與全球知名咨詢服務(wù)機(jī)構(gòu)畢馬威簽署戰(zhàn)略合作協(xié)議。
    的頭像 發(fā)表于 04-14 09:24 ?840次閱讀

    首屆能源電子產(chǎn)業(yè)創(chuàng)新大賽創(chuàng)佳績,智芯公司摘金奪銀

    1月18日,工信部第一屆能源電子產(chǎn)業(yè)創(chuàng)新大賽全國總決賽圓滿落幕,經(jīng)過激烈角逐,智芯公司兩只參賽隊伍脫穎而出,斬獲金獎、銀獎各1項,充分展現(xiàn)了智芯公司能源電子領(lǐng)域的領(lǐng)先地位。
    的頭像 發(fā)表于 01-29 10:06 ?1051次閱讀