0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大疆、港科大聯(lián)手!雙目3D目標(biāo)檢測實(shí)驗(yàn)效果大放送

電子工程師 ? 來源:lp ? 2019-03-12 09:43 ? 次閱讀

CVPR 2019的文章出來了,今天聊聊雙目的 3D object detection。這是一篇來自 DJI (大疆)與港科大合作的文章《Stereo R-CNN based 3D Object Detection for Autonomous Driving》,作者分別是 Peiliang Li,陳曉智(DJI,MV3D的作者)和港科大的 Shaojie Shen 老師。

論文鏈接,文中稱代碼將開源

https://arxiv.org/abs/1902.09738

1. Introduction

2018 年在 3D 檢測方面的文章層出不窮,也是各個(gè)公司無人駕駛或者機(jī)器人學(xué)部門關(guān)注的重點(diǎn),包含了點(diǎn)云,點(diǎn)云圖像融合,以及單目 3D 檢測,但是在雙目視覺方面的貢獻(xiàn)還是比較少,自從 3DOP 之后。

總體來說,圖像的檢測距離、圖像的 density 以及 context 信息,在 3D檢測中是不可或缺的一部分,因此作者在這篇文章中挖掘了雙目視覺做 3D檢測的的潛力。

2.Network Structure

整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)分為以下的幾個(gè)部分。

1). RPN部分,作者將左右目的圖像通過stereoRPN產(chǎn)生相應(yīng)的proposal。具體來說stereo RPN是在FPN的基礎(chǔ)上,將每個(gè)FPN的scale上的feature map的進(jìn)行concat的結(jié)構(gòu)。

2). Stereo Regression,在RPN之后,通過RoiAlign的操作,得到each FPN scale下的left and right Roi features,然后concat相應(yīng)的特征,經(jīng)過fc層得到object class, stereo bounding boxes dimension還有viewpoint angle(下圖所示) 的值。這里解釋一下viewpoint,根據(jù)Figure3.,假定物

3). keypoint的檢測。這里采用的是類似于mask rcnn的結(jié)構(gòu)進(jìn)行關(guān)鍵點(diǎn)的預(yù)測。文章定義了4個(gè)3D semantic keypoint,即車輛底部的3D corner point,同時(shí)將這4個(gè)點(diǎn)投影到圖像,得到4個(gè)perspective keypoint,這4個(gè)點(diǎn)在3D bbox regression起到一定的作用,我們在下一部分再介紹。

在keypoint檢測任務(wù)中,作者利用RoiAlign得到的14*14feature map,經(jīng)過conv,deconv最后得到6 * 28 * 28的feature map,注意到只有keypoint的u坐標(biāo)會(huì)提供2D Box以外的信息,因此,處于減少計(jì)算量的目的,作者aggregate每一列的feature,得到6 * 28的output,其中,前4個(gè)channel代表4個(gè)keypoint被投影到相應(yīng)的u坐標(biāo)的概率,后面兩個(gè)channel代表是left or right boundary上的keypoint的概率。

3. 3D Box Estimation

通過網(wǎng)絡(luò)回歸得到的 2D box 的 dimension,viewpoint,還有 keypoint,我們可以通過一定的方式得到3D box的位置。定義 3D box 的狀態(tài)x = [x, y, z, θ]。

Figure 5,給出了一些稀疏的約束。包含了特征點(diǎn)的映射過程。這里也體現(xiàn)了keypoint的用處。

上述公式即為約束方程,因此可以通過高斯牛頓的方法直接求解。具體可以參考論文的引文17。這里我們簡單證明一下第一個(gè)公式。注意,這里的假設(shè)都是u,v坐標(biāo)都已經(jīng)經(jīng)過相機(jī)內(nèi)參的歸一化了。

4. Dense 3D Box Alignment

這里就回到shenshaojie老師比較熟悉的BA的過程了,由于part 3僅僅只是一個(gè)object level的深度,這里文章利用最小化左右視圖的RGB的值,得到一個(gè)更加refine的過程。定義如下的誤差函數(shù)

求解可以利用G20或者ceres也可以完成。整個(gè)alignment過程其實(shí)相對于深度的直接預(yù)測是更加robust的,因?yàn)檫@種預(yù)測方法,避免了全局的depth estimation中的一些invalid的pixel引起的ill problem的問題。

5. experiment

作者在實(shí)驗(yàn)這塊達(dá)到了雙目視覺的state-of-the-art,同時(shí)對于各個(gè)module也做了很充足的實(shí)驗(yàn)(這塊請查看原論文)。

下面是圖a、b、c為處理結(jié)果示例,每幅圖像內(nèi)部上中下三部分,分別為左眼圖像檢測結(jié)果、右眼圖像檢測結(jié)果、鳥瞰視圖檢測結(jié)果。

圖a

圖b

圖c

6. Insight

最后談?wù)勎恼陆o我的一些 insights,首先,整個(gè)文章將傳統(tǒng)的 detection 的任務(wù),結(jié)合了 geometry constraint 優(yōu)化的方式,做到了3D位置的估計(jì),想法其實(shí)在不少文章sfm-learner之類的文章已經(jīng)有體現(xiàn)過了,不過用在3Ddetection上面還是比較新穎,避免了做雙目匹配估計(jì)深度的過程。也屬于slam跟深度學(xué)習(xí)結(jié)合的一篇文章,感興趣的朋友可以繼續(xù)看看(下面鏈接)相關(guān)文章

arxiv.org/abs/1802.0552

談幾點(diǎn)我個(gè)人意義上的不足吧,首先耗時(shí)過程 0.28s 的 inference time,不過可能作者的重點(diǎn)也不在這個(gè)方面,特征的利用上可以更加有效率,在實(shí)現(xiàn)上。其次,能不能采用deep3dbox的方式預(yù)測dimension,然后添加入優(yōu)化項(xiàng)呢...總體來說,是一篇不錯(cuò)的值得一讀的文章!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28483

    瀏覽量

    207438
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2891

    瀏覽量

    107640
  • 圖像檢測
    +關(guān)注

    關(guān)注

    0

    文章

    34

    瀏覽量

    11890

原文標(biāo)題:大疆、港科大聯(lián)手!雙目3D目標(biāo)檢測實(shí)驗(yàn)效果大放送 | CVPR 2019

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    TAS3103 EVM用于具有3D效果的數(shù)字音頻處理器

    電子發(fā)燒友網(wǎng)站提供《TAS3103 EVM用于具有3D效果的數(shù)字音頻處理器.pdf》資料免費(fèi)下載
    發(fā)表于 12-06 14:01 ?0次下載
    TAS3103 EVM用于具有<b class='flag-5'>3D</b><b class='flag-5'>效果</b>的數(shù)字音頻處理器

    透明塑料件噴粉3D掃描CAV全尺寸檢測逆向3D建模設(shè)計(jì)服務(wù)-CASAIM

    3D建模
    中科院廣州電子
    發(fā)布于 :2024年08月30日 10:04:53

    安寶特產(chǎn)品 安寶特3D Analyzer:智能的3D CAD高級(jí)分析工具

    安寶特3D Analyzer包含多種實(shí)用的3D CAD高級(jí)分析工具,包括自動(dòng)比對模型、碰撞檢測、間隙檢查、壁厚檢查,以及拔模和底切分析,能夠有效提升3D CAD模型
    的頭像 發(fā)表于 08-07 10:13 ?393次閱讀
    安寶特產(chǎn)品  安寶特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高級(jí)分析工具

    可存儲(chǔ)500張人臉的雙目3D人臉識(shí)別模塊

    。HLK-FM888是一款紅外+可見光雙目人臉識(shí)別算法模組,內(nèi)嵌雙目3D活體檢測算法和基于大數(shù)據(jù)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)動(dòng)態(tài)可見光識(shí)別算法,搭載高像素的攝像頭,在增強(qiáng)對環(huán)境光線的適應(yīng)性和
    的頭像 發(fā)表于 07-28 08:39 ?927次閱讀
    可存儲(chǔ)500張人臉的<b class='flag-5'>雙目</b><b class='flag-5'>3D</b>人臉識(shí)別模塊

    原理圖及PCB Checklist大放送~

    我們一、原理圖繪制及檢查流程階段流程原理圖繪制根據(jù)已有原理圖或資料(數(shù)據(jù)手冊、方案書)繪制原理圖DRC檢查EDA的DRC自檢,初步找出繪制不合理部分根據(jù)CheckList自檢根據(jù)CheckList進(jìn)行原理圖及PCB詳檢二、原理圖檢查清單細(xì)則原理圖CheckList電源電路自檢確認(rèn)項(xiàng)目確認(rèn)結(jié)果備注應(yīng)用設(shè)計(jì)模擬部分?jǐn)?shù)字部分是否隔離每個(gè)IC的電源引腳是否都有一個(gè)去
    的頭像 發(fā)表于 07-24 08:11 ?1107次閱讀
    原理圖及PCB Checklist<b class='flag-5'>大放送</b>~

    廣東3D掃描鈑金件外觀尺寸測量3D偏差檢測對比解決方案CASAIM

    3D掃描
    中科院廣州電子
    發(fā)布于 :2024年07月22日 16:13:45

    裸眼3D筆記本電腦——先進(jìn)的光場裸眼3D技術(shù)

    效果的用戶,這款筆記本電腦都能滿足你的需求。 一、卓越的3D模型設(shè)計(jì)能力 英倫科技裸眼3D筆記本電腦采用最新的光場裸眼3D技術(shù),使用戶無需佩戴3D
    的頭像 發(fā)表于 07-16 10:04 ?568次閱讀

    浪潮云洲發(fā)布云洲燭龍雙目結(jié)構(gòu)光3D相機(jī)

    在科技日新月異的今天,智能制造正逐步成為推動(dòng)社會(huì)發(fā)展的重要力量。近日,備受矚目的2024世界智能產(chǎn)業(yè)博覽會(huì)在天津盛大開幕。本次博覽會(huì)不僅匯聚了全球智能產(chǎn)業(yè)的精英,更見證了一項(xiàng)創(chuàng)新技術(shù)的誕生——浪潮云洲旗下國器智眸公司研發(fā)的“云洲燭龍雙目結(jié)構(gòu)光3D相機(jī)”正式發(fā)布。
    的頭像 發(fā)表于 06-25 18:00 ?1178次閱讀

    蘇州吳中區(qū)多色PCB板元器件3D視覺檢測技術(shù)

    3D視覺檢測相較于2D視覺檢測,有其獨(dú)特的優(yōu)勢,不受產(chǎn)品表面對比度影響,精確檢出產(chǎn)品形狀,可以測出高度(厚度)、體積、平整度等。在實(shí)際應(yīng)用中可以與2
    的頭像 發(fā)表于 06-14 15:02 ?425次閱讀
    蘇州吳中區(qū)多色PCB板元器件<b class='flag-5'>3D</b>視覺<b class='flag-5'>檢測</b>技術(shù)

    工業(yè)鏡頭在3D結(jié)構(gòu)光檢測中實(shí)際應(yīng)用

    工業(yè)鏡頭在3D結(jié)構(gòu)光檢測中實(shí)際應(yīng)用
    的頭像 發(fā)表于 06-01 08:34 ?309次閱讀
    工業(yè)鏡頭在<b class='flag-5'>3D</b>結(jié)構(gòu)光<b class='flag-5'>檢測</b>中實(shí)際應(yīng)用

    重磅| 奧比中光全新雙目系列3D相機(jī),搭載自研芯片,為智能機(jī)器人而生

    ? 4月29日,奧比中光正式發(fā)布全新Gemini 330系列雙目3D相機(jī),首發(fā)產(chǎn)品包括Gemini 335、Gemini 335L兩款通用型高性能雙目3D相機(jī)。新品首次搭載奧比中光為機(jī)
    發(fā)表于 04-30 18:00 ?475次閱讀
    重磅| 奧比中光全新<b class='flag-5'>雙目</b>系列<b class='flag-5'>3D</b>相機(jī),搭載自研芯片,為智能機(jī)器人而生

    奧比中光正式發(fā)布全新Gemini 330系列雙目3D相機(jī)

    4月29日,奧比中光正式發(fā)布全新Gemini 330系列雙目3D相機(jī),首發(fā)產(chǎn)品包括Gemini 335、Gemini 335L兩款通用型高性能雙目3D相機(jī)。
    的頭像 發(fā)表于 04-30 10:41 ?669次閱讀
    奧比中光正式發(fā)布全新Gemini 330系列<b class='flag-5'>雙目</b><b class='flag-5'>3D</b>相機(jī)

    Cognex發(fā)布了In-Sight? L38 3D視覺系統(tǒng),為3D檢測設(shè)立新標(biāo)準(zhǔn)

    人工智能(AI)驅(qū)動(dòng)的3D視覺系統(tǒng)為自動(dòng)化制造提供快速部署和可靠的檢測功能。
    的頭像 發(fā)表于 04-15 09:04 ?474次閱讀

    Nullmax提出多相機(jī)3D目標(biāo)檢測新方法QAF2D

    今天上午,計(jì)算機(jī)視覺領(lǐng)域頂會(huì)CVPR公布了最終的論文接收結(jié)果,Nullmax感知部門的3D目標(biāo)檢測研究《Enhancing 3D Object Detection with 2
    的頭像 發(fā)表于 02-27 16:38 ?1162次閱讀
    Nullmax提出多相機(jī)<b class='flag-5'>3D</b><b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>新方法QAF2<b class='flag-5'>D</b>

    三星電子在硅谷設(shè)立下一代3D DRAM研發(fā)實(shí)驗(yàn)

    近日,三星電子宣布在硅谷設(shè)立下一代3D DRAM研發(fā)實(shí)驗(yàn)室,以加強(qiáng)其在存儲(chǔ)技術(shù)領(lǐng)域的領(lǐng)先地位。該實(shí)驗(yàn)室的成立將專注于開發(fā)具有更高性能和更低功耗的3D DRAM,以滿足不斷增長的數(shù)據(jù)存儲(chǔ)
    的頭像 發(fā)表于 01-31 11:42 ?802次閱讀