0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里達(dá)摩院又有新的研究進(jìn)展,在自動(dòng)駕駛3D物體檢測(cè)領(lǐng)域

算法與數(shù)據(jù)結(jié)構(gòu) ? 來(lái)源:算法與數(shù)據(jù)結(jié)構(gòu) ? 2020-05-06 10:32 ? 次閱讀

最新消息,阿里達(dá)摩院又有新的研究進(jìn)展,這次在自動(dòng)駕駛3D物體檢測(cè)領(lǐng)域。

達(dá)摩院的研究人員提出一個(gè)通用、高性能的檢測(cè)器,在自動(dòng)駕駛領(lǐng)域權(quán)威數(shù)據(jù)集KITTI BEV(鳥(niǎo)瞰)上,檢測(cè)速度達(dá)到25FPS ,一舉占據(jù)榜首,與排名第二的方案相比,減少了一半多,同時(shí)精度也遠(yuǎn)超其他的單階段檢測(cè)器??梢哉f(shuō)首次實(shí)現(xiàn)3D物體檢測(cè)精度與速度兼得。

達(dá)摩院研究團(tuán)隊(duì)表示:“檢測(cè)器是自動(dòng)駕駛系統(tǒng)的核心組件之一,但該領(lǐng)域一直缺少創(chuàng)新和突破,此次我們實(shí)現(xiàn)3D檢測(cè)精度和速度的提升,將有助于提高自動(dòng)駕駛系統(tǒng)的安全性?!?/p>

從實(shí)驗(yàn)結(jié)果來(lái)看,他們顯然取得了良好進(jìn)展,而且研究的主要完成人員(一作),還是達(dá)摩院的實(shí)習(xí)生。

同時(shí),該研究也得到了同行們的認(rèn)可,被計(jì)算機(jī)視覺(jué)領(lǐng)域頂級(jí)會(huì)議CVPR 2020收錄。他們是如何做到的呢?我們借助阿里達(dá)摩院提供的解讀,一一來(lái)看。

如何實(shí)現(xiàn)精度和速度兼得?

眾所周知,與普通2D圖像識(shí)別應(yīng)用不同,自動(dòng)駕駛系統(tǒng)對(duì)精度和速度的要求更高,不僅需要快速識(shí)別周?chē)h(huán)境的物體,還要對(duì)物體在三維空間中的位置做精準(zhǔn)定位。

僅靠傳感器算法模型,通常無(wú)法平衡視覺(jué)識(shí)別的精度和速度。因此,檢測(cè)器成為提升自動(dòng)駕駛系統(tǒng)安全性的一個(gè)關(guān)鍵因素。

經(jīng)過(guò)多年研究,當(dāng)前業(yè)界主流的單階段檢測(cè)器在檢測(cè)速度上很好,但在檢測(cè)精度卻差強(qiáng)人意。

這就是達(dá)摩院研究的出發(fā)點(diǎn):尋找一種能二者兼得的方法。

他們提出的思路是:將兩階段檢測(cè)器中對(duì)特征進(jìn)行細(xì)粒度刻畫(huà)的思想,移植到單階段檢測(cè)中。

在他們的模型中,用于部署的檢測(cè)器, 即推斷網(wǎng)絡(luò), 由一個(gè)骨干網(wǎng)絡(luò)和檢測(cè)頭組成。

骨干網(wǎng)絡(luò)用3D的稀疏網(wǎng)絡(luò)實(shí)現(xiàn),用于提取含有高語(yǔ)義的體素特征。檢測(cè)頭將體素特征壓縮成鳥(niǎo)瞰圖表示,并在上面運(yùn)行2D全卷積網(wǎng)絡(luò)來(lái)預(yù)測(cè)3D物體框。

他們?cè)谟?xùn)練中利用一個(gè)輔助網(wǎng)絡(luò)將單階段檢測(cè)器中的體素特征,轉(zhuǎn)化為點(diǎn)級(jí)特征并施加一定的監(jiān)督信號(hào)

在實(shí)現(xiàn)上,他們將卷積特征中的非零信號(hào)映射到原始的點(diǎn)云空間中, 然后在每個(gè)點(diǎn)上進(jìn)行插值,來(lái)獲取卷積特征的點(diǎn)級(jí)表示。使得卷積特征也具有結(jié)構(gòu)感知能力,來(lái)提高檢測(cè)精度。

而在做模型推斷時(shí),輔助網(wǎng)絡(luò)并不參與計(jì)算(detached),保證單階段檢測(cè)器的檢測(cè)效率。

另外,他們還提出一個(gè)工程上的改進(jìn):Part-sensitive Warping (PSWarp),用于處理單階段檢測(cè)器中存在的 “框-置信度-不匹配” 問(wèn)題。

核心思路是:利用采樣器, 用生成的采樣網(wǎng)格在對(duì)應(yīng)的局部敏感特征圖上進(jìn)行采樣,生成對(duì)齊好的特征圖。最終能反映置信度的特征圖,是K個(gè)對(duì)齊好特征圖的平均。

單階段方法,能達(dá)到兩階段方法精度

阿里達(dá)摩院的研究人員,在KITTI數(shù)據(jù)集上評(píng)估了方法的有效性。下圖(PR Curve)中,實(shí)線(xiàn)為兩階段方法, 虛線(xiàn)為單階段方法。

可以看出,達(dá)摩院提出的單階段方法(黑色)能夠達(dá)到兩階段方法才能達(dá)到的精度。

下圖展示了他們?cè)贙ITTI 鳥(niǎo)瞰(BEV) 和 3D 測(cè)試集上的結(jié)果。

可以看出,他們提出的方法,可以在不增加額外計(jì)算量的情況下,達(dá)到25FPS 的檢測(cè)速度,而且還能保持精度。具體的檢測(cè)效果如下:

兩位共同一作,都是達(dá)摩院研究實(shí)習(xí)生

研究論文,標(biāo)題為“Structure Aware Single-Stage 3D Object Detection from Point Cloud”,共有5名研究人員參與,分別來(lái)自阿里達(dá)摩院和香港理工大學(xué)。

第一作者是Chenhang He,是阿里達(dá)摩院的研究實(shí)習(xí)生,正在香港理工大學(xué)讀博,預(yù)計(jì)2022年畢業(yè)。

他的導(dǎo)師是達(dá)摩院高級(jí)研究員、香港理工大學(xué)電子計(jì)算學(xué)系講座教授、IEEE Fellow張磊,也是這一研究的通訊作者。

另一位第一作者Hui Zeng,也是是阿里達(dá)摩院的研究實(shí)習(xí)生,同樣是張磊的博士生,預(yù)計(jì)在今年畢業(yè)。

其他作者,分別是達(dá)摩院高級(jí)研究員、IEEE Fellow華先勝、達(dá)摩院資深算法專(zhuān)家黃建強(qiáng)等。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:阿里達(dá)摩院新研究:實(shí)習(xí)生一作突破自動(dòng)駕駛技術(shù)難題,首次實(shí)現(xiàn)3D物體檢測(cè)精度與速度兼得

文章出處:【微信號(hào):TheAlgorithm,微信公眾號(hào):算法與數(shù)據(jù)結(jié)構(gòu)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    淺析基于自動(dòng)駕駛的4D-bev標(biāo)注技術(shù)

    4D-bev標(biāo)注技術(shù)是指在3D空間中以時(shí)間作為第四個(gè)維度進(jìn)行標(biāo)注的過(guò)程。4D-bev通常在地場(chǎng)景較為復(fù)雜的自動(dòng)駕駛場(chǎng)景中使用,其可以通過(guò)精準(zhǔn)地跟蹤和記錄動(dòng)態(tài)對(duì)象的運(yùn)動(dòng)軌跡、姿勢(shì)變化以及
    的頭像 發(fā)表于 12-06 15:01 ?1277次閱讀
    淺析基于<b class='flag-5'>自動(dòng)駕駛</b>的4<b class='flag-5'>D</b>-bev標(biāo)注技術(shù)

    使用STT全面提升自動(dòng)駕駛中的多目標(biāo)跟蹤

    3D多目標(biāo)跟蹤(3D MOT)各種機(jī)器人應(yīng)用中發(fā)揮著關(guān)鍵作用,例如自動(dòng)駕駛車(chē)輛。為了駕駛時(shí)避
    的頭像 發(fā)表于 10-28 10:07 ?292次閱讀
    使用STT全面提升<b class='flag-5'>自動(dòng)駕駛</b>中的多目標(biāo)跟蹤

    AI大模型的最新研究進(jìn)展

    AI大模型的最新研究進(jìn)展體現(xiàn)在多個(gè)方面,以下是對(duì)其最新進(jìn)展的介紹: 一、技術(shù)創(chuàng)新與突破 生成式AI技術(shù)的爆發(fā) : 生成式AI技術(shù)正在迅速發(fā)展,其強(qiáng)大的生成能力使得AI大模型多個(gè)領(lǐng)域
    的頭像 發(fā)表于 10-23 15:19 ?515次閱讀

    自動(dòng)駕駛HiL測(cè)試方案 ——場(chǎng)景仿真3D演示#ADAS #自動(dòng)駕駛 #VTHiL

    自動(dòng)駕駛
    北匯信息POLELINK
    發(fā)布于 :2024年10月16日 10:55:35

    自動(dòng)駕駛技術(shù)進(jìn)展及其對(duì)未來(lái)出行的影響

    駕駛,對(duì)于一些人而言是樂(lè)趣的源泉,但對(duì)于另一些人來(lái)說(shuō),卻是一項(xiàng)令人疲憊的任務(wù)。隨著自動(dòng)駕駛技術(shù)的飛速發(fā)展,這一現(xiàn)狀正在發(fā)生深刻的變化。自動(dòng)駕駛技術(shù)不僅能夠極大地減輕駕駛員的負(fù)擔(dān),還能通
    的頭像 發(fā)表于 10-10 16:25 ?1043次閱讀

    阿里達(dá)摩發(fā)布玄鐵R908 CPU

    杭州第四屆RISC-V中國(guó)峰會(huì)上,阿里達(dá)摩再次展現(xiàn)技術(shù)實(shí)力,隆重推出了玄鐵處理器家族的最新成員——R908 CPU。此次發(fā)布標(biāo)志著玄鐵系列
    的頭像 發(fā)表于 08-23 16:27 ?1029次閱讀

    FPGA自動(dòng)駕駛領(lǐng)域有哪些優(yōu)勢(shì)?

    FPGA(Field-Programmable Gate Array,現(xiàn)場(chǎng)可編程門(mén)陣列)自動(dòng)駕駛領(lǐng)域具有顯著的優(yōu)勢(shì),這些優(yōu)勢(shì)使得FPGA成為自動(dòng)駕駛技術(shù)中不可或缺的一部分。以下是FP
    發(fā)表于 07-29 17:11

    FPGA自動(dòng)駕駛領(lǐng)域有哪些應(yīng)用?

    FPGA(Field-Programmable Gate Array,現(xiàn)場(chǎng)可編程門(mén)陣列)自動(dòng)駕駛領(lǐng)域具有廣泛的應(yīng)用,其高性能、可配置性、低功耗和低延遲等特點(diǎn)為自動(dòng)駕駛的實(shí)現(xiàn)提供了強(qiáng)有
    發(fā)表于 07-29 17:09

    小馬智行再獲自動(dòng)駕駛卡車(chē)編隊(duì)測(cè)試許可

    自動(dòng)駕駛技術(shù)領(lǐng)域的佼佼者小馬智行近日北京取得重要進(jìn)展。該公司成功獲得北京首批自動(dòng)駕駛卡車(chē)編隊(duì)行駛測(cè)試許可,再次證明了其
    的頭像 發(fā)表于 05-24 09:38 ?466次閱讀

    三星停止自動(dòng)駕駛研究,開(kāi)發(fā)人員轉(zhuǎn)到機(jī)器人領(lǐng)域

    近日,三星電子宣布了一項(xiàng)重要的研發(fā)戰(zhàn)略調(diào)整。據(jù)業(yè)內(nèi)人士透露,三星先進(jìn)技術(shù)研究院(SAIT)已決定停止自動(dòng)駕駛汽車(chē)的研究,并將這一領(lǐng)域的開(kāi)發(fā)人員轉(zhuǎn)移到機(jī)器人
    的頭像 發(fā)表于 05-13 09:21 ?450次閱讀

    阿里達(dá)摩提出“知識(shí)鏈”框架,降低大模型幻覺(jué)

    近日,阿里巴巴達(dá)摩(湖畔實(shí)驗(yàn)室)攜手新加坡南洋理工大學(xué)等研究機(jī)構(gòu),共同推出了大模型知識(shí)鏈(CoK)框架。該框架不僅可實(shí)時(shí)檢索異構(gòu)知識(shí)源,還能逐步糾正推理錯(cuò)誤,有效提高了大模型
    的頭像 發(fā)表于 05-10 11:46 ?717次閱讀

    未來(lái)已來(lái),多傳感器融合感知是自動(dòng)駕駛破局的關(guān)鍵

    的架構(gòu),預(yù)計(jì)未來(lái)許多智能駕駛團(tuán)隊(duì)都會(huì)引入“占用網(wǎng)絡(luò)”來(lái)提升系統(tǒng)能力。多維像素的應(yīng)用前景非常廣闊。昱感微的融合感知技術(shù)+BEV +Transformer+占用網(wǎng)格有望成為L(zhǎng)3/L4級(jí)自動(dòng)駕駛最優(yōu)的落地方案。 昱感微電子融合感知平
    發(fā)表于 04-11 10:26

    阿里達(dá)摩北京公司新增AI業(yè)務(wù)

    阿里巴巴達(dá)摩(北京)科技有限公司近日進(jìn)行了工商變更,經(jīng)營(yíng)范圍有所調(diào)整。具體來(lái)說(shuō),公司去除了智聯(lián)網(wǎng)、芯片技術(shù)、量子計(jì)算等數(shù)據(jù)通信、電子產(chǎn)品、軟件和硬件技術(shù)及產(chǎn)品的研究、開(kāi)發(fā)等業(yè)務(wù),而新
    的頭像 發(fā)表于 02-23 11:39 ?1085次閱讀

    基于深度學(xué)習(xí)的方法處理3D點(diǎn)云進(jìn)行缺陷分類(lèi)應(yīng)用

    背景部分介紹了3D點(diǎn)云應(yīng)用領(lǐng)域中公開(kāi)可訪(fǎng)問(wèn)的數(shù)據(jù)集的重要性,這些數(shù)據(jù)集對(duì)于分析和比較各種模型至關(guān)重要。研究人員專(zhuān)門(mén)設(shè)計(jì)了各種數(shù)據(jù)集,包括用于3D形狀分類(lèi)、
    的頭像 發(fā)表于 02-22 16:16 ?1245次閱讀
    基于深度學(xué)習(xí)的方法<b class='flag-5'>在</b>處理<b class='flag-5'>3D</b>點(diǎn)云進(jìn)行缺陷分類(lèi)應(yīng)用

    阿里達(dá)摩在上海成立新公司,聚焦人工智能與軟件開(kāi)發(fā)

    天眼查信息顯示,達(dá)摩(上海)科技有限公司已正式成立,法定代表人為張建鋒,注冊(cè)資本為1000萬(wàn)人民幣。該公司由阿里巴巴旗下阿里巴巴達(dá)摩
    的頭像 發(fā)表于 02-04 10:52 ?1053次閱讀