3月19日,阿里巴巴達摩院宣布近日有論文入選計算機視覺頂會CVPR 2020。論文提出一個通用、高性能的自動駕駛檢測器,可兼顧3D物體的檢測精度和速度,提升自動駕駛系統(tǒng)安全性能,兩者兼得的實現(xiàn)在業(yè)界尚屬首次。
據(jù)了解,自動駕駛檢測器是自動駕駛具備感知能力的核心組件,檢測器需要快速處理、分析傳感器、激光雷達等采集的多維信息,使車輛識別周圍環(huán)境物體,并對物體在三維空間中的位置進行精準(zhǔn)定位,這個過程需要3D目標(biāo)檢測的輔助。
與使用RGB圖像進行目標(biāo)檢測,以輸出物體類別和在圖像上2D bounding box的2D檢測方式不同,3D目標(biāo)檢測需要使用RGB圖像、RGB-D深度圖像和激光點云的方式來實現(xiàn),最終輸出物體類別及在三維空間中的長寬高、旋轉(zhuǎn)角等信息。
對于自動駕駛而言,其需要從現(xiàn)實世界中估計更具信息量的3D邊界框,以完成諸如路徑規(guī)劃和避免碰撞之類的高級任務(wù)。為確保自動駕駛的安全,3D檢測的精度和速度缺一不可。但就目前兩種基于點云的3D物體檢測的主要架構(gòu)而言,單階段檢測器和兩階段檢測器尚無法能兼顧兩項指標(biāo)。
對此,達摩院在論文中提出在訓(xùn)練中利用一個輔助網(wǎng)絡(luò)來解決以上問題。具體而言,其能夠?qū)坞A段檢測器中的體素特征轉(zhuǎn)化為點級特征,并施加一定的監(jiān)督信號,從而使卷積特征也具有結(jié)構(gòu)感知能力,進而提高檢測精度。與此同時,在做模型推斷時,輔助網(wǎng)絡(luò)并不參與計算(detached),單階段檢測器的檢測效率得以保證。
此外,達摩院還提出工程上的改進,Part-sensitive Warping (PSWarp), 用于處理單階段檢測器中存在的“框-置信度-不匹配”問題。
目前,該檢測器在自動駕駛領(lǐng)域權(quán)威數(shù)據(jù)集KITTI BEV排行榜上排名第一。測試結(jié)果顯示,在自動駕駛領(lǐng)域權(quán)威數(shù)據(jù)集KITTI BEV排行榜上,該檢測器排名第一,精度超過其他單階段檢測器,檢測速度也達到25FPS ,是目前排名第二方案的兩倍多。
相較于百度和騰訊,阿里巴巴在自動駕駛領(lǐng)域一直頗為低調(diào)。自2018年4月宣布布局自動駕駛后,鮮有聲音對外發(fā)出。在技術(shù)路線上,阿里巴巴選擇L4級自動駕駛道路,并試圖以協(xié)同智能的方式降低自動駕駛現(xiàn)有方案的物理困境和成本障礙,該研究由AI實驗室首席科學(xué)家王剛親自帶隊。去年9月的云棲大會上,阿里巴巴集團首席技術(shù)官(CTO)兼阿里云智能總裁張建鋒稱,達摩院的自動駕駛已達到L4級水平,但未有更多信息流出。
該論文團隊表示,“檢測器的創(chuàng)新是自動駕駛領(lǐng)域落地的關(guān)鍵突破口,此次我們提出的檢測器融合了單階段檢測器和兩階段檢測器的優(yōu)勢,因此同時實現(xiàn)了3D檢測精讀和速度的提升,未來檢測器的創(chuàng)新研究還可以解決自動駕駛產(chǎn)業(yè)的更多難題?!?/p>
責(zé)任編輯:gt
-
阿里巴巴
+關(guān)注
關(guān)注
7文章
1618瀏覽量
47366 -
激光雷達
+關(guān)注
關(guān)注
968文章
4003瀏覽量
190183 -
自動駕駛
+關(guān)注
關(guān)注
784文章
13905瀏覽量
166746
發(fā)布評論請先 登錄
相關(guān)推薦
評論