簡介
我們在之前的博客中討論了一些激光回環(huán)檢測的方法,但是基本都是圍繞著點(diǎn)云特征去做的,并未涉足過深度學(xué)習(xí)的相關(guān)方法,之前作者在查找《經(jīng)典文獻(xiàn)閱讀之—BoW3D》資料時(shí)看到了一個(gè)比較感興趣的工作《OverlapNet: Loop Closing for LiDAR-based SLAM》,同時(shí)這個(gè)文章還擁有對應(yīng)的開源源碼Github,非常適合復(fù)現(xiàn)以及學(xué)習(xí)。
工作重心
同時(shí)定位和映射(SLAM)是大多數(shù)自主系統(tǒng)所需的基本能力。在本文中,我們討論了基于自動(dòng)駕駛汽車記錄的3D激光掃描的SLAM閉環(huán)問題。
我們的方法利用深度神經(jīng)網(wǎng)絡(luò),利用從激光雷達(dá)數(shù)據(jù)生成的不同線索來尋找環(huán)路閉合。
它估計(jì)廣義到距離圖像的圖像重疊,并提供掃描對之間的相對偏航角估計(jì)。
基于這些預(yù)測,我們處理環(huán)路閉合檢測,并將我們的方法集成到現(xiàn)有的SLAM系統(tǒng)中,以改善其映射結(jié)果。
簡單來說,作者通過深度學(xué)習(xí)完成點(diǎn)云轉(zhuǎn)換為影像,然后做回環(huán)檢測, 輸出Overlap和yaw的操作步驟,文中指出,本文的主要?jiǎng)?chuàng)新點(diǎn)有:
能夠利用多個(gè)線索,不需提前知道兩個(gè)雷達(dá)掃描的相對位姿,只利用范圍、法向量、強(qiáng)度和語義等線索,使用深度神經(jīng)網(wǎng)絡(luò)直接估計(jì)兩個(gè)激光雷達(dá)掃描的重疊率,以及相對偏航角。
結(jié)合里程計(jì)信息和重疊率預(yù)測實(shí)現(xiàn)閉環(huán)的檢測、修正,可以檢測到的閉環(huán)整合到現(xiàn)有SLAM系統(tǒng)中,可以提高整體位姿估計(jì)的結(jié)果,產(chǎn)生全局一致的地圖。
無需先驗(yàn)位姿信息,解決在自動(dòng)駕駛中3D LiDAR SLAM 的閉環(huán)檢測問題,使用產(chǎn)生正確掃描匹配結(jié)果的OverlapNet網(wǎng)絡(luò)預(yù)測初始化ICP
詳細(xì)算法
2.1 Overlap的概念
作者認(rèn)為直接對比兩個(gè)點(diǎn)云之間的距離不夠精確,因?yàn)闀?huì)受漂移的影響。
因此提出用重疊率來代替距離檢測回環(huán)。具體思路是由影像的overlap中來,要成功匹配兩個(gè)圖像并計(jì)算它們的相對姿態(tài),圖像必須重疊。
這可以通過將重疊百分比定義為第一圖像中的像素的百分比來量化,該像素可以在沒有遮擋的情況下成功地投影回第二圖像中。
請注意,該度量不是對稱的:如果圖像對存在較大的尺度差異。
例如,一幅圖像顯示一堵墻,另一幅顯示該墻周圍的許多建筑物,則第一到第二幅圖像的重疊百分比可能較大,而第二到第一幅圖像的交疊百分比較低。
在本文中,我們使用了距離圖像重疊的思想,明確地利用了距離信息
對于環(huán)路閉合,重疊百分比的閾值可用于決定兩個(gè)激光雷達(dá)掃描是否在同一位置和/或環(huán)路閉合。
對于環(huán)路閉合,這種測量可能比一對掃描記錄位置之間的常用距離更好,因?yàn)槲恢每赡軙?huì)受到漂移的影響,因此不可靠。
重疊預(yù)測與相對姿勢無關(guān),因此可用于查找環(huán)路閉合,而無需知道掃描之間的正確相對姿勢。
2.2 激光雷達(dá)掃描對之間重疊的定義
簡單來說就是將兩個(gè)點(diǎn)云轉(zhuǎn)化為二維圖并且坐標(biāo)系對齊,如果兩個(gè)坐標(biāo)差小于閾值記為1,否則為零,求和再除以兩個(gè)圖中像素較小的那個(gè),作者想用這個(gè)等式建立訓(xùn)練集。
對于旋轉(zhuǎn),作者選擇旋轉(zhuǎn)多個(gè)角度,用最大重疊值代表最終重疊值。
2.3 網(wǎng)絡(luò)結(jié)構(gòu)
下圖描述了所提出的重疊網(wǎng)絡(luò)的概述。我們利用了多個(gè)線索,這些線索可以從單個(gè)激光雷達(dá)掃描中生成,包括深度、法線、強(qiáng)度和語義類概率信息。
深度信息存儲(chǔ)在由一個(gè)通道組成的范圍圖R中。我們使用頂點(diǎn)映射的鄰域信息來生成法線映射N,它有三個(gè)通道編碼法線坐標(biāo)。
我們直接從傳感器獲得強(qiáng)度信息,也稱為緩解,并使用強(qiáng)度信息為單通道強(qiáng)度圖I。使用RangeNet++計(jì)算逐點(diǎn)語義類概率,我們將其表示為語義圖S。
RangeNet++提供20個(gè)不同類的概率。為了提高效率,我們使用主成分分析將20維RangeNet++輸出縮減為壓縮的三維向量。
信息被組合成一個(gè)大小為64×900×D64×900×D的輸入張量,其中64900是輸入的高度和寬度,$D$取決于使用的數(shù)據(jù)類型.
這里沒有特別仔細(xì)去研究,具體就是由兩個(gè)共享權(quán)重的Legs和由Legs生成的相同特征體積對的Head組成。
進(jìn)一步說這個(gè)模型的作用就是將深度圖,向量圖,強(qiáng)度圖,還用RangeNet++做了個(gè)語義圖一起作為輸入。
一個(gè)輸出是角度特征向量,一個(gè)輸出是兩次掃描之間的重疊率。
同時(shí)使用基于surfel的映射系統(tǒng)SuMa作為的SLAM的 pipeline,并將OverlapNet集成到SuMa中,以取代其原始的啟發(fā)式環(huán)路閉合檢測方法。
所以說最后就是SuMa+OverlapNet的集合完成的。
審核編輯:劉清
-
SLAM
+關(guān)注
關(guān)注
23文章
425瀏覽量
31844 -
激光掃描
+關(guān)注
關(guān)注
0文章
116瀏覽量
11449
原文標(biāo)題:經(jīng)典文獻(xiàn)閱讀之—OverlapNet
文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論