對象SLAM被認(rèn)為對于機器人高級感知和決策制定越來越重要。現(xiàn)有研究在數(shù)據(jù)關(guān)聯(lián)、對象表示和語義映射方面存在不足,并且經(jīng)常依賴于額外的假設(shè),從而限制了它們的性能。在本文中,我們提出了一個綜合的對象SLAM框架,該框架專注于基于對象的感知和面向?qū)ο蟮臋C器人任務(wù)。首先,我們提出了一種集成數(shù)據(jù)關(guān)聯(lián)方法,用于通過結(jié)合參數(shù)和非參數(shù)統(tǒng)計測試來關(guān)聯(lián)復(fù)雜條件下的對象。此外,我們建議基于iForest和線對齊的對象建模的離群魯棒質(zhì)心和尺度估計算法。然后由估計的通用對象模型表示輕量級和面向?qū)ο蟮牡貓D??紤]到對象的語義不變性,我們將對象圖轉(zhuǎn)換為拓?fù)鋱D以提供語義描述符以實現(xiàn)多圖匹配。最后,我們提出了一種對象驅(qū)動的主動探索策略,以在抓取場景中實現(xiàn)自主建圖。
提出的對象SLAM框架。
1 系統(tǒng)框架
本框架主要包含4個模塊:
1.Tracking module:基于ORB-SLAM2實現(xiàn)相機軌跡跟蹤并生成稀疏點云。
2.Semantic module:采用YOLO物體檢測網(wǎng)絡(luò),結(jié)合點云測量與2D檢測結(jié)果進行數(shù)據(jù)關(guān)聯(lián)。利用iForest和線段對齊算法優(yōu)化點云和線段。基于關(guān)聯(lián)和優(yōu)化結(jié)果參數(shù)化物體。
3.Object map:實現(xiàn)基于物體的輕量語義地圖表示。
4.Application module:Augmented reality:基于實際物體姿態(tài)實現(xiàn)虛實模型配準(zhǔn),考慮遮擋和碰撞效果。Scene matching:將對象地圖轉(zhuǎn)換為拓?fù)鋱D,設(shè)計物體描述子實現(xiàn)多情景匹配。Active exploration:利用物體不完整度量式信息熵驅(qū)動主動構(gòu)建全局對象地圖,實現(xiàn)抓握場景。
總的來說,框架實現(xiàn)穩(wěn)健的數(shù)據(jù)關(guān)聯(lián)、精確的物體參數(shù)化以及基于語義對象地圖的高層應(yīng)用,解決了對象SLAM涉及的主要挑戰(zhàn)。語義對象地圖能為機器人抓取、導(dǎo)航、規(guī)劃等復(fù)雜任務(wù)提供必要信息,有助于實現(xiàn)智能機器人
2 對象級數(shù)據(jù)關(guān)聯(lián)
本文提出一個集成方法來執(zhí)行多幀間的對象數(shù)據(jù)關(guān)聯(lián)。關(guān)聯(lián)算法主要包含4部分:
(1) 運動IOU模型:如果全局物體在前兩幀(t-1和t-2)可觀測,則基于勻速運動假設(shè)預(yù)測當(dāng)前幀(t)的邊界框,與檢測到的本地物體計算IOU值。
(2) 非參數(shù)檢驗?zāi)P?如果連續(xù)觀測到物體失敗,則直接應(yīng)用非參數(shù)Wilcoxon檢驗對P和Q(代表物體點云)進行驗證。假設(shè)它們來自同一物體,則應(yīng)滿足同一分布 fP = fQ 。
(3) 單樣本t檢驗?zāi)P?分析不同視角下物體質(zhì)心C和c是否來自同一物體。建立t統(tǒng)計量并與臨界值比較:
(4)投影IOU模型:將三維點云投影到二維圖像,擬合投影邊界框與檢測框的IOU(5) 雙樣本t檢驗?zāi)P?如果存在重復(fù)物體,則對兩個物體的歷史質(zhì)心C1和C2建立t統(tǒng)計量并比較,實現(xiàn)合并:
其中d為兩個物體的池化標(biāo)準(zhǔn)差。通過集成利用不同統(tǒng)計特征,提高了數(shù)據(jù)關(guān)聯(lián)的魯棒性和成功率。實驗結(jié)果表明,與單一方法相比,集成方法能更有效地關(guān)聯(lián)不同視角下的物體,為下一步的參數(shù)化奠定基礎(chǔ)??偟膩碚f,該方法充分利用了點云和質(zhì)心分別顯示的非高斯分布和高斯分布特性,通過不同統(tǒng)計模型集成提高關(guān)聯(lián)性能。
對象級數(shù)據(jù)關(guān)聯(lián)示意圖
3 對象參數(shù)化
我們利用立方體和二次曲面、圓柱體來表示對象,而不是復(fù)雜的實例級或類別級模型。對于具有規(guī)則形狀的對象,例如書本、鍵盤和椅子,我們使用立方體(由它們的頂點 Po 編碼)來表示它們。對于球、瓶、杯等沒有明確方向的非規(guī)則物體,采用二次/圓柱(由其半軸Qo編碼)表示,忽略其方向參數(shù)。這里,Po 和 Qo 在對象坐標(biāo)系中表示,僅取決于尺度 s。為了將這些元素對準(zhǔn)到全局地圖,我們還需要估計它們的平移 t 和方向 θ。全局坐標(biāo)系中的立方體和二次曲面表示如下:
隨后,提出了基于iForest和線段對齊的離群點過濾算法,實現(xiàn)精確的對象尺度、位置和方位估計。主要包括以下部分:
(1) 平移和尺度估計:利用iForest去除點云中的離群點,剩余點云實現(xiàn)對象的初始尺度s和位置t估計。算法1描述了基于iForest的算法:
(2) 方位估計:分為初始化和優(yōu)化兩個階段。
算法2描述了初始化算法:
(3) 對象表示:根據(jù)物體形狀使用立方體或?qū)悄P捅硎?編碼尺度s、位置t和方位角θ。
總的來說,采用iForest過濾離群點和線段對齊初始化方位角,有效實現(xiàn)了精確的6DOF姿態(tài)估計。最終構(gòu)建了基于物體類型的通用模型,實現(xiàn)了輕量級語義對象地圖:
3 對象描述子
為了描述不同物體間的關(guān)系,文章構(gòu)建了語義拓?fù)鋱D和基于此的隨機游走描述子。
拓?fù)鋱D:通過物體的語義標(biāo)簽、位置、姿態(tài)和尺寸信息,構(gòu)建不同物體及物體與情景的關(guān)系圖:
表示物體節(jié)點,編碼物體信息
表示邊,編碼兩個物體的距離d和角度α
描述子:基于拓?fù)鋱D中不同物體間的關(guān)系,采用隨機游走的方式構(gòu)建物體描述子υ:
r是一個隨機行走路徑,起始于被描述的物體,最多到達i個物體。每行重復(fù)j次隨機行走。
多維度信息:為了提高魯棒性,描述子中考慮物體標(biāo)簽l、尺寸s、距離d和角度α四個維度:
4. 場景匹配:基于多個物體對的描述子匹配,求解兩個情景的轉(zhuǎn)換矩陣T:
· 生成兩個情景T1和T2的描述子V1和V2。
· 對每個對象v1在V1中找到在V2中的最佳匹配v2。
· 根據(jù)多個物體對,利用奇異值分解(SVD)求解轉(zhuǎn)換矩陣T。
魯棒性:采用RANSAC算法去除誤匹配物體對,提高匹配的魯棒性??偟膩碚f,基于拓?fù)鋱D實現(xiàn)的物體描述子充分利用了物體的語義、尺寸和相對關(guān)系,能有效實現(xiàn)不同視角下的場景匹配??紤]更多非物體的語義特征可能進一步提高魯棒性和準(zhǔn)確性。
4 實驗結(jié)果
數(shù)據(jù)關(guān)聯(lián):實驗結(jié)果表明,集成不同統(tǒng)計模型超過單一方法。表明點云和質(zhì)心確實呈現(xiàn)非高斯分布和高斯分布。
2. 對象參數(shù)化: 實驗結(jié)果表明, iForest和線段對齊有效實現(xiàn)精確的6DOF姿態(tài)估計。并構(gòu)建了基于形狀的通用對象模型
3. 對象地圖構(gòu)建:可在不同數(shù)據(jù)集上構(gòu)建語義對象地圖,處理不同類、數(shù)量、尺寸和方位角的物體。實驗表明系統(tǒng)的魯棒性。
4. 增強現(xiàn)實:基于精確的物體姿態(tài)信息,實現(xiàn)虛擬模型與實物精準(zhǔn)配準(zhǔn)??紤]遮擋和碰撞效果,提高虛擬可信度。
5. 場景匹配:基于物體描述子,可在不同視角和照明條件下實現(xiàn)場景匹配和多地圖融合。具有魯棒性。
6. 主動地圖構(gòu)建:通過信息熵量化物體觀測完整度,驅(qū)動主動建設(shè)語義對象地圖。實驗表明比隨機探索和全面覆蓋策略更高效和更準(zhǔn)確。
7. 機器人抓取:基于語義對象地圖信息,實現(xiàn)機器人抓握。在虛擬環(huán)境和實際環(huán)境下的成功率分別達到86%和81%。
局限性:數(shù)據(jù)關(guān)聯(lián)在極端情況下存在問題;對象姿態(tài)估計受離群點影響而不準(zhǔn)確;場景匹配依賴精確的對象建模。改進方向:優(yōu)化數(shù)據(jù)關(guān)聯(lián)魯棒性;采用機器學(xué)習(xí)提高姿態(tài)估計精度;構(gòu)建更通用的物體描述子;采用多源感知實現(xiàn)全景對象地圖。
總的來說,實驗結(jié)果充分證明了對象SLAM框架在不同應(yīng)用上的有效性和潛力。同時指出了當(dāng)前的局限性和未來的改進方向。這對促進對象SLAM技術(shù)的發(fā)展至關(guān)重要。
-
框架
+關(guān)注
關(guān)注
0文章
403瀏覽量
17487 -
智能機器人
+關(guān)注
關(guān)注
17文章
868瀏覽量
82296 -
SLAM
+關(guān)注
關(guān)注
23文章
424瀏覽量
31832
原文標(biāo)題:TRO新文:用于數(shù)據(jù)關(guān)聯(lián)、建圖和高級任務(wù)的對象級SLAM框架
文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論