0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器人定位及建圖的準(zhǔn)確性和魯棒性

hl5C_deeptechch ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-01-06 11:24 ? 次閱讀

將一個機器人隨機放入未知環(huán)境中,是否有辦法讓機器人一邊移動一邊確定自己的位置并構(gòu)建該環(huán)境的地圖?近日,由重慶大學(xué)王科副教授帶領(lǐng)的團(tuán)隊的論文 SBAS:Salient Bundle Adjustment for Visual SLAM,將顯著性預(yù)測模型應(yīng)用于 SLAM 框架中去,模擬人類執(zhí)行這一任務(wù)的過程,有效提升了機器人定位及建圖的準(zhǔn)確性和魯棒性。

69a3b94c-4fce-11eb-8b86-12bb97331649.png

1. 什么是 SLAM?

SLAM 的全稱是 Simultaneous Localization And Mapping,即同時定位與建圖。

通俗來說,該技術(shù)希望搭載特定傳感器的機器人在未知的環(huán)境中,通過不斷的運動提取環(huán)境中的特征如墻角、柱子等來估計自身的位置,并同時根據(jù)傳感器觀測到的數(shù)據(jù)建立環(huán)境的地圖,從而達(dá)到同時定位和地圖構(gòu)建的目的。

通常情況下,基于幾何的方法的 SLAM 技術(shù)可以分為兩類:特征法和直接法。

特征法通過提取和匹配圖像中的關(guān)鍵點通過最小化重投影誤差來估計相機的姿態(tài),而直接法則直接利用圖像中的像素強度通過最小化光度誤差來估計相機的姿態(tài)。目前,該領(lǐng)域已經(jīng)有了一些較為出色的算法模型。

MonoSLAM 是第一個使用擴展卡爾曼濾波(EKF)和 Shi-Tomasi 角點的實時視覺 SLAM 系統(tǒng)。該方法簡化了 SLAM 對硬件的要求,并可以被應(yīng)用于仿人機器人實時 3D 定位和建圖以及手持相機的在線增強現(xiàn)實。

69d0f72c-4fce-11eb-8b86-12bb97331649.png

PTAM 是最早提出將 Track 和 Map 分開作為兩個線程的一種 SLAM 算法,也是一種基于關(guān)鍵幀的單目視覺 SLAM 算法。采用非線性優(yōu)化方法代替基于濾波器的方法作為后端優(yōu)化方法,PTAM 提出并實現(xiàn)了跟蹤映射過程的并行化。

6a187e26-4fce-11eb-8b86-12bb97331649.png

直接法不提取特征點,而是利用像素強度通過最小化光度誤差來估計攝像機的姿態(tài)?;谥苯臃ǖ?SLAM 模型如下:

DTAM 是第一個使用直接方法生成密集三維地圖的系統(tǒng)。然而,它需要商用 GPU 來執(zhí)行復(fù)雜的計算。為了提高效率,SVO 提取 FAST 特征,然后利用直接法的方式來估計攝像機的姿態(tài)和三維結(jié)構(gòu)。

6a67dda4-4fce-11eb-8b86-12bb97331649.png

LSD-SLAM 擴展了這項工作,并且可以在大比例尺環(huán)境下生成半密集地圖。同時能夠?qū)⑷S環(huán)境地圖實時重構(gòu)為關(guān)鍵幀的姿態(tài)圖和對應(yīng)的半稠密的深度圖。

6aba2a50-4fce-11eb-8b86-12bb97331649.png

除了基于幾何的方法的 SLAM 外,基于深度學(xué)習(xí)的 SLAM 憑借神經(jīng)網(wǎng)絡(luò)強大的學(xué)習(xí)能力也取得了很大的進(jìn)步。PoseNet 是最早使用 CNN 端到端估計相機姿態(tài)的方法之一。Deep VO 使用 RNN 來建模運動動力學(xué)和圖像序列之間的關(guān)系,ESP-VO 在此基礎(chǔ)上增加了位姿估計的不確定性估計。

2. 基于顯著性模型的 SLAM 框架

6b223d7a-4fce-11eb-8b86-12bb97331649.png

圖 | 框架總覽

為更好地解決現(xiàn)有 SLAM 框架的問題,作者提出了一個適用于室內(nèi)和室外環(huán)境的 SLAM 框架,它可以應(yīng)用于各種場景,具有較好的魯棒性和準(zhǔn)確性。

上圖為整體框架的簡化說明,它包括兩個組件:基于幾何法的 SLAM 管道和基于深度學(xué)習(xí)的顯著性預(yù)測模塊。顯著性預(yù)測模塊生成與 SLAM 數(shù)據(jù)集相對應(yīng)的顯著性圖。然后,將顯著性圖作為輸入,幫助 SLAM 選擇顯著的特征點,以提高定位的準(zhǔn)確性和魯棒性。

視覺顯著性是指模仿人類視覺系統(tǒng),從自然場景中選擇出最顯著、最感興趣的區(qū)域或點,以便在不同的任務(wù)下進(jìn)行進(jìn)一步的處理。近年來,有許多基于深度學(xué)習(xí)的方法來預(yù)測自然場景中的顯著性區(qū)域,并取得了很好的效果。然而,這些顯著性預(yù)測方法并不能完全描述 SLAM 系統(tǒng)應(yīng)該關(guān)注的特征,原因是這些方法只使用原始的人類注視信息,例如,在駕駛車輛行駛的過程中,人類的注視通常停留在車輛前方的道路上,因為這是車輛行駛的地方。但是,這還不夠,因為 SLAM/VO 還需要聚焦在遠(yuǎn)離圖像中心的區(qū)域,所以僅僅依靠人眼眼動跟蹤器獲得的凝視數(shù)據(jù),并不能幫助 SLAM 系統(tǒng)捕捉所有這些重要線索。

為解決這一問題,作者通過結(jié)合幾何信息和語義信息,在 KITTI 數(shù)據(jù)集的基礎(chǔ)上,構(gòu)造一個顯著性數(shù)據(jù)集 Salient-KITTI 來訓(xùn)練顯著性模型,用語義注視代替人類注視。具體來說,作者首先提取圖像幾何信息如特征點、線和平面等。然后使用語義分割網(wǎng)絡(luò) SDC Net 在感興趣對象周圍生成分割掩碼。

然后,作者選取了 13 個類別作為 SLAM 應(yīng)該重點關(guān)注的對象(紅綠燈、交通標(biāo)志、道路、建筑物、人行道、停車場、軌道、圍欄、橋梁、電線桿、桿群、植被、地形)來過濾幾何信息,因為這些類別中的區(qū)域通常包含顯著的、穩(wěn)定和魯棒的特征。如下圖,其顯示了語義注視和人類注視地面真值的比較。

6b837662-4fce-11eb-8b86-12bb97331649.png

最后,基于該顯著性數(shù)據(jù)集,作者使用 DI-Net 獲得顯著性模型,并用它來預(yù)測初始顯著性圖,隨后根據(jù)圖像的深度信息得到最終的顯著性圖。

為了驗證顯著性模型的可行性,作者做了三個實驗:

a) 1、顯著性模型的有效性驗證。使用分別在 Saleint-KITTI 數(shù)據(jù)集和 SALICON 數(shù)據(jù)集上訓(xùn)練的顯著性模型,驗證所提出的顯著性模型相對于其它顯著性模型的有效性。

6bb33cd0-4fce-11eb-8b86-12bb97331649.png

圖 | SALICON 和 KITTI 數(shù)據(jù)集訓(xùn)練的顯著性模型的比較

結(jié)果顯示,對于基于 SALICON 數(shù)據(jù)集訓(xùn)練的模型,當(dāng)圖像中沒有顯著對象時,注意力集中在圖像的中心,從而忽略了其他重要信息,即我們所說的存在中心偏差。相反,在 Salient-KITTI 數(shù)據(jù)集上訓(xùn)練的模型可成功地捕捉到這些重要信息。此外,該模型還可以減少動態(tài)對象的影響,因此具有顯著性值高的點通常是更穩(wěn)定和魯棒的點。

2、基于 KITTI 數(shù)據(jù)集的室外場景驗證。在單目和立體視覺配置中,作者提出的系統(tǒng)比 ORB-SLAM3 更精確,因為 SBA 使顯著特征點充分發(fā)揮其作用。同時,本實驗也證明利用顯著圖可以使算法在姿態(tài)估計方面有更多的優(yōu)勢,具體效果如下圖所示。

6c98bd28-4fce-11eb-8b86-12bb97331649.png

3、基于 EuRoc 數(shù)據(jù)集的室內(nèi)場景驗證。在第三個實驗中,作者將算法與其他最先進(jìn)的算法進(jìn)行了比較,如 ORB-SLAM、DSM、DSO、突出 DSO 和 ORB-SLAM3。

6ce2a546-4fce-11eb-8b86-12bb97331649.png

圖 | EuRoc 數(shù)據(jù)集的一些軌跡結(jié)果和地面真實情況

6d5143f2-4fce-11eb-8b86-12bb97331649.png

結(jié)果顯示,在大多數(shù)序列中,作者提出的模型在室內(nèi)和室外環(huán)境下都能很好地工作,同時也比文獻(xiàn)中的最新技術(shù)獲得更精確的結(jié)果。

王科表示,該研究不僅僅針對自動駕駛,基于圖像處理的都可以用,它是一個基礎(chǔ)的算法,而非純應(yīng)用的提升,只不過最初是在自動駕駛平臺做起來的。

而隨著 SLAM 技術(shù)的不斷發(fā)展,它們將被應(yīng)用到越來越多的領(lǐng)域中,小到掃地機器人,大到無人駕駛技術(shù)、AR、VR 等,未來將為人類生活帶來極大的便利。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4623

    瀏覽量

    93110
  • SLAM
    +關(guān)注

    關(guān)注

    23

    文章

    425

    瀏覽量

    31881
  • 機器人視覺
    +關(guān)注

    關(guān)注

    0

    文章

    48

    瀏覽量

    10108

原文標(biāo)題:重慶大學(xué)研發(fā)定位與建圖技術(shù),可讓機器人視覺更智能

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人的基礎(chǔ)模塊

    ,一次生成深度信息。 自主機器人定位任務(wù)的本質(zhì)是對機器人自身狀態(tài)的估計問題,包括位置,朝向,速度等問題。 路徑規(guī)劃旨在找到從起點到目標(biāo)區(qū)域的路徑,確保路徑的可行和最優(yōu)。路徑規(guī)劃方法
    發(fā)表于 01-04 19:22

    《具身智能機器人系統(tǒng)》第10-13章閱讀心得之具身智能機器人計算挑戰(zhàn)

    閱讀《具身智能機器人系統(tǒng)》第10-13章,我對具身智能機器人的工程實踐有了全新認(rèn)識。第10章從實時角度剖析了機器人計算加速問題。機器人定位
    發(fā)表于 01-04 01:15

    自動駕駛中常提的是個啥?

    隨著自動駕駛技術(shù)的快速發(fā)展,(Robustness)成為評價自動駕駛系統(tǒng)的重要指標(biāo)之一。很多小伙伴也會在自動駕駛相關(guān)的介紹中,對某些功能用
    的頭像 發(fā)表于 01-02 16:32 ?1936次閱讀
    自動駕駛中常提的<b class='flag-5'>魯</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>是個啥?

    如何提高OTDR測試的準(zhǔn)確性

    OTDR(光時域反射儀)是光纜線路故障定位和光纖特性測量的重要工具,提高OTDR測試的準(zhǔn)確性對于確保光纜線路的穩(wěn)定運行至關(guān)重要。以下是一些提高OTDR測試準(zhǔn)確性的方法: 一、準(zhǔn)確設(shè)置O
    的頭像 發(fā)表于 12-31 09:25 ?231次閱讀

    如何提高電位測量準(zhǔn)確性

    在電子工程和物理實驗中,電位測量是一項基本而重要的任務(wù)。電位測量的準(zhǔn)確性直接影響到實驗結(jié)果的可靠和產(chǎn)品的安全。 1. 選擇合適的測量設(shè)備 選擇合適的測量設(shè)備是提高電位測量準(zhǔn)確性的第
    的頭像 發(fā)表于 12-28 13:56 ?160次閱讀

    如何提升ASR模型的準(zhǔn)確性

    提升ASR(Automatic Speech Recognition,自動語音識別)模型的準(zhǔn)確性是語音識別技術(shù)領(lǐng)域的核心挑戰(zhàn)之一。以下是一些提升ASR模型準(zhǔn)確性的關(guān)鍵方法: 一、優(yōu)化數(shù)據(jù)收集與處理
    的頭像 發(fā)表于 11-18 15:14 ?1057次閱讀

    原理在控制系統(tǒng)中的應(yīng)用

    在現(xiàn)代控制系統(tǒng)的設(shè)計和分析中,是一個核心概念。指的是系統(tǒng)在面對模型不確定性、外部干擾
    的頭像 發(fā)表于 11-11 10:26 ?1576次閱讀

    深度學(xué)習(xí)模型的優(yōu)化

    深度學(xué)習(xí)模型的優(yōu)化是一個復(fù)雜但至關(guān)重要的任務(wù),它涉及多個方面的技術(shù)和策略。以下是一些關(guān)鍵的優(yōu)化方法: 一、數(shù)據(jù)預(yù)處理與增強 數(shù)據(jù)清洗 :去除數(shù)據(jù)中的噪聲和異常值,這是提高模型
    的頭像 發(fā)表于 11-11 10:25 ?324次閱讀

    算法在數(shù)據(jù)處理中的應(yīng)用

    。 二、算法的主要類型 統(tǒng)計方法:這類方法主要關(guān)注如何從含有異常值的數(shù)據(jù)中提取出有用
    的頭像 發(fā)表于 11-11 10:22 ?422次閱讀

    分析方法及其應(yīng)用

    (Robustness)是指系統(tǒng)或方法對于外部干擾、誤差或變化的穩(wěn)定性和適應(yīng)能力。以下是對
    的頭像 發(fā)表于 11-11 10:21 ?2308次閱讀

    機器學(xué)習(xí)中的重要

    機器學(xué)習(xí)領(lǐng)域,模型的是指模型在面對輸入數(shù)據(jù)的擾動、異常值、噪聲或?qū)剐怨魰r,仍能保持性能的能力。隨著人工智能技術(shù)的快速發(fā)展,機器學(xué)
    的頭像 發(fā)表于 11-11 10:19 ?453次閱讀

    如何提高系統(tǒng)的

    在當(dāng)今的技術(shù)環(huán)境中,系統(tǒng)面臨著各種挑戰(zhàn),包括硬件故障、軟件缺陷、網(wǎng)絡(luò)攻擊和人為錯誤。是指系統(tǒng)在面對這些挑戰(zhàn)時保持正常運行的能力。 一、定義
    的頭像 發(fā)表于 11-11 10:17 ?826次閱讀

    如何評估 ChatGPT 輸出內(nèi)容的準(zhǔn)確性

    評估 ChatGPT 輸出內(nèi)容的準(zhǔn)確性是一個復(fù)雜的過程,因為它涉及到多個因素,包括但不限于數(shù)據(jù)的質(zhì)量和多樣、模型的訓(xùn)練、上下文的理解、以及輸出內(nèi)容的邏輯一致。以下是一些評估 ChatGPT 輸出
    的頭像 發(fā)表于 10-25 17:48 ?632次閱讀

    影響電源紋波測試準(zhǔn)確性的因素

    電源紋波測試是評估電源質(zhì)量的重要手段之一,它能夠反映出電源在輸出電壓中的波動情況。然而,測試過程中的多種因素都可能對測試結(jié)果的準(zhǔn)確性產(chǎn)生影響。本文將從多個方面分析影響電源紋波測試準(zhǔn)確性的因素,并提
    的頭像 發(fā)表于 08-02 09:42 ?659次閱讀

    基于計算設(shè)計的超應(yīng)變傳感器,實現(xiàn)軟體機器人的感知和自主

    柔性應(yīng)變傳感器對軟體機器人的感知和自主至關(guān)重要。然而,它們的可變形體和動態(tài)驅(qū)動在預(yù)測傳感器制造和長期方面帶來了挑戰(zhàn)。
    的頭像 發(fā)表于 03-07 09:50 ?920次閱讀
    基于計算設(shè)計的超<b class='flag-5'>魯</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>應(yīng)變傳感器,實現(xiàn)軟體<b class='flag-5'>機器人</b>的感知和自主<b class='flag-5'>性</b>