0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

淺談語義在SLAM中的應用

新機器視覺 ? 來源:濤濤CV ? 作者:濤濤CV ? 2021-06-15 13:18 ? 次閱讀

Simultaneous Localization And Mapping(同時建圖與定位)

可以分為四大部分:initialization, tracking, local mapping, global optimization

視覺SLAM主要涉及的知識

多視角幾何:投影幾何,相機模型

圖像處理:特征提取,特征點跟蹤

優(yōu)化算法:非線性優(yōu)化算法(Levenberg-Marquardt法)

INITIALIZATION

一般將第一張圖像進入系統(tǒng)時的相機位姿作為V-SLAM系統(tǒng)的參考坐標系

選取之后輸入的某張圖像計算和第一張圖像匹配角點并三角化獲取深度,生成候選的初始化MAP

重投影計算誤差,如果誤差太大則重新選取圖像

直到誤差小于閾值,進行一次優(yōu)化,得到初始化MAP

TRACKING

計算當前圖像和之前相近圖像的關系(特征點匹配,光流法,邊緣跟蹤等等)

根據(jù)計算出的關系,通過相應算法估計當前相機的大概位置

其中“直接法”將前面兩部合并為一步來執(zhí)行

LOCAL MAPPING

可以采取滑動窗口的方式或者挑選某些關鍵幀來建立局部地圖

當某一幀圖像根據(jù)策略算法選為關鍵幀后,添加到局部地圖的關鍵幀隊列中

管理局部地圖中存在的點云

進行局部的Bundle Adjustment(BA)

最后進行關鍵幀的管理

GLOBAL OPTIMIZATION

利用BOW挑選出候選回環(huán)幀

對候選回環(huán)幀進行驗證,確保是正確的回環(huán)

根據(jù)回環(huán)幀計算累積漂移誤差

最后進行全局優(yōu)化

語義SLAM

為什么要語義?

對環(huán)境的魯棒性(動態(tài)環(huán)境)

獲取地圖的先驗信息,得到更高精度(添加語義約束)

更好地回環(huán)檢測

人機交互(如CAD制圖)

poYBAGDIOiuADxblAAE1k4-MlT0144.jpg

傳統(tǒng)回環(huán)檢測

目前比較主流的回環(huán)檢測方法一般都依賴于BoW(bag of visual words)方法

開源庫:DBoW2: https://github.com/dorian3d/DBoW2(當然還有DBoW3,fbow)

連續(xù)幀匹配DLoopDetector:https://github.com/dorian3d/DLoopDetector

ORB-SLAM,VINS等都使用了DBoW2

其他檢索方式還有LSH(Locality-Sensitive Hashing)以及

LLC(Locality-constrained Linear Coding)

語義能夠給SLAM系統(tǒng)帶來的好處

支持中長期的tracking

環(huán)境適應性更強(魯棒性)

潛在的人機交互特性

語義SLAM系統(tǒng)和傳統(tǒng)SLAM系統(tǒng)對比

pYYBAGDIOiSAXcocAAC_etSKNcA215.jpg

由于我們 人類見過大量的圖像,形成了一種天生的直覺,對大部分場景都有一個直觀的距離感 (空間感),它可以幫助我們判斷圖像中物體的遠近關系。

1.平移之后才能計算深度

2.無法確定真實尺度

原因是通過單張圖像無法確定深度。

深度相機(稱RGB-D相機)最大的特點是可以通過紅外結構光或Time-of-Flight(ToF) 原理,像激光傳感器那樣,通過主動向物體發(fā)射光并接收返回的光,測出物體與相機之間的距離。這部分是通過物理的測量手段來解決的,所以不需要大量的算力。

ToF

基本原理是通過連續(xù)發(fā)射光脈沖(一般為不可見光)到被觀測物體上,然后用傳感器接收從物體返回的光,通過探測光脈沖的飛行(往返)時間來得到目標物距離。

pYYBAGDIOh2AVTlIAABI93r9pxY207.jpg

結構光

結構光測距是用一個光源(常用是紅外)將一定的圖案投射到物體上,再用攝像頭收集變形后的圖案進行深度計算。

poYBAGDIOhaAaLXPAABQnZsNWSc032.jpg

這種方法比純雙目匹配好的地方在于,參考圖像不是獲取的,而是經(jīng)過專門設計的圖案 ,因此特征點是已知的,而且更容易從測試圖像中提取。結構光采用三角視差測距,基線(光源與鏡頭光心的距離)越長精度越高。由于是主動光,無法在室外使用。

不論是一般結構光還是散斑結構光,缺點是它所使用的激光器發(fā)出的編碼光斑容易被太陽光淹沒掉, 工作距離短,室外陽光下不工作。

結構光方案中的激光器壽命較短,難以滿足7x24小時的長時間工作要求,其長時間連續(xù)工作很容易損壞。而因為單目鏡頭和激光器需要進行精確的標定,一旦損壞,替換激光器時重新進行兩者的標定是非常困難的,所以往往導致整個模塊都要一起被換掉。

現(xiàn)在多數(shù) RGB-D 相機還存在測量范圍窄、噪聲大、視野小、易受日光干擾、無法測量透射材質等諸多問題,在 SLAM 方面,主要用于室內(nèi),室外則較難應用。

立體視覺

pYYBAGDIOg6AKaWtAACYEf1BI2Y459.jpg

雙目相機 的距離估計是比較左右眼的圖像獲得的,并不依賴其他傳感設備,所以它既可以應用在室內(nèi),亦可應用于室外。

雙目立體視覺是純視覺的方法,需要逐像素計算匹配;同時,為了保證匹配結果比較魯棒,算法中會增加大量的錯誤剔除策略,因此對算法要求較高,計算量較大。

VSLAM(Mono)

優(yōu)勢:成本低、搭建簡單

劣勢:

1) 需要專門初始化

2) 尺度問題

在單張圖片里,無法確定一個物體的真實大小。它可能是一個很大但很遠的物體,也可能是一個很近很小的物體。

3) 深度計算存在缺陷

a. 3D假圖問題

b. 機器學習的樣本問題

VSLAM(Stereo)

優(yōu)勢:

1) 不需要專門初始化

2) 能夠計算深度

3) 能夠用于室內(nèi)和室外

劣勢:

1) 標定較為復雜

2) 視差計算比較耗資源,需要GPU/FPGA 或 專門的ASIC芯片 協(xié)助。

責任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SLAM
    +關注

    關注

    23

    文章

    426

    瀏覽量

    31902

原文標題:語義SLAM與深度相機

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    利用VLM和MLLMs實現(xiàn)SLAM語義增強

    語義同步定位與建圖(SLAM)系統(tǒng)在對鄰近的語義相似物體進行建圖時面臨困境,特別是復雜的室內(nèi)環(huán)境。本文提出了一種面向對象
    的頭像 發(fā)表于 12-05 10:00 ?257次閱讀
    利用VLM和MLLMs實現(xiàn)<b class='flag-5'>SLAM</b><b class='flag-5'>語義</b>增強

    最新圖優(yōu)化框架,全面提升SLAM定位精度

    同時定位與地圖構建(SLAM)是一項關鍵技術,允許移動機器人在部分或完全未知的環(huán)境自主導航。它包括使用機載傳感器同時估計機器人狀態(tài)和構建傳感器檢測到的環(huán)境地圖。SLAM可以根據(jù)傳感器和地圖構建技術
    的頭像 發(fā)表于 11-12 11:26 ?603次閱讀
    最新圖優(yōu)化框架,全面提升<b class='flag-5'>SLAM</b>定位精度

    激光雷達SLAM算法的應用綜述

    一、文章概述 1.1 摘 要 即時定位與地圖構建(simultaneous localization and mapping,SLAM)是自主移動機器人和自動駕駛的關鍵 技術之一,而激光雷達則是支撐
    的頭像 發(fā)表于 11-12 10:30 ?1008次閱讀
    激光雷達<b class='flag-5'>在</b><b class='flag-5'>SLAM</b>算法<b class='flag-5'>中</b>的應用綜述

    MG-SLAM:融合結構化線特征優(yōu)化高斯SLAM算法

    同步定位與地圖構建 (SLAM) 是計算機視覺的一個基本問題,旨在在同時跟蹤相機姿勢的同時對環(huán)境進行地圖構建?;趯W習的密集 SLAM 方法,尤其是神經(jīng)輻射場 (NeRF) 方法,
    的頭像 發(fā)表于 11-11 16:17 ?410次閱讀
    MG-<b class='flag-5'>SLAM</b>:融合結構化線特征優(yōu)化高斯<b class='flag-5'>SLAM</b>算法

    從算法角度看 SLAM(第 2 部分)

    作者: Aswin S Babu 正如我們[第 1 部分]中所討論的,SLAM 是指在無地圖區(qū)域中估計機器人車輛的位置,同時逐步繪制該區(qū)域地圖的過程。根據(jù)使用的主要技術,SLAM 算法可分為三種
    的頭像 發(fā)表于 10-02 16:39 ?387次閱讀
    從算法角度看 <b class='flag-5'>SLAM</b>(第 2 部分)

    圖像語義分割的實用性是什么

    圖像語義分割是一種重要的計算機視覺任務,它旨在將圖像的每個像素分配到相應的語義類別。這項技術許多領域都有廣泛的應用,如自動駕駛、醫(yī)學圖
    的頭像 發(fā)表于 07-17 09:56 ?507次閱讀

    圖像分割與語義分割的CNN模型綜述

    圖像分割與語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定語義含義的區(qū)域或對象。卷積神經(jīng)網(wǎng)絡(CNN)作為深度學習的一種核心模型,圖像分割與語義分割中發(fā)揮著至關重要的
    的頭像 發(fā)表于 07-09 11:51 ?1114次閱讀

    深度解析深度學習下的語義SLAM

    隨著深度學習技術的興起,計算機視覺的許多傳統(tǒng)領域都取得了突破性進展,例如目標的檢測、識別和分類等領域。近年來,研究人員開始視覺SLAM算法引入深度學習技術,使得深度學習SLAM系統(tǒng)
    發(fā)表于 04-23 17:18 ?1370次閱讀
    深度解析深度學習下的<b class='flag-5'>語義</b><b class='flag-5'>SLAM</b>

    工程實踐VINS與ORB-SLAM的優(yōu)劣分析

    ORB-SLAM是一種基于特征的單目視覺SLAM系統(tǒng),廣泛用于實時三維地圖構建和機器人定位。該系統(tǒng)使用ORB特征進行高效的視覺識別和地圖重建,支持關鍵幀技術和回環(huán)檢測來優(yōu)化地圖的準確性。
    的頭像 發(fā)表于 04-08 10:17 ?3079次閱讀
    工程實踐<b class='flag-5'>中</b>VINS與ORB-<b class='flag-5'>SLAM</b>的優(yōu)劣分析

    什么是SLAMSLAM算法涉及的4要素

    SLAM技術可以應用在無人駕駛汽車、無人機、機器人、虛擬現(xiàn)實等領域中,為這些領域的發(fā)展提供了支持。SLAM技術的發(fā)展已經(jīng)逐漸從單純的定位和地圖構建轉向了基于場景理解的功能。
    發(fā)表于 04-04 11:50 ?2699次閱讀

    什么是SLAM?基于3D高斯輻射場的SLAM優(yōu)勢分析

    基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數(shù),通過可微分渲染捕獲稠密的光度信息,具有高保真度。
    的頭像 發(fā)表于 04-01 12:44 ?815次閱讀

    淺談IT隔離電源系統(tǒng)醫(yī)院電氣設計的應用

    淺談IT隔離電源系統(tǒng)醫(yī)院電氣設計的應用 張穎姣 安科瑞電氣股份有限公司 上海嘉定 201801 【摘要】許多國際標準都對醫(yī)療領域,尤其是那些生命攸關的場所,如手術室、重癥監(jiān)護室、心臟監(jiān)護室等
    的頭像 發(fā)表于 03-14 10:38 ?425次閱讀
    <b class='flag-5'>淺談</b>IT隔離電源系統(tǒng)<b class='flag-5'>在</b>醫(yī)院電氣設計<b class='flag-5'>中</b>的應用

    淺談配電節(jié)能技術醫(yī)院建筑的應用

    淺談配電節(jié)能技術醫(yī)院建筑的應用 張穎姣 安科瑞電氣股份有限公司 上海嘉定 201801 摘要:本文旨在探討電氣節(jié)能技術醫(yī)院建筑的應用
    的頭像 發(fā)表于 02-27 15:15 ?405次閱讀
    <b class='flag-5'>淺談</b>配電節(jié)能技術<b class='flag-5'>在</b>醫(yī)院建筑<b class='flag-5'>中</b>的應用

    從基本原理到應用的SLAM技術深度解析

    LSD-SLAM 即 Large-Scale Direct SLAM,兼容單目相機和雙目相機。LSD-SLAM是一種基于光流跟蹤的直接法SLAM,但是實現(xiàn)了半稠密建圖,建圖規(guī)模大,可以
    發(fā)表于 02-26 09:41 ?9595次閱讀
    從基本原理到應用的<b class='flag-5'>SLAM</b>技術深度解析