0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于視覺SLAM直接法的介紹

3D視覺工坊 ? 來源:深藍AI ? 作者:專注于人工智能的 ? 2022-11-30 09:22 ? 次閱讀

本次內(nèi)容包括三個部分,分別是三維幾何學的基礎(chǔ)和特征點法和直接法的對比,直接法的代表工作以及對于未來發(fā)展的展望。

三維幾何學基礎(chǔ)知識

關(guān)于基礎(chǔ)知識,首先要了解的是剛體運動的基本屬性。三維空間的剛體運動通常包括六個自由度,對應的轉(zhuǎn)換矩陣的表達方式在不同的文獻中有不同的方式,而在學術(shù)寫作的時候,不管用哪一種,重要的是一定要保持格式的統(tǒng)一和連貫。此外,轉(zhuǎn)換矩陣所描述的不是某種運動,而是點在不同坐標系的轉(zhuǎn)換。第二個比較重要的基礎(chǔ)知識是本質(zhì)矩陣和對極幾何。

考慮下列場景:我們用兩個攝像頭可以同時觀測到一個特征點,利用匹配的特征點,我們將可以建立對極約束,當匹配的特征點足夠多時,我們將可以求解本質(zhì)矩陣,比如使用常用的八點法,當求解完成后,我們就可以從本質(zhì)矩陣中分解得到兩個相機位置相對的位移和旋轉(zhuǎn)。值得注意的是本質(zhì)矩陣的自由度是5,因為在位移上,我們丟失了一個自由度的尺度信息

b70e93ba-703c-11ed-8abf-dac502259ad0.png

圖1:多視覺幾何基礎(chǔ)

而關(guān)于SLAM,它是英文“同時定位與建圖”的縮寫。而有時候,我們還會聽到VO,SfM等概念,而因此容易混淆。對于這些概念,我的理解是,sfm用于基于圖像的三維重建,過程可以是在線或者離線,圖像的順序可以是連續(xù)的,也可以是亂序的;視覺slam一般處理的圖像是連續(xù)的,并且過程也是在線的;視覺里程計中有局部地圖生成的模式其實就是slam,而沒有地圖的模式就是單獨的里程計。雖然我們接觸到的大部分視覺里程計都是有對應的地圖,但是,也有些情況,比如現(xiàn)在的一些深度網(wǎng)絡可以通過兩張圖片直接訓練輸出相對位姿,這就是單獨的里程計信息。

b731305a-703c-11ed-8abf-dac502259ad0.png

圖2:SLAM相關(guān)概念的關(guān)系圖

接下來我們來看看特征點法和直接法直接的對比。關(guān)于特征點法,通常我們在兩張圖片上找到特征點以及對應的匹配特征點,從而求兩幀圖像之間的相對位姿以及特征點的三維位置。當有一個初始的相對位姿估計時,我們可以計算特征投影到另一幀圖像的位置,從而可以建立重投影誤差。

相比于使用兩張圖片,當使用多張圖片時,重投影誤差則包括所有特征點在所有可被觀測到的幀上的誤差。而針對直接法,我們所關(guān)注的誤差稱為光度誤差。如果說特征點法關(guān)注的是像素的位置差,那么,直接法關(guān)注的則是像素的顏色差。

總結(jié)一下,特征點法通常會把圖像抽象成特征點的集合,然后去縮小特征點之間的重投影誤差;而直接法則通過warp function直接計算像素點在另一張圖像上的顏色差,這樣就省去了特征提取的步驟。

b775bee6-703c-11ed-8abf-dac502259ad0.png

圖3:直接法和特征點法流程對比

直接法的應用

關(guān)于直接法的應用,主要介紹的是DSO和大范圍DSO。首先關(guān)于直接圖像對齊(direct image alignment),針對每一個圖像的每一個點,我們需要計算像素點顏色的變化,對應點的尋找需要利用warp function,就是將一個點通過相機的內(nèi)外參數(shù)轉(zhuǎn)換到另一個相機的坐標系中,更周全的考慮還需要將兩張圖的亮度進行一致化處理。然而單目相機還是需要面對一個很棘手的問題,那就是無法恢復尺度信息,并且往往會出現(xiàn)尺度漂移的現(xiàn)象。

為了解決這個問題,一種方式是采用雙目攝像頭,對此我們需要使用新的能量函數(shù),添加的優(yōu)化量就是雙目相機另一個攝像頭投影到它上面的誤差,值得注意的是,雙目攝像頭的相對位置需要已知,并且,通過雙目項的添加,會自然的得到尺度的約束。

而實際上,隨著雙目相機和對尺度約束的引入,相比于ORB-SLAM2和深度LSD,大范圍DSO在KITTI等室外場景具備了更好的里程計效果,而經(jīng)過反思,我們認為通過將雙目相機用“聰明”的方式加以利用,我們確實可以得到正確的尺度信息。除了支持里程計信息的獲取,雙目DSO還能很好的支持三維重建。

b7a33024-703c-11ed-8abf-dac502259ad0.png

圖4:雙目DSO三維重建效果

在實現(xiàn)了比較好的三維重建后,接下來值得繼續(xù)研究的方向之一就是語義重建?;谝曈XSLAM的語義重建的流程包括實現(xiàn)定位和地圖后,通過點云信息來進行語義分割,基于分割好的點云,我們將進一步參數(shù)化,抽象化。

總之,我們希望實現(xiàn)對于點云比較簡潔的參數(shù)化描述。

我們接下來的一個工作是試圖從輸入的圖像直接得到想要的語義信息。對應的輸入包括雙目相機獲取的左右圖像,初始的位姿和形狀估計,以及物體的語義分割結(jié)果。而誤差的計算則包括兩張圖片光度投影的誤差,和將物體估計的形狀投影到圖像上的誤差,以及關(guān)于車的形狀和位置的先驗知識。利用構(gòu)建的誤差,我們可以通過高斯牛頓法進行優(yōu)化。

而這里,涉及到的問題包括構(gòu)建車輛的模型來進行參數(shù)化表達,一種方式是利用有效距離場對于形狀以高維度向量的形式進行描述,然后采用PCA模型進行降維壓縮。而在利用能量函數(shù)建立優(yōu)化問題后,我們需要計算雅可比進行二階優(yōu)化,由于待優(yōu)化的變量較多,所以雅可比推導很復雜,不過在我們的論文 DirectShape: Direct Photometric Alignment of Shape Priors for Visual Vehicle Pose and Shape Estimation中,對于所有優(yōu)化變量的雅可比的求解都進行了推導,從而提供了優(yōu)化問題的閉環(huán)解,感興趣的同學可以自行閱讀。而實驗效果也實現(xiàn)了很好的場景描述效果,包括在物體被部分遮擋的情況下。

b7c3f318-703c-11ed-8abf-dac502259ad0.png

圖5:語義重建的輸入信息

接下來一個主題是關(guān)于特征點法和直接法的結(jié)合,第一個工作是結(jié)合特征點實現(xiàn)的相機的在線光度標定。要理解光度標定,就要理解數(shù)碼攝像機的成像過程,首先光源發(fā)射到物體上的光會反射到鏡片上,經(jīng)過鏡頭后,光亮會發(fā)生變化,然后打到傳感器上,一定時間內(nèi)形成能量積累,經(jīng)過響應函數(shù)的處理從而得到對應的光照強度。

從物體表面反射的光通常稱為輻射亮度(radiance),而發(fā)射到傳感器上的光通常稱為輻射照度(irradiance)。這一過程涉及到三個參數(shù),包括是鏡頭的暗角V,曝光時間E,鏡頭的響應函數(shù)f。

b7f42db2-703c-11ed-8abf-dac502259ad0.png

圖6:數(shù)碼相機的成像過程

而相機的光度標定的目標就是求得相機的三個參數(shù),并利用這三個參數(shù)對于圖像進行矯正,從而確保輸出圖像的光度一致性。

為什么我們要進行光度標定呢?因為直接法SLAM的假設就是光度的一致性,即對應的點在不同的圖像中顏色要一致。已有的方法在進行光度標定時,我們需要至少10分鐘的時間完成全部的復雜操作。而當相機安裝在無人機上,或者曝光時間無法控制時,操作將更加復雜。我們所提出的在線光度標定的方法是基于特征點在不同圖片中對應的觀察,能量函數(shù)是所有的點在所有圖像中的實際顏色與模型估計出的顏色的誤差和。在定義了能量函數(shù)后,我們需要怎樣進行建模呢?

首先對于響應函數(shù)的建模還是利用主成分分析,我們收集一百個相機的響應函數(shù)進行PCA,任意一個相機的響應函數(shù)都可以用四個主成分的線性組合來進行描述。對于暗角的建模是基于暗角是完全對稱的假設,并用四階多項式來描述。在對能量函數(shù)進行參數(shù)化后,我們就可以進行優(yōu)化求解。而實際的效果也證明優(yōu)化參數(shù)可以很快收斂成真值。在進行光度標定后,DSO在Euroc等數(shù)據(jù)集上也實現(xiàn)了更好的定位和建圖效果。

b817f8b4-703c-11ed-8abf-dac502259ad0.png

圖7:光度標定后的成像效果

最后一個分享的課題是:如何在采用直接法的同時進行回環(huán)檢測?直接法中因為沒有描述子,所以很難利用進行數(shù)據(jù)關(guān)聯(lián)和回環(huán)檢測,一種思路就是對部分采樣的點添加描述子,在高翔博士的工作LDSO:Direct sparse odmetry with loop closure中,我們把采樣的點一部分換成角點,對于角點我們會建立描述子,從而得到整個圖像的描述子,然后就可以檢測回環(huán),進行全局的位姿圖優(yōu)化。

而實際效果說明,特征的替換并不會影響DSO的效果,并且還增加了新的回環(huán)檢測的功能。此外,還有一種思路是通過直接法得到的點云進行三維特征點的檢測,并且抽取局部特征點的描述子,從而合并成全局特征點的描述子。

未來的工作方向

而關(guān)于直接法的局限性,我認為直接法做全局的優(yōu)化是很有挑戰(zhàn)性的,因為沒有描述子,做回環(huán)檢測和地圖的重定位不是很直觀。而且在極端的光照條件下,它的魯棒性沒有保證,還有一點就是目前的直接法采樣點都是隨機采樣,這就意味著采樣沒有決定性,這就會為之后的重定位引入誤差。

此外,直接法得到的點云如何得到更具備實際意義的表述形式?因為目前得到的點云還是無法直接使用的。直接法需不需要存儲歷史圖像?特征點法只需要保留特征點和描述子,而直接法如果需要全局優(yōu)化,那么就需要存儲圖像與歷史信息進行對照,而一旦存儲圖像,就會導致存儲數(shù)據(jù)的增加,那么這個問題該如何解決?

關(guān)于直接法未來的研究方向,一個可行的工作是增加點的描述性,如果能將之前不具備描述性的圖像的顏色信息,換成具備描述性的描述子信息,那么將可以開展很多新工作。有了這些東西,我們就可以進行跨季節(jié),跨時間,跨天氣的回環(huán)檢測。

此外,直接法獲取的點云質(zhì)量通常較高,但現(xiàn)在依舊沒有充分挖掘這些點云信息的潛力,所以未來如果能夠提取這些點云的描述子,并且和圖像的描述子結(jié)合,那么就可以對場景實現(xiàn)更好的描述性,點云還有可能的潛在用途就是提供簡潔的場景描述。此外,目前點的采樣具有隨機性,而未來,是否可以實現(xiàn)具有確定性的點的采樣?從而實現(xiàn)更準確的重定位?還有就是直接法的全局地圖該如何更新和維護,現(xiàn)在還沒有解決。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • DSO
    DSO
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    23368
  • SLAM
    +關(guān)注

    關(guān)注

    23

    文章

    424

    瀏覽量

    31833
  • orb
    orb
    +關(guān)注

    關(guān)注

    0

    文章

    21

    瀏覽量

    9897

原文標題:視覺SLAM直接法及未來發(fā)展

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    利用VLM和MLLMs實現(xiàn)SLAM語義增強

    語義同步定位與建圖(SLAM)系統(tǒng)在對鄰近的語義相似物體進行建圖時面臨困境,特別是在復雜的室內(nèi)環(huán)境中。本文提出了一種面向?qū)ο?b class='flag-5'>SLAM的語義增強(SEO-SLAM)的新型SLAM系統(tǒng),借
    的頭像 發(fā)表于 12-05 10:00 ?162次閱讀
    利用VLM和MLLMs實現(xiàn)<b class='flag-5'>SLAM</b>語義增強

    網(wǎng)線國標接法介紹

    網(wǎng)線國標接法主要包括兩種:交叉線接法和平行(直通)線接法。以下是這兩種接法的詳細介紹: 一、交叉線接法
    的頭像 發(fā)表于 11-21 09:47 ?210次閱讀

    激光雷達在SLAM算法中的應用綜述

    SLAM算法運行的重要傳感器?;诩す饫走_的SLAM算法,對激光雷達SLAM總體框架進行介紹,詳細闡述前端里程計、后端優(yōu)化、回環(huán)檢測、地圖構(gòu)建模塊的作用并總結(jié)所使用的算法;按由2D到
    的頭像 發(fā)表于 11-12 10:30 ?585次閱讀
    激光雷達在<b class='flag-5'>SLAM</b>算法中的應用綜述

    MG-SLAM:融合結(jié)構(gòu)化線特征優(yōu)化高斯SLAM算法

    同步定位與地圖構(gòu)建 (SLAM) 是計算機視覺中的一個基本問題,旨在在同時跟蹤相機姿勢的同時對環(huán)境進行地圖構(gòu)建?;趯W習的密集 SLAM 方法,尤其是神經(jīng)輻射場 (NeRF) 方法,在捕獲密集光度
    的頭像 發(fā)表于 11-11 16:17 ?308次閱讀
    MG-<b class='flag-5'>SLAM</b>:融合結(jié)構(gòu)化線特征優(yōu)化高斯<b class='flag-5'>SLAM</b>算法

    電動機的△接法和Y接法有什么區(qū)別?簡單介紹

    電動機的△接法(星形接法)和Y接法(三角形接法)是兩種常見的電動機接線方式,它們在電氣特性和應用場景上有所不同。以下是對這兩種接法的簡單
    的頭像 發(fā)表于 10-23 09:53 ?2426次閱讀

    一種適用于動態(tài)環(huán)境的實時視覺SLAM系統(tǒng)

    既能保證效率和精度,又無需GPU,行業(yè)第一個達到此目標的視覺動態(tài)SLAM系統(tǒng)。
    的頭像 發(fā)表于 09-30 14:35 ?487次閱讀
    一種適用于動態(tài)環(huán)境的實時<b class='flag-5'>視覺</b><b class='flag-5'>SLAM</b>系統(tǒng)

    電機角形接法和星形接法介紹

    在電機設計與應用中,繞組的連接方式對電機的性能有著顯著的影響。常見的連接方式有三角形接法和星形接法,它們在電壓和電流的表現(xiàn)上存在顯著差異,這些差異進而影響到電機的效率、功率輸出以及適用場合。本文將
    的頭像 發(fā)表于 09-19 17:06 ?682次閱讀

    深度解析深度學習下的語義SLAM

    隨著深度學習技術(shù)的興起,計算機視覺的許多傳統(tǒng)領(lǐng)域都取得了突破性進展,例如目標的檢測、識別和分類等領(lǐng)域。近年來,研究人員開始在視覺SLAM算法中引入深度學習技術(shù),使得深度學習SLAM系統(tǒng)
    發(fā)表于 04-23 17:18 ?1292次閱讀
    深度解析深度學習下的語義<b class='flag-5'>SLAM</b>

    工程實踐中VINS與ORB-SLAM的優(yōu)劣分析

    ORB-SLAM是一種基于特征的單目視覺SLAM系統(tǒng),廣泛用于實時三維地圖構(gòu)建和機器人定位。該系統(tǒng)使用ORB特征進行高效的視覺識別和地圖重建,支持關(guān)鍵幀技術(shù)和回環(huán)檢測來優(yōu)化地圖的準確性
    的頭像 發(fā)表于 04-08 10:17 ?2853次閱讀
    工程實踐中VINS與ORB-<b class='flag-5'>SLAM</b>的優(yōu)劣分析

    什么是SLAM?SLAM算法涉及的4要素

    SLAM技術(shù)可以應用在無人駕駛汽車、無人機、機器人、虛擬現(xiàn)實等領(lǐng)域中,為這些領(lǐng)域的發(fā)展提供了支持。SLAM技術(shù)的發(fā)展已經(jīng)逐漸從單純的定位和地圖構(gòu)建轉(zhuǎn)向了基于場景理解的功能。
    發(fā)表于 04-04 11:50 ?2414次閱讀

    從基本原理到應用的SLAM技術(shù)深度解析

    LSD-SLAM 即 Large-Scale Direct SLAM,兼容單目相機和雙目相機。LSD-SLAM是一種基于光流跟蹤的直接法SLAM
    發(fā)表于 02-26 09:41 ?9256次閱讀
    從基本原理到應用的<b class='flag-5'>SLAM</b>技術(shù)深度解析

    伏安法測電阻中如何判斷內(nèi)接法或外接法?

    測電阻的過程中,有兩種常見的測試方法,即內(nèi)接法和外接法。接下來,我將詳細介紹如何判斷使用哪種測試方法。 首先,我們需要了解內(nèi)接法和外接法的原
    的頭像 發(fā)表于 02-05 13:46 ?4599次閱讀

    伏安法測電阻內(nèi)接法和外接法的區(qū)別 伏安法測電阻多次測量目的

    測量電流和電壓來計算電阻值。外接法則是將待測電阻與已知電阻串聯(lián)或并聯(lián),通過測量總電阻和已知電阻值來計算待測電阻的值。 內(nèi)接法和外接法在具體操作上有一些區(qū)別。在內(nèi)接法中,待測電阻
    的頭像 發(fā)表于 02-04 15:12 ?3139次閱讀

    伏安法測電阻內(nèi)接法和外接法的區(qū)別

    伏安法是一種常用的電阻測量方法,通過對電流和電壓的測量來計算電阻值。伏安法可以分為內(nèi)接法和外接法兩種。它們在測量電阻時有一些顯著的區(qū)別。在本文中,我將詳細討論內(nèi)接法和外接法的區(qū)別。 首
    的頭像 發(fā)表于 01-31 10:47 ?5119次閱讀

    水晶頭的接法和面板接法一樣嗎

    水晶頭和面板接法是兩種不同的接法,它們在結(jié)構(gòu)和用途上有所差異。以下是關(guān)于水晶頭的接法和面板接法介紹
    的頭像 發(fā)表于 01-22 16:15 ?4502次閱讀