最近在做基于激光信息的機(jī)器人行人跟蹤發(fā)現(xiàn)如果單獨(dú)利用激光信息很難完成機(jī)器人對(duì)行人的識(shí)別、跟蹤等功能,因此考慮與視覺融合的方法,這樣便可以充分利用激光雷達(dá)提供的精確位置信息及視覺提供的豐富紋理、顏色等場(chǎng)景信息。以下是最近調(diào)研視覺SLAM中的實(shí)現(xiàn)方法的總結(jié),包括三方面內(nèi)容:姿態(tài)計(jì)算、閉環(huán)檢測(cè)、BA優(yōu)化。
姿態(tài)計(jì)算
一、通過提取圖像的特征描述子,如ORB、SURF和SIFT等特征描述子,然后通過RANSAC算法進(jìn)行圖像匹配去除匹配點(diǎn)中的外點(diǎn),再通過將二維點(diǎn)對(duì)映射到三維之后,便可以利用PnP或ICP算法計(jì)算相機(jī)位姿?;谔卣魈崛〉奈蛔擞?jì)算算法對(duì)場(chǎng)景有一定的要求,在無紋理場(chǎng)景會(huì)出現(xiàn)位姿計(jì)算失敗的情形。
二、直接圖像匹配方法:直接圖像匹配并不對(duì)圖片進(jìn)行特征提取,核心思想是在旋轉(zhuǎn)坐標(biāo)系下,基于相機(jī)一致性的假設(shè),在相機(jī)的剛體變換已知的情況下,利用相機(jī)變換矩陣將目標(biāo)圖片投影到當(dāng)前圖片上,其像素之間的差異應(yīng)該最小,將姿態(tài)計(jì)算轉(zhuǎn)換為加權(quán)最小二乘問題。直接圖像匹配算法的計(jì)算效率很高,不依賴GPU,具有很高的理論和商用價(jià)值。
閉環(huán)檢測(cè)
閉環(huán)檢測(cè)算法指的是通過檢測(cè)算法檢測(cè)出之前訪問過的場(chǎng)景。如圖1所示,當(dāng)機(jī)器人在移動(dòng)過程中,特別是在探索大面積的場(chǎng)景時(shí),由于模型的不確定性以及設(shè)備的噪聲,不確定性會(huì)逐漸增長(zhǎng)。通過引入閉環(huán)檢測(cè)技術(shù),識(shí)別出歷史訪問過的場(chǎng)景以增加位姿之間的約束,可以很好的減少這種不確定性。
閉環(huán)檢測(cè)前后對(duì)比(a) 累計(jì)誤差導(dǎo)致的構(gòu)圖錯(cuò)誤,(b)閉環(huán)約束后的地圖
閉環(huán)檢測(cè)方法有:
一、最簡(jiǎn)單的閉環(huán)檢測(cè)算法是將新檢測(cè)出來的關(guān)鍵幀和過去所有的關(guān)鍵幀一一進(jìn)行比較,雖然這種方法能比較好的檢測(cè)出當(dāng)前場(chǎng)景是否在之前出現(xiàn)過,但是在大規(guī)模場(chǎng)景下,機(jī)器人往往有成千上萬個(gè)關(guān)鍵幀,這種方法檢測(cè)效率及其底下,不能再實(shí)際場(chǎng)景中使用。
二、通過將圖像中的特征和整個(gè)地圖中的路標(biāo)對(duì)應(yīng)起來,然后建立一個(gè)所有路標(biāo)的數(shù)據(jù)庫,通過使用路標(biāo)分類器來加快場(chǎng)景識(shí)別速度。比如講所有路標(biāo)構(gòu)建成一棵KD-Tree,當(dāng)新添加一幀關(guān)鍵幀時(shí),將關(guān)鍵幀在KD-Tree中進(jìn)行檢索,從中檢索之前出現(xiàn)過的場(chǎng)景。
三、基于視覺詞袋的閉環(huán)檢測(cè)方法,這種方法通過將特征描述子抽象成詞匯,通過TF-IDF方法識(shí)別出現(xiàn)過的場(chǎng)景。如圖2所示,是閉環(huán)檢測(cè)中基于詞袋模型流程圖。使用視覺詞袋的方法效率很高,可用在大規(guī)模地圖的創(chuàng)建上。
BA優(yōu)化
一、問題闡述:同時(shí)對(duì)三維點(diǎn)位置和相機(jī)參數(shù)進(jìn)行非線性優(yōu)化。
BA原理
二、LM法的原理與優(yōu)勢(shì):
原理:是一種“信賴域”的方法,當(dāng)收斂速度較快時(shí),增大信賴域使算法趨向于高斯牛頓法;當(dāng)收斂速度較慢時(shí),減小信賴域使算法趨向于最速下降法。優(yōu)勢(shì):速度快;可以在距離初始值較遠(yuǎn)處得到最優(yōu)解。
SLAM優(yōu)化算法對(duì)比
KF/EKF | 假設(shè)噪聲為高斯分布,在高維狀態(tài)空間時(shí)計(jì)算效率較低,不適合大規(guī)模場(chǎng)景的地圖構(gòu)建 | 原理簡(jiǎn)單,小場(chǎng)景下收斂性好。 |
PF | 會(huì)不可避免出現(xiàn)粒子退化現(xiàn)象,每個(gè)粒子需包含整張地圖信息導(dǎo)致不適合大場(chǎng)景地圖構(gòu)建 | 將運(yùn)動(dòng)方程表示為一組粒子,通過蒙特卡羅方法求解,能夠處理非線性非高斯噪聲。 |
EM | 計(jì)算量大,不能用于大規(guī)模場(chǎng)景 | 有效解決了數(shù)據(jù)關(guān)聯(lián)問題 |
圖優(yōu)化 | 對(duì)閉環(huán)檢測(cè)算法的要求嚴(yán)格 | 出現(xiàn)多種圖優(yōu)化框架,能夠有效解決濾波器算法的缺陷,能用于大規(guī)模場(chǎng)景的地圖創(chuàng)建 |
算法 | 缺點(diǎn) | 優(yōu)點(diǎn) |
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28418瀏覽量
207103 -
算法
+關(guān)注
關(guān)注
23文章
4612瀏覽量
92901 -
SLAM
+關(guān)注
關(guān)注
23文章
424瀏覽量
31833
原文標(biāo)題:視覺SLAM關(guān)鍵方法總結(jié)
文章出處:【微信號(hào):IV_Technology,微信公眾號(hào):智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論