0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種基于NeRF的六自由度姿態(tài)估計(jì)方法

3D視覺工坊 ? 來源:計(jì)算機(jī)視覺工坊 ? 作者:一杯紅茶 ? 2022-11-21 10:07 ? 次閱讀

主要內(nèi)容: 提出了一種基于NeRF的六自由度姿態(tài)估計(jì)方法,即當(dāng)給定單個(gè)RGB查詢圖像時(shí)通過最小化NeRF模型渲染的圖像像素與查詢圖像中的像素之間的殘差來估計(jì)相機(jī)的平移和旋轉(zhuǎn)。

算法基于動量的相機(jī)外參優(yōu)化算法集成到Instant Neural Graphics Primitives(一種最近非??焖俚腘eRF實(shí)現(xiàn),也是NVIDIA提出的),通過在姿態(tài)估計(jì)任務(wù)中引入并行蒙特卡羅采樣來克服問題總是收斂到局部極小值的問題,論文還研究了不同的基于像素的損失函數(shù)減少誤差的程度,最終的實(shí)驗(yàn)也表明其方法可以在合成基準(zhǔn)和真實(shí)基準(zhǔn)上實(shí)現(xiàn)較好的泛化和魯棒性

Nerf(Neural Radiance Fields):神經(jīng)輻射場,它提供了一種僅從一個(gè)或幾個(gè)RGB圖像中捕獲復(fù)雜3D和光學(xué)結(jié)構(gòu)的機(jī)制,Nerf為在訓(xùn)練或測試期間在沒有網(wǎng)格模型的情況下將合成-分析應(yīng)用到更廣泛的現(xiàn)實(shí)場景提供了機(jī)會,NeRF將場景的密度和顏色參數(shù)化為3D場景坐標(biāo)的函數(shù),該函數(shù)既可以從給定相機(jī)姿態(tài)的多視圖圖像中學(xué)習(xí),也可以給定一個(gè)或幾個(gè)輸入圖像通過生成模型直接預(yù)測。

Instant NGP:其提出是用來降低Nerf的訓(xùn)練和推理代價(jià),采用由可訓(xùn)練的特征向量的多分辨率哈希表增強(qiáng)的小神經(jīng)網(wǎng)絡(luò),允許網(wǎng)絡(luò)消除哈希沖突的歧義,使其易于在GPU上并行化,實(shí)現(xiàn)了幾個(gè)數(shù)量級的組合加速,允許在在線訓(xùn)練和推理等時(shí)間受限的環(huán)境中使用

出發(fā)點(diǎn): 將Nerf用在姿態(tài)估計(jì)任務(wù)中的第一篇工作則是inerf,即反轉(zhuǎn)Nerf,此論文基于inerf,進(jìn)一步探索了Nerf在姿態(tài)估計(jì)任務(wù)中的應(yīng)用,普遍認(rèn)為NeRF的一個(gè)缺點(diǎn)是其計(jì)算開銷很大,為了克服這一限制,本文利用了他們之前提出的快速NeRF,即即時(shí)神經(jīng)圖形原件(Instant NGP),Instant NGP的結(jié)構(gòu)允許并行優(yōu)化,這可以用來克服局部最小值問題,從而實(shí)現(xiàn)比iNeRF更大的魯棒性。 Inerf:假設(shè)已經(jīng)得到了權(quán)重θ參數(shù)化的NeRF模型,并且相機(jī)內(nèi)參已知,iNeRF旨在恢復(fù)查詢圖像I的相機(jī)姿態(tài)T

d6316d28-6928-11ed-8abf-dac502259ad0.png

Contributions:

提出了一種基于NeRF模型的估計(jì)6-DoF姿態(tài)方法。

將并行蒙特卡羅采樣引入到姿態(tài)估計(jì)任務(wù)中,展示了基于像素的損失函數(shù)選擇對魯棒性的重要性

通過合成和真實(shí)世界基準(zhǔn)進(jìn)行定量演示,證明所提出的方法改進(jìn)了泛化和魯棒性

Pipeline:

d641ca60-6928-11ed-8abf-dac502259ad0.png

三個(gè)輸入:單個(gè)RGB圖像、初始粗略姿態(tài)估計(jì)(通過向真值添加干擾得到)以及從目標(biāo)的多個(gè)視圖中訓(xùn)練的即時(shí)NGP模型。

基于動量的相機(jī)外參優(yōu)化:

相對于標(biāo)準(zhǔn)Nerf,對相機(jī)姿態(tài)和梯度表示進(jìn)行了修改,允許梯度更新的動態(tài)性結(jié)合基于動量的方法來增強(qiáng)優(yōu)化。

首先,相機(jī)姿態(tài)由平移分量(位置)和旋轉(zhuǎn)分量(方向)組成,通常由特殊歐式群建模,即SE(3),NeRF中外參優(yōu)化的目標(biāo)是找到那些通過梯度下降將圖像空間損失最小化的相機(jī)姿態(tài),梯度更新在特殊的歐式群上的李代數(shù)se(3)中計(jì)算,然后生成結(jié)合旋轉(zhuǎn)和平移的相機(jī)姿態(tài)更新,作者認(rèn)為使用SE(3)/se3表示有一個(gè)缺點(diǎn),即相機(jī)姿勢更新的旋轉(zhuǎn)中心不在相機(jī)原點(diǎn),而是在旋轉(zhuǎn)軸上,這將相機(jī)位置和方向耦合起來,這種耦合導(dǎo)致某些情況下次優(yōu)梯度更新,如下圖所示,

d678081e-6928-11ed-8abf-dac502259ad0.png

為了解耦平移和旋轉(zhuǎn)更新,作者將相機(jī)姿態(tài)建模為笛卡爾積SO(3)×T(3)(以及相應(yīng)的李代數(shù)空間上so(3)×t(3)),其在T(3)上采用加法結(jié)構(gòu),在SO(3)上采用乘積結(jié)構(gòu),梯度更新將沿直線移動,從而實(shí)現(xiàn)更高效的優(yōu)化。

其次,基于動量的優(yōu)化在經(jīng)驗(yàn)上證明了比基于標(biāo)準(zhǔn)梯度的方法更有效,尤其是當(dāng)與自適應(yīng)更新相結(jié)合時(shí),在NeRF中每個(gè)像素對應(yīng)于具有原點(diǎn)o和方向d的射線,沿著該射線,基于沿射線的移動距離ti得到pi=o+ti.d,損失的梯度與相機(jī)距離的叉積定義了每像素(光線)更新影響:

d69a3628-6928-11ed-8abf-dac502259ad0.png

基于剛體力學(xué),對上式有一種物理解釋,即由外力對相機(jī)產(chǎn)生的一個(gè)扭矩,該外力由基于圖像的損失函數(shù)梯度產(chǎn)生,應(yīng)用于光線導(dǎo)出點(diǎn),就像它剛性地連接到相機(jī)一樣。

因此將此分解應(yīng)用于Adam優(yōu)化器,將Adam的第一個(gè)moment轉(zhuǎn)化為相機(jī)的物理動量,因?yàn)橄鄼C(jī)被用作力矩的梯度“推動”,盡管Adam的第二moment和指數(shù)衰減沒有直接的物理類似物,由于物理系統(tǒng)遵循最小動作路徑,可以推斷相機(jī)在解耦參數(shù)化中遵循從其初始姿態(tài)到其優(yōu)化姿態(tài)的有效路徑。

并行蒙特卡洛采樣: 由于優(yōu)化的損失函數(shù)在6-DoF空間上是非凸的,單相機(jī)姿態(tài)假設(shè)很容易陷入局部極小值,由于Instant NGP的計(jì)算能力能夠同時(shí)從多個(gè)假設(shè)開始優(yōu)化,但是一個(gè)簡單的多起點(diǎn)思想是低效的,特別是在一個(gè)大的搜索空間中,其中許多假設(shè)在優(yōu)化過程中會偏離,因此它們無法對最終優(yōu)化做出貢獻(xiàn),且占用了大量計(jì)算資源,從粒子濾波框架中獲得靈感,提出了一種簡單有效的姿勢假設(shè)更新策略來處理這個(gè)問題。

將優(yōu)化過程分為兩個(gè)階段,自由探索和重采樣更新。 在第一階段,圍繞起始姿態(tài)生成相機(jī)姿態(tài)假設(shè),平移和旋轉(zhuǎn)偏移分別在歐式空間和SO(3)中均勻采樣,相機(jī)姿態(tài)假設(shè)將進(jìn)行獨(dú)立優(yōu)化,這樣其中一些可以相對接近實(shí)際情況。 之后第二階段,比較所有假設(shè)的損失,并將其作為采樣權(quán)重的參考。

不同損失函數(shù)的影響: 通過合成視圖進(jìn)行姿態(tài)估計(jì)的方法最大挑戰(zhàn)之一是與原視圖相比,視圖材質(zhì)具有不同的視覺表面,包括許多干擾、環(huán)境噪聲、照明條件變化和遮擋等都可能導(dǎo)致這個(gè)問題。

之前inerf使用L2損失,但作者研究了更多的損失選項(xiàng)以測量渲染像素和觀察像素之間的差異,不同的損失具有不同的收斂特性,進(jìn)而影響優(yōu)化過程

研究了L1(平等的對待error)、L2(懲罰較大的error,寬容較小的error)、Log L1(是L1損耗的對數(shù)版本,它試圖平滑收斂曲線,尤其是對于較大的誤差)、Relative L2(它對高強(qiáng)度目標(biāo)像素與低強(qiáng)度目標(biāo)像素錯(cuò)位的情況更敏感)、MAPE(MAPE表示平均絕對百分比誤差,作為基于誤差相對百分比的精度度量,它也可以被視為相對L2損耗的L1等效值,它與規(guī)模無關(guān),對負(fù)錯(cuò)誤的懲罰更重)、sMAPE(是MAPE的對稱版本,解決MAPE的不對稱問題,但當(dāng)預(yù)測和GT都具有低強(qiáng)度時(shí),它可能是不穩(wěn)定的)、Smooth L1(平滑L1損失被設(shè)計(jì)為對異常值不太敏感,并且可以防止梯度爆炸)

最終通過實(shí)驗(yàn)發(fā)現(xiàn)常用的L2損失未必是最好的,MAPE在其數(shù)據(jù)集測試上實(shí)現(xiàn)了最好的性能。

實(shí)驗(yàn): 在Nerf合成數(shù)據(jù)集和真實(shí)數(shù)據(jù)集LLFF與inerf進(jìn)行了比較

d6b84e60-6928-11ed-8abf-dac502259ad0.pngd6d94c1e-6928-11ed-8abf-dac502259ad0.png

不同損失函數(shù)對結(jié)果性能的比較:

d6ec3e5a-6928-11ed-8abf-dac502259ad0.png






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4777

    瀏覽量

    100961
  • RGB
    RGB
    +關(guān)注

    關(guān)注

    4

    文章

    800

    瀏覽量

    58600
  • NGP
    NGP
    +關(guān)注

    關(guān)注

    0

    文章

    12

    瀏覽量

    6695

原文標(biāo)題:并行Nerf逆過程解決姿態(tài)估計(jì)問題!(Arxiv 2022)

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    DSP在自由度電磁跟蹤系統(tǒng)中的應(yīng)用

    自由度電磁跟蹤系統(tǒng)根據(jù)電磁感應(yīng)的原理來計(jì)算出目標(biāo)的個(gè)自由度參數(shù),從而唯確定目標(biāo)的位置和姿態(tài)
    發(fā)表于 01-25 00:11 ?1328次閱讀
    DSP在<b class='flag-5'>六</b><b class='flag-5'>自由度</b>電磁跟蹤系統(tǒng)中的應(yīng)用

    基于FPGA EtherCAT的自由度機(jī)器人視覺伺服控制設(shè)計(jì)

    和增強(qiáng)系統(tǒng)處理圖像的實(shí)時(shí)性,本文提出了一種伊瑟特的自由度機(jī)器人視覺伺服控制系統(tǒng),將攝像頭集成到基于 Zynq的伊瑟特主站上,提高了視覺伺服的實(shí)時(shí)性.經(jīng)測試,該平臺能夠?qū)σ曈X檢測目標(biāo)的變化做出及時(shí)的反應(yīng)
    發(fā)表于 05-29 16:17

    基于STM32、以太網(wǎng)、Labview的自由度Stewart并聯(lián)運(yùn)動平臺模型

    自由度Stewart并聯(lián)運(yùn)動平臺模型-X,Y,Z平移、旋轉(zhuǎn)測試自由度Stewart并聯(lián)運(yùn)動平臺-Z向旋轉(zhuǎn)正弦波復(fù)現(xiàn)
    發(fā)表于 04-16 23:25

    關(guān)于個(gè)自由度座椅的控制

    最近在參與個(gè)個(gè)自由度座椅控制的課題,需要查閱哪些方面的相關(guān)書籍,有什么推薦嗎?謝謝各位
    發(fā)表于 01-13 14:46

    一種改進(jìn)的單神經(jīng)元二自由度PID控制

    提出一種單神經(jīng)元二自由度PID 控制方法,將前饋型二自由度PID 的五個(gè)參數(shù)分別對應(yīng)于單神經(jīng)元的五個(gè)權(quán)值,將二次型性能指標(biāo)Pe2 (k) + QΔu 2 (k)作為控制算法中加權(quán)系數(shù)學(xué)
    發(fā)表于 08-27 08:35 ?11次下載

    基于單親遺傳算法二自由度PID控制器設(shè)計(jì)

    針對二自由度PID 控制器參數(shù)整定困難的問題,提出了一種基于單親遺傳算法的二自由度參數(shù)整定方法。運(yùn)用該算法分別對單自由度PID 控制器和二
    發(fā)表于 12-26 13:56 ?23次下載

    自由度內(nèi)模控制方法

    針對典型的工業(yè)過程控制對象,提出了一種自由度內(nèi)??刂?b class='flag-5'>方法,此方法可以使系統(tǒng)同時(shí)具有良好的目標(biāo)值跟蹤特性、干擾抑制特性和魯棒性,改進(jìn)了常規(guī)內(nèi)模控制的不足,而且控制算法簡
    發(fā)表于 05-23 15:12 ?27次下載
    二<b class='flag-5'>自由度</b>內(nèi)??刂?b class='flag-5'>方法</b>

    自由度轉(zhuǎn)臺的設(shè)計(jì)與實(shí)現(xiàn)

    基于MSP430F149單片機(jī)設(shè)計(jì)了一種自由度轉(zhuǎn)臺系統(tǒng)。在該系統(tǒng)中,利用旋轉(zhuǎn)編碼器的信息反饋,通過對電機(jī)的閉環(huán)控制,使三自由度轉(zhuǎn)臺能夠模擬飛機(jī)的飛行姿態(tài)。
    發(fā)表于 09-26 13:58 ?2576次閱讀
    三<b class='flag-5'>自由度</b>轉(zhuǎn)臺的設(shè)計(jì)與實(shí)現(xiàn)

    一種新型7自由度冗余繩驅(qū)動機(jī)械臂

    針對傳統(tǒng)機(jī)械臂負(fù)載白重比小、臂身慣量大、人機(jī)交互安全性弱等問題,對繩驅(qū)動機(jī)械臂的結(jié)構(gòu)、繩驅(qū)關(guān)節(jié)耦合、冗余運(yùn)動學(xué)等方面進(jìn)行了研究,創(chuàng)新設(shè)計(jì)了一種新型7自由度冗余繩驅(qū)動機(jī)械臂。采用繩索間接驅(qū)動前端4個(gè)
    發(fā)表于 02-27 14:33 ?7次下載
    <b class='flag-5'>一種</b>新型7<b class='flag-5'>自由度</b>冗余繩驅(qū)動機(jī)械臂

    一種基于自由度IMU和動力學(xué)的車身姿態(tài)和側(cè)向速度估計(jì)方法

    如前文所述,本文建立了三個(gè)估計(jì)器,在小側(cè)向激勵工況下,可通過基于動力學(xué)模型的估計(jì)估計(jì)出側(cè)向車速,進(jìn)步使用該側(cè)向車速估計(jì)出由于平動產(chǎn)生的側(cè)
    的頭像 發(fā)表于 07-31 14:26 ?1w次閱讀
    <b class='flag-5'>一種</b>基于<b class='flag-5'>六</b><b class='flag-5'>自由度</b>IMU和動力學(xué)的車身<b class='flag-5'>姿態(tài)</b>和側(cè)向速度<b class='flag-5'>估計(jì)</b><b class='flag-5'>方法</b>

    磁致伸縮位移傳感器在自由度運(yùn)動平臺上的應(yīng)用解析

    自由度運(yùn)動平臺是典型的并聯(lián)運(yùn)動機(jī)構(gòu),由支作動筒,上、下各只萬向鉸鏈和上、下兩個(gè)平臺組成,下平臺固定在基礎(chǔ)上,借助支作動筒的伸縮運(yùn)動,
    發(fā)表于 03-07 16:54 ?1530次閱讀

    ADIS16495:戰(zhàn)術(shù)級自由度慣性傳感器數(shù)據(jù)表

    ADIS16495:戰(zhàn)術(shù)級自由度慣性傳感器數(shù)據(jù)表
    發(fā)表于 05-25 18:04 ?9次下載
    ADIS16495:戰(zhàn)術(shù)級<b class='flag-5'>六</b><b class='flag-5'>自由度</b>慣性傳感器數(shù)據(jù)表

    自由度視覺定位

    基于三維模型的視覺定位通過在查詢圖像和三維模型間建立 2D-3D 對應(yīng)關(guān)系,估計(jì)相機(jī)自由度的位姿。傳統(tǒng)的視覺定位方法通常采用人工設(shè)計(jì)的局部特征,如 SIFT,來實(shí)現(xiàn) 2D-3D 匹配
    的頭像 發(fā)表于 04-20 10:07 ?1172次閱讀

    自由度激光跟蹤儀的特點(diǎn)

    GTS6000激光跟蹤儀與空間姿態(tài)探頭配合組成自由度激光跟蹤儀,能夠根據(jù)合作目標(biāo)的精確空間姿態(tài)對被測工件的內(nèi)部特征、隱藏特征或曲面等復(fù)雜特征進(jìn)行快速、高精度的測量。
    的頭像 發(fā)表于 07-21 10:58 ?734次閱讀
    <b class='flag-5'>六</b><b class='flag-5'>自由度</b>激光跟蹤儀的特點(diǎn)

    文讀懂自由度激光跟蹤儀

    激光跟蹤儀與空間姿態(tài)探頭(iProbe 6D姿態(tài)探頭)配合使用,就組成自由度激光跟蹤儀。它能夠根據(jù)合作目標(biāo)的精確空間姿態(tài)對被測工件的內(nèi)部特
    的頭像 發(fā)表于 12-12 09:39 ?786次閱讀
    <b class='flag-5'>一</b>文讀懂<b class='flag-5'>六</b><b class='flag-5'>自由度</b>激光跟蹤儀