0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達新方法入選CVPR 2023:對未知物體的6D姿態(tài)追蹤和三維重建

3D視覺工坊 ? 來源:凹非寺 ? 2023-04-10 11:12 ? 次閱讀

普通手機“隨手”拍的雕像,一下就變成了精細(xì)的三維重建圖。

水杯來回動的動態(tài)場景下,細(xì)節(jié)清晰可見:

38654f44-d72b-11ed-bfe3-dac502259ad0.gif

靜態(tài)場景效果也同樣nice,狗狗突出的肋骨都被還原了出來:

38743edc-d72b-11ed-bfe3-dac502259ad0.gif

對比來看其他方法,效果是醬嬸的……

388fbc84-d72b-11ed-bfe3-dac502259ad0.png

這就是英偉達最新提出的方法BundleSDF。

這是一種可對未知物體的6D姿態(tài)追蹤和三維重建的方法。

用于從單目RGBD視頻序列中跟蹤未知物體的6自由度運動,同時進行物體的隱式神經(jīng)三維重建,方法接近于實時(10Hz)。

這種方法適用于任意剛性物體,即使視覺紋理大部分確實,僅需在第一幀中分割出物體,不需要任何額外的信息,并且不對智能體與物體的交互模式做任何假設(shè)。

目前,該方法已被CVPR 2023接收。

可處理大幅度姿態(tài)變化、有遮擋視頻

該方法的關(guān)鍵是一個神經(jīng)物體場,它與姿態(tài)圖優(yōu)化過程同時進行,以便將信息穩(wěn)健地累積到一致的3D表示中,捕捉幾何和外觀。

方法自動維護了一組動態(tài)的姿態(tài)內(nèi)存幀,以便這些線程之間進行通信。

它能處理具有大幅度姿態(tài)變化、部分和完全遮擋、無紋理表面和高光反射等具有挑戰(zhàn)性的視頻。

作者展示了HO3D、YCBInEOAT和BEHAVE數(shù)據(jù)集上的結(jié)果,證明了我們的方法顯著優(yōu)于現(xiàn)有方法。

野外測試

用于iPhone 12 Pro Max的效果:

38a7c02c-d72b-11ed-bfe3-dac502259ad0.gif

用于Intel RealSense的效果:

38dd70a0-d72b-11ed-bfe3-dac502259ad0.gif

該方法不僅適用于更具挑戰(zhàn)性的動態(tài)場景,還適用于此前經(jīng)常被考慮的靜態(tài)場景(移動相機)。

因此實現(xiàn)了比專門設(shè)計用于靜態(tài)場景的那些方法更好或相當(dāng)?shù)慕Y(jié)果(即文章開頭展示動圖)。

391d3c6c-d72b-11ed-bfe3-dac502259ad0.png

與SOTA對比

HO3D數(shù)據(jù)集上三種最具競爭力方法的定性比較。

左圖:6自由度姿態(tài)跟蹤可視化,其中輪廓(青色)以估計的姿態(tài)渲染。

值得注意的是,如第二列所示,我們的預(yù)測姿態(tài)有時甚至?xí)m正GT的錯誤。

右圖:每種方法輸出的最終3D重建的正面和背面視圖。

由于手部遮擋,視頻中的某些部分永遠不可見。雖然從相同的視角渲染網(wǎng)格,但是DROID-SLAM和BundleTrack的顯著漂移導(dǎo)致網(wǎng)格錯誤旋轉(zhuǎn)。

3924d4f4-d72b-11ed-bfe3-dac502259ad0.png

定量結(jié)果對比如下:

3943413c-d72b-11ed-bfe3-dac502259ad0.png

394be404-d72b-11ed-bfe3-dac502259ad0.png

3952cb34-d72b-11ed-bfe3-dac502259ad0.png

問題設(shè)置

給定一段單目RGBD輸入視頻以及僅在第一幀中目標(biāo)物體的分割掩碼,該方法能持續(xù)追蹤物體的6-DoF姿態(tài)并重建物體的3D模型。

所有處理都是在線自回歸的(沒有假設(shè)未來幀可用)。

處理的物體是剛性的,但不依賴其特定豐富的紋理 - 方法適用于無紋理的物體。

此外,不需要物體的實例級CAD模型,也不需要物體類別的先驗知識(例如事先對同一物體類別進行預(yù)訓(xùn)練)。

具體框架

395af3d6-d72b-11ed-bfe3-dac502259ad0.png

首先,在連續(xù)的分割圖像之間匹配特征,以獲得粗略的姿態(tài)估計(第3.1節(jié))。

其中一些帶姿態(tài)的幀被存儲在內(nèi)存池中,以便稍后使用和精化(第3.2節(jié))。

從內(nèi)存池的子集動態(tài)創(chuàng)建位姿圖(第3.3節(jié));在線優(yōu)化與當(dāng)前姿態(tài)一起聯(lián)合細(xì)化圖中的所有姿態(tài)。

然后,這些更新的姿態(tài)被存儲回內(nèi)存池中。

最后,內(nèi)存池中的所有帶姿態(tài)的幀用于學(xué)習(xí)神經(jīng)物體場(在單獨的線程中),該場建模了物體的幾何和視覺紋理(第3.4節(jié)),同時調(diào)整其先前估計的姿態(tài),使姿態(tài)跟蹤更加魯棒。

項目地址:
https://bundlesdf.github.io/

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2878

    瀏覽量

    107538
  • 三維重建
    +關(guān)注

    關(guān)注

    0

    文章

    26

    瀏覽量

    9922
  • 姿態(tài)
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    7896

原文標(biāo)題:英偉達新方法入選CVPR 2023:對未知物體的6D姿態(tài)追蹤和三維重建

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    三維掃描與建模的區(qū)別 三維掃描在工業(yè)中的應(yīng)用

    數(shù)據(jù)。這一過程是自動化的,能夠快速捕捉物體三維信息。 三維建模 :則需要專業(yè)建模師使用三維建模軟件,從無到有地創(chuàng)建三維模型。建模師可以根據(jù)
    的頭像 發(fā)表于 12-19 14:55 ?160次閱讀

    商湯科技運用AI大模型實現(xiàn)實景三維重建

    近日,在北京建筑大學(xué)舉行的2024第八屆北京國際城市設(shè)計大會上,商湯科技把這些“活過來”的文物實景三維也帶到了現(xiàn)場。
    的頭像 發(fā)表于 11-25 16:49 ?456次閱讀

    CASAIM與邁普醫(yī)學(xué)達成合作,三維掃描技術(shù)助力醫(yī)療輔具實現(xiàn)高精度三維建模和偏差比對

    近期,CASAIM與廣州邁普再生醫(yī)學(xué)科技股份有限公司(簡稱:邁普醫(yī)學(xué))合作,基于CT數(shù)據(jù)三維重建和設(shè)計,在醫(yī)療輔具研究開發(fā)中實現(xiàn)高精度三維建模和偏差比對,實現(xiàn)與缺損區(qū)域的精確匹配。
    的頭像 發(fā)表于 11-12 14:48 ?177次閱讀

    建筑物邊緣感知和邊緣融合的多視圖立體三維重建方法

    航空建筑深度估計是三維數(shù)字城市重建中的一項重要任務(wù),基于深度學(xué)習(xí)的多視圖立體(MVS)方法在該領(lǐng)域取得了較好的成果。目前的主要方法通過修改MVS 框架實現(xiàn)建筑物的深度估計,缺乏對建筑物
    的頭像 發(fā)表于 11-07 10:16 ?214次閱讀
    建筑物邊緣感知和邊緣融合的多視圖立體<b class='flag-5'>三維重建</b><b class='flag-5'>方法</b>

    三維打印技術(shù)原理

    三維打印技術(shù),又稱3D打印技術(shù),是一種快速成型技術(shù),其核心原理在于將數(shù)字模型文件逐層轉(zhuǎn)化為實體物體。以下是三維打印技術(shù)原理的詳細(xì)闡述:
    的頭像 發(fā)表于 09-16 15:31 ?711次閱讀

    留形科技借助NVIDIA平臺提供高效精確的三維重建解決方案

    本案例中,留形科技借助 NVIDIA Jetson 和 Omniverse 平臺,實現(xiàn)邊緣設(shè)備上的實時、全彩、無損三維重建,從而在建筑細(xì)節(jié)捕捉、大型基礎(chǔ)設(shè)施的數(shù)字孿生等應(yīng)用中,大幅提升三維數(shù)據(jù)采集與處理的效率與精度。
    的頭像 發(fā)表于 09-09 09:42 ?450次閱讀

    基于大模型的仿真系統(tǒng)研究一——三維重建大模型

    問題,賽目推出了基于大模型的仿真系統(tǒng),利用機器學(xué)習(xí)、深度學(xué)習(xí)等人工智能技術(shù),不僅推出自動標(biāo)注大模型、多模態(tài)檢測大模型和場景生成大模型等模塊,并且引入三維重建大模型加強渲染畫面真實性。 ? ?通過上述模塊,賽目的路采
    的頭像 發(fā)表于 07-30 14:51 ?1612次閱讀
    基于大模型的仿真系統(tǒng)研究一——<b class='flag-5'>三維重建</b>大模型

    泰來三維 工廠三維掃描建模技術(shù)服務(wù)

    通過利用三維掃描技術(shù)建立工廠物體三維模型,可以更加直觀地了解物體的形狀和尺寸信息,避免傳統(tǒng)測量方法的誤差和繁瑣操作,從而提高生產(chǎn)效率和質(zhì)量
    的頭像 發(fā)表于 07-22 13:14 ?322次閱讀
    泰來<b class='flag-5'>三維</b> 工廠<b class='flag-5'>三維</b>掃描建模技術(shù)服務(wù)

    三維掃描與3D打印在法醫(yī)頭骨重建中的突破性應(yīng)用

    隨著科技的飛速發(fā)展,三維掃描和3D打印技術(shù)已經(jīng)逐漸滲透到醫(yī)療領(lǐng)域的各個環(huán)節(jié),為臨床診斷、治療和醫(yī)學(xué)研究帶來了前所未有的便利。特別是在法醫(yī)學(xué)領(lǐng)域,三維掃描和3D打印技術(shù)的應(yīng)用更是為頭骨
    的頭像 發(fā)表于 04-19 10:26 ?499次閱讀
    <b class='flag-5'>三維</b>掃描與3<b class='flag-5'>D</b>打印在法醫(yī)頭骨<b class='flag-5'>重建</b>中的突破性應(yīng)用

    常用的RGB-D SLAM解決方案

    BundleFusion是一種稠密的實時室內(nèi)場景三維重建算法框架。輸入為RGB-D相機采集的并且是對齊好的RGB圖像和深度圖的數(shù)據(jù)流。輸出為重建好的稠密三維場景模型。
    的頭像 發(fā)表于 04-16 09:37 ?1016次閱讀
    常用的RGB-<b class='flag-5'>D</b> SLAM解決方案

    泰來三維|文物三維掃描,文物三維模型怎樣制作

    文物三維掃描,文物三維模型怎樣制作:我們都知道文物是不可再生的,要繼續(xù)保存?zhèn)鞒?,需要文?b class='flag-5'>三維數(shù)字化保護,所以三維數(shù)字化文物保護是非常重要的一個技術(shù)手段。 那么文物
    的頭像 發(fā)表于 03-12 11:10 ?628次閱讀
    泰來<b class='flag-5'>三維</b>|文物<b class='flag-5'>三維</b>掃描,文物<b class='flag-5'>三維</b>模型怎樣制作

    Nullmax提出多相機3D目標(biāo)檢測新方法QAF2D

    今天上午,計算機視覺領(lǐng)域頂會CVPR公布了最終的論文接收結(jié)果,Nullmax感知部門的3D目標(biāo)檢測研究《Enhancing 3D Object Detection with 2D De
    的頭像 發(fā)表于 02-27 16:38 ?1139次閱讀
    Nullmax提出多相機3<b class='flag-5'>D</b>目標(biāo)檢測<b class='flag-5'>新方法</b>QAF2<b class='flag-5'>D</b>

    角礦山機械設(shè)備三維掃描、逆向3d建模抄數(shù)設(shè)計

    在機械制造領(lǐng)域,逆向工程很多企業(yè)經(jīng)常使用的一種方法,逆向工程可以幫助企業(yè)復(fù)制、改進和優(yōu)化產(chǎn)品。CASAIM中科廣電主要使用三維掃描技術(shù)來獲取產(chǎn)品表面的三維數(shù)據(jù),三維測量技術(shù)能夠快速、高
    的頭像 發(fā)表于 01-16 15:14 ?508次閱讀
    珠<b class='flag-5'>三</b>角礦山機械設(shè)備<b class='flag-5'>三維</b>掃描、逆向3<b class='flag-5'>d</b>建模抄數(shù)設(shè)計

    工業(yè)上常見的高精度主動式重建算法

    三維重建目前是最為炙手可熱的領(lǐng)域。攝影測量或結(jié)構(gòu)光投影技術(shù)可以解決漫反射重建問題,但卻無法有效應(yīng)對鏡面反射物體(如玻璃、積水、反光物體和汽車車身)等的
    發(fā)表于 01-05 10:46 ?487次閱讀
    工業(yè)上常見的高精度主動式<b class='flag-5'>重建</b>算法

    三維視覺測量技術(shù)知識科普

    三維視覺測量技術(shù)按照測量過程中是否投射光源,獲取被測物體三維形貌信息的方法可以分為兩大類: 被動視覺測量和主動視覺測量。
    的頭像 發(fā)表于 01-03 11:47 ?848次閱讀
    <b class='flag-5'>三維</b>視覺測量技術(shù)知識科普