0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)新方法入選CVPR 2023:對(duì)未知物體的6D姿態(tài)追蹤和三維重建

3D視覺(jué)工坊 ? 來(lái)源:凹非寺 ? 2023-04-10 11:12 ? 次閱讀

普通手機(jī)“隨手”拍的雕像,一下就變成了精細(xì)的三維重建圖。

水杯來(lái)回動(dòng)的動(dòng)態(tài)場(chǎng)景下,細(xì)節(jié)清晰可見(jiàn):

38654f44-d72b-11ed-bfe3-dac502259ad0.gif

靜態(tài)場(chǎng)景效果也同樣nice,狗狗突出的肋骨都被還原了出來(lái):

38743edc-d72b-11ed-bfe3-dac502259ad0.gif

對(duì)比來(lái)看其他方法,效果是醬嬸的……

388fbc84-d72b-11ed-bfe3-dac502259ad0.png

這就是英偉達(dá)最新提出的方法BundleSDF。

這是一種可對(duì)未知物體的6D姿態(tài)追蹤和三維重建的方法。

用于從單目RGBD視頻序列中跟蹤未知物體的6自由度運(yùn)動(dòng),同時(shí)進(jìn)行物體的隱式神經(jīng)三維重建,方法接近于實(shí)時(shí)(10Hz)。

這種方法適用于任意剛性物體,即使視覺(jué)紋理大部分確實(shí),僅需在第一幀中分割出物體,不需要任何額外的信息,并且不對(duì)智能體與物體的交互模式做任何假設(shè)。

目前,該方法已被CVPR 2023接收。

可處理大幅度姿態(tài)變化、有遮擋視頻

該方法的關(guān)鍵是一個(gè)神經(jīng)物體場(chǎng),它與姿態(tài)圖優(yōu)化過(guò)程同時(shí)進(jìn)行,以便將信息穩(wěn)健地累積到一致的3D表示中,捕捉幾何和外觀。

方法自動(dòng)維護(hù)了一組動(dòng)態(tài)的姿態(tài)內(nèi)存幀,以便這些線程之間進(jìn)行通信。

它能處理具有大幅度姿態(tài)變化、部分和完全遮擋、無(wú)紋理表面和高光反射等具有挑戰(zhàn)性的視頻。

作者展示了HO3D、YCBInEOAT和BEHAVE數(shù)據(jù)集上的結(jié)果,證明了我們的方法顯著優(yōu)于現(xiàn)有方法。

野外測(cè)試

用于iPhone 12 Pro Max的效果:

38a7c02c-d72b-11ed-bfe3-dac502259ad0.gif

用于Intel RealSense的效果:

38dd70a0-d72b-11ed-bfe3-dac502259ad0.gif

該方法不僅適用于更具挑戰(zhàn)性的動(dòng)態(tài)場(chǎng)景,還適用于此前經(jīng)常被考慮的靜態(tài)場(chǎng)景(移動(dòng)相機(jī))。

因此實(shí)現(xiàn)了比專門(mén)設(shè)計(jì)用于靜態(tài)場(chǎng)景的那些方法更好或相當(dāng)?shù)慕Y(jié)果(即文章開(kāi)頭展示動(dòng)圖)。

391d3c6c-d72b-11ed-bfe3-dac502259ad0.png

與SOTA對(duì)比

HO3D數(shù)據(jù)集上三種最具競(jìng)爭(zhēng)力方法的定性比較。

左圖:6自由度姿態(tài)跟蹤可視化,其中輪廓(青色)以估計(jì)的姿態(tài)渲染。

值得注意的是,如第二列所示,我們的預(yù)測(cè)姿態(tài)有時(shí)甚至?xí)m正GT的錯(cuò)誤。

右圖:每種方法輸出的最終3D重建的正面和背面視圖。

由于手部遮擋,視頻中的某些部分永遠(yuǎn)不可見(jiàn)。雖然從相同的視角渲染網(wǎng)格,但是DROID-SLAM和BundleTrack的顯著漂移導(dǎo)致網(wǎng)格錯(cuò)誤旋轉(zhuǎn)。

3924d4f4-d72b-11ed-bfe3-dac502259ad0.png

定量結(jié)果對(duì)比如下:

3943413c-d72b-11ed-bfe3-dac502259ad0.png

394be404-d72b-11ed-bfe3-dac502259ad0.png

3952cb34-d72b-11ed-bfe3-dac502259ad0.png

問(wèn)題設(shè)置

給定一段單目RGBD輸入視頻以及僅在第一幀中目標(biāo)物體的分割掩碼,該方法能持續(xù)追蹤物體的6-DoF姿態(tài)并重建物體的3D模型。

所有處理都是在線自回歸的(沒(méi)有假設(shè)未來(lái)幀可用)。

處理的物體是剛性的,但不依賴其特定豐富的紋理 - 方法適用于無(wú)紋理的物體。

此外,不需要物體的實(shí)例級(jí)CAD模型,也不需要物體類(lèi)別的先驗(yàn)知識(shí)(例如事先對(duì)同一物體類(lèi)別進(jìn)行預(yù)訓(xùn)練)。

具體框架

395af3d6-d72b-11ed-bfe3-dac502259ad0.png

首先,在連續(xù)的分割圖像之間匹配特征,以獲得粗略的姿態(tài)估計(jì)(第3.1節(jié))。

其中一些帶姿態(tài)的幀被存儲(chǔ)在內(nèi)存池中,以便稍后使用和精化(第3.2節(jié))。

從內(nèi)存池的子集動(dòng)態(tài)創(chuàng)建位姿圖(第3.3節(jié));在線優(yōu)化與當(dāng)前姿態(tài)一起聯(lián)合細(xì)化圖中的所有姿態(tài)。

然后,這些更新的姿態(tài)被存儲(chǔ)回內(nèi)存池中。

最后,內(nèi)存池中的所有帶姿態(tài)的幀用于學(xué)習(xí)神經(jīng)物體場(chǎng)(在單獨(dú)的線程中),該場(chǎng)建模了物體的幾何和視覺(jué)紋理(第3.4節(jié)),同時(shí)調(diào)整其先前估計(jì)的姿態(tài),使姿態(tài)跟蹤更加魯棒。

項(xiàng)目地址:
https://bundlesdf.github.io/

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2955

    瀏覽量

    110133
  • 三維重建
    +關(guān)注

    關(guān)注

    0

    文章

    27

    瀏覽量

    10057
  • 姿態(tài)
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    7970

原文標(biāo)題:英偉達(dá)新方法入選CVPR 2023:對(duì)未知物體的6D姿態(tài)追蹤和三維重建

文章出處:【微信號(hào):3D視覺(jué)工坊,微信公眾號(hào):3D視覺(jué)工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    奧比中光助力創(chuàng)想三維登頂世界消費(fèi)級(jí)3D掃描儀市場(chǎng)

    Lite及Raptor Pro提供基于自研多核異構(gòu)三維重建芯片技術(shù)的軟硬件引擎,助力戰(zhàn)略合作伙伴創(chuàng)想三維登頂世界消費(fèi)級(jí)3D掃描儀市場(chǎng)。
    的頭像 發(fā)表于 04-11 11:38 ?545次閱讀

    使用DLP LightCrafter4500投影結(jié)構(gòu)光進(jìn)行三維重建遇到的疑問(wèn)求解

    使用DLP LightCrafter4500 投影結(jié)構(gòu)光進(jìn)行三維重建,遇到以下問(wèn)題: (1)投影自己的圖片,如何使投影出的圖片和原圖片的亮度一致。它是可以設(shè)定LED的亮度,我投影出來(lái)的圖片亮度很
    發(fā)表于 03-03 06:29

    請(qǐng)問(wèn)DLP3010投影圖像DMD格柵如何模糊化?

    我們?cè)谑褂?00W相機(jī)采集投影條紋時(shí),相機(jī)的采樣率高,把DMD的微鏡格柵也采集到,影響到我們三維重建的數(shù)據(jù)質(zhì)量,會(huì)帶來(lái)格柵網(wǎng)狀的錯(cuò)誤數(shù)據(jù)。 是否有方法可以模糊化這種格柵網(wǎng)格,除了使用更高分辨率的DMD方案,或者使用DLP3310這種偽1080P DMD方案是否也可以?
    發(fā)表于 02-27 07:01

    三維測(cè)量在醫(yī)療領(lǐng)域的應(yīng)用

    三維測(cè)量在醫(yī)療領(lǐng)域的應(yīng)用十分廣泛,為醫(yī)療診斷、治療及手術(shù)規(guī)劃等提供了重要的技術(shù)支持。以下是對(duì)三維測(cè)量在醫(yī)療領(lǐng)域應(yīng)用的分析: 一、醫(yī)學(xué)影像的三維重建與分析 CT、MRI等影像的三維重建
    的頭像 發(fā)表于 12-30 15:21 ?621次閱讀

    常見(jiàn)的三維測(cè)量方法和工具

    三維測(cè)量是用于獲取物體三維幾何信息的技術(shù),它在工業(yè)制造、建筑、考古、醫(yī)學(xué)等領(lǐng)域有著廣泛的應(yīng)用。以下是一些常見(jiàn)的三維測(cè)量方法和工具的概述,以及
    的頭像 發(fā)表于 12-30 15:02 ?958次閱讀

    三維測(cè)量技術(shù)在工業(yè)中的應(yīng)用

    中不可或缺的一部分。 一、三維測(cè)量技術(shù)的工作原理 三維測(cè)量技術(shù),也稱為三維掃描技術(shù),是一種通過(guò)捕捉物體表面點(diǎn)的三維坐標(biāo)信息來(lái)
    的頭像 發(fā)表于 12-30 15:01 ?602次閱讀

    三維掃描與建模的區(qū)別 三維掃描在工業(yè)中的應(yīng)用

    數(shù)據(jù)。這一過(guò)程是自動(dòng)化的,能夠快速捕捉物體三維信息。 三維建模 :則需要專業(yè)建模師使用三維建模軟件,從無(wú)到有地創(chuàng)建三維模型。建模師可以根據(jù)
    的頭像 發(fā)表于 12-19 14:55 ?1019次閱讀

    商湯科技運(yùn)用AI大模型實(shí)現(xiàn)實(shí)景三維重建

    近日,在北京建筑大學(xué)舉行的2024第八屆北京國(guó)際城市設(shè)計(jì)大會(huì)上,商湯科技把這些“活過(guò)來(lái)”的文物實(shí)景三維也帶到了現(xiàn)場(chǎng)。
    的頭像 發(fā)表于 11-25 16:49 ?957次閱讀

    CASAIM與邁普醫(yī)學(xué)達(dá)成合作,三維掃描技術(shù)助力醫(yī)療輔具實(shí)現(xiàn)高精度三維建模和偏差比對(duì)

    近期,CASAIM與廣州邁普再生醫(yī)學(xué)科技股份有限公司(簡(jiǎn)稱:邁普醫(yī)學(xué))合作,基于CT數(shù)據(jù)三維重建和設(shè)計(jì),在醫(yī)療輔具研究開(kāi)發(fā)中實(shí)現(xiàn)高精度三維建模和偏差比對(duì),實(shí)現(xiàn)與缺損區(qū)域的精確匹配。
    的頭像 發(fā)表于 11-12 14:48 ?481次閱讀

    建筑物邊緣感知和邊緣融合的多視圖立體三維重建方法

    航空建筑深度估計(jì)是三維數(shù)字城市重建中的一項(xiàng)重要任務(wù),基于深度學(xué)習(xí)的多視圖立體(MVS)方法在該領(lǐng)域取得了較好的成果。目前的主要方法通過(guò)修改MVS 框架實(shí)現(xiàn)建筑物的深度估計(jì),缺乏對(duì)建筑物
    的頭像 發(fā)表于 11-07 10:16 ?839次閱讀
    建筑物邊緣感知和邊緣融合的多視圖立體<b class='flag-5'>三維重建</b><b class='flag-5'>方法</b>

    三維打印技術(shù)原理

    三維打印技術(shù),又稱3D打印技術(shù),是一種快速成型技術(shù),其核心原理在于將數(shù)字模型文件逐層轉(zhuǎn)化為實(shí)體物體。以下是三維打印技術(shù)原理的詳細(xì)闡述:
    的頭像 發(fā)表于 09-16 15:31 ?1640次閱讀

    留形科技借助NVIDIA平臺(tái)提供高效精確的三維重建解決方案

    本案例中,留形科技借助 NVIDIA Jetson 和 Omniverse 平臺(tái),實(shí)現(xiàn)邊緣設(shè)備上的實(shí)時(shí)、全彩、無(wú)損三維重建,從而在建筑細(xì)節(jié)捕捉、大型基礎(chǔ)設(shè)施的數(shù)字孿生等應(yīng)用中,大幅提升三維數(shù)據(jù)采集與處理的效率與精度。
    的頭像 發(fā)表于 09-09 09:42 ?952次閱讀

    基于大模型的仿真系統(tǒng)研究一——三維重建大模型

    問(wèn)題,賽目推出了基于大模型的仿真系統(tǒng),利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等人工智能技術(shù),不僅推出自動(dòng)標(biāo)注大模型、多模態(tài)檢測(cè)大模型和場(chǎng)景生成大模型等模塊,并且引入三維重建大模型加強(qiáng)渲染畫(huà)面真實(shí)性。 ? ?通過(guò)上述模塊,賽目的路采
    的頭像 發(fā)表于 07-30 14:51 ?2543次閱讀
    基于大模型的仿真系統(tǒng)研究一——<b class='flag-5'>三維重建</b>大模型

    泰來(lái)三維 工廠三維掃描建模技術(shù)服務(wù)

    通過(guò)利用三維掃描技術(shù)建立工廠物體三維模型,可以更加直觀地了解物體的形狀和尺寸信息,避免傳統(tǒng)測(cè)量方法的誤差和繁瑣操作,從而提高生產(chǎn)效率和質(zhì)量
    的頭像 發(fā)表于 07-22 13:14 ?649次閱讀
    泰來(lái)<b class='flag-5'>三維</b> 工廠<b class='flag-5'>三維</b>掃描建模技術(shù)服務(wù)

    泰來(lái)三維 三維激光掃描結(jié)合BIM在工廠掃描建模中的優(yōu)勢(shì)

    BIM技術(shù)是建設(shè)項(xiàng)目實(shí)施前的建筑信息模型搭建,三維激光掃描技術(shù)則是現(xiàn)實(shí)物體三維信息數(shù)字化。BIM具有可視化、協(xié)調(diào)性、優(yōu)化性、模擬性和可視圖形的特點(diǎn),而三維掃描儀獲取的數(shù)據(jù)非常真實(shí)和準(zhǔn)
    的頭像 發(fā)表于 07-19 10:39 ?704次閱讀

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品