0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GO-Surf: 用于快速、高保真RGB-D表面重建的神經(jīng)特征網(wǎng)格優(yōu)化

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-03-24 11:13 ? 次閱讀

摘要

我們提出了GO-Surf,一種直接的特征網(wǎng)格優(yōu)化方法,用于從RGB-D序列中準(zhǔn)確和快速地重建表面。我們用一個(gè)學(xué)習(xí)過的分層特征體素網(wǎng)格對底層場景進(jìn)行建模,該網(wǎng)格封裝了多層次的幾何和外觀局部信息。特征向量被直接優(yōu)化,以便在三線插值后,由兩個(gè)淺層MLP解碼為有符號的距離和輻射度值,并通過體積渲染進(jìn)行渲染,使合成的RGB/深度值與觀察到的RGB/深度值之間的差異最小。我們的監(jiān)督信號--RGB、深度和近似的SDF--可以直接從輸入圖像中獲得,不需要任何融合或后處理。我們制定了一個(gè)新的SDF梯度正則化項(xiàng),鼓勵表面光滑和孔洞填充,同時(shí)保持高頻細(xì)節(jié)。GO-Surf可以在15-45分鐘內(nèi)優(yōu)化1-2K幀的序列,比基于MLP表示的最相關(guān)方法NeuralRGB-D的速度提高了60倍,同時(shí)在標(biāo)準(zhǔn)基準(zhǔn)上保持同等的性能。

項(xiàng)目頁面:https://jingwenwang95.github. io/go_surf。

主要貢獻(xiàn):

GO-Surf將可學(xué)習(xí)的特征網(wǎng)格引入RGB-D序列的SDF重建中,以實(shí)現(xiàn):

(i) 在交互式運(yùn)行時(shí)間內(nèi)快速優(yōu)化

(ii) 高精度的表面重建。

我們還首次在體素網(wǎng)格的背景下應(yīng)用Eikonal和平滑度正則化條款。

主要方法

給定一個(gè)輸入的RGB-D序列,GO-Surf通過直接優(yōu)化一個(gè)多分辨率的特征網(wǎng)格和有符號的距離值以及顏色預(yù)測來獲得高質(zhì)量的三維表面重建。我們在有符號距離值上制定了一個(gè)新的平滑度先驗(yàn),從而在保留細(xì)節(jié)的同時(shí),改善了孔洞填充和平滑度特性。我們的優(yōu)化比基于MLP的方法快×60倍。

8d79e1ec-c9b7-11ed-bfe3-dac502259ad0.png

GO-Surf使用多級特征網(wǎng)格和兩個(gè)淺層MLP解碼器。給定一個(gè)沿射線的采樣點(diǎn),每個(gè)網(wǎng)格通過三線插值進(jìn)行查詢。多級特征被串聯(lián)并解碼為SDF,并用于計(jì)算樣本權(quán)重。顏色是由最細(xì)的網(wǎng)格單獨(dú)解碼的。損失項(xiàng)被應(yīng)用于SDF值,并渲染深度和顏色。在每個(gè)查詢點(diǎn)計(jì)算SDF的梯度,并用于Eikonal和平滑度正則化。

8dc457ae-c9b7-11ed-bfe3-dac502259ad0.png

8df6c748-c9b7-11ed-bfe3-dac502259ad0.png

主要結(jié)果

8e53939c-c9b7-11ed-bfe3-dac502259ad0.png

8fdd0b08-c9b7-11ed-bfe3-dac502259ad0.png

9066030e-c9b7-11ed-bfe3-dac502259ad0.png

909b8088-c9b7-11ed-bfe3-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1144

    瀏覽量

    40835
  • 網(wǎng)格
    +關(guān)注

    關(guān)注

    0

    文章

    139

    瀏覽量

    16029
  • MLP
    MLP
    +關(guān)注

    關(guān)注

    0

    文章

    57

    瀏覽量

    4260

原文標(biāo)題:GO-Surf: 用于快速、高保真RGB-D表面重建的神經(jīng)特征網(wǎng)格優(yōu)化

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    動態(tài)環(huán)境中基于神經(jīng)隱式表示的RGB-D SLAM

    神經(jīng)隱式表示已經(jīng)被探索用于增強(qiáng)視覺SLAM掩碼算法,特別是在提供高保真的密集地圖方面。
    的頭像 發(fā)表于 01-17 10:39 ?929次閱讀
    動態(tài)環(huán)境中基于<b class='flag-5'>神經(jīng)</b>隱式表示的<b class='flag-5'>RGB-D</b> SLAM

    高保真是什么意思?什么叫高保真

    `<p><b><font face="Verdana">高保真
    發(fā)表于 05-04 18:58

    如何去開發(fā)一款基于RGB-D相機(jī)與機(jī)械臂的三維重建無序抓取系統(tǒng)

    基于RGB-D相機(jī)與機(jī)械臂的三維重建無序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)?如何去開發(fā)一款基于RGB-D相機(jī)與機(jī)械臂的三維重建無序抓取系統(tǒng)?基于RGB-D
    發(fā)表于 09-08 06:12

    什么是高保真耳機(jī)

    什么叫高保真耳機(jī) 常聽說“高保真耳機(jī)”、“高保真音響”。音響中的“高保真”指的是什么高保真簡單的說就是 讓你感受原汁原味的聲音 好象就在
    發(fā)表于 10-09 16:18 ?53次下載

    什么是高保真

    什么是高保真? 高保真的英文原詞是High Fidelity,簡稱HI-FI。高保真指聲頻錄音及放音系統(tǒng)或設(shè)備具有如實(shí)反
    發(fā)表于 05-04 18:55 ?1.2w次閱讀

    基于RGB-D圖像物體識別方法

    針對傳統(tǒng)的顏色一深度(RGB-D)圖像物體識別的方法所存在的圖像特征學(xué)習(xí)不全面、特征編碼魯棒性不夠等問題,提出了基于核描述子局部約束線性編碼( KD-LLC)的RGB-D圖像物體識別方
    發(fā)表于 12-07 10:22 ?1次下載
    基于<b class='flag-5'>RGB-D</b>圖像物體識別方法

    基于STL曲面網(wǎng)格重建算法

    快速獲得完整拓?fù)潢P(guān)系且其存在大量冗余信息的缺點(diǎn),制約了STL網(wǎng)格模型的進(jìn)一步優(yōu)化處理與應(yīng)用.為此,需要針對STL網(wǎng)格模型進(jìn)行網(wǎng)格
    發(fā)表于 12-25 11:52 ?1次下載
    基于STL曲面<b class='flag-5'>網(wǎng)格</b><b class='flag-5'>重建</b>算法

    RGB-D圖像是什么

    RGB-D圖像其實(shí)是兩幅圖像。
    的頭像 發(fā)表于 11-01 11:46 ?1.8w次閱讀

    用于快速高保真RGB-D表面重建神經(jīng)特征網(wǎng)格優(yōu)化GO-Surf

    我們提出了GO-Surf,一種直接的特征網(wǎng)格優(yōu)化方法,用于RGB-D序列中準(zhǔn)確和
    的頭像 發(fā)表于 03-17 16:35 ?767次閱讀

    基于RGB-D相機(jī)的三維重建和傳統(tǒng)SFM和SLAM算法有什么區(qū)別?

    輸入數(shù)據(jù)流不同。在基于RGB-D相機(jī)的三維重建中,輸入有深度信息和彩色信息,并且深度信息起主導(dǎo)作用,而在SLAM和SFM算法中輸入的是主要是彩色信息,個(gè)別工作也有結(jié)合深度信息。
    發(fā)表于 03-23 12:28 ?1367次閱讀

    生成高質(zhì)量 3D 網(wǎng)格,從重建到生成式 AI

    新一代 AI 工作流已經(jīng)在生成高保真 3D 模型方面取得了巨大成功,從基于給定圖像的場景重建,到能夠?yàn)榻换ナ襟w驗(yàn)制作資產(chǎn)的生成式 AI。 這些生成的 3D 模型通常被提取成標(biāo)準(zhǔn)的三角
    的頭像 發(fā)表于 08-17 19:15 ?747次閱讀
    生成高質(zhì)量 3<b class='flag-5'>D</b> <b class='flag-5'>網(wǎng)格</b>,從<b class='flag-5'>重建</b>到生成式 AI

    基于3D形狀重建網(wǎng)絡(luò)的機(jī)器人抓取規(guī)劃方法

    一個(gè)帶有分割掩碼的輸入RGB-D圖像被提供給兩個(gè)神經(jīng)網(wǎng)絡(luò),分別產(chǎn)生一個(gè)6自由度的抓取姿勢和一個(gè)物體的3D點(diǎn)云重建。通過將抓取姿勢投影到點(diǎn)云中最近的點(diǎn)來
    發(fā)表于 11-02 10:39 ?455次閱讀
    基于3<b class='flag-5'>D</b>形狀<b class='flag-5'>重建</b>網(wǎng)絡(luò)的機(jī)器人抓取規(guī)劃方法

    一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng)

    提出了一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng),該系統(tǒng)由完整的前端和后端模塊組成,包括里程計(jì)、回環(huán)檢測、子圖融合和全局優(yōu)化。
    的頭像 發(fā)表于 11-29 10:35 ?639次閱讀
    一種基于<b class='flag-5'>RGB-D</b>圖像序列的協(xié)同隱式<b class='flag-5'>神經(jīng)</b>同步定位與建圖(SLAM)系統(tǒng)

    手持RGB-D傳感器廣泛應(yīng)用的情況

    DisCo方法:提出了一種基于擴(kuò)散的跨模態(tài)形狀重建方法。該方法利用三平面擴(kuò)散模型,結(jié)合部分點(diǎn)云和多視圖圖像,實(shí)現(xiàn)了高保真度的3D形狀重建?;旌?b class='flag-5'>特征
    的頭像 發(fā)表于 12-26 16:44 ?541次閱讀
    手持<b class='flag-5'>RGB-D</b>傳感器廣泛應(yīng)用的情況

    常用的RGB-D SLAM解決方案

    BundleFusion是一種稠密的實(shí)時(shí)室內(nèi)場景三維重建算法框架。輸入為RGB-D相機(jī)采集的并且是對齊好的RGB圖像和深度圖的數(shù)據(jù)流。輸出為重建好的稠密三維場景模型。
    的頭像 發(fā)表于 04-16 09:37 ?1065次閱讀
    常用的<b class='flag-5'>RGB-D</b> SLAM解決方案