0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于NeRF的三維場(chǎng)景重建和理解

3D視覺工坊 ? 來源:深藍(lán)AI ? 2023-02-06 10:50 ? 次閱讀

如果從方法出發(fā)的話,兩張圖就能看懂:

a30c93d0-a570-11ed-bfe3-dac502259ad0.png

圖 1

a31dad5a-a570-11ed-bfe3-dac502259ad0.png

圖 2 上面是 NeRF網(wǎng)絡(luò)結(jié)構(gòu),下面是 Semantic-NeRF 的網(wǎng)絡(luò)結(jié)構(gòu),就是在 NeRF 的網(wǎng)絡(luò)中加了一個(gè)分支,輸出到語(yǔ)義。和 NeRF 一樣,Semantic-NeRF 能夠連續(xù)的表達(dá)空間信息,因此你可以看到 Semantic-NeRF 主頁(yè)里的各種酷炫的 demo. 這是 ICCV 2021 的 oral 工作。 如果有留意上一講的講座,從 Semantic-NeRF 的demo中你應(yīng)該能推測(cè)出,這應(yīng)該是第四種拍攝方式:

a33919e6-a570-11ed-bfe3-dac502259ad0.png

圖 3 這種拍攝方式在SLAM或者SFM中更多見,而傳統(tǒng)三維重建或者RGBD重建是很難做出 NeRF 或者 Semantic-NeRF 這種效果的。所以方法可能很簡(jiǎn)單,但是這個(gè)工作很有意義。 應(yīng)用的話,大家可以參考視頻

Semantic-NeRF應(yīng)用

稀疏監(jiān)督下的新視角語(yǔ)義生成(Semantic View Synthesis with Sparse Labels

語(yǔ)義標(biāo)簽去噪(LabelDenoising

語(yǔ)義標(biāo)簽超分辨(Super-Resolution)

稀疏語(yǔ)義標(biāo)簽傳播(LabelPropagation)

多視角語(yǔ)義融合(Multi-view Semantic Fusion)

稠密的語(yǔ)義三維重建

在這篇工作之后智博又做了 iLabel 的工作,將 imap 和 semantic-NeRF 結(jié)合,這里我們就不細(xì)講了,感興趣的同學(xué)歡迎去看原文。 需要提到的另一篇工作是 NeSF 這篇文章。 智博在講解 NeSF 的時(shí)候提到,訓(xùn)練的sample是場(chǎng)景,而不是圖片,這是對(duì)這篇文章的一個(gè)高度概況。NeSF 首先會(huì)訓(xùn)練許多場(chǎng)景,比如100個(gè)場(chǎng)景,那我們就會(huì)得到100個(gè) NeRF 的模型,我們對(duì)這 100 個(gè) NeRF 的模型做 Grid query,從而獲取一個(gè) Density Grid,其實(shí)就是一堆規(guī)則的點(diǎn),可以使用 3D 卷積,從而轉(zhuǎn)換為 Feature Grid. 對(duì) Feature Grid 做 volume rendering 就能渲染出各個(gè)視角的語(yǔ)義圖像了。下面是 NeSF 的流程圖。

a374c306-a570-11ed-bfe3-dac502259ad0.png

圖 4 NeSF流程圖 NeSF 的泛化性從 demo 來看還是不錯(cuò)的,但是這樣的工作顯然不是我們可以玩的 (訓(xùn)練 100 個(gè) NeRF), 你幾乎不用猜都知道是哪里出的工作。 這也就引出了 NeRF 的許多痛點(diǎn),印象里第四講嘉賓在講 NeRF in the wild 和 Ha-NeRF 的時(shí)候說,每次實(shí)驗(yàn)要 4 張V100 跑2天。因此不論是推理還是訓(xùn)練,加速工作都顯得尤為重要,對(duì)語(yǔ)義 NeRF 相關(guān)的工作更是如此,因?yàn)槟壳暗募铀俟ぷ鞔蠖純A向于擺脫神經(jīng)網(wǎng)絡(luò)。 動(dòng)態(tài)場(chǎng)景的 NeRF 也有一些工作,但是是否一樣能像 Semantic NeRF 一樣,很輕松地 work 呢?其實(shí)能引發(fā)的問題還是挺多的。 評(píng)估一項(xiàng)工作的 novelty 的其中一項(xiàng)指標(biāo)就是看這篇工作挖了多少坑,能啟發(fā)多少后續(xù)工作,Semantic NeRF 就是這樣的一篇工作。如果你看懂這個(gè)系列的工作,推薦大家立刻去看 panoptic NeRF 相關(guān)的工作。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2894

    瀏覽量

    107651
  • 網(wǎng)絡(luò)結(jié)構(gòu)

    關(guān)注

    0

    文章

    48

    瀏覽量

    11129

原文標(biāo)題:基于NeRF的三維場(chǎng)景重建和理解

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    怎樣去設(shè)計(jì)一種基于RGB-D相機(jī)的三維重建無(wú)序抓取系統(tǒng)?

    為什么要開發(fā)一種三維重建無(wú)序抓取系統(tǒng)?三維重建無(wú)序抓取系統(tǒng)是由哪些部分組成的?三維重建無(wú)序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)和創(chuàng)新點(diǎn)?
    發(fā)表于 07-02 06:29

    如何去開發(fā)一款基于RGB-D相機(jī)與機(jī)械臂的三維重建無(wú)序抓取系統(tǒng)

    基于RGB-D相機(jī)與機(jī)械臂的三維重建無(wú)序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)?如何去開發(fā)一款基于RGB-D相機(jī)與機(jī)械臂的三維重建無(wú)序抓取系統(tǒng)?基于RGB-D相機(jī)與機(jī)械臂的三維重建無(wú)序抓取系統(tǒng)是由哪些部分組成的?
    發(fā)表于 09-08 06:12

    無(wú)人機(jī)三維建模的信息

    項(xiàng)目需要調(diào)研一下無(wú)人機(jī)三維建模的信息無(wú)人機(jī)三維建模核心技術(shù)是三維重建,或者說基于圖片的建模(Image-Based Modeling)。項(xiàng)目需要是建立園區(qū)的三維模型,其他應(yīng)用上可以用于
    發(fā)表于 09-16 06:55

    一種新穎實(shí)用的基于視覺導(dǎo)航的三維重建算法

    一種新穎實(shí)用的基于視覺導(dǎo)航的三維重建算法 根據(jù)立體視覺在視覺導(dǎo)航應(yīng)用中的特點(diǎn),提出了由視差圖重建三維場(chǎng)景的整套算法。首先,推導(dǎo)視差圖里各點(diǎn)在攝
    發(fā)表于 02-27 09:24 ?18次下載

    基于FPGA的醫(yī)學(xué)圖像三維重建系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

    目前大部分的醫(yī)學(xué)圖像三維重建過程都是在PC機(jī)上完成的,由于PC機(jī)本身性能的限制和重建算法的復(fù)雜性,使得重建效率不高。針對(duì)這個(gè)問題,設(shè)計(jì)與實(shí)現(xiàn)了一個(gè)基于FPGA(Field Programmable Gate Array,現(xiàn)場(chǎng)可編
    發(fā)表于 03-15 13:52 ?44次下載

    基于非量測(cè)相片的三維模型重建

    三維激光掃描技術(shù)進(jìn)行三維重建和傳統(tǒng)的室內(nèi)三維重建。近年來,數(shù)碼攝像產(chǎn)品性價(jià)比進(jìn)一步提高得到廣泛使用且其數(shù)碼攝像技術(shù)有了突破性進(jìn)展,攝影成像的質(zhì)量和分辨率有了大幅度的提高,為三維模型構(gòu)建
    發(fā)表于 02-23 10:30 ?0次下載
    基于非量測(cè)相片的<b class='flag-5'>三維</b>模型<b class='flag-5'>重建</b>

    如何使用單目視覺進(jìn)行高精度三維場(chǎng)景重建技術(shù)研究

    近年來,隨著計(jì)算機(jī)硬件的不斷快速更新,計(jì)算機(jī)的處理能力也不斷變強(qiáng)。同時(shí)場(chǎng)景三維模型的獲取技術(shù)越來越成熟,我們獲得場(chǎng)景三維模型數(shù)據(jù)的方式更多也更加方便了。而目前在基于單目和雙目的
    發(fā)表于 12-24 15:55 ?7次下載
    如何使用單目視覺進(jìn)行高精度<b class='flag-5'>三維</b><b class='flag-5'>場(chǎng)景</b><b class='flag-5'>重建</b>技術(shù)研究

    NVIDIA Omniverse平臺(tái)助力三維重建服務(wù)協(xié)同發(fā)展

    計(jì)算機(jī)視覺的進(jìn)步為元宇宙的數(shù)字孿生應(yīng)用打下堅(jiān)實(shí)基礎(chǔ)。在計(jì)算機(jī)視覺中,三維重建是指根據(jù)單視圖或者多視圖的圖像重建三維信息的過程。數(shù)字孿生開發(fā)者可借助三維重建服務(wù),加速 3D 模型構(gòu)建,提
    的頭像 發(fā)表于 10-13 09:45 ?1194次閱讀

    深度學(xué)習(xí)背景下的圖像三維重建技術(shù)進(jìn)展綜述

    根據(jù)三維模型的表示形式可以將圖像三維重建方法分類為基于體素的三維重建、基于點(diǎn)云的三維重建和基于網(wǎng)格的三維重建,其中基于網(wǎng)格的
    的頭像 發(fā)表于 01-09 14:26 ?2582次閱讀

    NerfingMVS:引導(dǎo)優(yōu)化神經(jīng)輻射場(chǎng)實(shí)現(xiàn)室內(nèi)多視角三維重建

    既然Nerf可以表示場(chǎng)景三維信息,一個(gè)自然的想法是能不能將NeRF應(yīng)用到室內(nèi)場(chǎng)景三維重建任務(wù)中
    的頭像 發(fā)表于 02-13 11:20 ?3107次閱讀

    從多視角圖像做三維場(chǎng)景重建 (CVPR&apos;22 Oral)

    最近,有方法提出基于隱式神經(jīng)表示做三維重建。NeRF [3] 通過可微分的體積渲染技術(shù)從圖像中學(xué)習(xí)隱式輻射場(chǎng)。NeRF可以實(shí)現(xiàn)有真實(shí)感的視角合成,但是幾何重建結(jié)果噪音很嚴(yán)重,主要是因?yàn)?/div>
    的頭像 發(fā)表于 02-20 10:11 ?2862次閱讀

    三維重建:從入門到入土

    經(jīng)典三維重建系統(tǒng)的整個(gè)pipeline從相機(jī)標(biāo)定、基礎(chǔ)矩陣與本質(zhì)矩陣估計(jì)、特征匹配到運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(SFM),從SFM到稠密點(diǎn)云重建、表面重建、紋理貼圖。熟悉SFM的工程師已經(jīng)是行業(yè)內(nèi)的佼佼者,能掌握
    的頭像 發(fā)表于 03-03 10:17 ?1212次閱讀

    三維場(chǎng)景點(diǎn)云理解重建技術(shù)

    三維場(chǎng)景理解重建技術(shù)主要包含場(chǎng)景點(diǎn)云特征提取、掃描點(diǎn)云配準(zhǔn)與融合、場(chǎng)景
    的頭像 發(fā)表于 08-08 16:58 ?1350次閱讀
    <b class='flag-5'>三維</b><b class='flag-5'>場(chǎng)景</b>點(diǎn)云<b class='flag-5'>理解</b>與<b class='flag-5'>重建</b>技術(shù)

    如何實(shí)現(xiàn)整個(gè)三維重建過程

    在計(jì)算機(jī)視覺中,三維重建是指根據(jù)單視圖或者多視圖的圖像重建三維信息的過程。由于單視頻的信息不完全,因此三維重建需要利用經(jīng)驗(yàn)知識(shí),而多視圖的三維重建
    發(fā)表于 09-01 11:06 ?1714次閱讀
    如何實(shí)現(xiàn)整個(gè)<b class='flag-5'>三維重建</b>過程

    全面總結(jié)動(dòng)態(tài)NeRF

    1. 摘要 神經(jīng)輻射場(chǎng)(NeRF)是一種新穎的隱式方法,可以實(shí)現(xiàn)高分辨率的三維重建和表示。在首次提出NeRF的研究之后,NeRF獲得了強(qiáng)大的發(fā)展力量,并在
    的頭像 發(fā)表于 11-14 16:48 ?395次閱讀
    全面總結(jié)動(dòng)態(tài)<b class='flag-5'>NeRF</b>