0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于DetNet的單階段單視圖三維點(diǎn)云重建網(wǎng)絡(luò)

冬至子 ? 來(lái)源:蘇大軌道交通學(xué)院研究生 ? 作者:Bin Li , Shiao Zhu an ? 2023-12-06 15:34 ? 次閱讀

1. 文章摘要與主要貢獻(xiàn)

從一張圖片中推斷出具有合理形狀和外觀的物體是一個(gè)具有挑戰(zhàn)性的問(wèn)題。現(xiàn)有的研究往往更多地關(guān)注點(diǎn)云生成網(wǎng)絡(luò)的結(jié)構(gòu),而忽略了二維圖像的特征提取,減少了網(wǎng)絡(luò)中特征傳播過(guò)程中的損失。本文提出了一種單級(jí)單視圖三維點(diǎn)云重建網(wǎng)絡(luò)3D SSRecNet。所提出的3D SSRecNet是一個(gè)簡(jiǎn)單的單級(jí)網(wǎng)絡(luò),由2D圖像特征提取網(wǎng)絡(luò)和點(diǎn)云預(yù)測(cè)網(wǎng)絡(luò)組成。單級(jí)網(wǎng)絡(luò)結(jié)構(gòu)可以減少提取的2D圖像特征的丟失。二維圖像特征提取網(wǎng)絡(luò)以DetNet為骨干。DetNet可以從2D圖像中提取更多細(xì)節(jié)。

為了生成形狀和外觀更好的點(diǎn)云,在點(diǎn)云預(yù)測(cè)網(wǎng)絡(luò)中,使用ELU作為激活函數(shù),并使用CD和EMD的聯(lián)合函數(shù)作為3D SSRecNet的損失函數(shù)。為了驗(yàn)證3D SSRecNet的有效性,該文在ShapeNet和Pix3D數(shù)據(jù)集上進(jìn)行了一系列實(shí)驗(yàn)。CD和EMD測(cè)量的實(shí)驗(yàn)結(jié)果表明,3D SSRecNet優(yōu)于最先進(jìn)的重建方法。

該文工作的主要貢獻(xiàn)如下:

  1. 該文提出了一種用于從單個(gè)圖像進(jìn)行3D重建的單階段神經(jīng)網(wǎng)絡(luò),即3D SSRecNet。3D SSRecNet將圖像作為輸入,并直接輸出預(yù)測(cè)的點(diǎn)云,而無(wú)需進(jìn)一步處理。
  2. 3D SSRecNet包括特征提取和三維點(diǎn)云生成。特征提取網(wǎng)絡(luò)更善于提取2D輸入的詳細(xì)特征。點(diǎn)云生成網(wǎng)絡(luò)具有簡(jiǎn)單的結(jié)構(gòu),并在其多層感知器中使用適當(dāng)?shù)募せ詈瘮?shù),這減少了轉(zhuǎn)發(fā)傳播過(guò)程中的特征損失,以獲得精細(xì)的輸出。
  3. 在ShapeNet和pix3D數(shù)據(jù)集上的實(shí)驗(yàn)表明,3D SSRecNet在單視圖重建任務(wù)上優(yōu)于現(xiàn)有技術(shù)的重建方法。同時(shí),該文還通過(guò)實(shí)驗(yàn)證明了點(diǎn)云生成網(wǎng)絡(luò)激活函數(shù)的有效性。

**2. **研究方法

2.1 3D-SSRecNet的結(jié)構(gòu)

3D SSRecNet的體系結(jié)構(gòu)如圖1所示。3D SSRecNet包括兩個(gè)主要部分:二維圖像特征提取網(wǎng)絡(luò)和點(diǎn)云預(yù)測(cè)網(wǎng)絡(luò)。這兩個(gè)部分構(gòu)成了一個(gè)簡(jiǎn)單的單階段點(diǎn)云重建網(wǎng)絡(luò)。單階段網(wǎng)絡(luò)結(jié)構(gòu)僅在3D SSRecNet的網(wǎng)絡(luò)內(nèi)傳輸2D圖片的特征。與需要跨網(wǎng)絡(luò)傳輸特征的兩階段重建網(wǎng)絡(luò)相比,這種網(wǎng)絡(luò)結(jié)構(gòu)減少了特征的損失。

圖片

圖 1 3D-SSRecNet框架—architecture of 3D-SSRecNet.

給定一個(gè)2D圖像,首先,該文通過(guò)DetNet獲得一個(gè)潛在的表示V。然后,該文通過(guò)全連接(FC)層將V映射到低維特征V’。然后直接應(yīng)用多層感知器(MLP)對(duì)點(diǎn)集進(jìn)行預(yù)測(cè)。在訓(xùn)練過(guò)程中,計(jì)算倒角距離和推土機(jī)的距離損失函數(shù),并監(jiān)督可訓(xùn)練參數(shù)的更新。

2.2 二維圖像特征提取

許多圖像特征網(wǎng)絡(luò)應(yīng)用下采樣,帶來(lái)了更高的感受野,但不可避免地造成了圖像細(xì)節(jié)的損失。然而,對(duì)于重建,圖像細(xì)節(jié)對(duì)于幾何形狀的恢復(fù)至關(guān)重要。這種網(wǎng)絡(luò)更適合圖像分類(lèi)任務(wù),但不適合需要更詳細(xì)特征的重建任務(wù)。

DetNet不僅保留了更多的細(xì)節(jié),而且保留了很大的感受野。盡管DetNet是為物體檢測(cè)而設(shè)計(jì)的,但其新穎的擴(kuò)張瓶頸結(jié)構(gòu)提供了高分辨率的特征圖和大的感受野。該文使用DetNet作為圖像特征提取的主干。DetNet在階段4之前遵循與ResNet-50相同的結(jié)構(gòu),因此DetNet還具有易于訓(xùn)練且不會(huì)陷入梯度消失的優(yōu)點(diǎn)。表1顯示了DetNet最后兩個(gè)階段的參數(shù),即DetNet和ResNet-50之間的差異。

在第4階段之后,DetNet將特征圖的大小保持在16×16,這使得能夠保留更多細(xì)節(jié)。DetNet的第五和第六階段由具有擴(kuò)張卷積的瓶頸組成,一些瓶頸在其快捷連接上具有1×1卷積。擴(kuò)大的卷積增加了感受野。然而,考慮到計(jì)算量和存儲(chǔ)量,階段5和階段6設(shè)置相同的通道數(shù)256。在基線結(jié)束時(shí),將應(yīng)用完全連接的圖層。

表 1 DetNet最后兩個(gè)階段的參數(shù)—the parameters of last two stages DetNet.

圖片

如圖1所示,在對(duì)輸入圖像進(jìn)行特征提取后,該文獲得了輸入圖像的1000維潛在特征V。之后,全連接(FC)層將向量V的維度從1000壓縮到100,并獲得向量V’。

2.3 點(diǎn)云預(yù)測(cè)

該文使用三層MLP來(lái)直接預(yù)測(cè)點(diǎn)集。三個(gè)MLP層的輸出尺寸分別為512、1024和N×3。特征提取網(wǎng)絡(luò)的輸出:向量V'被饋送到點(diǎn)云預(yù)測(cè)網(wǎng)絡(luò)的MLP中。在前兩層上,引入ELU作為激活函數(shù)。

ELU激活函數(shù)及其導(dǎo)數(shù)的曲線分別如圖2a、b所示。對(duì)于常見(jiàn)的激活函數(shù),如ReLU,對(duì)應(yīng)于負(fù)軸的值為0。然而,標(biāo)準(zhǔn)化的點(diǎn)云坐標(biāo)間隔為[-1,1],這表明點(diǎn)云坐標(biāo)將具有負(fù)值。如圖2a所示,ELU激活函數(shù)的負(fù)軸對(duì)應(yīng)的值為非零。因此,使用ELU作為激活函數(shù),重建網(wǎng)絡(luò)中的負(fù)值信息在前向傳播過(guò)程中不會(huì)丟失。如圖3b所示,ELU的導(dǎo)數(shù)在負(fù)軸上也是非零的。在網(wǎng)絡(luò)的反向傳播過(guò)程中,負(fù)梯度不會(huì)丟失,它可以幫助更新網(wǎng)絡(luò)權(quán)重。

圖片

(a)激活函數(shù)ELU曲線 (b) ELU導(dǎo)數(shù)曲線

Curve of activation function ELU Curve of derivative of ELU

圖 2 ELU激活函數(shù)及其導(dǎo)數(shù)—ELU activation function and its derivative

圖片

圖 3 具有相同CD損失值的不同重建—different reconstructions with the same CD loss value

在實(shí)驗(yàn)部分,該文證明了使用ELU作為激活函數(shù)的重建效果優(yōu)于使用其他激活函數(shù)。該文在最后一個(gè)激活層之后直接輸出預(yù)測(cè)的點(diǎn)集。它由tanh函數(shù)實(shí)現(xiàn),其輸出屬于[-1,1],與所需的點(diǎn)集數(shù)據(jù)相同。

2.4 損失函數(shù)

定義點(diǎn)云重建的損失函數(shù)。該文必須考慮兩個(gè)重要的性質(zhì)。(1)點(diǎn)云是一個(gè)無(wú)序的點(diǎn)集,因此無(wú)論該文如何改變點(diǎn)的順序,該文都將獲得相同的數(shù)據(jù)。(2)無(wú)論任何旋轉(zhuǎn)變換,真實(shí)物體的幾何特征均不得發(fā)生顯著變化。然而,例如,當(dāng)該文進(jìn)行旋轉(zhuǎn)變換時(shí),點(diǎn)坐標(biāo)似乎不同。

CD定義如下:

圖片

EMD定義如下:

圖片

綜合CD和EMD的優(yōu)缺點(diǎn),該文的網(wǎng)絡(luò)的損失函數(shù)定義為:

圖片

3. 實(shí)驗(yàn)過(guò)程 ****

該文分別在ShapeNet和Pix3D數(shù)據(jù)集上評(píng)估了所提出的3D SSRecNet。ShapeNet是一個(gè)紋理CAD模型的大集合,由13個(gè)類(lèi)和43809個(gè)點(diǎn)云模型組成,用于訓(xùn)練和測(cè)試。該文使用80–20%的訓(xùn)練/測(cè)試分割來(lái)執(zhí)行該文的實(shí)驗(yàn)。該文在Pix3D數(shù)據(jù)庫(kù)上進(jìn)行了同樣的實(shí)驗(yàn)。Pix3D數(shù)據(jù)庫(kù)由三個(gè)類(lèi)和7595個(gè)點(diǎn)云模型組成。該數(shù)據(jù)集是真實(shí)場(chǎng)景的CAD模型。在Pix3D上的實(shí)驗(yàn)可以更好地評(píng)估點(diǎn)云重建算法的實(shí)用性。

該文使用梯度優(yōu)化算法Adam來(lái)優(yōu)化所提出的3DSSRecNet。在訓(xùn)練中,該文將學(xué)習(xí)率設(shè)置為0.0005,將歷元設(shè)置為50。訓(xùn)練環(huán)境如下:Ubuntu 18.04.6,CUDA 10.1,GPU型號(hào)為NVIDIA Tesla T4×4。該文使用在1024個(gè)采樣點(diǎn)上計(jì)算的CD和EMD值來(lái)評(píng)估重建點(diǎn)云的質(zhì)量。

表 2 ShapeNet數(shù)據(jù)集上不同激活函數(shù)的重構(gòu)結(jié)果—reconstruction results of different activation functions on ShapeNet dataset.

圖片

表 3 CD評(píng)估的ShapeNet重建結(jié)果—reconstruction results on ShapeNet evaluated by CD

圖片

表 4 EMD評(píng)估的ShapeNet重建結(jié)果—reconstruction results on ShapeNet evaluated by EMD

圖片

**4. **文章結(jié)論

本文提出了一種高效的三維點(diǎn)云重建方法3DSSRecNet。給定圖像,它學(xué)習(xí)潛在的表示,在降維后,該文應(yīng)用MLP直接預(yù)測(cè)對(duì)應(yīng)點(diǎn)云。該文在ShapeNet和Pix3D數(shù)據(jù)集上進(jìn)行了幾個(gè)實(shí)驗(yàn)。該文證明了在發(fā)電網(wǎng)絡(luò)中使用激活函數(shù)ELU的重建效果優(yōu)于使用其他激活函數(shù)。也就是說(shuō),使用ELU生成的點(diǎn)云的CD和EMD值低于使用其他激活函數(shù)生成的點(diǎn)云中的CD和EMD值。

**5. **閱讀心得

這篇論文提出了一種名為3D-SSRecNet的單階段和單視圖3D點(diǎn)云重建網(wǎng)絡(luò),該網(wǎng)絡(luò)由2D圖像特征提取網(wǎng)絡(luò)和點(diǎn)云預(yù)測(cè)網(wǎng)絡(luò)組成。單階段網(wǎng)絡(luò)結(jié)構(gòu)可以減少提取的2D圖像特征的損失。2D圖像特征提取網(wǎng)絡(luò)采用DetNet作為骨干網(wǎng)絡(luò),可以從2D圖像中提取更多細(xì)節(jié)。為了生成形狀和外觀更好的點(diǎn)云,在點(diǎn)云預(yù)測(cè)網(wǎng)絡(luò)中,使用ELU作為激活函數(shù),并使用Chamfer距離(CD)和Earth mover’s distance(EMD)的聯(lián)合函數(shù)作為3D-SSRecNet的損失函數(shù)。在ShapeNet和Pix3D數(shù)據(jù)集上進(jìn)行的實(shí)驗(yàn)結(jié)果表明,通過(guò)CD和EMD測(cè)量,3D-SSRecNet優(yōu)于現(xiàn)有的重建方法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4772

    瀏覽量

    100808
  • CAD
    CAD
    +關(guān)注

    關(guān)注

    17

    文章

    1092

    瀏覽量

    72537
  • EMD
    EMD
    +關(guān)注

    關(guān)注

    1

    文章

    43

    瀏覽量

    20056
  • 感知器
    +關(guān)注

    關(guān)注

    0

    文章

    34

    瀏覽量

    11842
  • MLP
    MLP
    +關(guān)注

    關(guān)注

    0

    文章

    57

    瀏覽量

    4253
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    怎樣去設(shè)計(jì)一種基于RGB-D相機(jī)的三維重建無(wú)序抓取系統(tǒng)?

    為什么要開(kāi)發(fā)一種三維重建無(wú)序抓取系統(tǒng)?三維重建無(wú)序抓取系統(tǒng)是由哪些部分組成的?三維重建無(wú)序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)和創(chuàng)新點(diǎn)
    發(fā)表于 07-02 06:29

    人工神經(jīng)網(wǎng)絡(luò)三維X線頭影測(cè)量系統(tǒng)中的應(yīng)用

    給出一種iX線頭影測(cè)量中圖形圖像重建的方法; 南正側(cè)位兩張X線頭影片上72個(gè)標(biāo)志點(diǎn)??梢?b class='flag-5'>重建 顱頜骨三維
    發(fā)表于 07-07 14:24 ?19次下載

    AI+AR將用于智能三維重建領(lǐng)域

    AI與AR的關(guān)系日漸微妙,正在不斷融合、相互促進(jìn)。在計(jì)算機(jī)視覺(jué)中, 三維重建是指根據(jù)視圖或者多視圖的二圖像
    發(fā)表于 09-21 10:33 ?4622次閱讀

    如何使用目視覺(jué)進(jìn)行高精度三維場(chǎng)景重建技術(shù)研究

    近年來(lái),隨著計(jì)算機(jī)硬件的不斷快速更新,計(jì)算機(jī)的處理能力也不斷變強(qiáng)。同時(shí)場(chǎng)景三維模型的獲取技術(shù)越來(lái)越成熟,我們獲得場(chǎng)景的三維模型數(shù)據(jù)的方式更多也更加方便了。而目前在基于目和雙目的三維重建
    發(fā)表于 12-24 15:55 ?7次下載
    如何使用<b class='flag-5'>單</b>目視覺(jué)進(jìn)行高精度<b class='flag-5'>三維</b>場(chǎng)景<b class='flag-5'>重建</b>技術(shù)研究

    計(jì)算機(jī)視覺(jué):三維點(diǎn)數(shù)據(jù)處理學(xué)習(xí)內(nèi)容總結(jié)

    。三維匹配的目的就是把相鄰掃描的點(diǎn)數(shù)據(jù)拼接在一起。三維匹配重點(diǎn)關(guān)注匹配算法,常用的算法有最近點(diǎn)迭代算法 ICP和各種全局匹配算法。 2)多
    的頭像 發(fā)表于 11-27 10:32 ?4863次閱讀

    點(diǎn)的概念以及與三維圖像的關(guān)系

    點(diǎn)概念 點(diǎn)三維圖像的關(guān)系:三維圖像是一種特殊的信息表達(dá)形式,其特征是表達(dá)的空間中
    的頭像 發(fā)表于 08-17 09:18 ?7299次閱讀
    <b class='flag-5'>點(diǎn)</b><b class='flag-5'>云</b>的概念以及與<b class='flag-5'>三維</b>圖像的關(guān)系

    NVIDIA Omniverse平臺(tái)助力三維重建服務(wù)協(xié)同發(fā)展

    計(jì)算機(jī)視覺(jué)的進(jìn)步為元宇宙的數(shù)字孿生應(yīng)用打下堅(jiān)實(shí)基礎(chǔ)。在計(jì)算機(jī)視覺(jué)中,三維重建是指根據(jù)視圖或者多視圖的圖像重建
    的頭像 發(fā)表于 10-13 09:45 ?1187次閱讀

    深度學(xué)習(xí)背景下的圖像三維重建技術(shù)進(jìn)展綜述

    根據(jù)三維模型的表示形式可以將圖像三維重建方法分類(lèi)為基于體素的三維重建、基于點(diǎn)三維重建和基于網(wǎng)
    的頭像 發(fā)表于 01-09 14:26 ?2567次閱讀

    如何使用純格雷碼進(jìn)行三維重建

    對(duì)于新手來(lái)說(shuō),使用格雷碼做目結(jié)構(gòu)光三維重建是一個(gè)入門(mén)級(jí)的訓(xùn)練。但是在復(fù)現(xiàn)時(shí)往往會(huì)遇到一個(gè)問(wèn)題,明明解碼都很不錯(cuò)了,重建后的點(diǎn)精度卻很低,
    的頭像 發(fā)表于 01-13 11:41 ?1149次閱讀

    三維重建:從入門(mén)到入土

    經(jīng)典三維重建系統(tǒng)的整個(gè)pipeline從相機(jī)標(biāo)定、基礎(chǔ)矩陣與本質(zhì)矩陣估計(jì)、特征匹配到運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(SFM),從SFM到稠密點(diǎn)重建、表面重建
    的頭像 發(fā)表于 03-03 10:17 ?1195次閱讀

    為什么三維視圖中不顯示PCB三維模型?

    PCB三維視圖中的三維主體模型顯示通過(guò)View Configuration Panel中的設(shè)置控制。我們將簡(jiǎn)單介紹如何確保該選項(xiàng)被啟用。
    的頭像 發(fā)表于 04-28 15:48 ?5811次閱讀
    為什么<b class='flag-5'>三維</b><b class='flag-5'>視圖</b>中不顯示PCB<b class='flag-5'>三維</b>模型?

    三維計(jì)算視覺(jué)研究分析

    掃描。三維匹配的目的就是把相鄰掃描的點(diǎn)數(shù)據(jù)拼接在一起。三維匹配重點(diǎn)關(guān)注匹配算法,常用的算法有最近點(diǎn)迭代算法 ICP和各種全局匹配算法。 2
    的頭像 發(fā)表于 06-19 11:06 ?667次閱讀

    三維場(chǎng)景點(diǎn)理解與重建技術(shù)

    三維場(chǎng)景理解與重建技術(shù)主要包含場(chǎng)景點(diǎn)特征提取、掃描點(diǎn)配準(zhǔn)與融合、場(chǎng)景理解與語(yǔ)義分割、掃描物體點(diǎn)
    的頭像 發(fā)表于 08-08 16:58 ?1336次閱讀
    <b class='flag-5'>三維</b>場(chǎng)景點(diǎn)<b class='flag-5'>云</b>理解與<b class='flag-5'>重建</b>技術(shù)

    如何實(shí)現(xiàn)整個(gè)三維重建過(guò)程

    在計(jì)算機(jī)視覺(jué)中,三維重建是指根據(jù)視圖或者多視圖的圖像重建三維信息的過(guò)程。由于
    發(fā)表于 09-01 11:06 ?1685次閱讀
    如何實(shí)現(xiàn)整個(gè)<b class='flag-5'>三維重建</b>過(guò)程

    總結(jié)!三維點(diǎn)基礎(chǔ)知識(shí)

    該方法具體通過(guò)六個(gè)步驟實(shí)現(xiàn):圖像的采集、系統(tǒng)相機(jī)標(biāo)定、特征模板匹配、圖像處理、三維仿真匹配以及三維重建。首先,通過(guò)兩個(gè)相機(jī)于不同位置對(duì)待測(cè)物體進(jìn)行圖像信息感知獲取。然后根據(jù)角測(cè)量原理獲得待測(cè)表面的
    的頭像 發(fā)表于 09-01 16:12 ?2217次閱讀
    總結(jié)!<b class='flag-5'>三維</b><b class='flag-5'>點(diǎn)</b><b class='flag-5'>云</b>基礎(chǔ)知識(shí)