0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種新的基于可學(xué)習(xí)的雙邊網(wǎng)格的代價空間上采樣模塊

新機器視覺 ? 來源:3D視覺工坊 ? 作者:3D視覺工坊 ? 2021-06-27 09:21 ? 次閱讀

高精度的實時立體匹配網(wǎng)絡(luò)是時下研究的一個熱點,它在自動駕駛、機器人導(dǎo)航和增強現(xiàn)實等領(lǐng)域中有著廣泛的應(yīng)用。雖然近年來對立體匹配網(wǎng)絡(luò)的研究已經(jīng)取得了顯著的成果,但要同時兼顧實時性和高精度仍然是一個挑戰(zhàn)。現(xiàn)有的高精度立體匹配網(wǎng)絡(luò),通常需要在較高的分辨率建立代價空間。比如,GANet在1/3分辨率建立代價空間,PSMNet在1/4分辨率,但這會影響網(wǎng)絡(luò)的效率(GANet處理一對1242×375的圖像,需要1.8s,PSMNet需要0.41s)。

本文的動機是期望尋求一種解決方案:用高分辨率代價空間預(yù)測視差圖,以保持高的精度,同時要保持高的計算效率。

[CVPR 2021] Bilateral Grid Learning for Stereo Matching Networks

徐彬1,徐玉華1,2,*,楊曉立1,賈偉2,郭裕蘭3

( 1奧比中光,2合肥工業(yè)大學(xué),3國防科技大學(xué))

論文鏈接: https://arxiv.org/pdf/2101.01601.pdf

代碼開源: https://github.com/3DCVdeveloper/BGNet

1.創(chuàng)新點

(1)本文提出一種新的基于可學(xué)習(xí)的雙邊網(wǎng)格的代價空間上采樣模塊(Cost volume Upsampling in the learned Bilateral Grid, CUBG)?;谶@個具有邊緣保持特性的上采樣模塊,通過無參數(shù)的切片層(slicing layer)可以高效地從低分辨率的代價空間獲得高質(zhì)量的高分辨率代價空間。這樣,費時的代價聚合只需要在低分辨率執(zhí)行。該模塊能夠無縫嵌入到許多現(xiàn)有的立體匹配網(wǎng)絡(luò)(如GCNet,PSMNet,GANet等)中,在保持相當(dāng)精度的條件下取得4-29倍的加速。據(jù)我們所知,這是可微雙邊網(wǎng)格首次在立體匹配網(wǎng)絡(luò)中的應(yīng)用。

(2)基于本文提出的代價空間上采樣模塊,我們設(shè)計了一個高精度的實時立體匹配網(wǎng)絡(luò)(稱為BGNet),該網(wǎng)絡(luò)在KITTI數(shù)據(jù)集的分辨率下能夠達(dá)到39fps,且精度超過了之前所有實時立體匹配網(wǎng)絡(luò)。

2. 相關(guān)工作

基于深度學(xué)習(xí)的立體匹配網(wǎng)絡(luò)研究已經(jīng)持續(xù)了很多年。MC-CNN [1]首次使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來計算兩個圖像塊之間的匹配代價,但后續(xù)步驟(如代價聚合、視差后處理等)仍然使用傳統(tǒng)方法。DispNetC [2]是第一個端到端的立體匹配網(wǎng)絡(luò),后續(xù)的工作引入了殘差優(yōu)化模塊,對網(wǎng)絡(luò)預(yù)測的視差圖做一步的優(yōu)化。GCNet [6]首次使用3D卷積學(xué)習(xí)構(gòu)建4D代價空間,并使用soft argmin操作進(jìn)行視差回歸。

基于3D卷積的立體匹配網(wǎng)絡(luò)在各大數(shù)據(jù)集榜單上都取得了很好的結(jié)果,但是 3D卷積比2D卷積計算量大的多,現(xiàn)有的基于3D卷積的實時立體匹配網(wǎng)絡(luò)[7, 8]都是對低分辨率代價空間進(jìn)行代價聚合,得到低分辨率的視差圖,然后對視差圖進(jìn)行逐級上采樣和優(yōu)化,這種策略不如使用高分辨率代價空間計算視差圖的方法精度高。

我們的工作受到雙邊網(wǎng)格[9]的啟發(fā)。雙邊網(wǎng)格最早用于加速雙邊濾波器,主要包含三個步驟,即splat,blur和slice。splat操作對圖像進(jìn)行下采樣構(gòu)建雙邊網(wǎng)格,blur操作對雙邊網(wǎng)格進(jìn)行平滑濾波,最后通過slice操作將濾波后的雙邊網(wǎng)格上采樣到高分辨率。slice操作主要涉及在高分辨率引導(dǎo)圖的指引下進(jìn)行線性插值,因此其計算是非常高效的。

3. 方法描述

雙邊網(wǎng)格代價空間上采樣

本文采用的思路是使用3D卷積在低分辨率構(gòu)建雙邊網(wǎng)格代價空間,并通過提出的上采樣模塊(CUBG)得到高質(zhì)量的高分辨率代價空間,在高分辨率代價空間進(jìn)行視差回歸。

如圖1所示,CUBG模塊的輸入是一個低分辨率的代價空間和高分辨率的圖像特征,輸出是高分辨率的代價空間,該模塊包含雙邊網(wǎng)格的生成和slicing上采樣操作。

給定一個維度為 的低分辨率的代價空間。其中, 分別表示圖像寬度,圖像高度,視差范圍和特征通道數(shù)。我們使用一個3*3*3的3D卷積完成向雙邊網(wǎng)格的轉(zhuǎn)換,其中的維度為 , 為引導(dǎo)特征的通道數(shù)。

為了得到維度為 的三維高分辨率的代價空間(其中 和 分別是圖像寬度和高度, 是給定的最大視差值),我用雙邊網(wǎng)絡(luò)中的slicing操作進(jìn)行上采樣。slicing操作一種基于引導(dǎo)圖的無參數(shù)插值算法。slicing的操作可以表示為公式(1):

6b41d962-d6e4-11eb-9e57-12bb97331649.png

其中為低分辨率代價空間相對于高分辨率代價空間的寬度或者高度比例, 是生成的引導(dǎo)圖特征,范圍為[0,255]。不同于雙邊網(wǎng)格[9]原文,我們的雙邊網(wǎng)格是從低分辨率的代價空間中學(xué)習(xí)得到的。在本文的所有試驗,我們設(shè)置雙邊網(wǎng)格的維度為 。

嵌入式模塊

CUBG模塊可以無縫嵌入到許多現(xiàn)有的立體匹配網(wǎng)絡(luò)結(jié)構(gòu)中。在本文中,我把CUBG模塊嵌入到四種具有代表性的網(wǎng)絡(luò),分別是GCNet, PSMNet, GANet和DeepPrunerFast。嵌入后的模型用后綴BG表示。比如,GCNet-BG表示在GCNet中嵌入了CUBG模塊后的網(wǎng)絡(luò)結(jié)構(gòu)。

對于前三種網(wǎng)絡(luò)結(jié)構(gòu),我們分別在1/8, 1/8, 1/6分辨率上重新建立代價空間,然后用CUBG模塊把濾波后的代價空間分別上采樣到1/2, 1/4和1/3分辨率。對于DeepPrunerFast,類似PatchMatch的視差上、下界估計模塊和窄代價空間被1/8分辨率的完整的代價空間所代替。然后,用CUBG把濾波后的代價空間上采樣到1/2分辨率。網(wǎng)絡(luò)其余的結(jié)構(gòu)都保持不變。

BGNet

基于CUBG模塊,我們設(shè)計了一個高精度實時立體匹配網(wǎng)絡(luò)。該網(wǎng)絡(luò)主要包含四個模塊:特征提取,代價空間聚合,代價空間上采樣和殘差優(yōu)化模塊。在不使用殘差優(yōu)化的情況下(對應(yīng)BGNet),對于KITTI分辨率,速度為39fps。使用殘差優(yōu)化時(對應(yīng)BGNet+),速度為30fps。

4.實驗結(jié)果

消融實驗

為了驗證所提出CUBG上采樣模塊的有效性,我們在SceneFlow、Middlebury 2014數(shù)據(jù)集上進(jìn)行了消融實驗??梢姛o論是在合成數(shù)據(jù)集還是在真實數(shù)據(jù)集上,CUBG都優(yōu)于線性插值上采樣(LU)。尤其是在深度邊緣附近區(qū)域,CUBG優(yōu)勢更加明顯(EPE-edge)。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:【CVPR2021】用于立體匹配的可學(xué)習(xí)雙邊網(wǎng)格

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AN-851: 一種WiMax雙下變頻IF采樣接收機設(shè)計方案

    電子發(fā)燒友網(wǎng)站提供《AN-851: 一種WiMax雙下變頻IF采樣接收機設(shè)計方案.pdf》資料免費下載
    發(fā)表于 01-13 14:53 ?0次下載
    AN-851: <b class='flag-5'>一種</b>WiMax雙下變頻IF<b class='flag-5'>采樣</b>接收機設(shè)計方案

    介紹一種 WiMax 雙下變頻 IF 采樣接收機設(shè)計方案

    介紹了一種 WiMax 雙下變頻 IF 采樣接收機設(shè)計方案,詳細(xì)闡述了其背景知識、架構(gòu)、實現(xiàn)方法、性能評估等內(nèi)容,為相關(guān)工程人員提供了全面的設(shè)計參考。 *附件:一種WiMax雙下變頻IF采樣
    的頭像 發(fā)表于 12-18 16:29 ?932次閱讀
    介紹<b class='flag-5'>一種</b> WiMax 雙下變頻 IF <b class='flag-5'>采樣</b>接收機設(shè)計方案

    SXRTO(采樣擴展實時示波器)的5W1H

    、SXRTO(采樣擴展實時示波器)的定義SXRTO英文全稱是Sampler-extendedReal-timeOscilloscope,采樣擴展實時示波器又名實時采樣示波器是
    的頭像 發(fā)表于 11-21 10:24 ?198次閱讀
    SXRTO(<b class='flag-5'>采樣</b>擴展實時示波器)的5W1H

    LP8758快速采樣模塊用戶指南

    電子發(fā)燒友網(wǎng)站提供《LP8758快速采樣模塊用戶指南.pdf》資料免費下載
    發(fā)表于 11-15 14:06 ?0次下載
    LP8758快速<b class='flag-5'>采樣</b><b class='flag-5'>模塊</b>用戶指南

    一種基于深度學(xué)習(xí)的二維拉曼光譜算法

    近日,天津大學(xué)精密儀器與光電子工程學(xué)院的光子芯片實驗室提出了一種基于深度學(xué)習(xí)的二維拉曼光譜算法,成果以“Rapid and accurate bacteria identification
    的頭像 發(fā)表于 11-07 09:08 ?265次閱讀
    <b class='flag-5'>一種</b>基于深度<b class='flag-5'>學(xué)習(xí)</b>的二維拉曼光譜算法

    一種簡單高效配置FPGA的方法

    本文描述了一種簡單高效配置FPGA的方法,該方法利用微處理器從串行外圍接口(SPI)閃存配置FPGA設(shè)備。這種方法減少了硬件組件、板空間和成本。
    的頭像 發(fā)表于 10-24 14:57 ?736次閱讀
    <b class='flag-5'>一種</b>簡單高效配置FPGA的方法

    高斯濾波和雙邊濾波的區(qū)別

    思想是對圖像中的每個像素點,用其鄰域內(nèi)像素的加權(quán)平均灰度值來替代該點的灰度值。 高斯濾波的權(quán)重由高斯函數(shù)決定,距離中心像素點越近的像素點權(quán)重越高。 雙邊濾波 : 是一種非線性的濾波方法,是結(jié)合圖像的
    的頭像 發(fā)表于 09-29 09:37 ?532次閱讀

    服務(wù)網(wǎng)格DPU卸載解決方案

    服務(wù)網(wǎng)格(Service Mesh)是微服務(wù)架構(gòu)中的一種重要技術(shù),它主要處理服務(wù)之間的通信,為服務(wù)間的信息交換提供更安全、更快速且更可靠的基礎(chǔ)設(shè)施層。服務(wù)網(wǎng)格將服務(wù)治理從業(yè)務(wù)邏輯中剝離出來,拆解為獨立的進(jìn)程,實現(xiàn)異構(gòu)系統(tǒng)的統(tǒng)
    的頭像 發(fā)表于 09-20 16:25 ?346次閱讀
    服務(wù)<b class='flag-5'>網(wǎng)格</b>DPU卸載解決方案

    信號采樣的算法原理是什么

    信號采樣一種將連續(xù)信號轉(zhuǎn)換為離散信號的過程,它是數(shù)字信號處理的基礎(chǔ)。本文將詳細(xì)介紹信號采樣的算法原理,包括采樣過程、采樣定理、
    的頭像 發(fā)表于 07-15 14:20 ?985次閱讀

    深度學(xué)習(xí)中反卷積的原理和應(yīng)用

    在深度學(xué)習(xí)的廣闊領(lǐng)域中,反卷積(Deconvolution,也稱作Transposed Convolution)作為一種重要的圖像采樣技術(shù),扮演著至關(guān)重要的角色。特別是在計算機視覺任
    的頭像 發(fā)表于 07-14 10:22 ?2092次閱讀

    rup是一種什么模型

    RUP(Rational Unified Process,統(tǒng)建模語言)是一種軟件開發(fā)過程模型,它是一種迭代和增量的軟件開發(fā)方法。RUP是由Rational Software公司(現(xiàn)為IBM的
    的頭像 發(fā)表于 07-09 10:13 ?1348次閱讀

    示波器如何設(shè)置分段采樣模式?

    分段采樣一種高級的采樣技術(shù),允許示波器以非常高的時間分辨率捕獲信號的關(guān)鍵部分,同時保持較長的記錄長度。
    的頭像 發(fā)表于 05-31 16:51 ?895次閱讀

    運算放大器采樣保持電路的工作原理

    采樣和保持電路是一種電子電路,它創(chuàng)建作為輸入的電壓樣本,然后將這些樣本保持定的時間。采樣保持電路對輸入信號產(chǎn)生采樣的時間稱為
    發(fā)表于 04-12 10:03 ?2783次閱讀
    運算放大器<b class='flag-5'>采樣</b>保持電路的工作原理

    一種使用近紅外照明來進(jìn)行人體血糖測定的設(shè)備設(shè)計

    使用光學(xué)傳感技術(shù)評估血糖水平是監(jiān)測糖尿病患者的一種有前途的技術(shù)路徑,可能會成為侵入性血液采樣技術(shù)的替代方案。
    的頭像 發(fā)表于 03-18 09:26 ?2248次閱讀
    <b class='flag-5'>一種</b>使用近紅外照明來進(jìn)行人體血糖測定的設(shè)備設(shè)計

    AEB是一種汽車主動安全技術(shù),主要由哪3大模塊構(gòu)成?

    AEB是一種汽車主動安全技術(shù),主要由哪3大模塊構(gòu)成
    發(fā)表于 02-20 06:06