0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

清華D提出首個二值化光譜重建算法

CVer ? 來源:CVer ? 2023-11-29 15:43 ? 次閱讀

本文介紹我們在 NeurIPS 2023 上的新工作 《Binarized Spectral Compressive Imaging》

234d8d3a-8e76-11ee-939d-92fbcf53809c.jpg

論文:https://arxiv.org/abs/2305.10299 代碼1:github.com/caiyuanhao1998/BiSCI 代碼2:github.com/caiyuanhao1998/MST

2365c0da-8e76-11ee-939d-92fbcf53809c.jpg

圖1 BiSRNet 與當前最先進的二值網絡的性能對比

目前所有的代碼,預訓練模型和測試結果均已開源在我們開發(fā)的一個二值化光譜壓縮重建工具包 BiSCI 內,該工具包支持八類最主要的二值網絡,歡迎大家來使用。同時,我們還將 BiSRNet 嵌入到了我們之前開發(fā)的光譜重建工具箱 MST 當中。目前 MST 工具包已支持超過 12 類深度學習算法,并包含各種配套的可視化函數,歡迎大家來對比。

1. 光譜壓縮重建任務介紹

相比于常規(guī)的三通道 RGB 圖像,高光譜圖像包含幾十上百個波段,從而捕獲了關于成像場景更豐富的信息。也正因為這一重要特性,高光譜圖像被廣泛地應用于醫(yī)療,地形勘探,農業(yè)等領域。如圖2所示,在醫(yī)院進行檢查時,如果只看常規(guī)的RGB圖像可能很難診斷病因,但是如果采用高光譜圖像捕獲并在特定波長下渲染的話,就可以看清楚各類血管,骨骼結構等,從而輔助醫(yī)生診斷。同樣的原理也可應用在遙感地形勘探和農業(yè)病蟲害檢測。

237ba2f6-8e76-11ee-939d-92fbcf53809c.jpg

圖2 高光譜圖像的應用

然而高光譜圖像并容易獲取,傳統(tǒng)的成像設備采用光譜儀對成像場景進行逐波段的掃描,費時費力,難以捕捉運動場景。近些年,科學家們專門設計了單曝光壓縮成像(Snapshot Compressive Imaging,SCI)系統(tǒng)來解決這一問題。其光路結構如圖3所示。該系統(tǒng)首先通過一個編碼孔徑掩膜對成像場景的各光譜通道進行調制,然后通過一個三棱鏡進行色散后在相機上捕獲到一個二維的快照估計圖(compressive measurement)。通過這個光路系統(tǒng),我們便可將三維的光譜立方塊壓縮成一個二維的圖像。而光譜壓縮重建的任務便是從這個二維的壓縮估計圖上恢復出三維的高光譜數據。

23a901ba-8e76-11ee-939d-92fbcf53809c.jpg

圖3 單曝光壓縮成像系統(tǒng)

當前的主流方法是采用的是全精度模型如 CNN 或者 Transformer 來學一個從壓縮估計圖到三維光譜立方塊的映射。幾個比較經典算法有我們之前的工作 MST,MST++,CST,DAUHST,HDNet 等(這些方法全部都開源在我們的工具箱 MST 當中)。這類方法雖然取得了很好的重建效果,但卻難以部署到移動端設備(如智能手機、相機、無人機等)上,因為移動端設備的內存空間,計算資源和電力均有限,無法運轉全精度模型。另一方面,全精度模型的一些計算單元如深度展開算子和多頭自注意力機制等相對復雜,移動端設備無法支持。為了推動光譜重建算法的實際應用,本文做了如下貢獻:

(1)提出了光譜壓縮重建領域內首個基于二值神經網絡(Binarized Neural Network,BNN)的算法 — 二值化光譜重分布網絡(Binarized Spectral-Redistribution Network,BiSRNet)。

(2)設計了一個新的二值化卷積單元 — 二值化光譜重分布卷積(Binarized Spectral-Redistribution Convolution,BiSR-Conv)。該卷積單元可以調整光譜表征的強度和分布,同時在反向傳播中更好地逼近二值化符號(Sign)函數,從而讓求得的梯度更加準確。

(3)制作了四個二值化卷積模塊來解決特征圖形變過程中的維度不匹配問題,從而讓全精度信息能流通整個模型的每一層卷積單元以彌補二值卷積造成的信息損失。

(4)我們的 BiSRNet 顯著地超越了當前最先進的二值化算法,甚至取得了能與全精度CNN比肩的效果,然而我們的BiSRNet算法卻只需要極低的存儲空間(約 0.06 %)和計算代價(約 1 %)。

2. 本文方法

2.1 基礎模型

一般來說,用于二值化的全精度模型應該是比較輕量的且它的計算單元可以再移動端設備上運行。然而,現存的CNN 或 Transformer 模型均不滿足這一要求。為此,我們重新設計了一個簡單,輕量,易于部署的基礎模型(Base Model)。

受到之前工作 MST,MST++,CST,DAUHST 的啟發(fā),我們設計的基礎模型也采用一個 U 形結構,如圖4所示。

23c0ccfa-8e76-11ee-939d-92fbcf53809c.jpg

圖4 基礎模型的網絡結構

在這個基礎模型中,采用的所有計算單元都可以被移動端設備支持,同時也不涉及計算復雜度高的操作。

2.2 二值化光譜重分布卷積單元

23d86d60-8e76-11ee-939d-92fbcf53809c.png

23ebbdca-8e76-11ee-939d-92fbcf53809c.jpg

圖 5 符號函數與各類逼近函數的對比圖

Clip(x) 與 Quad(x) 的具體表達式如下:

23fd2236-8e76-11ee-939d-92fbcf53809c.jpg

然而分段線性函數知識一個粗略的估計,它與符號函數之間依舊有著很大的誤差。圖 5 中的陰影部分面積就表示這個誤差的大小,Clip(x) 的誤差是1。此外,一旦激活或者權重的值落在了 [-1, 1] 之外,他們就不會再被更新。盡管分段二次函數是一個更精確的逼近(誤差為2/3),上述的兩個問題依舊存在。為此,我們設計了一個可縮放的雙曲正切函數來在反向傳播中擬合符號函數:

2411b85e-8e76-11ee-939d-92fbcf53809c.jpg

2422c036-8e76-11ee-939d-92fbcf53809c.png

244e7924-8e76-11ee-939d-92fbcf53809c.png

通過我們的設計,全精度信息流就不會被二值卷積給阻斷,從而能夠順暢地流過我們設計的 BiSR-Conv 單元,如圖 4 (c) 中的紅色箭頭所示。

246c260e-8e76-11ee-939d-92fbcf53809c.jpg

圖6 本文卷積二值卷積塊與普通二值卷積塊在處理特征圖維度變化時的對比

全精度信息流在二值化算法中非常重要,因為它在一定程度上彌補了量化導致的信息損失。然而在特征圖的上下采樣過程中,由于維度發(fā)生了變化,難以直接引入殘差鏈接以補充全精度信息,如圖 6 中每個子圖的左半部分所示。藍色箭頭表示二值信號,紅色箭頭表示全精度信息流。普通的二值卷積模塊會在特征度維度改變的同時阻斷全精度信息流的傳遞。然而我們的二值卷積模塊通過采用分割合并的技巧,讓全精度信息流不被阻斷,從而在整個二值模型中流通。

3. 實驗結果

3.1 量化指標

2479d416-8e76-11ee-939d-92fbcf53809c.jpg

表1 BiSRNet 與 SOTA BNN,傳統(tǒng)方法,全精度CNN方法的量化指標對比

24a9dd32-8e76-11ee-939d-92fbcf53809c.png

3.2 視覺對比

24bf622e-8e76-11ee-939d-92fbcf53809c.jpg

圖7 BiSRNet 與其他 BNN 方法在仿真數據及上的視覺對比

24da4328-8e76-11ee-939d-92fbcf53809c.jpg

圖8 BiSRNet 與其他 BNN 方法在真實數據集上的視覺對比

4. 總結

本文首次探索了壓縮量化在光譜壓縮重建領域的應用,提出了該領域首個二值化卷積神經網絡 BiSRNet,在量化指標和視覺結果上都顯著地超越了當前最先進的二值化模型。代碼,預訓練權重,重建結果均開源在:

github.com/caiyuanhao1998/BiSCI

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4625

    瀏覽量

    93123
  • 光譜
    +關注

    關注

    4

    文章

    836

    瀏覽量

    35252
  • 深度學習
    +關注

    關注

    73

    文章

    5510

    瀏覽量

    121349
  • 二值化
    +關注

    關注

    0

    文章

    13

    瀏覽量

    4247

原文標題:NeurIPS 2023 | 清華Ð提出首個二值化光譜重建算法

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于圖像分塊的局部閾值方法

    針對目前局部閾值結果存在目標虛假或斷裂的缺陷,提出了一種基于圖像分塊的局部閾值
    發(fā)表于 05-04 11:10

    基于約束的地質網格曲面重建算法

    提出一種基于地質約束的地質曲面重建算法,為在三維地質建模中構造線性不連續(xù)層位面片提供一種解決方案。應用“移動立方體”算法從點云重建出無約束的
    發(fā)表于 04-03 09:04 ?8次下載

    基于大津法的圖像分塊算法

    本文對灰度圖像的方法進行研究,提出了一種新的以大津法為基礎的圖像分塊
    發(fā)表于 08-04 09:25 ?48次下載

    MC三維重建算法義性消除研究

    面繪制法進行三維重建是三維重建技術的主要方法,Marching Cubes(移動立方體)算法是經典的面繪制法。本文在剖析了MC 算法的基礎上,針對其存在的
    發(fā)表于 01-22 12:02 ?21次下載

    一種基于散亂數據的自適應曲面重建算法

    本文依據Shepard基本原理,提出了一種新的自適應曲面重建算法。該算法首先利用LMS方法優(yōu)化改進型Shepard算法,求出由粗糙到細致的控
    發(fā)表于 03-01 16:18 ?8次下載

    基于POCS算法的圖像超分辨率重建

    超分辨率技術是指通過融合多幅模糊、變形、頻譜混疊的低分辨率圖像來重建一幅高分辨率圖像.本文提出一種基于POCS算法的視頻圖像超分辨率重建方法.POCS
    發(fā)表于 11-08 17:03 ?40次下載

    ECT圖像重建算法的FPGA實現

    ECT圖像重建算法的FPGA實現 ECT圖像重建算法的FPGA實現
    發(fā)表于 11-19 14:59 ?2次下載

    一種改進的字符圖像算法_袁璐

    一種改進的字符圖像算法_袁璐
    發(fā)表于 03-14 17:48 ?9次下載

    基于Fast Newman算法的加權腦網絡模塊算法

    針對人腦結構網絡的模塊方法不足以反映復雜的人腦生理特征這一問題,提出一種基于Fast Newman
    發(fā)表于 12-08 17:38 ?1次下載

    基于各向異性TV最小重建算法

    (Total-Variation,TV)最小模型使用基于交替方向法(alternating direction method,ADM)的稀疏優(yōu)化算法能夠在不完全角度的圖像重建中獲得較優(yōu)的重建
    發(fā)表于 12-12 19:08 ?3次下載

    基于分析稀疏表示的圖像重建算法

    TV-Wavelet-I_1( TVWI_1)模型因包含全變分(Total-variation,TV)和小波正則約束,具有較強的圖像重建能力。而傳統(tǒng)求解TVWI_I模型的算法往往忽略了綜合/分析
    發(fā)表于 03-07 16:40 ?1次下載

    關注算法安全新興領域,清華團隊RealAI推出業(yè)界首個AI模型“殺毒軟件”

    近日,清華大學AI研究院孵化企業(yè)RealAI(瑞萊智慧)正式推出首個針對AI在極端和對抗環(huán)境下的算法安全性檢測與加固的工具平臺RealSafe人工智能安全平臺。該平臺內置領先的AI對抗攻防算法
    的頭像 發(fā)表于 04-09 13:02 ?1601次閱讀

    CVPR2023:IDEA與清華提出首個一階段3D全身人體網格重建算法

    三維全身人體網格重建(3D Whole-Body Mesh Recovery)是人類行為建模的一個重要環(huán)節(jié),用于從單目圖像中估計出人體姿態(tài)(Body Pose), 手勢(Hand Gesture)和臉部表情(Facial Expressions),該任務在許多下游現實場景中有著廣泛的應用
    的頭像 發(fā)表于 04-07 09:56 ?1162次閱讀

    清華研制出首個全模擬光電智能計算芯片ACCEL

    清華研制出首個全模擬光電智能計算芯片ACCEL 清華大學研究團隊研制出國際首個全模擬光電智能計算芯片簡稱ACCEL。高算力低功耗智能計算芯片典范,目前ACCEL 芯片利用現有成熟的工藝
    的頭像 發(fā)表于 11-05 18:10 ?1364次閱讀

    NeurIPS 2023 | 清華ETH提出首個光譜重建算法

    壓縮重建工具包 BiSCI 內,該工具包支持八類最主要的網絡,歡迎大家來使用。同時,我們還將 BiSRNet 嵌入到了我們之前開發(fā)的光譜重建
    的頭像 發(fā)表于 12-03 20:20 ?672次閱讀
    NeurIPS 2023 | <b class='flag-5'>清華</b>ETH<b class='flag-5'>提出首個</b><b class='flag-5'>二</b><b class='flag-5'>值</b><b class='flag-5'>化</b><b class='flag-5'>光譜</b><b class='flag-5'>重建</b><b class='flag-5'>算法</b>