0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

NeurIPS 2023 | 清華ETH提出首個二值化光譜重建算法

智能感知與物聯(lián)網(wǎng)技術研究所 ? 來源:未知 ? 2023-12-03 20:20 ? 次閱讀
wKgaomVsc56ANMSQAAC3ITqhUNk915.png論文鏈接:https://arxiv.org/abs/2305.10299

代碼鏈接1:

https://github.com/caiyuanhao1998/BiSCI

代碼鏈接2:

https://github.com/caiyuanhao1998/MSTwKgaomVsc56ADjR6AAFs8X4VRDo646.png

▲ 圖1 BiSRNet 與當前最先進的二值網(wǎng)絡的性能對比

目前所有的代碼,預訓練模型和測試結果均已開源在我們開發(fā)的一個二值化光譜壓縮重建工具包 BiSCI 內(nèi),該工具包支持八類最主要的二值網(wǎng)絡,歡迎大家來使用。同時,我們還將 BiSRNet 嵌入到了我們之前開發(fā)的光譜重建工具箱 MST 當中。目前 MST 工具包已支持超過 12 類深度學習算法,并包含各種配套的可視化函數(shù),歡迎大家來對比。

wKgaomVsc56AHhoZAAAl6LOgh3c585.png光譜壓縮重建任務介紹

相比于常規(guī)的三通道 RGB 圖像,高光譜圖像包含幾十上百個波段,從而捕獲了關于成像場景更豐富的信息。也正因為這一重要特性,高光譜圖像被廣泛地應用于醫(yī)療,地形勘探,農(nóng)業(yè)等領域。如圖 2 所示,在醫(yī)院進行檢查時,如果只看常規(guī)的 RGB 圖像可能很難診斷病因,但是如果采用高光譜圖像捕獲并在特定波長下渲染的話,就可以看清楚各類血管,骨骼結構等,從而輔助醫(yī)生診斷。同樣的原理也可應用在遙感地形勘探和農(nóng)業(yè)病蟲害檢測。

wKgaomVsc5-AO7A6AAZHNQUitzI972.png

▲圖2 高光譜圖像的應用

然而高光譜圖像并容易獲取,傳統(tǒng)的成像設備采用光譜儀對成像場景進行逐波段的掃描,費時費力,難以捕捉運動場景。近些年,科學家們專門設計了單曝光壓縮成像(Snapshot Compressive Imaging,SCI)系統(tǒng)來解決這一問題。其光路結構如圖 3 所示。

該系統(tǒng)首先通過一個編碼孔徑掩膜對成像場景的各光譜通道進行調(diào)制,然后通過一個三棱鏡進行色散后在相機上捕獲到一個二維的快照估計圖(compressive measurement)。通過這個光路系統(tǒng),我們便可將三維的光譜立方塊壓縮成一個二維的圖像。而光譜壓縮重建的任務便是從這個二維的壓縮估計圖上恢復出三維的高光譜數(shù)據(jù)。

wKgaomVsc5-ABFdEAARU9M4SX2I257.png

▲圖3 單曝光壓縮成像系統(tǒng)

當前的主流方法是采用的是全精度模型如 CNN 或者 Transformer 來學一個從壓縮估計圖到三維光譜立方塊的映射。幾個比較經(jīng)典算法有我們之前的工作 MST,MST++,CST,DAUHST,HDNet 等(這些方法全部都開源在我們的工具箱 MST 當中)。

這類方法雖然取得了很好的重建效果,但卻難以部署到移動端設備(如智能手機、相機、無人機等)上,因為移動端設備的內(nèi)存空間,計算資源和電力均有限,無法運轉全精度模型。另一方面,全精度模型的一些計算單元如深度展開算子和多頭自注意力機制等相對復雜,移動端設備無法支持。為了推動光譜重建算法的實際應用,本文做了如下貢獻:

(1)提出了光譜壓縮重建領域內(nèi)首個基于二值神經(jīng)網(wǎng)絡(Binarized Neural Network,BNN)的算法——二值化光譜重分布網(wǎng)絡(Binarized Spectral-Redistribution Network,BiSRNet)。

(2)設計了一個新的二值化卷積單元——二值化光譜重分布卷積(Binarized Spectral-Redistribution Convolution,BiSR-Conv)。該卷積單元可以調(diào)整光譜表征的強度和分布,同時在反向傳播中更好地逼近二值化符號(Sign)函數(shù),從而讓求得的梯度更加準確。

(3)制作了四個二值化卷積模塊來解決特征圖形變過程中的維度不匹配問題,從而讓全精度信息能流通整個模型的每一層卷積單元以彌補二值卷積造成的信息損失。

(4)我們的 BiSRNet 顯著地超越了當前最先進的二值化算法,甚至取得了能與全精度 CNN 比肩的效果,然而我們的 BiSRNet 算法卻只需要極低的存儲空間(約 0.06 %)和計算代價(約 1 %)。

wKgaomVsc5-AfHKrAAAtJ0fTuoM470.png

本文方法

2.1 基礎模型

一般來說,用于二值化的全精度模型應該是比較輕量的且它的計算單元可以再移動端設備上運行。然而,現(xiàn)存的 CNN 或 Transformer 模型均不滿足這一要求。為此,我們重新設計了一個簡單,輕量,易于部署的基礎模型(Base Model)。

受到之前工作 MST,MST++,CST,DAUHST 的啟發(fā),我們設計的基礎模型也采用一個 U 形結構,如圖 4 所示。

wKgaomVsc5-AP5IkAASFDtpAqCk484.png

▲圖4 基礎模型的網(wǎng)絡結構

在這個基礎模型中,采用的所有計算單元都可以被移動端設備支持,同時也不涉及計算復雜度高的操作。

2.2 二值化光譜重分布卷積單元

二值化光譜重分布卷積的細節(jié)如圖 4(c)所示。將輸入的全精度激活信號記為 。我們注意到,受到特定成像波長的限制,高光譜信號沿著光譜維度有著不同的強度與分布。為了適應光譜圖像的這一特性,我們提議在二值化激活之前,按通道對高光譜圖像表示進行重分布:

wKgaomVsc5-AKqqgAAAQUCI-D0c210.png

其中的 表示重分布后的激活。 表示可學習參數(shù)。然后 經(jīng)過一個符號函數(shù)后被量化到 1 位的激活

wKgaomVsc6CAY4mGAAAmhlDOkGU686.png

如圖 5(b)和(c)所示,由于符號函數(shù)是不可導的,之前的方法大都采用一個分段線性函數(shù) Clip(x)或者二次函數(shù) Quad(x)來在反向傳播中擬合符號函數(shù)。

wKgaomVsc6CACZJrAAFMLlcBEqs399.png

▲圖 5 符號函數(shù)與各類逼近函數(shù)的對比圖

Clip(x)與 Quad(x)的具體表達式如下:

wKgaomVsc6CAZ6o-AABAxK7AE-k034.png

然而分段線性函數(shù)知識一個粗略的估計,它與符號函數(shù)之間依舊有著很大的誤差。圖 5 中的陰影部分面積就表示這個誤差的大小,Clip(x)的誤差是 1。此外,一旦激活或者權重的值落在了 [-1,1] 之外,他們就不會再被更新。盡管分段二次函數(shù)是一個更精確的逼近(誤差為 2/3),上述的兩個問題依舊存在。為此,我們設計了一個可縮放的雙曲正切函數(shù)來在反向傳播中擬合符號函數(shù):

wKgaomVsc6GAOTt-AAAvB_4yjbk974.png

其中 是一個可學習的參數(shù),自適應地調(diào)整 Tanh()與 Sign()之間的距離。我們證明當 時,Tanh()→ Sign()如下:

wKgaomVsc6GAYSWWAABmZOuOrgM511.png

我們仿照之前的二值化算法,定義。然后我們可以得到:

wKgaomVsc6GAeJM2AAAd6rj5uxc468.png

我們計算圖 5(d)中的陰影面積:

wKgaomVsc6GAHxBPAABm9UvZ2Cg495.png

由此可見,當 足夠大時,Tanh()可以任意地逼近 Sign()。同時,我們的 Tanh()既不是分段函數(shù),也不會因為 x 落在 [-1,1] 之外而無法更新。

更進一步,我們比較三個逼近函數(shù)的一階導數(shù)。如圖 5 下邊一行所示取值范圍均為 ,這著本質的區(qū)別。而我們以通過改變參數(shù) 來調(diào)整它的取值范圍 和形狀,從而更加靈活地逼

在二值化卷積層當中,32 位的權重 也被二值化到一位的權重

wKgaomVsc6GAaEVrAAAgEOvSUNc118.png

其中的 表示取均值。由此,計算繁重的全精度卷積操作便可由純邏輯異或非運算(XNOR)與位計數(shù)(bit-count)操作替換如下:

wKgaomVsc6GAVa4vAAAoaSWeh8I209.png

因為全精度信息 的取值范圍與二值卷積的輸出 差別較大,直接引入殘差連接將兩者相加容易導致 的信息被淹沒掉,所以先采用一個 RPReLU 激活函數(shù)來重塑 的取值范圍:

wKgaomVsc6GAcfHtAAA0Ol_z078790.png

然后再引入殘差鏈接:

wKgaomVsc6KAQmKUAAAc1nmtwfE996.png

通過我們的設計,全精度信息流就不會被二值卷積給阻斷,從而能夠順暢地流過我們設計的 BiSR-Conv 單元,如圖 4 (c) 中的紅色箭頭所示。

wKgaomVsc6KALu6jAAPXzkRMOgw342.png

▲圖6 本文卷積二值卷積塊與普通二值卷積塊在處理特征圖維度變化時的對比

全精度信息流在二值化算法中非常重要,因為它在一定程度上彌補了量化導致的信息損失。然而在特征圖的上下采樣過程中,由于維度發(fā)生了變化,難以直接引入殘差鏈接以補充全精度信息,如圖 6 中每個子圖的左半部分所示。藍色箭頭表示二值信號,紅色箭頭表示全精度信息流。普通的二值卷積模塊會在特征度維度改變的同時阻斷全精度信息流的傳遞。然而我們的二值卷積模塊通過采用分割合并的技巧,讓全精度信息流不被阻斷,從而在整個二值模型中流通。

wKgaomVsc5-AfHKrAAAtJ0fTuoM470.png

實驗結果

3.1 量化指標

wKgaomVsc6KAQcy9AAau48xfLoQ304.png

▲表1 BiSRNet 與 SOTA BNN,傳統(tǒng)方法,全精度CNN方法的量化指標對比 表 1 展示了我們的 BiSRNet 與 SOTA BNN,傳統(tǒng)方法,全精度 CNN 方法的量化指標對比。可以看到,我們的 BiSRNet 顯著超越了當前最先進的 BNN 算法 BTM 2.55 dB。同時超越了所有的 64 位傳統(tǒng)算法,增幅超過了 4.49 dB。值得注意的是,我們的 BiSRNet 取得了能與全精度 CNN 方法比肩的性能,比如超過了 1.23 dB,然而卻只占用了 0.06 % 的存儲空間和 1 % 計算代價。

3.2 視覺對比

wKgaomVsc6KAQvF7AAZ04FQhqmw396.png▲圖7 BiSRNet 與其他 BNN 方法在仿真數(shù)據(jù)及上的視覺對比wKgaomVsc6KAclbJAAVJ0W-RZIU240.png??圖8 BiSRNet 與其他 BNN 方法在真實數(shù)據(jù)集上的視覺對比

wKgaomVsc6OAfjN5AAAr2pbNr48215.png

總結

本文首次探索了壓縮量化在光譜壓縮重建領域的應用,提出了該領域首個二值化卷積神經(jīng)網(wǎng)絡 BiSRNet,在量化指標和視覺結果上都顯著地超越了當前最先進的二值化模型。代碼,預訓練權重,重建結果均開源在:https://github.com/caiyuanhao1998/BiSCI ·


原文標題:NeurIPS 2023 | 清華ETH提出首個二值化光譜重建算法

文章出處:【微信公眾號:智能感知與物聯(lián)網(wǎng)技術研究所】歡迎添加關注!文章轉載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:NeurIPS 2023 | 清華ETH提出首個二值化光譜重建算法

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Teledyne Lecroy示波器插算法

    示波器是通過內(nèi)部硬件ADC對模擬信號采樣來獲取離散的數(shù)據(jù)點,然而這些離散的數(shù)據(jù)點有時難以完整呈現(xiàn)出原始模擬信號的全貌。軟件插算法的意義就在于,它能夠依據(jù)特定的數(shù)學算法,在已采集的數(shù)據(jù)點之間插入新的數(shù)據(jù)點,幫助使用者更好地還原和
    的頭像 發(fā)表于 12-24 16:11 ?333次閱讀

    一種基于深度學習的維拉曼光譜算法

    近日,天津大學精密儀器與光電子工程學院的光子芯片實驗室提出了一種基于深度學習的維拉曼光譜算法,成果以“Rapid and accurate bacteria identificati
    的頭像 發(fā)表于 11-07 09:08 ?267次閱讀
    一種基于深度學習的<b class='flag-5'>二</b>維拉曼<b class='flag-5'>光譜</b><b class='flag-5'>算法</b>

    愛芯元智受邀參加2024清華自動論壇

    近日,“2024清華自動論壇”在廣州舉行。本次論壇由清華校友總會自動系分會主辦,匯聚了海內(nèi)外約200位清華大學自動
    的頭像 發(fā)表于 11-05 14:41 ?403次閱讀

    基于高光譜成像的法醫(yī)痕跡非接觸分析

    的成像和光譜學,幫助使用者能夠從標本中獲得空間和光譜信息。這種技術使研究人員能夠分析痕跡的化學成分,并同時可視它們的空間分布,可用于估算痕跡存在的時間,為調(diào)查人員提供有價值的信息,有助于重建
    的頭像 發(fā)表于 10-28 16:12 ?165次閱讀
    基于高<b class='flag-5'>光譜</b>成像的法醫(yī)痕跡非接觸分析

    什么是光纖光譜儀?光纖光譜儀的應用

    儀是一種利用光纖將光信號傳輸?shù)?b class='flag-5'>光譜儀進行分析的儀器。它通常由光源、光纖、光譜儀和探測器等部分組成。光纖光譜儀具有體積小、重量輕、靈敏度高、測量速度快等優(yōu)點,能夠對各種物質的光譜特性進行
    的頭像 發(fā)表于 10-25 17:21 ?515次閱讀
    什么是光纖<b class='flag-5'>光譜</b>儀?光纖<b class='flag-5'>光譜</b>儀的應用

    基于FPGA實現(xiàn)OTSU算法

    OSTU大津法是一種確定圖像閾值的方法,由日本學者大津提出來的。
    的頭像 發(fā)表于 10-25 15:23 ?424次閱讀
    基于FPGA實現(xiàn)OTSU<b class='flag-5'>算法</b>

    光譜、多光譜與高光譜的區(qū)別

    在現(xiàn)代科學技術領域中,光譜分析技術發(fā)揮著至關重要的作用。其中,光譜、多光譜和高光譜是常見的概念,但很多人對它們之間的區(qū)別并不十分清楚。本文將深入探討這三種
    的頭像 發(fā)表于 10-11 18:02 ?1245次閱讀
    <b class='flag-5'>光譜</b>、多<b class='flag-5'>光譜</b>與高<b class='flag-5'>光譜</b>的區(qū)別

    阿里云推出首個域名AI大模型應用

    阿里云近日宣布其域名產(chǎn)品服務已全面完成AI升級,并成功推出首個基于通義大模型的域名AI應用。此次升級不僅引入了“.ai”等40多個熱門新域名后綴,還納入了2000萬個全球域名資源,極大地豐富了用戶的注冊選擇。
    的頭像 發(fā)表于 08-09 14:55 ?552次閱讀

    極管擊穿電壓是最大還是有效

    極管擊穿電壓是指極管在反向偏置下,電流突然增大,導致極管損壞的電壓。 最大(Peak Value):最大
    的頭像 發(fā)表于 08-08 10:05 ?1064次閱讀

    CO2 AI推出首個大規(guī)模產(chǎn)品排放量計算解決方案

    CO2 AI推出首個可擴展的解決方案,它可用于計算數(shù)千種產(chǎn)品的碳排放量,從而幫助企業(yè)減少對環(huán)境的影響。 手動生命周期評估(LCA)等傳統(tǒng)方法速度慢、不一致且成本高。 根據(jù)CO2 AI和波士頓咨詢集團
    的頭像 發(fā)表于 06-29 09:30 ?632次閱讀

    水質怎么用光譜法監(jiān)測的# 水質

    光譜
    siyb
    發(fā)布于 :2024年05月09日 09:11:57

    康謀分享 | aiSim5仿真場景重建感知置信度評估(三)

    aiSim5能重建高精度的賽道、車庫、高速公路等真實交通場景,用于測試和訓練ADAS/AD系統(tǒng)。通過全局行動日志,能將駕駛數(shù)據(jù)轉化為場景重建,車道線檢測算法和多目標檢測算法在仿真與現(xiàn)實
    的頭像 發(fā)表于 05-08 16:59 ?2460次閱讀
    康謀分享 | aiSim5仿真場景<b class='flag-5'>重建</b>感知置信度評估(三)

    基于高光譜技術的紅茶茶多酚可視研究

    基于高光譜技術的紅茶茶多酚可視研究紅茶是一種全發(fā)酵茶葉,因其風味獨特而受到消費者青睞。
    的頭像 發(fā)表于 04-22 18:08 ?803次閱讀
    基于高<b class='flag-5'>光譜</b>技術的紅茶茶多酚可視<b class='flag-5'>化</b>研究

    華為提出業(yè)界首個L4級AI安全智能體,邁入智能防御新時代

    2024華為分析師大會期間,在“加速邁向網(wǎng)絡智能”論壇上,華為提出業(yè)界首個L4級AI安全智能體,該智能體架構為人工智能時代全球網(wǎng)絡安全防御提供了新的思路和方向,引領網(wǎng)絡安全邁入智能防御新時代。
    的頭像 發(fā)表于 04-19 09:23 ?678次閱讀

    求助大神 :Labview中如何最簡單的實現(xiàn)圖片?謝謝!

    Labview中如何最簡單的實現(xiàn)圖片程序編程
    發(fā)表于 03-05 13:31