0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Mamba入局圖像復(fù)原,達成新SOTA

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:智能感知與物聯(lián)網(wǎng)技術(shù)研 ? 2024-12-30 18:09 ? 次閱讀

圖像復(fù)原又來新突破了!還記得性能超越SwinIR(基于Transformer)的MambaIR嗎?一種基于Mamba的圖像復(fù)原基準模型,登上ECCV 2024。最近原作者又開發(fā)了新版本MambaIRv2,更高性能、更高效率!另外還有ACM MM 2024上的Freqmamba方法,在圖像去雨任務(wù)中取得了SOTA性能!

顯然,這種基于Mamba的方法在圖像復(fù)原領(lǐng)域,比基于CNN和Transformer的方法更受歡迎。得益于Mamba全局感受野、線性計算復(fù)雜度、高效遠程依賴處理等諸多優(yōu)勢,它在圖像復(fù)原(比如超分辨率、去噪等)任務(wù)上實現(xiàn)了更高的復(fù)原質(zhì)量和更低的計算成本!可以說是圖像增強領(lǐng)域的研究焦點。

目前這方向研究熱情高漲,頂會成果多,為了幫論文er抓緊機會,我已經(jīng)挑選好了10篇Mamba做圖像復(fù)原的高質(zhì)量論文供大家參考,基本都有代碼,想速發(fā)論文拿下頂會的別錯過啦。

MambaIRv2: Attentive State Space Restoration

方法:論文提出了一種基于Mamba架構(gòu)的圖像復(fù)原方法MambaIRv2,通過引入非因果建模能力,類似于ViT,來增強Mamba的圖像復(fù)原性能。這種方法特別關(guān)注解決Mamba在因果建模中的局限性,允許模型在整個圖像中更有效地利用像素信息,從而提高圖像復(fù)原任務(wù)的性能,如超分辨率、去噪和JPEG壓縮減少等。

e39fbd7c-c5ea-11ef-9310-92fbcf53809c.png

創(chuàng)新點:

提出了“注意力狀態(tài)空間恢復(fù)”的新方法,通過將注意力機制與狀態(tài)空間模型結(jié)合,克服了Mamba架構(gòu)的因果建模限制。

通過語義引導(dǎo)的鄰域重構(gòu),作者將相似像素在一維序列中重新排列,使其更加接近。

e3c5df5c-c5ea-11ef-9310-92fbcf53809c.png

Freqmamba: Viewing mamba from a frequency perspective for image deraining

方法:論文提出了一種名為FreqMamba的圖像復(fù)原方法。FreqMamba結(jié)合了Mamba模型和頻率分析,專注于圖像去雨任務(wù)。該方法通過結(jié)合頻率分析和Mamba的狀態(tài)空間模型來提高去雨效果,包括空間Mamba、頻率帶Mamba和傅里葉全局建模三個交互結(jié)構(gòu),旨在利用Mamba捕捉局部相關(guān)性的能力,同時通過頻率分析增強對全局退化的感知。

e3ee6314-c5ea-11ef-9310-92fbcf53809c.png

創(chuàng)新點:

FreqMamba 是一種創(chuàng)新性的去雨網(wǎng)絡(luò),通過結(jié)合空間域序列建模和頻率域全局建模,以應(yīng)對圖像去雨的挑戰(zhàn)。

引入了一種新穎的三分支結(jié)構(gòu)用于低光圖像增強,成功應(yīng)對照明不足和噪聲放大的場景。

頻率SSM模塊利用多尺度U-Net架構(gòu),并結(jié)合不同尺度的降解圖像生成注意力圖,捕獲不同尺度的降解分布。

e420b63e-c5ea-11ef-9310-92fbcf53809c.png


Multi-dimensional Visual Prompt Enhanced Image Restoration via Mamba-Transformer Aggregation

方法:論文提出了一個名為MTAIR的方法,通過充分利用Mamba和Transformer的互補優(yōu)勢,在不犧牲計算效率的情況下,處理包括圖像去噪、去雨和去霧等多種圖像退化問題。MTAIR通過在空間和通道維度上設(shè)計多維提示學(xué)習(xí)模塊,來動態(tài)調(diào)整特征分布并挖掘與特定退化任務(wù)相關(guān)的上下文信息,從而提高了“全能型”圖像復(fù)原模型的性能。

e4476ee6-c5ea-11ef-9310-92fbcf53809c.png

創(chuàng)新點:

結(jié)合了Mamba和Transformer的優(yōu)勢,通過選擇性掃描機制在空間維度進行長距離依賴建模,同時利用Transformer的自注意力機制在通道維度進行判別特征學(xué)習(xí)。

設(shè)計了一種新穎的多維提示學(xué)習(xí)模塊,能夠從多尺度層中學(xué)習(xí)提示流,有助于從空間和通道角度揭示各種退化的底層特征,從而增強"多合一"模型解決各種恢復(fù)任務(wù)的能力。

e46e8ae4-c5ea-11ef-9310-92fbcf53809c.png

Cu-mamba: Selective state space models with channel learning for image restoration

方法:論文介紹了一個名為CU-Mamba的模型,該模型結(jié)合了U-Net架構(gòu)和雙狀態(tài)空間模型框架,用于圖像復(fù)原任務(wù)。CU-Mamba模型利用空間SSM模塊進行全局上下文編碼,以及通道SSM組件來保留通道相關(guān)特征,兩者都具有相對于特征圖大小的線性計算復(fù)雜度。

e49d9a1e-c5ea-11ef-9310-92fbcf53809c.png

創(chuàng)新點:

提出了一種新型的通道感知U形Mamba模型(CU-Mamba),通過結(jié)合U-Net框架與雙向選擇性狀態(tài)空間模型(SSM),顯著提升了圖像復(fù)原能力。

在CU-Mamba模型中,作者創(chuàng)新性地在通道維度引入選擇性SSM機制,以彌補現(xiàn)有Mamba-based U-Net在捕獲通道信息方面的不足。

e4c063f0-c5ea-11ef-9310-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1091

    瀏覽量

    40881
  • 建模
    +關(guān)注

    關(guān)注

    1

    文章

    315

    瀏覽量

    61307

原文標題:超越Transformer!Mamba入局圖像復(fù)原,達成新SOTA!

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦

    紫光展銳UWB芯片!首選落地應(yīng)用竟是車載雷達?

    處于探索更多應(yīng)用場景的階段。 ? 然而隨著汽車智能化的發(fā)展,UWB在汽車鑰匙或其他定位應(yīng)用上得到更多機會。最近紫光展銳在全球合作伙伴大會上展示了其首款UWB芯片,這也意味著紫光展銳正式加入到UWB市場,成為又一家到UWB的芯片大廠。那么紫光展銳作為通信
    的頭像 發(fā)表于 12-01 10:04 ?2973次閱讀
    紫光展銳<b class='flag-5'>入</b><b class='flag-5'>局</b>UWB芯片!首選落地應(yīng)用竟是車載雷達?

    商湯科技與上海徐匯區(qū)文旅達成合作

    近日,商湯科技與上海徐匯區(qū)文旅達成合作,基于商湯最新AI大模型日日新SenseNova V6,打造智慧文旅新技術(shù)與應(yīng)用成果,可為游客提供擬人化的“貼身導(dǎo)游”服務(wù)。
    的頭像 發(fā)表于 04-24 16:23 ?22次閱讀

    ST、漢威科技和紐迪瑞人形機器人,多家企業(yè)亮出關(guān)鍵傳感器

    傳感器、激光雷達、柔性電子皮膚、高性能慣性測量單元(IMU)及力控扭矩傳感器等在該領(lǐng)域具有較高的技術(shù)價值和市場潛力。 2025年,人形機器人熱度高漲,減速器、伺服電機、關(guān)節(jié)模組、傳感器等核心領(lǐng)域件者大增。漢威科技具身智
    的頭像 發(fā)表于 04-03 09:08 ?3333次閱讀
    ST、漢威科技和紐迪瑞<b class='flag-5'>入</b><b class='flag-5'>局</b>人形機器人,多家企業(yè)亮出關(guān)鍵傳感器

    首個Mamba系列模型量化方案MambaQuant解讀

    MambaQuant在Mamba系列模型上實現(xiàn)了W8A8/W4A8量化的方法,精度逼近浮點,超過Quarot等SOTA方法。該工作已被人工智能頂會ICLR-2025接收。
    的頭像 發(fā)表于 03-05 11:10 ?318次閱讀
    首個<b class='flag-5'>Mamba</b>系列模型量化方案MambaQuant解讀

    UHV(J) 無放耐壓試驗裝置

    一、概述 無放試驗變壓器。采用SF6氣體絕緣及特殊結(jié)構(gòu)及精密工藝使得其 放量能控制在較小的范圍內(nèi)。外形工藝精度高。適用于現(xiàn)場和試驗室。 方便適用。重量輕,體積小,便于移動。 二、工作環(huán)境 1.
    發(fā)表于 02-18 08:58

    地平線ViG基于視覺Mamba的通用視覺主干網(wǎng)絡(luò)

    Vision Mamba的成功預(yù)示著將視覺表征學(xué)習(xí)轉(zhuǎn)換為線性復(fù)雜度視覺序列表征學(xué)習(xí)具有巨大的潛力。盡管以Vision Mamba為代表的線性視覺序列表征學(xué)習(xí)結(jié)構(gòu)在高清圖像上展示了顯著的效率優(yōu)勢,但在更為常見的分辨率,仍略遜于Tr
    的頭像 發(fā)表于 01-08 09:33 ?426次閱讀
    地平線ViG基于視覺<b class='flag-5'>Mamba</b>的通用視覺主干網(wǎng)絡(luò)

    港大提出SparX:強化Vision Mamba和Transformer的稀疏跳躍連接機制

    本文分享香港大學(xué)計算和數(shù)據(jù)科學(xué)學(xué)院俞益洲教授及其研究團隊發(fā)表于 AAAI 2025 的論文——SparX,一種強化 Vision Mamba 和 Transformer 的稀疏跳躍連接機制,性能強大
    的頭像 發(fā)表于 01-03 09:28 ?463次閱讀
    港大提出SparX:強化Vision <b class='flag-5'>Mamba</b>和Transformer的稀疏跳躍連接機制

    放變頻電源系列

    放變頻電源裝置、放量測試電源裝置、無放測試變頻電源裝置
    的頭像 發(fā)表于 12-31 11:41 ?308次閱讀
    無<b class='flag-5'>局</b>放變頻電源系列

    放變頻電源哪家做的比較好?

    放變頻電源 放量測試小于10PC 功率600KVA 輸出電壓0-1000V 頻率45-300HZ 哪家做的比較好?
    發(fā)表于 12-26 16:49

    華為正式人形機器人領(lǐng)域

    11月29日最新消息,華為正式人形機器人領(lǐng)域,有望明年量產(chǎn)。該消息瞬間引爆市場!華為人形機器人,一方面是一個新的科技項目啟動與攻關(guān),另一方面,其實又是各項科技成果的一次系統(tǒng)集成
    的頭像 發(fā)表于 12-03 09:57 ?922次閱讀
    華為正式<b class='flag-5'>入</b><b class='flag-5'>局</b>人形機器人領(lǐng)域

    萬年芯解讀國產(chǎn)半導(dǎo)體產(chǎn)業(yè)年內(nèi)新增16萬家

    的萬年芯看來,者激增是好是壞,還有待商榷。OR攪局據(jù)報道數(shù)據(jù)顯示,國內(nèi)現(xiàn)存半導(dǎo)體相關(guān)企業(yè)91.33萬家,近十年相關(guān)企業(yè)注冊量持續(xù)穩(wěn)步增長。2023年注冊量首
    的頭像 發(fā)表于 12-02 17:14 ?379次閱讀
    萬年芯解讀國產(chǎn)半導(dǎo)體產(chǎn)業(yè)年內(nèi)新增16萬家<b class='flag-5'>入</b><b class='flag-5'>局</b>者

    關(guān)于\"OPA615\"的SOTA的跨導(dǎo)大小的疑問求解

    關(guān)于OPA615的SOTA部分,看datasheet的page9的figure22,我們可以知道跨導(dǎo)大小大概是35mA/V左右,并且可以知道其Chold輸出一般在5mA以內(nèi),但是我從社區(qū)里面找到
    發(fā)表于 09-13 06:25

    大疆eBike千億市場,芯片廠商有哪些機遇?

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)今年7月,大疆首次亮相了其用于eBike(電助力自行車)的電助力系統(tǒng)DJI Avinox,正式eBike市場。這也是大疆繼戶外電源之后,又一次跨界邁入新的領(lǐng)域
    的頭像 發(fā)表于 08-21 09:02 ?4278次閱讀
    大疆<b class='flag-5'>入</b><b class='flag-5'>局</b>eBike千億市場,芯片廠商有哪些機遇?

    NB81是否支持OneNet SOTA功能?應(yīng)該如何激活SOTA

    NB81是否支持OneNet SOTA功能? 可以支持,應(yīng)該如何激活SOTA?
    發(fā)表于 06-04 06:14

    旋變位置不變的情況下,當使能SOTA功能與關(guān)閉SOTA功能時,APP中DSADC采樣得到的旋變sin和cos兩者值不一樣,為什么?

    旋變位置不變的情況下,當使能SOTA功能與關(guān)閉SOTA功能時,APP中DSADC采樣得到的旋變sin和cos兩者值不一樣,用示波器采的輸入到MCU端的差分電壓是一樣的,難道是SOTA使能后影響了MCU芯片內(nèi)部的等效阻抗嗎,有專家
    發(fā)表于 05-17 08:13

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品