0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Mamba入局圖像復(fù)原,達(dá)成新SOTA

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:智能感知與物聯(lián)網(wǎng)技術(shù)研 ? 2024-12-30 18:09 ? 次閱讀

圖像復(fù)原又來新突破了!還記得性能超越SwinIR(基于Transformer)的MambaIR嗎?一種基于Mamba的圖像復(fù)原基準(zhǔn)模型,登上ECCV 2024。最近原作者又開發(fā)了新版本MambaIRv2,更高性能、更高效率!另外還有ACM MM 2024上的Freqmamba方法,在圖像去雨任務(wù)中取得了SOTA性能!

顯然,這種基于Mamba的方法在圖像復(fù)原領(lǐng)域,比基于CNN和Transformer的方法更受歡迎。得益于Mamba全局感受野、線性計算復(fù)雜度、高效遠(yuǎn)程依賴處理等諸多優(yōu)勢,它在圖像復(fù)原(比如超分辨率、去噪等)任務(wù)上實現(xiàn)了更高的復(fù)原質(zhì)量和更低的計算成本!可以說是圖像增強領(lǐng)域的研究焦點。

目前這方向研究熱情高漲,頂會成果多,為了幫論文er抓緊機會,我已經(jīng)挑選好了10篇Mamba做圖像復(fù)原的高質(zhì)量論文供大家參考,基本都有代碼,想速發(fā)論文拿下頂會的別錯過啦。

MambaIRv2: Attentive State Space Restoration

方法:論文提出了一種基于Mamba架構(gòu)的圖像復(fù)原方法MambaIRv2,通過引入非因果建模能力,類似于ViT,來增強Mamba的圖像復(fù)原性能。這種方法特別關(guān)注解決Mamba在因果建模中的局限性,允許模型在整個圖像中更有效地利用像素信息,從而提高圖像復(fù)原任務(wù)的性能,如超分辨率、去噪和JPEG壓縮減少等。

e39fbd7c-c5ea-11ef-9310-92fbcf53809c.png

創(chuàng)新點:

提出了“注意力狀態(tài)空間恢復(fù)”的新方法,通過將注意力機制與狀態(tài)空間模型結(jié)合,克服了Mamba架構(gòu)的因果建模限制。

通過語義引導(dǎo)的鄰域重構(gòu),作者將相似像素在一維序列中重新排列,使其更加接近。

e3c5df5c-c5ea-11ef-9310-92fbcf53809c.png

Freqmamba: Viewing mamba from a frequency perspective for image deraining

方法:論文提出了一種名為FreqMamba的圖像復(fù)原方法。FreqMamba結(jié)合了Mamba模型和頻率分析,專注于圖像去雨任務(wù)。該方法通過結(jié)合頻率分析和Mamba的狀態(tài)空間模型來提高去雨效果,包括空間Mamba、頻率帶Mamba和傅里葉全局建模三個交互結(jié)構(gòu),旨在利用Mamba捕捉局部相關(guān)性的能力,同時通過頻率分析增強對全局退化的感知。

e3ee6314-c5ea-11ef-9310-92fbcf53809c.png

創(chuàng)新點:

FreqMamba 是一種創(chuàng)新性的去雨網(wǎng)絡(luò),通過結(jié)合空間域序列建模和頻率域全局建模,以應(yīng)對圖像去雨的挑戰(zhàn)。

引入了一種新穎的三分支結(jié)構(gòu)用于低光圖像增強,成功應(yīng)對照明不足和噪聲放大的場景。

頻率SSM模塊利用多尺度U-Net架構(gòu),并結(jié)合不同尺度的降解圖像生成注意力圖,捕獲不同尺度的降解分布。

e420b63e-c5ea-11ef-9310-92fbcf53809c.png


Multi-dimensional Visual Prompt Enhanced Image Restoration via Mamba-Transformer Aggregation

方法:論文提出了一個名為MTAIR的方法,通過充分利用Mamba和Transformer的互補優(yōu)勢,在不犧牲計算效率的情況下,處理包括圖像去噪、去雨和去霧等多種圖像退化問題。MTAIR通過在空間和通道維度上設(shè)計多維提示學(xué)習(xí)模塊,來動態(tài)調(diào)整特征分布并挖掘與特定退化任務(wù)相關(guān)的上下文信息,從而提高了“全能型”圖像復(fù)原模型的性能。

e4476ee6-c5ea-11ef-9310-92fbcf53809c.png

創(chuàng)新點:

結(jié)合了Mamba和Transformer的優(yōu)勢,通過選擇性掃描機制在空間維度進(jìn)行長距離依賴建模,同時利用Transformer的自注意力機制在通道維度進(jìn)行判別特征學(xué)習(xí)。

設(shè)計了一種新穎的多維提示學(xué)習(xí)模塊,能夠從多尺度層中學(xué)習(xí)提示流,有助于從空間和通道角度揭示各種退化的底層特征,從而增強"多合一"模型解決各種恢復(fù)任務(wù)的能力。

e46e8ae4-c5ea-11ef-9310-92fbcf53809c.png

Cu-mamba: Selective state space models with channel learning for image restoration

方法:論文介紹了一個名為CU-Mamba的模型,該模型結(jié)合了U-Net架構(gòu)和雙狀態(tài)空間模型框架,用于圖像復(fù)原任務(wù)。CU-Mamba模型利用空間SSM模塊進(jìn)行全局上下文編碼,以及通道SSM組件來保留通道相關(guān)特征,兩者都具有相對于特征圖大小的線性計算復(fù)雜度。

e49d9a1e-c5ea-11ef-9310-92fbcf53809c.png

創(chuàng)新點:

提出了一種新型的通道感知U形Mamba模型(CU-Mamba),通過結(jié)合U-Net框架與雙向選擇性狀態(tài)空間模型(SSM),顯著提升了圖像復(fù)原能力。

在CU-Mamba模型中,作者創(chuàng)新性地在通道維度引入選擇性SSM機制,以彌補現(xiàn)有Mamba-based U-Net在捕獲通道信息方面的不足。

e4c063f0-c5ea-11ef-9310-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1085

    瀏覽量

    40490
  • 建模
    +關(guān)注

    關(guān)注

    1

    文章

    308

    瀏覽量

    60779

原文標(biāo)題:超越Transformer!Mamba入局圖像復(fù)原,達(dá)成新SOTA!

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    紫光展銳UWB芯片!首選落地應(yīng)用竟是車載雷達(dá)?

    處于探索更多應(yīng)用場景的階段。 ? 然而隨著汽車智能化的發(fā)展,UWB在汽車鑰匙或其他定位應(yīng)用上得到更多機會。最近紫光展銳在全球合作伙伴大會上展示了其首款UWB芯片,這也意味著紫光展銳正式加入到UWB市場,成為又一家到UWB的芯片大廠。那么紫光展銳作為通信
    的頭像 發(fā)表于 12-01 10:04 ?1965次閱讀
    紫光展銳<b class='flag-5'>入</b><b class='flag-5'>局</b>UWB芯片!首選落地應(yīng)用竟是車載雷達(dá)?

    港大提出SparX:強化Vision Mamba和Transformer的稀疏跳躍連接機制

    本文分享香港大學(xué)計算和數(shù)據(jù)科學(xué)學(xué)院俞益洲教授及其研究團(tuán)隊發(fā)表于 AAAI 2025 的論文——SparX,一種強化 Vision Mamba 和 Transformer 的稀疏跳躍連接機制,性能強大
    的頭像 發(fā)表于 01-03 09:28 ?51次閱讀
    港大提出SparX:強化Vision <b class='flag-5'>Mamba</b>和Transformer的稀疏跳躍連接機制

    放變頻電源哪家做的比較好?

    放變頻電源 放量測試小于10PC 功率600KVA 輸出電壓0-1000V 頻率45-300HZ 哪家做的比較好?
    發(fā)表于 12-26 16:49

    華為正式人形機器人領(lǐng)域

    11月29日最新消息,華為正式人形機器人領(lǐng)域,有望明年量產(chǎn)。該消息瞬間引爆市場!華為人形機器人,一方面是一個新的科技項目啟動與攻關(guān),另一方面,其實又是各項科技成果的一次系統(tǒng)集成
    的頭像 發(fā)表于 12-03 09:57 ?450次閱讀
    華為正式<b class='flag-5'>入</b><b class='flag-5'>局</b>人形機器人領(lǐng)域

    萬年芯解讀國產(chǎn)半導(dǎo)體產(chǎn)業(yè)年內(nèi)新增16萬家

    的萬年芯看來,者激增是好是壞,還有待商榷。OR攪局據(jù)報道數(shù)據(jù)顯示,國內(nèi)現(xiàn)存半導(dǎo)體相關(guān)企業(yè)91.33萬家,近十年相關(guān)企業(yè)注冊量持續(xù)穩(wěn)步增長。2023年注冊量首
    的頭像 發(fā)表于 12-02 17:14 ?171次閱讀
    萬年芯解讀國產(chǎn)半導(dǎo)體產(chǎn)業(yè)年內(nèi)新增16萬家<b class='flag-5'>入</b><b class='flag-5'>局</b>者

    關(guān)于\"OPA615\"的SOTA的跨導(dǎo)大小的疑問求解

    關(guān)于OPA615的SOTA部分,看datasheet的page9的figure22,我們可以知道跨導(dǎo)大小大概是35mA/V左右,并且可以知道其Chold輸出一般在5mA以內(nèi),但是我從社區(qū)里面找到
    發(fā)表于 09-13 06:25

    大疆eBike千億市場,芯片廠商有哪些機遇?

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)今年7月,大疆首次亮相了其用于eBike(電助力自行車)的電助力系統(tǒng)DJI Avinox,正式eBike市場。這也是大疆繼戶外電源之后,又一次跨界邁入新的領(lǐng)域
    的頭像 發(fā)表于 08-21 09:02 ?3830次閱讀
    大疆<b class='flag-5'>入</b><b class='flag-5'>局</b>eBike千億市場,芯片廠商有哪些機遇?

    NB81是否支持OneNet SOTA功能?應(yīng)該如何激活SOTA

    NB81是否支持OneNet SOTA功能? 可以支持,應(yīng)該如何激活SOTA?
    發(fā)表于 06-04 06:14

    旋變位置不變的情況下,當(dāng)使能SOTA功能與關(guān)閉SOTA功能時,APP中DSADC采樣得到的旋變sin和cos兩者值不一樣,為什么?

    旋變位置不變的情況下,當(dāng)使能SOTA功能與關(guān)閉SOTA功能時,APP中DSADC采樣得到的旋變sin和cos兩者值不一樣,用示波器采的輸入到MCU端的差分電壓是一樣的,難道是SOTA使能后影響了MCU芯片內(nèi)部的等效阻抗嗎,有專家
    發(fā)表于 05-17 08:13

    激光雷達(dá)賽道再有新玩家,智能汽車增量部件是趨勢?

    、車載計算平臺模組方案、車載OS等軟硬件產(chǎn)品,但激光雷達(dá)產(chǎn)品是首次亮相。 ? 億咖通CEO沈子瑜在發(fā)布會上講道:“我覺得不再會存在只有激光雷達(dá)公司、毫米波雷達(dá)公司,只會存在的是智能電動汽車的增量部件公司。” 所以億咖通
    的頭像 發(fā)表于 03-27 02:11 ?4254次閱讀

    美妝巨頭吹風(fēng)機市場,歐萊雅或?qū)⒑硠邮袌龈窬郑俊酒淅煜录夹g(shù)】

    日前,美妝品牌歐萊雅推出一款搭載紅外光和風(fēng)力相結(jié)合技術(shù)的AirLight Pro光動力吹風(fēng)機。 作為國際美妝巨頭,比肩戴森、定位高端的歐萊雅有著龐大消費者基礎(chǔ)與品牌影響力,其跨界吹風(fēng)機市場,是否會讓已然內(nèi)卷嚴(yán)重的吹風(fēng)機市場競爭再度加劇呢?
    的頭像 發(fā)表于 03-18 21:17 ?1121次閱讀
    美妝巨頭<b class='flag-5'>入</b><b class='flag-5'>局</b>吹風(fēng)機市場,歐萊雅或?qū)⒑硠邮袌龈窬郑俊酒淅煜录夹g(shù)】

    使用分散加載將部分程序放到RAM,RAM掉電后數(shù)據(jù)就沒有了,如何復(fù)原?

    我使用分散加載將部分程序放到RAM,RAM掉電后數(shù)據(jù)就沒有了,重新上電后,芯片是如何將RAM區(qū)程序復(fù)原的呢。
    發(fā)表于 03-06 07:01

    人形機器人火熱 OpenAI人形機器人 英偉達(dá)等巨頭機器人行業(yè)

    人形機器人火熱 OpenAI人形機器人 英偉達(dá)等巨頭機器人行業(yè) 人形機器人在AI的帶動下越加火熱,業(yè)界多認(rèn)為相關(guān)產(chǎn)業(yè)進(jìn)程或加速推進(jìn)。成立于2022年的Figure AI一下就吸
    的頭像 發(fā)表于 02-26 17:21 ?811次閱讀

    電位器調(diào)亂了該怎么復(fù)原

    電位器調(diào)亂了該怎么復(fù)原? 如何復(fù)原電位器? 電位器常常用于電子設(shè)備中,用于調(diào)整電路中的電壓或電流。但有時候,由于誤操作或其他原因,電位器可能會被調(diào)亂。在這種情況下,需要采取正確的步驟來復(fù)原電位器
    的頭像 發(fā)表于 02-04 09:42 ?1867次閱讀

    SWAP是否適用于兩個用于TC3xx系列控制器的獨立軟件?

    目前正在使用 Swap/Partitions 概念實現(xiàn) SOTA(TC3xx 系列)。 檢查為應(yīng)用程序和引導(dǎo)加載程序?qū)嵤?SOTA 的可行性。 1。對于兩個獨立的軟件,SOTA是否可行? 2。如果是
    發(fā)表于 01-30 07:56