0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三項(xiàng)SOTA!MasQCLIP:開放詞匯通用圖像分割新網(wǎng)絡(luò)

3D視覺工坊 ? 來(lái)源:3D視覺工坊 ? 2023-12-12 11:23 ? 次閱讀

1. 效果展示

MasQCLIP在開放詞匯實(shí)例分割、語(yǔ)義分割和全景分割三項(xiàng)任務(wù)上均實(shí)現(xiàn)了SOTA,漲點(diǎn)非常明顯。這里也推薦工坊推出的新課程《徹底搞懂視覺-慣性SLAM:VINS-Fusion原理精講與源碼剖析》。

2c36400a-987a-11ee-8b88-92fbcf53809c.png

再來(lái)看看開放詞匯全景分割的定性效果,圖片來(lái)源于ADE20k,可以發(fā)現(xiàn)MasQCLIP分割出的Mask和類別精度更高。

2c7bd53e-987a-11ee-8b88-92fbcf53809c.png

2. 具體原理是什么?

先介紹一下基礎(chǔ)的CLIP模型:ICML-2021的工作,多模態(tài)視覺-語(yǔ)言模型代表。主要用來(lái)提取zero-shot目標(biāo)的特征。核心思想是,很多模型需要預(yù)定義圖像類別,但是文本實(shí)際上就已經(jīng)提供了未見類別的信息,融合文本就可以極大增強(qiáng)模型的泛化性。

MasQCLIP的思想是,利用稠密特征與預(yù)訓(xùn)練的CLIP模型無(wú)縫集成,從而避免訓(xùn)練大規(guī)模參數(shù)。MasQCLIP在使用CLIP模型構(gòu)建圖像分割時(shí)側(cè)重兩方面:

(1)學(xué)生-教師模塊,通過(guò)從基礎(chǔ)(已見)類中提取信息來(lái)處理新(未見)類的Mask;

(2)更新CLIP模型中查詢的模型參數(shù)的微調(diào)過(guò)程。

具體Pipeline是,MasQCLIP由類無(wú)關(guān)Mask提議網(wǎng)絡(luò)和基于CLIP的Mask分類模塊組成。在Mask提議網(wǎng)絡(luò)中,應(yīng)用漸進(jìn)蒸餾來(lái)分割基類之外的Mask。之后將預(yù)測(cè)的Mask送入分類模塊以獲得標(biāo)簽。為了有效利用密集CLIP特征,還提出了MasQ-Tuning策略。

2cfae536-987a-11ee-8b88-92fbcf53809c.png

再來(lái)看看這個(gè)漸進(jìn)蒸餾,就是從教師模型的分割圖中提取和基礎(chǔ)類別沒有重疊的Mask,用來(lái)做輔助訓(xùn)練,將這些額外的標(biāo)注蒸餾到學(xué)生模型中,然后不停的迭代循環(huán)來(lái)提高泛化性。

2d2090f6-987a-11ee-8b88-92fbcf53809c.png

3. 再來(lái)看看效果如何

開放詞匯通用圖像分割的定量結(jié)果,直接對(duì)比了實(shí)例分割、語(yǔ)義分割、全景分割三個(gè)任務(wù)。三大任務(wù)漲點(diǎn)都非常明顯!

2d438bce-987a-11ee-8b88-92fbcf53809c.png

開放詞匯實(shí)例分割結(jié)果,分別對(duì)比基類和新類別的定量精度,展示了模型的泛化性。這里也推薦工坊推出的新課程《徹底搞懂視覺-慣性SLAM:VINS-Fusion原理精講與源碼剖析》。

2d6efc00-987a-11ee-8b88-92fbcf53809c.png

開放詞匯實(shí)例分割定性對(duì)比,可以發(fā)現(xiàn)MasQCLIP分割精度更高!

2d87cc80-987a-11ee-8b88-92fbcf53809c.jpg








審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像分割
    +關(guān)注

    關(guān)注

    4

    文章

    182

    瀏覽量

    18263
  • Clip
    +關(guān)注

    關(guān)注

    0

    文章

    32

    瀏覽量

    6978

原文標(biāo)題:北大&清華最新開源 | 三項(xiàng)SOTA!MasQCLIP:開放詞匯通用圖像分割新網(wǎng)絡(luò)

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    安富利榮獲Bourns三項(xiàng)大獎(jiǎng)

    近日,安富利憑借卓越表現(xiàn)榮膺由Bourns公司頒發(fā)的三項(xiàng)大獎(jiǎng)——“2024年度最佳分銷商”、 “2024年度最佳生意增長(zhǎng)” 及“2024年度最佳設(shè)計(jì)獎(jiǎng)”。以上榮譽(yù)不僅是對(duì)安富利在亞洲和中國(guó)區(qū)域市場(chǎng)開拓、業(yè)務(wù)增長(zhǎng)方面突出表現(xiàn)的認(rèn)可,更是雙方在技術(shù)協(xié)作、項(xiàng)目落地中默契配合的有力見證。
    的頭像 發(fā)表于 05-17 13:58 ?825次閱讀

    Future AIHER公司提交三項(xiàng)AI混增系統(tǒng)專利申請(qǐng)

    ,其新近成立的子公司 Future AIHER 已正式提交三項(xiàng)專利申請(qǐng),旨在確立FF在智能電動(dòng)動(dòng)力系統(tǒng)創(chuàng)新的領(lǐng)先地位。
    的頭像 發(fā)表于 05-12 10:18 ?188次閱讀

    長(zhǎng)城汽車榮獲三項(xiàng)重量級(jí)大獎(jiǎng)

    近日,長(zhǎng)城汽車在泰國(guó)“2025年度CAR & BIKE OF THE YEAR”評(píng)選中榮獲三項(xiàng)重量級(jí)大獎(jiǎng)。其中,坦克300 HEV榮獲“最佳混合動(dòng)力四驅(qū)越野車”, 歐拉閃電貓榮獲“最佳純電動(dòng)轎車”,山海炮 HEV榮獲“最佳混合動(dòng)力皮卡”。
    的頭像 發(fā)表于 03-25 13:30 ?520次閱讀

    華為MWC2025斬獲三項(xiàng)GLOMO大獎(jiǎng)

    MWC25巴塞羅那展期間,華為服務(wù)與軟件攜手中國(guó)移動(dòng)和bKash在智能化運(yùn)維運(yùn)營(yíng)領(lǐng)域斬獲三項(xiàng)GLOMO大獎(jiǎng),包括“最佳網(wǎng)絡(luò)軟件突破獎(jiǎng)”,“CTO甄選:卓越移動(dòng)技術(shù)獎(jiǎng)”和“最佳金融科技創(chuàng)新獎(jiǎng)”。
    的頭像 發(fā)表于 03-18 17:08 ?454次閱讀

    科技為用戶而生!海爾智家大腦HomeGPT連獲三項(xiàng)大獎(jiǎng)

    科技創(chuàng)新的根本目的在于給用戶更好的生活。為用戶而生的海爾智家,通過(guò)行業(yè)首個(gè)智慧家庭垂域大模型HomeGPT,不僅為用戶帶來(lái)更自然、更智能的智慧生活體驗(yàn),更贏得了行業(yè)的高度認(rèn)可,連獲三項(xiàng)行業(yè)大獎(jiǎng),助力
    的頭像 發(fā)表于 01-24 11:36 ?437次閱讀

    松下電氣榮獲SGS三項(xiàng)服務(wù)認(rèn)證

    近日,松下電氣設(shè)備(中國(guó))有限公司在國(guó)際公認(rèn)的測(cè)試、檢驗(yàn)和認(rèn)證機(jī)構(gòu)SGS的嚴(yán)格評(píng)審下,榮獲了商品售后服務(wù)“五星級(jí)”、售后服務(wù)完善度“鉑金級(jí)”以及顧客滿意度“鉑金級(jí)”三項(xiàng)認(rèn)證證書。這一榮譽(yù)的獲得
    的頭像 發(fā)表于 01-22 13:40 ?415次閱讀

    Mamba入局圖像復(fù)原,達(dá)成新SOTA

    MambaIRv2,更高性能、更高效率!另外還有ACM MM 2024上的Freqmamba方法,在圖像去雨任務(wù)中取得了SOTA性能! 顯然,這種基于Mamba的方法在圖像復(fù)原領(lǐng)域,比基于CNN
    的頭像 發(fā)表于 12-30 18:09 ?708次閱讀
    Mamba入局<b class='flag-5'>圖像</b>復(fù)原,達(dá)成新<b class='flag-5'>SOTA</b>

    納微半導(dǎo)體榮獲2024行家極光獎(jiǎng)三項(xiàng)大獎(jiǎng)

    近日,一年一度的行家說(shuō)代半年會(huì)“2024碳化硅&氮化鎵產(chǎn)業(yè)高峰論壇暨極光獎(jiǎng)?lì)C獎(jiǎng)典禮”重磅召開。納微半導(dǎo)體憑借2024年優(yōu)異的應(yīng)用和產(chǎn)品表現(xiàn),榮獲三項(xiàng)重磅大獎(jiǎng)!
    的頭像 發(fā)表于 12-13 17:43 ?880次閱讀

    蘋果iOS 18.2將推三項(xiàng)備忘錄AI功能,提升創(chuàng)作效率

    11月6日,據(jù)外媒報(bào)道,蘋果公司正籌備推出第二波Apple Intelligence(蘋果智能)功能,并計(jì)劃在下個(gè)月發(fā)布的iOS 18.2更新中,為備忘錄應(yīng)用帶來(lái)三項(xiàng)關(guān)鍵的人工智能改進(jìn),旨在提升用戶的創(chuàng)作效率和日常記錄體驗(yàn)。
    的頭像 發(fā)表于 11-06 14:58 ?977次閱讀

    圖像語(yǔ)義分割的實(shí)用性是什么

    圖像語(yǔ)義分割是一種重要的計(jì)算機(jī)視覺任務(wù),它旨在將圖像中的每個(gè)像素分配到相應(yīng)的語(yǔ)義類別中。這項(xiàng)技術(shù)在許多領(lǐng)域都有廣泛的應(yīng)用,如自動(dòng)駕駛、醫(yī)學(xué)圖像分析、機(jī)器人導(dǎo)航等。 一、
    的頭像 發(fā)表于 07-17 09:56 ?827次閱讀

    圖像分割和語(yǔ)義分割的區(qū)別與聯(lián)系

    圖像分割和語(yǔ)義分割是計(jì)算機(jī)視覺領(lǐng)域中兩個(gè)重要的概念,它們?cè)?b class='flag-5'>圖像處理和分析中發(fā)揮著關(guān)鍵作用。 1. 圖像
    的頭像 發(fā)表于 07-17 09:55 ?1759次閱讀

    圖像分割與目標(biāo)檢測(cè)的區(qū)別是什么

    圖像分割與目標(biāo)檢測(cè)是計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)重要任務(wù),它們?cè)谠S多應(yīng)用場(chǎng)景中都發(fā)揮著關(guān)鍵作用。然而,盡管它們?cè)谀承┓矫嬗邢嗨浦?,但它們的目?biāo)、方法和應(yīng)用場(chǎng)景有很大的不同。本文將介紹圖像分割
    的頭像 發(fā)表于 07-17 09:53 ?2227次閱讀

    圖像分割與語(yǔ)義分割中的CNN模型綜述

    圖像分割與語(yǔ)義分割是計(jì)算機(jī)視覺領(lǐng)域的重要任務(wù),旨在將圖像劃分為多個(gè)具有特定語(yǔ)義含義的區(qū)域或?qū)ο?。卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為深度學(xué)習(xí)的一種核心
    的頭像 發(fā)表于 07-09 11:51 ?1791次閱讀

    機(jī)器人視覺技術(shù)中常見的圖像分割方法

    機(jī)器人視覺技術(shù)中的圖像分割方法是一個(gè)廣泛且深入的研究領(lǐng)域。圖像分割是將圖像劃分為多個(gè)區(qū)域或?qū)ο蟮倪^(guò)程,這些區(qū)域或?qū)ο缶哂心撤N共同的特征,如顏
    的頭像 發(fā)表于 07-09 09:31 ?1274次閱讀

    機(jī)器人視覺技術(shù)中圖像分割方法有哪些

    機(jī)器人視覺技術(shù)是人工智能領(lǐng)域的一個(gè)重要分支,它涉及到圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等多個(gè)學(xué)科。圖像分割是機(jī)器人視覺技術(shù)中的一個(gè)重要環(huán)節(jié),它的目標(biāo)是從一幅圖像中將目標(biāo)物體與背景分離出來(lái),以
    的頭像 發(fā)表于 07-04 11:34 ?1596次閱讀

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品