0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何縮小弱監(jiān)督信號與密集預(yù)測之間的差距

新機(jī)器視覺 ? 來源:極市平臺 ? 作者:PaperWeekly ? 2022-07-13 10:51 ? 次閱讀

導(dǎo)讀本文圍繞非完全監(jiān)督下的圖像分割方法最新綜述,講述用于解決“如何縮小弱監(jiān)督信號與密集預(yù)測之間的差距”的四種通用的啟發(fā)式先驗(yàn)。

前言

0f48f706-01ec-11ed-ba43-dac502259ad0.jpg

論文鏈接:https://arxiv.org/abs/2207.01223團(tuán)隊(duì)介紹:https://shenwei1231.github.io/上海交通大學(xué)人工智能研究院楊小康、沈?yàn)閳F(tuán)隊(duì)聯(lián)合華為田奇團(tuán)隊(duì)共同發(fā)布了非完全監(jiān)督(即標(biāo)簽有限)下的圖像分割方法最新綜述 “A Survey on Label-efficient Deep Segmentation: Bridging the Gap between Weak Supervision and Dense Prediction”。該工作由人工智能研究院沈?yàn)楦苯淌谥鞒?,全文包?70余篇文獻(xiàn),全面總結(jié)了不同類型的監(jiān)督標(biāo)簽在不同分割任務(wù)上的進(jìn)展情況:包括無監(jiān)督、弱監(jiān)督、半監(jiān)督、部分監(jiān)督、域遷移等多種設(shè)置下的語義、實(shí)例、全景分割問題,并以統(tǒng)一視角--“如何縮小弱監(jiān)督信號與密集預(yù)測之間的差距”進(jìn)行分析,總結(jié)出用于解決這個問題的四種通用的啟發(fā)式先驗(yàn):① cross-label constraint (跨標(biāo)簽約束);② cross-pixel similarity(跨像素相似性);③ cross-view consistency(跨視圖一致性);④ cross-image relation(跨圖像關(guān)系)。

0f6192e8-01ec-11ed-ba43-dac502259ad0.jpg

▲不同模態(tài)的數(shù)據(jù)會被分別經(jīng)過“連續(xù)向量路徑”和“離散詞路徑”,分別為連續(xù)向量和離散詞向量作為其的特征;最終的特征為二者的向量和。

背景與問題

圖像分割是計算機(jī)視覺領(lǐng)域最古老最廣泛的研究任務(wù)之一。它的目標(biāo)是對給定的圖像來生成密集的預(yù)測,根據(jù)預(yù)測的類型決定具體的分割方向,例如:給每個像素分配一個預(yù)定義的類別標(biāo)簽為語義分割;為每個像素預(yù)測一個對象實(shí)例標(biāo)簽為實(shí)例分割;或前兩者的預(yù)測結(jié)果的組合為全景分割。無論哪種具體分割方向,其都能使語義相似的像素組成有意義的概念,如動態(tài)對象(人、貓、球等)和靜態(tài)物體(道路、天空、水等)。在過去的近十年里,深度學(xué)習(xí)的出現(xiàn)極大地帶動了圖像分割領(lǐng)域的研究進(jìn)展,特別是隨著全卷積網(wǎng)絡(luò)(FCN)的發(fā)展,諸如DeepLab系列,Mask RCNN系列等方法憑借卷積網(wǎng)絡(luò)強(qiáng)大的密集特征表征能力以及獨(dú)特的設(shè)計在圖像分割領(lǐng)域大放異彩,取得了非常好的分割效果。然而這些方法也存在著一個共同的缺點(diǎn),即往往分割效果與具有可用的密集標(biāo)注的圖像的數(shù)量是成正比的,對像素級的標(biāo)簽的需求量非常大。但是人為地給每一張圖像做像素級的標(biāo)注卻非常地耗費(fèi)時間與精力,這不僅限制了深度學(xué)習(xí)的進(jìn)一步發(fā)展,而且限制了圖像分割在真實(shí)工業(yè)場景中的應(yīng)用。近年來,設(shè)計基于非完全監(jiān)督信號來減少對密集標(biāo)簽依賴的分割方法越來越受到關(guān)注,非完全監(jiān)督下的圖像分割方法的數(shù)量呈爆發(fā)式增長,由于缺少對這些方法進(jìn)行系統(tǒng)地歸納總結(jié),這給研究者學(xué)習(xí)跟進(jìn)最新研究進(jìn)展帶來不小的挑戰(zhàn)。 然而,目前僅有個別幾篇相關(guān)的調(diào)研論文,且它們僅僅關(guān)注于一個特定的分割任務(wù),并僅包含個別類型的弱標(biāo)簽,無法做到全面的總結(jié)。

本文工作

本文研究人員旨在提供一個面向于非完全監(jiān)督下圖像分割領(lǐng)域的全面的綜述,分析語義分割、實(shí)例分割、全景分割三類使用弱監(jiān)督信號(標(biāo)簽)來解決分割問題的方法之間的統(tǒng)一性與關(guān)聯(lián)性。為了達(dá)到該目的,研究人員需要想好兩個問題:

如何對這些方法建立合適分類與關(guān)聯(lián)?

如何從統(tǒng)一的角度總結(jié)這些方法所使用的策略?

研究人員注意到,弱標(biāo)簽的類型是設(shè)計非完全監(jiān)督圖像分割方法的關(guān)鍵,決定了可用信息的多少,因此試圖從弱標(biāo)簽信號差異的角度來回答上述兩個問題。針對第一個問題,本綜述首先總結(jié)出層次化的非完全監(jiān)督信號的分類,具體類型包括如下所示:

無監(jiān)督信號:即訓(xùn)練集中的圖像沒有任何標(biāo)注信號(圖 2a)。

粗粒度監(jiān)督信號:即訓(xùn)練集中的圖像有標(biāo)注信號,但這些信號不是像素級的,無法為每一個像素提供類別信息或者實(shí)例信息。(圖2b)在該類型下主要包括:

圖像級別的標(biāo)注

檢測框級別的標(biāo)注

涂鴉級別的標(biāo)注

不完全監(jiān)督信號:即訓(xùn)練集中的一部分圖像有像素級的標(biāo)注信號(圖2c)。在該類型下主要包括:

半監(jiān)督標(biāo)簽,即屬于同域的另一部分圖像沒有任何標(biāo)簽

特定域的標(biāo)簽,即另一部分圖像屬于另一個域,其沒有任何標(biāo)注

部分密集標(biāo)簽,即屬于同域的另一部分圖像有檢測框級別的弱標(biāo)注

帶噪監(jiān)督信號:即有像素級別的標(biāo)注,但是這些標(biāo)注并不一定全部準(zhǔn)確(圖 2d)。

根據(jù)這些分類,再結(jié)合不同的任務(wù)類型,整理出來了如圖 1 所示的分類表,也標(biāo)注了不同任務(wù)不同標(biāo)簽類型下已有的代表性工作和待開發(fā)的領(lǐng)域。

0f7359e2-01ec-11ed-ba43-dac502259ad0.jpg

▲圖2. 每一種弱監(jiān)督信號的示意圖。第一列為完全密集監(jiān)督信號的例子。針對第二個問題,本綜述結(jié)合不同弱監(jiān)督信號之間的關(guān)聯(lián)以及對 170 余篇論文進(jìn)行歸納提煉后,總結(jié)出了四種通用的啟發(fā)式先驗(yàn):

cross-label constraint,即跨標(biāo)簽約束:弱標(biāo)簽與密集標(biāo)簽之間具有一些約束關(guān)系,如給定圖像的類別標(biāo)簽,我們可以知道圖中必有至少一個像素屬于該類別。

cross-pixel similarity,即跨像素相似性:具有諸如顏色,紋理,高層次特征相似性的像素點(diǎn)很可能是同類像素或者同對象像素。

cross-view consistency,即跨視圖一致性:同一張圖的不同的視角具有強(qiáng)關(guān)聯(lián)性/預(yù)測一致性。

cross-image relation,即跨圖像關(guān)系:不同圖像中屬于同一類別的實(shí)例具有相同的語義關(guān)系。

通過下列表1的代表性方法的核心做法歸納中可以看到,在各種監(jiān)督信號/各種任務(wù)下,這四種先驗(yàn)貫穿每一種任務(wù)設(shè)定,證明了本綜述總結(jié)的啟發(fā)式先驗(yàn)具有通用性。

0f8436ea-01ec-11ed-ba43-dac502259ad0.jpg

▲表1. 多種弱監(jiān)督信號下的圖像分割代表性工作。

0f9e4602-01ec-11ed-ba43-dac502259ad0.jpg

▲表2. 統(tǒng)一的數(shù)學(xué)描述。本綜述幾乎對各章節(jié)部分(即某種監(jiān)督信號下的某個任務(wù))都總結(jié)了一個具有概括性的流程圖,便于研究人員明確當(dāng)前已有工作的入手點(diǎn)與研究路線,如圖 3 所示。

0fb95604-01ec-11ed-ba43-dac502259ad0.jpg

▲圖3. 部分論文圖示預(yù)覽

總結(jié)

本綜述對現(xiàn)有不完全監(jiān)督下的圖像分割方法進(jìn)行了歸納總結(jié),同時也分析了未來的潛在研究方向,包括:

結(jié)合文本監(jiān)督的零樣本圖像分割。 多模態(tài)技術(shù)是未來的主流方向,也更貼近人的認(rèn)知系統(tǒng)。從文本中獲得一定的語義信息可以更好的幫助新類別的識別與分割,利于零樣本任務(wù)的發(fā)展。

利用 Transformer 特性的不完全監(jiān)督圖像分割方法。 當(dāng)前大部分方法還是基于卷積神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)的,爆火的 Transformer 在不完全監(jiān)督下的圖像分割領(lǐng)域目前還沒有被探索,許多 Transformer 特性可能對該任務(wù)具有更有力的優(yōu)勢。

還未開拓的利用其他不完全監(jiān)督信號的方案。 如圖 1 所示,這里依然有很多方向還沒有被探索,如帶噪監(jiān)督信號下的實(shí)例分割等,研究者可以發(fā)掘更多合理的任務(wù)設(shè)置,充分利用現(xiàn)有的具有多種標(biāo)注類型的數(shù)據(jù)集。

原文標(biāo)題:綜述|上海交大&華為:非完全監(jiān)督下基于深度學(xué)習(xí)的圖像分割方法

文章出處:【微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 像素
    +關(guān)注

    關(guān)注

    1

    文章

    205

    瀏覽量

    18598
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47314

    瀏覽量

    238643
  • 圖像分割算法
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    6316

原文標(biāo)題:綜述|上海交大&華為:非完全監(jiān)督下基于深度學(xué)習(xí)的圖像分割方法

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    snmp口令及安全加固

    snmp口令及安全加固 口令檢測 ? nmap –sU –p161 –script=snmp-brute ip //查找snmp口令 ? 口令利用 ? nmap -sU -p1
    的頭像 發(fā)表于 12-17 14:47 ?129次閱讀

    三星與SK海力士市值份額差距縮至13年最小

    韓國交易所近日發(fā)布的數(shù)據(jù)顯示,三星電子與SK海力士的市值份額差距已經(jīng)縮小至近13年來的最低水平。
    的頭像 發(fā)表于 10-28 15:44 ?516次閱讀

    4G5G手機(jī)信號放大器:從到強(qiáng),為數(shù)字生活加速

    深圳特信屏蔽器|4G5G手機(jī)信號放大器:從到強(qiáng),為數(shù)字生活加速
    的頭像 發(fā)表于 09-11 16:18 ?576次閱讀

    深圳特信屏蔽器 2G手機(jī)信號放大器:從鄉(xiāng)村到城市,信號不再

    深圳特信屏蔽器|2G手機(jī)信號放大器:從鄉(xiāng)村到城市,信號不再
    的頭像 發(fā)表于 08-05 09:03 ?591次閱讀

    電機(jī)磁時的電流大小關(guān)系?

    電機(jī)的相電流按矢量選擇分為勵磁電流和轉(zhuǎn)矩電流,勵磁電流用于產(chǎn)生磁場,轉(zhuǎn)矩電流用于提供扭矩。 在電機(jī)磁時,即到達(dá)恒功率區(qū)時刻,電機(jī)的勵磁電流開始減小,這是因?yàn)橐?b class='flag-5'>弱磁,但是轉(zhuǎn)矩電流會增大,這是因?yàn)橐?/div>
    發(fā)表于 07-13 13:09

    三星加強(qiáng)半導(dǎo)體封裝技術(shù)聯(lián)盟,以縮小與臺積電差距

    據(jù)最新報道,三星電子正積極加強(qiáng)其在半導(dǎo)體封裝技術(shù)領(lǐng)域的聯(lián)盟建設(shè),旨在縮小與全球半導(dǎo)體制造巨頭臺積電之間的技術(shù)差距。為實(shí)現(xiàn)這一目標(biāo),三星預(yù)計將在今年進(jìn)一步擴(kuò)大其2.5D和3D MDI(多芯片集成)聯(lián)盟,計劃新增十名成員。
    的頭像 發(fā)表于 06-11 09:32 ?539次閱讀

    什么是電機(jī)的磁?電機(jī)磁的可能原因有哪些?

    在電機(jī)運(yùn)行的過程中,我們有時會遇到電機(jī)磁的情況。電機(jī)磁,簡而言之,即電機(jī)在運(yùn)行時輸出功率下降,不足以滿足正常使用需求的現(xiàn)象。這一現(xiàn)象可能由多種原因引起,對電機(jī)的性能和運(yùn)行穩(wěn)定性產(chǎn)生不良影響。本文將詳細(xì)探討電機(jī)的磁現(xiàn)象及其可
    的頭像 發(fā)表于 06-04 16:15 ?4348次閱讀

    商湯科技采購40000顆英偉達(dá)芯片,縮小中美算力差距

    徐冰認(rèn)為,國產(chǎn)芯片崛起以及算力商品化帶來的投資價值,使中美算力差距有望逐步縮小。只要中國持續(xù)在算力研發(fā)上投入資金及資源,便能拉近與美國的算力差距。
    的頭像 發(fā)表于 05-28 11:25 ?1282次閱讀

    4G手機(jī)信號放大器:解決信號區(qū),提升移動網(wǎng)絡(luò)

    深圳特信電子|4G手機(jī)信號放大器:解決信號區(qū),提升移動網(wǎng)絡(luò)
    的頭像 發(fā)表于 05-06 08:58 ?1641次閱讀

    三星顯示CEO:中韓OLED顯示器企業(yè)技術(shù)差距僅1年

    三星Display社長崔周善表示:“與中國顯示器企業(yè)的技術(shù)差距縮小到1年或1年半。為了維持技術(shù)超差距,有必要聚集人才,提高研發(fā)的效率。”
    的頭像 發(fā)表于 03-08 14:54 ?1125次閱讀

    縮短連續(xù)傳導(dǎo)模式與過渡模式功率因數(shù)校正器之間差距

    電子發(fā)燒友網(wǎng)站提供《縮短連續(xù)傳導(dǎo)模式與過渡模式功率因數(shù)校正器之間差距.pdf》資料免費(fèi)下載
    發(fā)表于 02-28 10:06 ?0次下載

    Meta發(fā)布新型無監(jiān)督視頻預(yù)測模型“V-JEPA”

    Meta,這家社交媒體和科技巨頭,近日宣布推出一種新型的無監(jiān)督視頻預(yù)測模型,名為“V-JEPA”。這一模型在視頻處理領(lǐng)域引起了廣泛關(guān)注,因?yàn)樗ㄟ^抽象性預(yù)測生成視頻中缺失或模糊的部分來進(jìn)行學(xué)習(xí),提供了一種全新的視頻處理方法。
    的頭像 發(fā)表于 02-19 11:19 ?1027次閱讀

    在TC3XX系列中,safety manual中寫著DTSCLIM和PMS-DTSLIM之間差距大于9攝氏度,為什么?

    在TC3XX系列中,safety manual中寫著DTSCLIM和PMS-DTSLIM之間差距大于9攝氏度,認(rèn)為此時是異常的,要觸發(fā)alarm。請問為什么要設(shè)計成這樣,這個閾值為啥是9攝氏度
    發(fā)表于 01-22 06:36

    三元電芯與鐵鋰電芯的價格差異不斷縮小

    三元電芯與鐵鋰電芯之間的價差正在不斷縮小
    的頭像 發(fā)表于 01-03 11:29 ?1458次閱讀

    基于神經(jīng)輻射場的自監(jiān)督多相機(jī)占用預(yù)測

    本研究提出了一種自監(jiān)督的多攝相機(jī)3D占據(jù)預(yù)測方法,名為OccNeRF。該方法旨在解決無界場景的建模問題。
    的頭像 發(fā)表于 01-02 14:53 ?480次閱讀
    基于神經(jīng)輻射場的自<b class='flag-5'>監(jiān)督</b>多相機(jī)占用<b class='flag-5'>預(yù)測</b>