0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何用卷積神經(jīng)網(wǎng)絡(luò)處理語義圖像分割

電子設(shè)計 ? 作者:電子設(shè)計 ? 2018-10-15 09:51 ? 次閱讀

圖像分割是根據(jù)圖像內(nèi)容對指定區(qū)域進(jìn)行標(biāo)記的計算機(jī)視覺任務(wù),簡言之就是“這張圖片里有什么,其在圖片中的位置是什么?”本文聚焦于語義分割任務(wù),即在分割圖中將同一類別的不同實例視為同一對象。

更具體地講,語義圖像分割的目標(biāo)在于標(biāo)記圖片中每一個像素,并將每一個像素與其表示的類別對應(yīng)起來。因為會預(yù)測圖像中的每一個像素,所以一般將這樣的任務(wù)稱為密集預(yù)測。

語義分割的例子,目標(biāo)是預(yù)測圖像中每一個像素的類別標(biāo)簽。

當(dāng)我們有越來越多要用機(jī)器執(zhí)行的任務(wù)時,為這些機(jī)器配備必需的感知器是很重要的。

自動駕駛中實時語義分割道路場景

還有一點(diǎn)要注意的是我們不會分割同一類別的實例,只需要關(guān)注每一個像素的類別。換句話講,如果在輸入圖像中有兩個目標(biāo)屬于同一類,分割映射不會將其分為單獨(dú)的兩個目標(biāo)。

相對地,實例分割模型是另一種不同的模型,該模型可以區(qū)分同一類的不同目標(biāo)。

任務(wù)表征

簡單地說,我們的目標(biāo)是要用 RGB 圖(高 x 寬 x3)或灰度圖(高 x 寬 x1)為輸入,并輸出一個分割圖,在分割圖中每個像素都包括一個用整數(shù)表示的類別標(biāo)簽(高 x 寬 x1)。

注意:為了視覺上的理解簡單起見,我標(biāo)記的是分辨率比較低的預(yù)測圖。事實上,分割標(biāo)簽的分辨率是和原始輸入圖的分辨率相對應(yīng)的。

與我們處理標(biāo)準(zhǔn)分類值的方法相似,我們通過獨(dú)熱編碼類別標(biāo)簽的方法創(chuàng)建目標(biāo)——本質(zhì)上講是要為每一個可能的類創(chuàng)建一個輸出通道。

然后我們可以利用每一個像素位深向量的 argmax 函數(shù)將預(yù)測值分解為分割映射(如上圖所示)。

也可以通過將目標(biāo)重疊在輸入圖像上來對目標(biāo)進(jìn)行觀察。

建立網(wǎng)絡(luò)架構(gòu)

針對這項任務(wù)簡單地構(gòu)建神經(jīng)網(wǎng)絡(luò)架構(gòu)的方法是簡單地堆疊大量卷積層(用 same 填充保留維度)后輸出最終的分割映射。通過特征圖的接連轉(zhuǎn)換,直接從輸入圖像學(xué)到了相對應(yīng)的分割映射;然而,在整個網(wǎng)絡(luò)中要保留完整分辨率的計算成本是很高的。

回顧深度卷積網(wǎng)絡(luò),前期的卷積層更傾向于學(xué)習(xí)低級概念,而后期的卷積層則會產(chǎn)生更高級(且專一)的特征圖。為了保持表達(dá)性,一般而言,當(dāng)我們到達(dá)更深層的網(wǎng)絡(luò)時,需要增加特征圖(通道)的數(shù)量。

對圖像分類任務(wù)而言,這不一定會造成什么問題,因為對這個任務(wù)而言,我們只需要關(guān)注圖像里面有什么(而不是目標(biāo)類別對象的位置)。因此,我們可以通過池化或逐步卷積(即壓縮空間分辨率)定期對特征圖進(jìn)行下采樣以緩和計算壓力。

常用的圖像分割模型的方法遵循編碼器/解碼器結(jié)構(gòu),在這個結(jié)構(gòu)中,我們對輸入的空間分辨率下采樣,產(chǎn)生分辨率更低的特征圖,通過學(xué)習(xí)這些特征圖可以更高效地分辨類別,還可以將這些特征表征上采樣至完整分辨率的分割圖。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關(guān)推薦

    卷積神經(jīng)網(wǎng)絡(luò)如何使用

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)究竟是什么,鑒于神經(jīng)網(wǎng)絡(luò)在工程上經(jīng)歷了曲折的歷史,您為什么還會在意它呢? 對于這些非常中肯的問題,我們似乎可以給出相對簡明的答案。
    發(fā)表于 07-17 07:21

    卷積神經(jīng)網(wǎng)絡(luò)一維卷積處理過程

    。本文就以一維卷積神經(jīng)網(wǎng)絡(luò)為例談?wù)勗趺磥磉M(jìn)一步優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)使用的memory。文章(卷積神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 12-23 06:16

    卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

    神經(jīng)網(wǎng)絡(luò)已經(jīng)廣泛應(yīng)用于圖像分類、目標(biāo)檢測、語義分割以及自然語言處理等領(lǐng)域。首先分析了典型卷積
    發(fā)表于 08-02 10:39

    卷積神經(jīng)網(wǎng)絡(luò)為什么適合圖像處理

    卷積神經(jīng)網(wǎng)絡(luò)為什么適合圖像處理?
    發(fā)表于 09-08 10:23

    聚焦語義分割任務(wù),如何用卷積神經(jīng)網(wǎng)絡(luò)處理語義圖像分割

    同一對象。作者將沿著該領(lǐng)域的研究脈絡(luò),說明如何用卷積神經(jīng)網(wǎng)絡(luò)處理語義圖像
    發(fā)表于 09-17 15:21 ?571次閱讀

    分析總結(jié)基于深度神經(jīng)網(wǎng)絡(luò)圖像語義分割方法

    隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展及其在語義分割領(lǐng)域的廣泛應(yīng)用,語義分割效果得到顯著提升。對基于深度神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 03-19 14:14 ?21次下載
    分析總結(jié)基于深度<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的<b class='flag-5'>圖像</b><b class='flag-5'>語義</b><b class='flag-5'>分割</b>方法

    基于深度神經(jīng)網(wǎng)絡(luò)圖像語義分割方法

    對應(yīng)用于圖像語義分割的幾種深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行簡單介紹,接著詳細(xì)闡述了現(xiàn)有主流的基于深度神經(jīng)網(wǎng)絡(luò)圖像
    發(fā)表于 04-02 13:59 ?11次下載
    基于深度<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的<b class='flag-5'>圖像</b><b class='flag-5'>語義</b><b class='flag-5'>分割</b>方法

    卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用 卷積神經(jīng)網(wǎng)絡(luò)通常用來處理什么

    神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)廣泛用于圖像識別、自然語言處理、視頻處理等方面。本文將對
    的頭像 發(fā)表于 08-21 16:41 ?5002次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)概述 卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn) cnn卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)

    卷積神經(jīng)網(wǎng)絡(luò)概述 卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn) cnn卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)?
    的頭像 發(fā)表于 08-21 16:41 ?2999次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)如何識別圖像

    卷積神經(jīng)網(wǎng)絡(luò)如何識別圖像? 卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)由于其出色的
    的頭像 發(fā)表于 08-21 16:49 ?1945次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本原理 卷積神經(jīng)網(wǎng)絡(luò)發(fā)展 卷積神經(jīng)網(wǎng)絡(luò)三大特點(diǎn)

    中最重要的神經(jīng)網(wǎng)絡(luò)之一。它是一種由多個卷積層和池化層(也可稱為下采樣層)組成的神經(jīng)網(wǎng)絡(luò)。CNN 的基本思想是以圖像為輸入,通過網(wǎng)絡(luò)
    的頭像 發(fā)表于 08-21 16:49 ?2469次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的介紹 什么是卷積神經(jīng)網(wǎng)絡(luò)算法

    的深度學(xué)習(xí)算法。CNN模型最早被提出是為了處理圖像,其模型結(jié)構(gòu)中包含卷積層、池化層和全連接層等關(guān)鍵技術(shù),經(jīng)過多個卷積層和池化層的處理,CNN
    的頭像 發(fā)表于 08-21 16:49 ?1890次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及其功能

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。本文將詳細(xì)介紹
    的頭像 發(fā)表于 07-02 14:45 ?2298次閱讀

    cnn卷積神經(jīng)網(wǎng)絡(luò)分類有哪些

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像分類、目標(biāo)檢測、語義分割等領(lǐng)域。本文將詳細(xì)介紹CNN在分類任務(wù)中的應(yīng)用,包括基本結(jié)構(gòu)
    的頭像 發(fā)表于 07-03 09:28 ?636次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)分類方法有哪些

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像分類、目標(biāo)檢測、語義分割
    的頭像 發(fā)表于 07-03 09:40 ?479次閱讀