0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是圖像分割?圖像分割的體系結(jié)構(gòu)和方法

INDEMIND ? 來源:INDEMIND ? 2023-08-18 10:34 ? 次閱讀

圖像分割(Image Segmentation)是計(jì)算機(jī)視覺領(lǐng)域中的一項(xiàng)重要基礎(chǔ)技術(shù),是圖像理解中的重要一環(huán)。前端時(shí)間,數(shù)據(jù)科學(xué)家Derrick Mwiti在一篇文章中,就什么是圖像分割、圖像分割架構(gòu)、圖像分割損失函數(shù)以及圖像分割工具和框架等問題進(jìn)行了討論,讓我們一探究竟吧。

01 什么是圖像分割?

顧名思義,這是將一個(gè)圖像分割成多個(gè)片段的過程。在這個(gè)過程中,圖像中的每個(gè)像素都與一個(gè)對(duì)象類型相關(guān)聯(lián)。圖像分割主要有兩種類型:語義分割和實(shí)例分割。

在語義分割中,同一類型的所有對(duì)象都使用一個(gè)類標(biāo)簽進(jìn)行標(biāo)記,而在實(shí)例分割中,相似的對(duì)象使用各自獨(dú)立的標(biāo)簽。

02 圖像分割的體系結(jié)構(gòu)

圖像分割的基本結(jié)構(gòu)包括編碼器和解碼器。

編碼器通過過濾器從圖像中提取特征。解碼器負(fù)責(zé)生成最終的輸出,通常是一個(gè)包含對(duì)象輪廓的分割掩碼。大多數(shù)體系結(jié)構(gòu)都有這種結(jié)構(gòu)或其變體,看幾個(gè)例子:

U-Net

U-Net是最初用于分割生物醫(yī)學(xué)圖像的卷積神經(jīng)網(wǎng)絡(luò)。可視化時(shí),其架構(gòu)看起來像字母U,因此名稱為U-Net。

它的體系結(jié)構(gòu)由兩部分組成,左邊部分是收縮路徑,右邊部分是擴(kuò)展路徑。收縮路徑的目的是捕獲上下文,而擴(kuò)展路徑的作用是幫助精確定位。

7abfd2a6-3cde-11ee-ac96-dac502259ad0.jpg

U-Net由右邊的擴(kuò)展路徑和左邊的收縮路徑組成。收縮路徑由兩個(gè)3×3的卷積組成,卷積之后是一個(gè)整流的線性單元和一個(gè)用于降采樣的兩乘二最大池計(jì)算。

FastFCN —Fast Fully-connected network

在這種結(jié)構(gòu)中,聯(lián)合金字塔上采樣(JPU)模塊被用來代替擴(kuò)展卷積,因?yàn)樗鼈兿拇罅康膬?nèi)存和時(shí)間。它的核心是一個(gè)全連接網(wǎng)絡(luò),同時(shí)使用JPU進(jìn)行上采樣。JPU將低分辨率特征圖提升為高分辨率特征圖。

Gated-SCNN

該架構(gòu)由雙流CNN架構(gòu)組成。在此模型中,一個(gè)單獨(dú)的分支用于處理圖像形狀信息。形狀流用于處理邊界信息。

你可以通過檢查這里的代碼來實(shí)現(xiàn)

DeepLab

在這種結(jié)構(gòu)中,卷積與上采樣濾波器用于涉及密集預(yù)測(cè)的任務(wù)。多個(gè)對(duì)象的分割是通過空間金字塔池來完成的。最后,用DCNNs改進(jìn)對(duì)象邊界的定位。通過插入零點(diǎn)或?qū)斎胩卣鲌D進(jìn)行稀疏采樣來對(duì)濾波器進(jìn)行上采樣,從而實(shí)現(xiàn)空洞卷積。

可以在PyTorch或TensorFlow上嘗試其實(shí)現(xiàn)。

Mask R-CNN

在這種體系結(jié)構(gòu)中,使用bounding box和語義分割對(duì)對(duì)象進(jìn)行分類和定位,并將每個(gè)像素分類為一組類別。每個(gè)感興趣的區(qū)域都有一個(gè)分割掩碼,最終的輸出是一個(gè)類標(biāo)簽和一個(gè)bounding box。該體系結(jié)構(gòu)是Faster R-CNN的擴(kuò)展,F(xiàn)aster R-CNN由提出區(qū)域的深度卷積網(wǎng)絡(luò)和利用區(qū)域的檢測(cè)器組成。

這是在COCO測(cè)試集上得到的結(jié)果的圖像

03 圖像分割損失函數(shù)

語義分割模型在訓(xùn)練過程中通常使用一個(gè)簡(jiǎn)單的交叉熵?fù)p失函數(shù)。但是,如果對(duì)獲取圖像的粒度信息感興趣,則必須恢復(fù)到稍微高級(jí)一些的損失函數(shù),來看幾個(gè)例子:

Focal Loss

這種損失是對(duì)標(biāo)準(zhǔn)交叉熵準(zhǔn)則的改進(jìn)。這是通過改變其形狀來實(shí)現(xiàn)的,使得分配給分類良好的示例的損失權(quán)重降低了。最終,確保不存在類不平衡。

在這個(gè)損失函數(shù)中,交叉熵?fù)p失是會(huì)隨著縮放系數(shù)衰減為零而縮,訓(xùn)練時(shí),比例因數(shù)自動(dòng)降低了簡(jiǎn)單示例的權(quán)重,并將重點(diǎn)放在困難示例上。

7b7bfdc8-3cde-11ee-ac96-dac502259ad0.png

Dice loss

該損失是通過計(jì)算平滑dice coefficient函數(shù)獲得的。這種損失是最常用的損失,是分割

問題。

7b98513a-3cde-11ee-ac96-dac502259ad0.png

Intersection over Union (IoU)-balanced Loss

IoU平衡分類損失的目的是增加高IoU樣本的梯度,降低低IoU樣本的梯度。從而提高了機(jī)器學(xué)習(xí)模型的定位精度。

7bb0f37a-3cde-11ee-ac96-dac502259ad0.png

Boundary loss

Boundary loss的一種變體應(yīng)用于具有高度不平衡分段的任務(wù)。

這種損失的形式是空間輪廓而非區(qū)域上的距離度量。通過這種方式,它解決了高度不平衡的分割任務(wù)的區(qū)域損失所帶來的問題。

7bd48fce-3cde-11ee-ac96-dac502259ad0.png

Weighted cross-entropy

在交叉熵的一個(gè)變體中,所有正例均按一定系數(shù)加權(quán)。它用于涉及類不平衡的方案。

7bea244c-3cde-11ee-ac96-dac502259ad0.png

Lovász-Softmaxloss

該損失基于子模塊損失的convex Lovasz擴(kuò)展,對(duì)神經(jīng)網(wǎng)絡(luò)中的intersection-over-union loss進(jìn)行了直接優(yōu)化。

7c05f906-3cde-11ee-ac96-dac502259ad0.png

其他值得一提的損失有:

TopK loss:其目標(biāo)是確保網(wǎng)絡(luò)在訓(xùn)練過程中專注于困難樣本。

Distance penalized CE loss:它將網(wǎng)絡(luò)引向難以分割的邊界區(qū)域。

Sensitivity-Specificity (SS) loss:計(jì)算特異性和敏感性的均方差的加權(quán)和。

Hausdorff distance(HD) loss:可從卷積神經(jīng)網(wǎng)絡(luò)估計(jì)Hausdorff距離。

這些是在圖像分割中使用的一些損失函數(shù)。了解更多,請(qǐng)查看

04 圖像分割的數(shù)據(jù)集

Common Objects in COntext—Coco Dataset

COCO是一個(gè)大型的對(duì)象檢測(cè)、分割和字幕數(shù)據(jù)集。數(shù)據(jù)集包含91個(gè)類。它有25萬人,都有自己的關(guān)鍵點(diǎn)。它的下載大小是37.57 GiB。它包含80個(gè)對(duì)象類別。它在Apache 2.0的許可下可用,可以從這里下載。

PASCAL Visual Object Classes (PASCAL VOC)

PASCAL有20個(gè)不同的類,9963張圖片。訓(xùn)練/驗(yàn)證集是一個(gè)2GB的tar文件。數(shù)據(jù)集可以從官方網(wǎng)站下載。

The Cityscapes Dataset

這個(gè)數(shù)據(jù)集包含城市場(chǎng)景的圖像。該方法可用于評(píng)價(jià)視覺算法在城市場(chǎng)景中的性能。數(shù)據(jù)集可以從這里下載。

The Cambridge-driving Labeled Video Database?—?CamVid

這是一個(gè)基于動(dòng)作的分割和識(shí)別數(shù)據(jù)集。它包含32個(gè)語義類。以下鏈接包含數(shù)據(jù)集的進(jìn)一步說明和下載鏈接。

05 圖像分割框架

如果準(zhǔn)備好了數(shù)據(jù)集,那么來談?wù)勔恍┛捎糜谌腴T的工具/框架。

FastAI庫:給定一個(gè)圖像,該庫能夠?yàn)閳D像中的對(duì)象創(chuàng)建掩碼。

Sefexa圖像分割工具:可用于半自動(dòng)圖像分割,圖像分析和創(chuàng)建地面實(shí)況。

Deepmask:Facebook Research的Deepmask是DeepMask和SharpMask的Torch實(shí)現(xiàn)。

MultiPath:這是一個(gè)Torch實(shí)現(xiàn),從“用于目標(biāo)檢測(cè)的多路徑網(wǎng)絡(luò)”中提取目標(biāo)檢測(cè)網(wǎng)絡(luò)。

OpenCV :這是一個(gè)開放源代碼的計(jì)算機(jī)視覺庫,具有2500多種優(yōu)化算法。

MIScnn:醫(yī)學(xué)圖像分割開源庫。它允許在幾行代碼中使用最新的卷積神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)模型建立管道。

Fritz:提供了多種計(jì)算機(jī)視覺工具,包括用于移動(dòng)設(shè)備的圖像分割工具。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1163

    瀏覽量

    41704
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3775

    瀏覽量

    137167
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7631

    瀏覽量

    90192
  • 圖像分割
    +關(guān)注

    關(guān)注

    4

    文章

    182

    瀏覽量

    18256
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4371

    瀏覽量

    64207

原文標(biāo)題:干貨丨沒有想的那么難,10分鐘了解圖像分割方法及原理

文章出處:【微信號(hào):gh_c87a2bc99401,微信公眾號(hào):INDEMIND】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于改進(jìn)遺傳算法的圖像分割方法

    基于改進(jìn)遺傳算法的圖像分割方法提出一種應(yīng)用于圖像分割的改進(jìn)遺傳算法,算法中引入了優(yōu)生算子、改進(jìn)的變異算子和新個(gè)體,避免了局部早熟,提高了收斂
    發(fā)表于 09-19 09:36

    基于區(qū)域的區(qū)域生長(zhǎng)圖像分割方法

    基于區(qū)域的區(qū)域生長(zhǎng)圖像分割方法,提供給從事圖像分割的朋友們 -based on the growth of the regional ima
    發(fā)表于 02-10 10:19 ?112次下載

    PCB缺陷檢測(cè)中圖像分割算法

    圖像分割圖像處理中占有重要的地位,分割結(jié)果的好壞直接影響圖像的后續(xù)處理。本文介紹了4種常用的圖像
    發(fā)表于 06-16 15:31 ?0次下載
    PCB缺陷檢測(cè)中<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>算法

    圖像分割—基于圖的圖像分割

    圖像分割—基于圖的圖像分割圖像分割—基于圖的圖像
    發(fā)表于 11-19 16:17 ?0次下載

    基于Matlab圖像分割的研究

    圖像分割圖像處理過渡到圖像分析這個(gè)過程中起著非常重要的作用,它是圖像工程的核心,圖像
    發(fā)表于 01-04 15:10 ?0次下載

    圖像分割方法的研究現(xiàn)狀與展望

    立體視覺的應(yīng)用越來越廣泛,立體視覺需要用到圖像分割方法,這個(gè)論文是有關(guān)圖像分割的研究現(xiàn)狀與展望
    發(fā)表于 05-20 16:50 ?0次下載

    基于紋理幾何結(jié)構(gòu)的紋理描述圖像分割

    。利用一種基于紋理幾何結(jié)構(gòu)的紋理描述符描述圖像中不同的紋理區(qū)域,使得不同紋理區(qū)域?qū)Ρ雀用黠@,相同紋理區(qū)域更加平滑,通過抑制紋理信息使后續(xù)的圖像分割在紋理部分的錯(cuò)分大大減少。實(shí)驗(yàn)結(jié)果表
    發(fā)表于 11-22 17:29 ?0次下載
    基于紋理幾何<b class='flag-5'>結(jié)構(gòu)</b>的紋理描述<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>

    圖像分割基礎(chǔ)算法及實(shí)現(xiàn)實(shí)例

    圖像分割就是把圖像分成若干個(gè)特定的、具有獨(dú)特性質(zhì)的區(qū)域并提出感興趣目標(biāo)的技術(shù)和過程。它是由圖像處理到圖像分析的關(guān)鍵步驟?,F(xiàn)有的
    發(fā)表于 12-18 18:19 ?9521次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>分割</b>基礎(chǔ)算法及實(shí)現(xiàn)實(shí)例

    圖像分割評(píng)價(jià)方法研究

     閥值分割法是一種傳統(tǒng)的圖像分割方法,因其實(shí)現(xiàn)簡(jiǎn)單、計(jì)算量小、性能較穩(wěn)定而成為圖像分割中最基本和
    發(fā)表于 12-19 09:13 ?3.1w次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>分割</b>評(píng)價(jià)<b class='flag-5'>方法</b>研究

    圖像分割圖像邊緣檢測(cè)

     圖像分割的研究多年來一直受到人們的高度重視,至今提出了各種類型的分割算法。Pal把圖像分割算法分成了6類:閾值
    發(fā)表于 12-19 09:29 ?1.1w次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>分割</b>和<b class='flag-5'>圖像</b>邊緣檢測(cè)

    圖像分割技術(shù)的原理及應(yīng)用

    圖像分割至今尚無通用的自身理論。隨著各學(xué)科許多新理論和新方法的提出,出現(xiàn)了許多與一些特定理論、方法相結(jié)合的圖像
    發(fā)表于 12-19 15:00 ?4.1w次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>分割</b>技術(shù)的原理及應(yīng)用

    圖像分割的基本方法解析

    本文詳細(xì)介紹了圖像分割的基本方法有:基于邊緣的圖像分割方法、閾值
    發(fā)表于 12-20 11:06 ?11w次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>分割</b>的基本<b class='flag-5'>方法</b>解析

    基于內(nèi)容的圖像分割方法綜述

    方法、基于像素聚類的方法和語義分割方法這3種類型并分別加以介紹對(duì)每類方法所包含的典型算法,尤其是最近幾年利用深度網(wǎng)絡(luò)技術(shù)的語義
    發(fā)表于 01-02 16:52 ?2次下載
    基于內(nèi)容的<b class='flag-5'>圖像</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>綜述

    機(jī)器視覺圖像分割方法有哪些?

    現(xiàn)有的圖像分割方法主要分以下幾類:基于閾值(threshold)的分割方法、基于區(qū)域的分割
    發(fā)表于 11-02 10:26 ?1898次閱讀
    機(jī)器視覺<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>的<b class='flag-5'>方法</b>有哪些?

    圖像分割和語義分割的區(qū)別與聯(lián)系

    圖像分割和語義分割是計(jì)算機(jī)視覺領(lǐng)域中兩個(gè)重要的概念,它們?cè)?b class='flag-5'>圖像處理和分析中發(fā)揮著關(guān)鍵作用。 1. 圖像
    的頭像 發(fā)表于 07-17 09:55 ?1735次閱讀

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品