0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

簡述圖像檢測和圖像分割之間的區(qū)別

機(jī)器視覺自動化 ? 來源:雷鋒網(wǎng) ? 作者:雷鋒字幕組 ? 2021-04-19 09:31 ? 次閱讀

英語原文:

What is the difference between Object Detection and Image Segmentation?

翻譯:雷鋒字幕組(明明知道)

人工智能對于圖像處理有不同的任務(wù)。在本文中,我將介紹目標(biāo)檢測和圖像分割之間的區(qū)別。

在這兩個任務(wù)中,我們都希望找到圖像中某些感興趣的項目的位置。例如,我們可以有一組安全攝像頭照片,在每張照片上,我們想要識別照片中所有人的位置。

通常有兩種方法可以用于此:目標(biāo)檢測(Object Detection)和圖像分割(Image Segmentation)。

目標(biāo)檢測-預(yù)測包圍盒

當(dāng)我們說到物體檢測時,我們通常會說到邊界盒。這意味著我們的圖像處理將在我們的圖片中識別每個人周圍的矩形。

邊框通常由左上角的位置(2 個坐標(biāo))和寬度和高度(以像素為單位)定義。

來自開放圖像數(shù)據(jù)集的注釋圖像。家庭堆雪人,來自 mwvchamber。在CC BY 2.0 許可下使用的圖像。

如何理解目標(biāo)檢測

如果我們回到任務(wù):識別圖片上的所有人,則可以理解通過邊界框進(jìn)行對象檢測的邏輯。

我們首先想到的解決方案是將圖像切成小塊,然后在每個子圖像上應(yīng)用圖像分類,以區(qū)別該圖像是否是人類。對單個圖像進(jìn)行分類是一項較容易的任務(wù),并且是對象檢測的一項,因此,他們采用了這種分步方法。

當(dāng)前,YOLO模型(You Only Look Once)是解決此問題的偉大發(fā)明。YOLO模型的開發(fā)人員已經(jīng)構(gòu)建了一個神經(jīng)網(wǎng)絡(luò),該神經(jīng)網(wǎng)絡(luò)能夠立即執(zhí)行整個邊界框方法!

當(dāng)前用于目標(biāo)檢測的最佳模型

YOLO

Faster RCNN

目標(biāo)分割-預(yù)測掩模

一步一步地掃描圖像的邏輯替代方法是遠(yuǎn)離畫框,而是逐像素地注釋圖像。

如果你這樣做,你將會有一個更詳細(xì)的模型,它基本上是輸入圖像的一個轉(zhuǎn)換。

來自開放圖像數(shù)據(jù)集的注釋圖像。家庭堆雪人,來自 mwvchamber。在CC BY 2.0 許可下使用的圖像。

如何理解圖像分割

這個想法很基本:即使在掃描產(chǎn)品上的條形碼時,也可以應(yīng)用一種算法來轉(zhuǎn)換輸入信息(通過應(yīng)用各種過濾器),這樣,除了條形碼序列以外的所有信息在最終圖像中都不可見。

這是在圖像上定位條形碼的基本方法,但與在圖像分割中所發(fā)生的情況類似。

圖像分割的返回格式稱為掩碼:與原始圖像大小相同的圖像,但是對于每個像素,它只有一個布爾值來指示對象是否存在。

如果我們允許多個類別,它就會變得更加復(fù)雜:例如,它可以將一個海灘景觀分為三類:空氣、海洋和沙子。

當(dāng)下圖像分割的最佳模型

Mask RCNN

Unet

Segnet

比較總結(jié)

對象檢測

輸入是一個矩陣(輸入圖像),每個像素有 3 個值(紅、綠、藍(lán)),如果是黑色和白色,則每個像素有 1 個值

輸出是由左上角和大小定義的邊框列表

圖像分割

輸入是一個矩陣(輸入圖像),每個像素有 3 個值(紅、綠、藍(lán)),如果是黑色和白色,則每個像素有 1 個值

輸出是一個矩陣(掩模圖像),每個像素有一個包含指定類別的值

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1292

    瀏覽量

    56745
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47279

    瀏覽量

    238493

原文標(biāo)題:計算機(jī)視覺:圖像檢測和圖像分割有什么區(qū)別?

文章出處:【微信號:jiqishijue2020,微信公眾號:機(jī)器視覺自動化】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    圖像處理器與計算機(jī)視覺有什么關(guān)系和區(qū)別

    圖像處理器與計算機(jī)視覺是兩個在圖像處理領(lǐng)域緊密相連但又有所區(qū)別的概念。它們之間的關(guān)系和區(qū)別可以從多個維度進(jìn)行探討。
    的頭像 發(fā)表于 08-14 09:36 ?542次閱讀

    圖像邊緣檢測系統(tǒng)的設(shè)計流程

    圖像邊緣檢測系統(tǒng)的設(shè)計流程是一個涉及多個步驟的復(fù)雜過程,它旨在從圖像中提取出重要的結(jié)構(gòu)信息,如邊界、輪廓等。這些邊緣信息對于圖像分析、機(jī)器視覺、圖像
    的頭像 發(fā)表于 07-17 16:39 ?354次閱讀

    圖像語義分割的實用性是什么

    什么是圖像語義分割 圖像語義分割是一種將圖像中的所有像素點按照其語義類別進(jìn)行分類的任務(wù)。與傳統(tǒng)的圖像
    的頭像 發(fā)表于 07-17 09:56 ?431次閱讀

    圖像分割和語義分割區(qū)別與聯(lián)系

    、亮度等。圖像分割的目的是將圖像中感興趣的部分與背景分離,以便進(jìn)行進(jìn)一步的處理和分析。 1.1 圖像分割的類型
    的頭像 發(fā)表于 07-17 09:55 ?951次閱讀

    圖像分割與目標(biāo)檢測區(qū)別是什么

    區(qū)別。 定義 圖像分割是將圖像劃分為若干個區(qū)域或?qū)ο蟮倪^程,這些區(qū)域或?qū)ο缶哂邢嗨频膶傩?,如顏色、紋理或形狀。圖像
    的頭像 發(fā)表于 07-17 09:53 ?1335次閱讀

    目標(biāo)檢測圖像識別的區(qū)別在哪

    目標(biāo)檢測圖像識別是計算機(jī)視覺領(lǐng)域中的兩個重要研究方向,它們在實際應(yīng)用中有著廣泛的應(yīng)用,如自動駕駛、智能監(jiān)控、醫(yī)療診斷等。盡管它們在某些方面有相似之處,但它們之間存在一些關(guān)鍵的區(qū)別。
    的頭像 發(fā)表于 07-17 09:51 ?890次閱讀

    圖像檢測圖像識別的原理、方法及應(yīng)用場景

    圖像檢測圖像識別是計算機(jī)視覺領(lǐng)域的兩個重要概念,它們在許多應(yīng)用場景中發(fā)揮著關(guān)鍵作用。 1. 定義 1.1 圖像檢測
    的頭像 發(fā)表于 07-16 11:19 ?4184次閱讀

    圖像分割與語義分割中的CNN模型綜述

    圖像分割與語義分割是計算機(jī)視覺領(lǐng)域的重要任務(wù),旨在將圖像劃分為多個具有特定語義含義的區(qū)域或?qū)ο?。卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為深度學(xué)習(xí)的一種核心模型,在
    的頭像 發(fā)表于 07-09 11:51 ?902次閱讀

    機(jī)器人視覺技術(shù)中常見的圖像分割方法

    機(jī)器人視覺技術(shù)中的圖像分割方法是一個廣泛且深入的研究領(lǐng)域。圖像分割是將圖像劃分為多個區(qū)域或?qū)ο蟮倪^程,這些區(qū)域或?qū)ο缶哂心撤N共同的特征,如顏
    的頭像 發(fā)表于 07-09 09:31 ?701次閱讀

    機(jī)器人視覺技術(shù)中圖像分割方法有哪些

    機(jī)器人視覺技術(shù)是人工智能領(lǐng)域的一個重要分支,它涉及到圖像處理、模式識別、機(jī)器學(xué)習(xí)等多個學(xué)科。圖像分割是機(jī)器人視覺技術(shù)中的一個重要環(huán)節(jié),它的目標(biāo)是從一幅圖像中將目標(biāo)物體與背景分離出來,以
    的頭像 發(fā)表于 07-04 11:34 ?989次閱讀

    圖像檢測與識別技術(shù)的關(guān)系

    圖像檢測與識別技術(shù)是計算機(jī)視覺領(lǐng)域的兩個重要分支,它們在許多應(yīng)用場景中發(fā)揮著關(guān)鍵作用。本文將介紹圖像檢測與識別技術(shù)的關(guān)系,以及它們在不同領(lǐng)域的應(yīng)用。 一、
    的頭像 發(fā)表于 07-03 14:43 ?650次閱讀

    圖像檢測圖像識別的區(qū)別是什么

    圖像檢測圖像識別是計算機(jī)視覺領(lǐng)域的兩個重要研究方向,它們在許多應(yīng)用場景中都有著廣泛的應(yīng)用。盡管它們在某些方面有相似之處,但它們之間還是存在一些明顯的
    的頭像 發(fā)表于 07-03 14:41 ?1007次閱讀

    基于FPGA的實時邊緣檢測系統(tǒng)設(shè)計,Sobel圖像邊緣檢測,F(xiàn)PGA圖像處理

    摘要 :本文設(shè)計了一種 基于 FPGA 的實時邊緣檢測系統(tǒng) ,使用OV5640 攝像頭模塊獲取實時的視頻圖像數(shù)據(jù),提取圖像邊緣信息并通過 VGA顯示。FPGA 內(nèi)部使用流水線設(shè)計和 并行運算加速
    發(fā)表于 05-24 07:45

    改進(jìn)棉花根系圖像分割方法

    棉花是錦葵科棉屬植物,棉花生產(chǎn)的纖維是我國各類衣服、家具布和工業(yè)用布的材料,目前我國的棉花產(chǎn)量也非常高,主要以新疆地區(qū)為主。根系是植物組成的重要部分,其生長發(fā)育至關(guān)重要。 根系圖像分割是根系表型分析
    的頭像 發(fā)表于 01-18 16:18 ?303次閱讀

    機(jī)器視覺的圖像目標(biāo)識別方法操作要點

    通過加強圖像分割,能夠提高機(jī)器視覺的圖像目標(biāo)識別的自動化水平,使得圖像目標(biāo)識別效果更加顯著。圖像分割
    發(fā)表于 01-15 12:17 ?438次閱讀