0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像標(biāo)注在計(jì)算機(jī)視覺中起著至關(guān)重要的作用

Dbwd_Imgtec ? 來源:AI公園 ? 作者:AI公園 ? 2021-01-08 14:17 ? 次閱讀

導(dǎo)讀

給大家介紹圖像標(biāo)注的種類,應(yīng)用場(chǎng)景,以及各種標(biāo)注的優(yōu)缺點(diǎn)。

介紹

“如果沒有數(shù)據(jù)分析,公司就會(huì)變得既盲又聾,就像高速公路上的鹿一樣在網(wǎng)絡(luò)上游蕩?!?/p>

— Geoffrey Moore

每個(gè)數(shù)據(jù)科學(xué)任務(wù)都需要數(shù)據(jù)。具體地說,是輸入系統(tǒng)的干凈易懂的數(shù)據(jù)。說到圖像,計(jì)算機(jī)需要看到人類眼睛看到的東西。

例如,人類有識(shí)別和分類物體的能力。同樣,我們可以使用計(jì)算機(jī)視覺來解釋它接收到的視覺數(shù)據(jù)。這就是圖像標(biāo)注的作用。

圖像標(biāo)注在計(jì)算機(jī)視覺中起著至關(guān)重要的作用。圖像標(biāo)注的目標(biāo)是為和任務(wù)相關(guān)的、特定于任務(wù)的標(biāo)簽。這可能包括基于文本的標(biāo)簽(類),繪制在圖像上的標(biāo)簽(即邊框),甚至是像素級(jí)的標(biāo)簽。我們將在下面探討這一系列不同的標(biāo)注技術(shù)。

人工智能需要的人工干預(yù)比我們想象的要多。為了準(zhǔn)備高精度的訓(xùn)練數(shù)據(jù),我們必須對(duì)圖像進(jìn)行標(biāo)注以得到正確的結(jié)果。數(shù)據(jù)注釋通常需要較高水平的領(lǐng)域知識(shí),只有來自特定領(lǐng)域的專家才能提供這些知識(shí)。

需要標(biāo)注的計(jì)算機(jī)視覺任務(wù):

物體檢測(cè)

線/邊緣檢測(cè)

分割

姿態(tài)預(yù)測(cè)/關(guān)鍵點(diǎn)識(shí)別

圖像分類

目標(biāo)檢測(cè)

進(jìn)行目標(biāo)檢測(cè)的技術(shù)主要有兩種,即2D和3D包圍框。 對(duì)于多邊形物體,可以使用多邊形方法。讓我們?cè)敿?xì)討論一下。

2D 包圍框

在這種方法中,只需要在被檢測(cè)的物體周圍繪制矩形框。它們用于定義對(duì)象在圖像中的位置。邊框可以由矩形左上角的x、y軸坐標(biāo)和右下角的x、y軸坐標(biāo)來確定。

優(yōu)點(diǎn)和缺點(diǎn):

標(biāo)注起來快速和容易。

不能提供重要的信息,如物體的方向,這對(duì)許多應(yīng)用來說是至關(guān)重要的。

包括不屬于物體一部分的背景像素。這可能會(huì)影響訓(xùn)練。

3D 包圍框或者立方體

類似于2D邊框,除了它們還可以顯示目標(biāo)的深度。這種標(biāo)注是通過將二維圖像平面上的邊界框向后投影到三維長(zhǎng)方體來實(shí)現(xiàn)的。它允許系統(tǒng)區(qū)分三維空間中的體積和位置等特征。

優(yōu)點(diǎn)和缺點(diǎn):

解決了物體方向的問題。

當(dāng)物體被遮擋,這種標(biāo)注可以想象包圍框的維度,這可能會(huì)影響訓(xùn)練。

這種標(biāo)注也會(huì)包括背景像素,可能會(huì)影響訓(xùn)練。

多邊形

有時(shí),必須標(biāo)記形狀不規(guī)則的物體。在這種情況下,使用多邊形。注釋時(shí)只需標(biāo)記物體的邊緣,我們就能得到要檢測(cè)的物體的完美輪廓。

優(yōu)點(diǎn)和缺點(diǎn):

多邊形標(biāo)記的主要優(yōu)點(diǎn)是它消除了背景像素,并捕獲了物體的精確尺寸。

非常耗時(shí),如果物體的形狀是復(fù)雜的,很難標(biāo)注。

注:多邊形方法也用于物體形狀的分割。我們將在下面討論分割。

數(shù)據(jù)采集是ML冷啟動(dòng)的問題。但是,即使你有了一個(gè)可行的數(shù)據(jù)集,構(gòu)建和測(cè)試模型也是需要技巧的。

線/邊緣檢測(cè)(線和樣條)

在劃分邊界時(shí),線和樣條是有用的。將區(qū)分一個(gè)區(qū)域和另一個(gè)區(qū)域的像素進(jìn)行標(biāo)注。

優(yōu)點(diǎn)和缺點(diǎn):

這種方法的優(yōu)點(diǎn)是,連線上的像素不需要都是連續(xù)的。這樣在檢測(cè)有中斷的線或部分遮擋的物體是非常有用的。

手動(dòng)標(biāo)注圖像中的線是非常累人和費(fèi)時(shí)的,特別是圖像中有很多的線的時(shí)候。

當(dāng)物體碰巧是對(duì)齊的時(shí)候,可能會(huì)給出誤導(dǎo)的結(jié)果。

姿態(tài)預(yù)測(cè) / 關(guān)鍵點(diǎn)識(shí)別

在許多計(jì)算機(jī)視覺應(yīng)用中,神經(jīng)網(wǎng)絡(luò)常常需要識(shí)別輸入圖像中重要的感興趣的點(diǎn)。我們把這些點(diǎn)稱為地標(biāo)或關(guān)鍵點(diǎn)。在這種應(yīng)用中,我們希望神經(jīng)網(wǎng)絡(luò)輸出關(guān)鍵點(diǎn)的坐標(biāo)(x, y)。

分割

圖像分割是將一幅圖像分割為多個(gè)部分的過程。圖像分割通常用于在像素級(jí)定位圖像中的物體和邊界。圖像分割方法有很多種。

語義分割:語義分割是一項(xiàng)機(jī)器學(xué)習(xí)任務(wù),它需要像素級(jí)標(biāo)注,其中圖像中的每個(gè)像素都被分配給一個(gè)類。每個(gè)像素都帶有語義意義。這主要用于環(huán)境背景非常重要的情況。

實(shí)例分割:實(shí)例分割是圖像分割的一種子類型,它在像素級(jí)別上標(biāo)識(shí)圖像中每個(gè)物體的每個(gè)實(shí)例。實(shí)例分割和語義分割是圖像分割的兩種粒度級(jí)別之一。

全景分割:全景分割結(jié)合了語義分割和實(shí)例分割,所有像素都被分配一個(gè)類標(biāo)簽,所有目標(biāo)實(shí)例都被唯一地分割。

圖像分類

圖像分類不同于目標(biāo)檢測(cè)。目標(biāo)檢測(cè)的目的是識(shí)別和定位目標(biāo),而圖像分類的目的是識(shí)別和識(shí)別特定的目標(biāo)類。這個(gè)用例的一個(gè)常見示例是對(duì)貓和狗的圖片進(jìn)行分類。標(biāo)注者必須為一只狗的圖像分配一個(gè)類標(biāo)簽“dog”,對(duì)貓的圖像分配類標(biāo)簽“cat”。

圖像標(biāo)注的用例

在本節(jié)中,我們將討論如何使用圖像標(biāo)注來幫助機(jī)器模型執(zhí)行特定行業(yè)的任務(wù):

零售:

2D邊框可以用于標(biāo)注產(chǎn)品的圖像,然后機(jī)器學(xué)習(xí)算法可以使用這些圖像來預(yù)測(cè)成本和其他屬性。圖像分類在這方面也有幫助。

醫(yī)學(xué):

多邊形可用于在醫(yī)用x射線中標(biāo)記器官,以便將它們輸入深度學(xué)習(xí)模型,以訓(xùn)練x射線中的畸形或缺陷。這是圖像標(biāo)注最重要的應(yīng)用之一,需要醫(yī)學(xué)專家具有較高的領(lǐng)域知識(shí)。

自動(dòng)駕駛汽車:

這是另一個(gè)重要的領(lǐng)域,圖像標(biāo)注可以應(yīng)用。利用語義分割對(duì)圖像中的每個(gè)像素進(jìn)行標(biāo)記,使車輛能夠感知到道路上的障礙物。這一領(lǐng)域的研究仍在進(jìn)行中。

情緒檢測(cè):

這是里程碑,可以用來檢測(cè)一個(gè)人的情緒(高興,悲傷,或自然)。這可以應(yīng)用于評(píng)估受試者對(duì)特定內(nèi)容的情緒反應(yīng)。

制造行業(yè):

線和樣條可用于標(biāo)注工廠的圖像線跟隨機(jī)器人工作。這可以幫助自動(dòng)化生產(chǎn)過程,人力勞動(dòng)可以最小化。

圖像標(biāo)注的一些挑戰(zhàn)

時(shí)間復(fù)雜度

手工標(biāo)注圖像需要很多時(shí)間,機(jī)器學(xué)習(xí)需要大量的數(shù)據(jù)集,需要大量的時(shí)間來有效地標(biāo)注這些基于圖像的數(shù)據(jù)集。

計(jì)算復(fù)雜度

機(jī)器學(xué)習(xí)需要精確標(biāo)注的數(shù)據(jù)來運(yùn)行模型。如果標(biāo)注者在給圖像做標(biāo)注的時(shí)候,注入任何一種錯(cuò)誤,都可能會(huì)影響到訓(xùn)練,所有的努力都可能付諸東流。

領(lǐng)域知識(shí)

如前所述,圖像標(biāo)注通常需要特定領(lǐng)域的高級(jí)領(lǐng)域知識(shí)。因此,我們需要知道該標(biāo)注什么的注解者,以及該領(lǐng)域的專家。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1088

    瀏覽量

    40515
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1699

    瀏覽量

    46052
  • 圖像標(biāo)注
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    2613

原文標(biāo)題:圖像標(biāo)注的基礎(chǔ)內(nèi)容介紹

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    簡(jiǎn)述計(jì)算機(jī)總線的分類

    計(jì)算機(jī)總線作為計(jì)算機(jī)系統(tǒng)連接各個(gè)功能部件的公共通信干線,其結(jié)構(gòu)和分類對(duì)于理解計(jì)算機(jī)硬件系統(tǒng)的工作原理至關(guān)重要。以下是對(duì)
    的頭像 發(fā)表于 08-26 16:23 ?2313次閱讀

    存儲(chǔ)器微型計(jì)算機(jī)系統(tǒng)作用

    存儲(chǔ)器微型計(jì)算機(jī)系統(tǒng)扮演著至關(guān)重要的角色,它是計(jì)算機(jī)存儲(chǔ)和處理數(shù)據(jù)的核心部件。以下將詳細(xì)介紹存儲(chǔ)器
    的頭像 發(fā)表于 08-22 14:25 ?2644次閱讀

    計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)

    計(jì)算機(jī)視覺作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像和視頻的信息
    的頭像 發(fā)表于 08-14 09:49 ?1067次閱讀

    邊沿觸發(fā)器計(jì)算機(jī)中的應(yīng)用

    邊沿觸發(fā)器計(jì)算機(jī)中的應(yīng)用極為廣泛,它們作為數(shù)字電路的基本單元,對(duì)于實(shí)現(xiàn)計(jì)算機(jī)內(nèi)部的時(shí)序控制、數(shù)據(jù)存儲(chǔ)與傳輸、以及復(fù)雜邏輯功能等方面起著
    的頭像 發(fā)表于 08-12 14:20 ?651次閱讀

    計(jì)算機(jī)視覺圖像融合

    許多計(jì)算機(jī)視覺應(yīng)用(例如機(jī)器人運(yùn)動(dòng)和醫(yī)學(xué)成像),需要將多個(gè)圖像的相關(guān)信息整合到單一圖像
    的頭像 發(fā)表于 08-01 08:28 ?735次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b><b class='flag-5'>中</b>的<b class='flag-5'>圖像</b>融合

    DRAM計(jì)算機(jī)中的應(yīng)用

    DRAM(Dynamic Random Access Memory,動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)計(jì)算機(jī)系統(tǒng)扮演著至關(guān)重要的角色。它是一種半導(dǎo)體存儲(chǔ)器,用于存儲(chǔ)和快速訪問數(shù)據(jù),是
    的頭像 發(fā)表于 07-24 17:04 ?1398次閱讀

    機(jī)器視覺計(jì)算機(jī)視覺有什么區(qū)別

    機(jī)器視覺計(jì)算機(jī)視覺是兩個(gè)密切相關(guān)但又有所區(qū)別的概念。 一、定義 機(jī)器視覺 機(jī)器視覺,又稱為計(jì)算機(jī)
    的頭像 發(fā)表于 07-16 10:23 ?573次閱讀

    計(jì)算機(jī)視覺圖像處理的區(qū)別和聯(lián)系

    計(jì)算機(jī)視覺圖像處理是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 1. 基本概念 1.1 計(jì)算機(jī)視覺 計(jì)算機(jī)
    的頭像 發(fā)表于 07-09 09:16 ?1393次閱讀

    計(jì)算機(jī)視覺人工智能領(lǐng)域有哪些主要應(yīng)用?

    計(jì)算機(jī)視覺是人工智能領(lǐng)域的一個(gè)重要分支,它主要研究如何讓計(jì)算機(jī)能夠像人類一樣理解和處理圖像和視頻數(shù)據(jù)。計(jì)
    的頭像 發(fā)表于 07-09 09:14 ?1526次閱讀

    計(jì)算機(jī)視覺屬于人工智能嗎

    屬于,計(jì)算機(jī)視覺是人工智能領(lǐng)域的一個(gè)重要分支。 引言 計(jì)算機(jī)視覺是一門研究如何使計(jì)算機(jī)具有
    的頭像 發(fā)表于 07-09 09:11 ?1362次閱讀

    計(jì)算機(jī)視覺怎么給圖像分類

    圖像分類是計(jì)算機(jī)視覺領(lǐng)域中的一項(xiàng)核心任務(wù),其目標(biāo)是將輸入的圖像自動(dòng)分配到預(yù)定義的類別集合。這一過程涉及
    的頭像 發(fā)表于 07-08 17:06 ?810次閱讀

    深度學(xué)習(xí)計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其中的核心技術(shù)之一,已經(jīng)計(jì)算機(jī)視覺領(lǐng)域取得了顯著的成果。計(jì)算機(jī)視覺,作為
    的頭像 發(fā)表于 07-01 11:38 ?883次閱讀

    機(jī)器視覺計(jì)算機(jī)視覺的區(qū)別

    人工智能和自動(dòng)化技術(shù)的快速發(fā)展,機(jī)器視覺(Machine Vision, MV)和計(jì)算機(jī)視覺(Computer Vision, CV)作
    的頭像 發(fā)表于 06-06 17:24 ?1379次閱讀

    計(jì)算機(jī)視覺的主要研究方向

    計(jì)算機(jī)視覺(Computer Vision, CV)作為人工智能領(lǐng)域的一個(gè)重要分支,致力于使計(jì)算機(jī)能夠像人眼一樣理解和解釋圖像和視頻
    的頭像 發(fā)表于 06-06 17:17 ?1039次閱讀

    計(jì)算機(jī)視覺的十大算法

    視覺技術(shù)的發(fā)展起到了重要的推動(dòng)作用。一、圖像分割算法圖像分割算法是計(jì)算機(jī)
    的頭像 發(fā)表于 02-19 13:26 ?1290次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>的十大算法