0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計(jì)算機(jī)視覺物體檢測中所面對的挑戰(zhàn)

新機(jī)器視覺 ? 來源:AI公園 ? 作者:AI公園 ? 2021-05-11 09:43 ? 次閱讀


導(dǎo)讀

給出了目前目標(biāo)檢測中的一些問題和挑戰(zhàn)。

幾年前,在圖像中尋找并分類單個(gè)物體是一項(xiàng)極其困難的任務(wù)。今天,在計(jì)算機(jī)視覺的幫助下,數(shù)字設(shè)備可以簡單快速地識別圖像的內(nèi)容,這為不同領(lǐng)域的視覺數(shù)據(jù)理解和分析開辟了新的途徑。

現(xiàn)在的物體檢測的作用是什么?

具有目標(biāo)檢測的設(shè)備可以找到目標(biāo),在其周圍畫出矩形邊界框,并確定每個(gè)被檢測目標(biāo)的類別。目標(biāo)檢測應(yīng)用程序應(yīng)用于許多不同的行業(yè),包括零售、體育、醫(yī)療保健、營銷、室內(nèi)設(shè)計(jì)、農(nóng)業(yè)、建筑、公共安全、交通等。

使用計(jì)算機(jī)視覺目標(biāo)檢測的一個(gè)很好的例子是足球?qū)W校系統(tǒng),旨在提高訓(xùn)練分析和俱樂部內(nèi)比賽的質(zhì)量。該平臺允許用戶使用攝像頭跟蹤足球運(yùn)動員和足球在球場上的運(yùn)動,并使用收集到的數(shù)據(jù)創(chuàng)建個(gè)人訓(xùn)練計(jì)劃。

盡管在這一領(lǐng)域取得了巨大的進(jìn)展,計(jì)算機(jī)視覺的能力也很強(qiáng),但目標(biāo)檢測是一個(gè)復(fù)雜的過程,其實(shí)現(xiàn)需要經(jīng)歷一定的挑戰(zhàn)。

目標(biāo)檢測面臨的挑戰(zhàn)有哪些?

視角的多樣性

物體檢測的最大困難之一是,從不同的角度看一個(gè)物體可能看起來完全不同。例如,你可以在下面看到的蛋糕圖片各不相同,因?yàn)樗鼈儚牟煌膫?cè)面展示物體。因此,檢測器的目標(biāo)是從不同的角度來識別物體。

變形

計(jì)算機(jī)視覺分析的主題不僅是一個(gè)固體目標(biāo),而且還可以變形和改變其形狀,這為目標(biāo)檢測提供了額外的復(fù)雜性。

看看足球運(yùn)動員擺出不同姿勢的圖片。如果物體檢測器被訓(xùn)練為只發(fā)現(xiàn)站立或奔跑的人,它可能無法發(fā)現(xiàn)躺在球場上或準(zhǔn)備彎腰做動作的球員。

遮擋

有時(shí),物體會被其他東西遮擋住,這使得人們很難辨認(rèn)這些物體的標(biāo)志。例如,在下面的第一張圖片中,一個(gè)杯子被拿這個(gè)杯子的人的手蓋住了。

在第二幅圖中,一個(gè)人也拿著手機(jī),手擋住了物體。這種情況增加了確定目標(biāo)的困難。

光照條件

照明對物體的定義有很大的影響。相同的物體會因光照條件的不同而看起來不同。看看下面的圖片:照亮的空間越少,物體就越不可見。所有這些因素都會影響檢測器定義目標(biāo)的能力。

雜亂或有紋理的背景

需要識別的物體可能會融入背景中,使其難以識別。例如,下圖顯示了很多物品,在識別剪刀或其他感興趣的物品時(shí),這些物品會造成干擾。在這種情況下,目標(biāo)檢測器將遇到檢測問題。

多樣性

同一個(gè)物體可能有完全不同的形狀和大小。計(jì)算機(jī)視覺需要做大量的研究來閱讀一個(gè)物體并理解它的含義。

上面所有的圖片都描述了不同類型的房子。一個(gè)好的檢測器應(yīng)該檢測這些目標(biāo),并將它們分配給同一個(gè)類。

速度

視頻方面,探測器需要經(jīng)過訓(xùn)練,以便在不斷變化的環(huán)境中進(jìn)行分析。這意味著目標(biāo)檢測算法不僅必須準(zhǔn)確地分類重要的目標(biāo),而且還必須在預(yù)測過程中具有令人難以置信的速度,以便能夠識別運(yùn)動中的目標(biāo)。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4623

    瀏覽量

    93102
  • 目標(biāo)檢測
    +關(guān)注

    關(guān)注

    0

    文章

    210

    瀏覽量

    15638
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1699

    瀏覽量

    46050

原文標(biāo)題:計(jì)算機(jī)視覺物體檢測中所面對的挑戰(zhàn)

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)

    計(jì)算機(jī)視覺作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動了多個(gè)行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時(shí)也伴隨著一些挑戰(zhàn)和局限
    的頭像 發(fā)表于 08-14 09:49 ?1053次閱讀

    機(jī)器視覺計(jì)算機(jī)視覺有什么區(qū)別

    機(jī)器視覺計(jì)算機(jī)視覺是兩個(gè)密切相關(guān)但又有所區(qū)別的概念。 一、定義 機(jī)器視覺 機(jī)器視覺,又稱為計(jì)算機(jī)
    的頭像 發(fā)表于 07-16 10:23 ?572次閱讀

    計(jì)算機(jī)視覺的五大技術(shù)

    計(jì)算機(jī)視覺作為深度學(xué)習(xí)領(lǐng)域最熱門的研究方向之一,其技術(shù)涵蓋了多個(gè)方面,為人工智能的發(fā)展開拓了廣闊的道路。以下是對計(jì)算機(jī)視覺五大技術(shù)的詳細(xì)解析,包括圖像分類、對象
    的頭像 發(fā)表于 07-10 18:26 ?1460次閱讀

    計(jì)算機(jī)視覺的工作原理和應(yīng)用

    計(jì)算機(jī)視覺(Computer Vision,簡稱CV)是一門跨學(xué)科的研究領(lǐng)域,它利用計(jì)算機(jī)和數(shù)學(xué)算法來模擬人類視覺系統(tǒng)對圖像和視頻進(jìn)行識別、理解、分析和處理。其核心目標(biāo)在于使
    的頭像 發(fā)表于 07-10 18:24 ?2151次閱讀

    計(jì)算機(jī)視覺與人工智能的關(guān)系是什么

    引言 計(jì)算機(jī)視覺是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識別、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域的知識。人工智能則是研究如何使計(jì)算
    的頭像 發(fā)表于 07-09 09:25 ?704次閱讀

    計(jì)算機(jī)視覺與智能感知是干嘛的

    引言 計(jì)算機(jī)視覺(Computer Vision)是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識別、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域,是人工智能的重要組成部分。智能
    的頭像 發(fā)表于 07-09 09:23 ?996次閱讀

    計(jì)算機(jī)視覺和機(jī)器視覺區(qū)別在哪

    ,旨在實(shí)現(xiàn)對圖像和視頻的自動分析和理解。 機(jī)器視覺 機(jī)器視覺計(jì)算機(jī)視覺的一個(gè)分支,主要應(yīng)用于工業(yè)自動化領(lǐng)域。它利用計(jì)算機(jī)和圖像處理技術(shù),實(shí)
    的頭像 發(fā)表于 07-09 09:22 ?486次閱讀

    計(jì)算機(jī)視覺和圖像處理的區(qū)別和聯(lián)系

    計(jì)算機(jī)視覺和圖像處理是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 1. 基本概念 1.1 計(jì)算機(jī)視覺 計(jì)算機(jī)視覺
    的頭像 發(fā)表于 07-09 09:16 ?1391次閱讀

    計(jì)算機(jī)視覺在人工智能領(lǐng)域有哪些主要應(yīng)用?

    與分類是計(jì)算機(jī)視覺的基礎(chǔ)應(yīng)用之一。通過訓(xùn)練機(jī)器學(xué)習(xí)模型,計(jì)算機(jī)可以識別和分類各種圖像,如動物、植物、物體等。這種技術(shù)在許多領(lǐng)域都有應(yīng)用,如搜索引擎、社交媒體、醫(yī)療診斷等。 1.1 圖像
    的頭像 發(fā)表于 07-09 09:14 ?1520次閱讀

    計(jì)算機(jī)視覺屬于人工智能嗎

    屬于,計(jì)算機(jī)視覺是人工智能領(lǐng)域的一個(gè)重要分支。 引言 計(jì)算機(jī)視覺是一門研究如何使計(jì)算機(jī)具有視覺
    的頭像 發(fā)表于 07-09 09:11 ?1360次閱讀

    深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用

    深度學(xué)習(xí)技術(shù)的引入,極大地推動了計(jì)算機(jī)視覺領(lǐng)域的發(fā)展,使其能夠處理更加復(fù)雜和多樣化的視覺任務(wù)。本文將詳細(xì)介紹深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用,
    的頭像 發(fā)表于 07-01 11:38 ?878次閱讀

    機(jī)器視覺計(jì)算機(jī)視覺的區(qū)別

    在人工智能和自動化技術(shù)的快速發(fā)展中,機(jī)器視覺(Machine Vision, MV)和計(jì)算機(jī)視覺(Computer Vision, CV)作為兩個(gè)重要的分支領(lǐng)域,都扮演著至關(guān)重要的角色。盡管它們在
    的頭像 發(fā)表于 06-06 17:24 ?1375次閱讀

    計(jì)算機(jī)視覺的主要研究方向

    計(jì)算機(jī)視覺(Computer Vision, CV)作為人工智能領(lǐng)域的一個(gè)重要分支,致力于使計(jì)算機(jī)能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學(xué)習(xí)、大數(shù)據(jù)等技術(shù)的快速發(fā)展,計(jì)算機(jī)
    的頭像 發(fā)表于 06-06 17:17 ?1030次閱讀

    計(jì)算機(jī)視覺的十大算法

    隨著科技的不斷發(fā)展,計(jì)算機(jī)視覺領(lǐng)域也取得了長足的進(jìn)步。本文將介紹計(jì)算機(jī)視覺領(lǐng)域的十大算法,包括它們的基本原理、應(yīng)用場景和優(yōu)缺點(diǎn)。這些算法在圖像處理、目標(biāo)
    的頭像 發(fā)表于 02-19 13:26 ?1282次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>的十大算法

    工業(yè)視覺計(jì)算機(jī)視覺的區(qū)別

    工業(yè)視覺主要解決以往需要人眼進(jìn)行的工件的定位、測量、檢測等重復(fù)性勞動;計(jì)算機(jī)視覺的主要任務(wù)是賦予智能機(jī)器人視覺,利用測距、
    發(fā)表于 01-16 10:06 ?629次閱讀
    工業(yè)<b class='flag-5'>視覺</b>與<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>的區(qū)別