導(dǎo)讀
給出了目前目標(biāo)檢測中的一些問題和挑戰(zhàn)。
幾年前,在圖像中尋找并分類單個(gè)物體是一項(xiàng)極其困難的任務(wù)。今天,在計(jì)算機(jī)視覺的幫助下,數(shù)字設(shè)備可以簡單快速地識別圖像的內(nèi)容,這為不同領(lǐng)域的視覺數(shù)據(jù)理解和分析開辟了新的途徑。
現(xiàn)在的物體檢測的作用是什么?
具有目標(biāo)檢測的設(shè)備可以找到目標(biāo),在其周圍畫出矩形邊界框,并確定每個(gè)被檢測目標(biāo)的類別。目標(biāo)檢測應(yīng)用程序應(yīng)用于許多不同的行業(yè),包括零售、體育、醫(yī)療保健、營銷、室內(nèi)設(shè)計(jì)、農(nóng)業(yè)、建筑、公共安全、交通等。
使用計(jì)算機(jī)視覺目標(biāo)檢測的一個(gè)很好的例子是足球?qū)W校系統(tǒng),旨在提高訓(xùn)練分析和俱樂部內(nèi)比賽的質(zhì)量。該平臺允許用戶使用攝像頭跟蹤足球運(yùn)動員和足球在球場上的運(yùn)動,并使用收集到的數(shù)據(jù)創(chuàng)建個(gè)人訓(xùn)練計(jì)劃。
盡管在這一領(lǐng)域取得了巨大的進(jìn)展,計(jì)算機(jī)視覺的能力也很強(qiáng),但目標(biāo)檢測是一個(gè)復(fù)雜的過程,其實(shí)現(xiàn)需要經(jīng)歷一定的挑戰(zhàn)。
目標(biāo)檢測面臨的挑戰(zhàn)有哪些?
視角的多樣性
物體檢測的最大困難之一是,從不同的角度看一個(gè)物體可能看起來完全不同。例如,你可以在下面看到的蛋糕圖片各不相同,因?yàn)樗鼈儚牟煌膫?cè)面展示物體。因此,檢測器的目標(biāo)是從不同的角度來識別物體。
變形
計(jì)算機(jī)視覺分析的主題不僅是一個(gè)固體目標(biāo),而且還可以變形和改變其形狀,這為目標(biāo)檢測提供了額外的復(fù)雜性。
看看足球運(yùn)動員擺出不同姿勢的圖片。如果物體檢測器被訓(xùn)練為只發(fā)現(xiàn)站立或奔跑的人,它可能無法發(fā)現(xiàn)躺在球場上或準(zhǔn)備彎腰做動作的球員。
遮擋
有時(shí),物體會被其他東西遮擋住,這使得人們很難辨認(rèn)這些物體的標(biāo)志。例如,在下面的第一張圖片中,一個(gè)杯子被拿這個(gè)杯子的人的手蓋住了。
在第二幅圖中,一個(gè)人也拿著手機(jī),手擋住了物體。這種情況增加了確定目標(biāo)的困難。
光照條件
照明對物體的定義有很大的影響。相同的物體會因光照條件的不同而看起來不同。看看下面的圖片:照亮的空間越少,物體就越不可見。所有這些因素都會影響檢測器定義目標(biāo)的能力。
雜亂或有紋理的背景
需要識別的物體可能會融入背景中,使其難以識別。例如,下圖顯示了很多物品,在識別剪刀或其他感興趣的物品時(shí),這些物品會造成干擾。在這種情況下,目標(biāo)檢測器將遇到檢測問題。
多樣性
同一個(gè)物體可能有完全不同的形狀和大小。計(jì)算機(jī)視覺需要做大量的研究來閱讀一個(gè)物體并理解它的含義。
上面所有的圖片都描述了不同類型的房子。一個(gè)好的檢測器應(yīng)該檢測這些目標(biāo),并將它們分配給同一個(gè)類。
速度
在視頻方面,探測器需要經(jīng)過訓(xùn)練,以便在不斷變化的環(huán)境中進(jìn)行分析。這意味著目標(biāo)檢測算法不僅必須準(zhǔn)確地分類重要的目標(biāo),而且還必須在預(yù)測過程中具有令人難以置信的速度,以便能夠識別運(yùn)動中的目標(biāo)。
責(zé)任編輯:lq
-
算法
+關(guān)注
關(guān)注
23文章
4623瀏覽量
93102 -
目標(biāo)檢測
+關(guān)注
關(guān)注
0文章
210瀏覽量
15638 -
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1699瀏覽量
46050
原文標(biāo)題:計(jì)算機(jī)視覺物體檢測中所面對的挑戰(zhàn)
文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論