0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

多目標(biāo)跟蹤:監(jiān)控領(lǐng)域里你必須要了解的算法

電子設(shè)計(jì) ? 來(lái)源:電子設(shè)計(jì) ? 作者:電子設(shè)計(jì) ? 2020-12-14 23:04 ? 次閱讀

首發(fā):AI公園公眾號(hào)
作者:Deval Shah
編譯:ronghuaiyang

導(dǎo)讀

對(duì)監(jiān)控領(lǐng)域的目標(biāo)跟蹤方法以及面臨的挑戰(zhàn)進(jìn)行了一個(gè)介紹,是一個(gè)很好的了解目標(biāo)跟蹤領(lǐng)域的“是什么”和“為什么”問(wèn)題的文章。、

在我們深入到目標(biāo)跟蹤的世界之前,我們必須理解監(jiān)控世界的“為什么”和“是什么”。全球各國(guó)都安裝了數(shù)百萬(wàn)個(gè)攝像頭,但幾乎沒(méi)有人監(jiān)控它們。人與攝像機(jī)的比例很小。

由于深度學(xué)習(xí)技術(shù)在監(jiān)控領(lǐng)域的廣泛應(yīng)用,智能軟件在過(guò)去十年中接管了監(jiān)控領(lǐng)域。復(fù)雜的問(wèn)題,如人員跟蹤,交通密度估計(jì),盜竊保護(hù)等,已經(jīng)被世界各地的杰出研究人員解決了,并顯示了巨大的前景。

本文將向你介紹智能監(jiān)控中最重要的主題之一 —— 目標(biāo)跟蹤。

介紹

目標(biāo)跟蹤是指根據(jù)之前的信息估計(jì)場(chǎng)景中目標(biāo)物體的狀態(tài)。

在high level的抽象中,主要有兩個(gè)層次的物體跟蹤。

單目標(biāo)跟蹤(SOT)

多目標(biāo)跟蹤(MOT)

目標(biāo)跟蹤不局限于二維序列數(shù)據(jù),可以應(yīng)用于三維領(lǐng)域。

在本文中,我們將深入研究目標(biāo)跟蹤范式的一個(gè)子領(lǐng)域,即使用深度學(xué)習(xí)的二維視頻序列中的多目標(biāo)跟蹤(MOT)。

深度神經(jīng)網(wǎng)絡(luò)(DNN)的強(qiáng)大之處在于它們能夠?qū)W習(xí)豐富的表示,并從輸入中提取復(fù)雜和抽象的特征。

多目標(biāo)跟蹤(MOT),也稱為多目標(biāo)跟蹤(MTT),是一種計(jì)算機(jī)視覺(jué)任務(wù),旨在分析視頻,以識(shí)別和跟蹤屬于一個(gè)或多個(gè)類別的對(duì)象,如行人,汽車,動(dòng)物和無(wú)生命的物體,沒(méi)有任何先驗(yàn)的目標(biāo)外觀和目標(biāo)數(shù)量。

在單目標(biāo)跟蹤中,目標(biāo)的出現(xiàn)是預(yù)先知道的,而在多目標(biāo)跟蹤中,需要一個(gè)檢測(cè)步驟來(lái)識(shí)別出進(jìn)入或離開場(chǎng)景的目標(biāo)。同時(shí)跟蹤多個(gè)目標(biāo)的主要困難來(lái)自于各種各樣的遮擋以及物體之間的相互重疊,有時(shí)物體間也會(huì)有相似的外觀。因此,僅僅使用SOT模型直接解決MOT問(wèn)題,往往會(huì)導(dǎo)致較差的結(jié)果,往往會(huì)導(dǎo)致目標(biāo)漂移和大量的ID切換錯(cuò)誤,因?yàn)榇祟惸P屯y以區(qū)分外觀相似的類內(nèi)物體。

近年來(lái),由于深度學(xué)習(xí)方法的研究呈指數(shù)級(jí)增長(zhǎng),檢測(cè)和跟蹤方法在準(zhǔn)確性和性能方面取得了巨大的進(jìn)步。

大多數(shù)先進(jìn)的跟蹤方法遵循“檢測(cè)跟蹤”的方案,他們首先在場(chǎng)景中找到對(duì)象,然后找到對(duì)象對(duì)應(yīng)的tracklets(它在下一幀的位置)。

如今,這種探測(cè)器的性能異常出色,能夠適應(yīng)不同的場(chǎng)景。因此,它定義了跟蹤算法的標(biāo)準(zhǔn)輸入。

還有其他的方法,比如Lucas Kanade的光流,基于排序的跟蹤等,它們?cè)趥鹘y(tǒng)的計(jì)算機(jī)視覺(jué)方法的基礎(chǔ)上表現(xiàn)也都很出色。

挑戰(zhàn)

在解決目標(biāo)跟蹤問(wèn)題時(shí),會(huì)出現(xiàn)一些問(wèn)題,這些問(wèn)題會(huì)導(dǎo)致糟糕的結(jié)果。多年來(lái),算法試圖解決這些問(wèn)題,但到目前為止,我們還沒(méi)有找到一個(gè)被充分證明的解決辦法,這仍然是一個(gè)開放的研究領(lǐng)域。

由于幾何變化導(dǎo)致的多樣性,如:姿態(tài),關(guān)節(jié),物體的尺度

由于光學(xué)因素的差異。例如:照明、外觀

非線性運(yùn)動(dòng)

有限的分辨率,如從低端手機(jī)采集的視頻

場(chǎng)景中有相似的物體,例如:相同顏色的衣服,配飾等

高度擁擠的場(chǎng)景,如街道,音樂(lè)會(huì),體育館,市場(chǎng)。

跟蹤起始和終止。在開始任何跟蹤算法之前,你需要想要跟蹤的物體的先驗(yàn)信息。但是并不是一定可以使用目標(biāo)對(duì)象初始化算法。

跟蹤軌跡可能由于運(yùn)動(dòng)的突然變化導(dǎo)致合并和切換,比如相機(jī)成像質(zhì)量的急劇變化等。

由于相似的特征,如相似的衣服,面部結(jié)構(gòu),眼鏡,膚色,身高等,目標(biāo)物體的ID可能被切換。

目標(biāo)模型更新錯(cuò)誤導(dǎo)致漂移。一次錯(cuò)誤的更新可能會(huì)導(dǎo)致在錯(cuò)誤的方向上持續(xù)的更新,從而在整個(gè)視頻中遺忘掉正確的目標(biāo)。

綜述文章

現(xiàn)在你已經(jīng)了解了這個(gè)問(wèn)題的廣泛性,讓我們深入研究對(duì)象跟蹤領(lǐng)域中一些最令人興奮的研究工作。

在目標(biāo)跟蹤領(lǐng)域領(lǐng)先的研究方法的篩選標(biāo)準(zhǔn)是基于5關(guān)鍵指標(biāo):

主要會(huì)議(如:CVPR, NeurIPS, ICCV, ICML, ECCV等)

基準(zhǔn)測(cè)試結(jié)果(例如,MOT, Kitti, VOT, CVPR19挑戰(zhàn))

支持論文結(jié)果的公開代碼(由作者/第三方提供)。

引用

新的想法

有太多令人興奮的研究工作。但是,如果作者不能提供代碼(可能是由于一些原因)來(lái)重現(xiàn)論文中的結(jié)果,那么我們不得不對(duì)文檔中提到的結(jié)果持保留態(tài)度。

我們已經(jīng)提到了與2D MOT相關(guān)的論文,但有些想法也可以外推到3D版本。

—END—

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    淺談多目標(biāo)優(yōu)化約束條件下充電設(shè)施有序充電控制策略

    隨著電動(dòng)汽車的普及,充電設(shè)施的需求日益增長(zhǎng),如何在多目標(biāo)優(yōu)化約束下實(shí)現(xiàn)充電設(shè)施的有序充電成為亟待解決的問(wèn)題。新能源汽車的快速發(fā)展為清潔能源和可持續(xù)交通帶來(lái)了新機(jī)遇,但也引出了許多問(wèn)題。其中,充電設(shè)施的有序充電控制策略在多目標(biāo)優(yōu)化約束條件下顯得尤為重要。
    的頭像 發(fā)表于 01-07 13:17 ?119次閱讀
    淺談<b class='flag-5'>多目標(biāo)</b>優(yōu)化約束條件下充電設(shè)施有序充電控制策略

    請(qǐng)問(wèn)TFP501必須要接EEPROM嗎?

    TFP501芯片必須要接EEPROM嗎? EEPROM中存儲(chǔ)的數(shù)據(jù)哪里提供,是需要提前寫到EEPROM,還是TFP501自己來(lái)操作的不需要額外來(lái)讀寫? TFP501是不是搭接好硬件就可以工作,不需要配置寄存器或編程下載什么的
    發(fā)表于 12-27 06:11

    視頻目標(biāo)跟蹤從0到1,概念與方法

    導(dǎo)讀從目標(biāo)跟蹤的應(yīng)用場(chǎng)景,底層模型,組件,類型和具體算法幾個(gè)方面對(duì)目標(biāo)跟蹤做了全方面的介紹,非常好的入門文章。在今天的文章中,我們將深入研究
    的頭像 發(fā)表于 11-20 01:06 ?449次閱讀
    視頻<b class='flag-5'>目標(biāo)</b><b class='flag-5'>跟蹤</b>從0到1,概念與方法

    使用TS5A22362必須要接負(fù)載嗎?

    在使用TS5A22362作為音頻SPK通道切換輸出,使用萬(wàn)用表測(cè)量SPK輸出頻率時(shí)發(fā)現(xiàn)未接負(fù)載的情況下(末端接萬(wàn)用表)音頻信號(hào)震蕩很厲害;大約會(huì)產(chǎn)生1.5MHZ的震蕩頻率;請(qǐng)問(wèn)這是正常的嗎?使用TS5A22362必須要接負(fù)載嗎?
    發(fā)表于 11-01 08:21

    使用STT全面提升自動(dòng)駕駛中的多目標(biāo)跟蹤

    3D多目標(biāo)跟蹤(3D MOT)在各種機(jī)器人應(yīng)用中發(fā)揮著關(guān)鍵作用,例如自動(dòng)駕駛車輛。為了在駕駛時(shí)避免碰撞,機(jī)器人汽車必須可靠地跟蹤道路上的物體,并準(zhǔn)確估計(jì)它們的運(yùn)動(dòng)狀態(tài),例如速度和加速度
    的頭像 發(fā)表于 10-28 10:07 ?320次閱讀
    使用STT全面提升自動(dòng)駕駛中的<b class='flag-5'>多目標(biāo)</b><b class='flag-5'>跟蹤</b>

    淺談分時(shí)電價(jià)下含電動(dòng)汽車的微電網(wǎng)群雙層多目標(biāo)優(yōu)化調(diào)度

    充電滿意度多目標(biāo)下的電動(dòng)汽車充電模式,建立了微電網(wǎng)內(nèi)運(yùn)營(yíng)商峰谷差—用戶充電費(fèi)用少和充電滿意度的雙盈多目標(biāo)優(yōu)化調(diào)度模型,采用上海市實(shí)際居民辦公商業(yè)混合體,基于MATLAB/NSGA?Ⅱ算法求解負(fù)荷整形度;采取粒子群優(yōu)化
    的頭像 發(fā)表于 09-23 14:46 ?424次閱讀
    淺談分時(shí)電價(jià)下含電動(dòng)汽車的微電網(wǎng)群雙層<b class='flag-5'>多目標(biāo)</b>優(yōu)化調(diào)度

    深度識(shí)別與多目標(biāo)識(shí)別傳感器的區(qū)別

    深度識(shí)別與多目標(biāo)識(shí)別是兩個(gè)在計(jì)算機(jī)視覺(jué)和傳感器技術(shù)領(lǐng)域中非常重要的概念。它們?cè)谧詣?dòng)駕駛、機(jī)器人導(dǎo)航、工業(yè)自動(dòng)化、安防監(jiān)控等多個(gè)領(lǐng)域有著廣泛的應(yīng)用。 深度識(shí)別 深度識(shí)別,通常指的是通過(guò)傳
    的頭像 發(fā)表于 09-10 14:52 ?453次閱讀

    抖動(dòng)跟蹤不丟失 慧視圖像跟蹤板和自研算法強(qiáng)勢(shì)升級(jí)

    圖像跟蹤板應(yīng)用場(chǎng)景的不斷增加,為了滿足更復(fù)雜場(chǎng)景的需求,目標(biāo)跟蹤算法跟蹤能力也在不斷提升。例如在無(wú)人機(jī)
    的頭像 發(fā)表于 09-04 08:05 ?539次閱讀
    抖動(dòng)<b class='flag-5'>跟蹤</b>不丟失 慧視圖像<b class='flag-5'>跟蹤</b>板和自研<b class='flag-5'>算法</b>強(qiáng)勢(shì)升級(jí)

    要了解下大模型知識(shí)

    工作需要,想要了解一下大模型算力建設(shè)知識(shí)。
    發(fā)表于 08-20 15:31

    多目標(biāo)智能識(shí)別系統(tǒng)

    智慧華盛恒輝多目標(biāo)智能識(shí)別系統(tǒng)是一種利用現(xiàn)代計(jì)算機(jī)視覺(jué)技術(shù)和人工智能算法,從圖像或視頻中同時(shí)識(shí)別和分類多個(gè)目標(biāo)物體的系統(tǒng)。這種系統(tǒng)廣泛應(yīng)用于自動(dòng)駕駛、智能監(jiān)控、人機(jī)交互、軍事偵察、災(zāi)害
    的頭像 發(fā)表于 07-16 10:42 ?1.5w次閱讀

    不只是前端,后端、產(chǎn)品和測(cè)試也需要了解的瀏覽器知識(shí)

    一、我們?yōu)槭裁?b class='flag-5'>要了解瀏覽器? 1. 對(duì)于前端開發(fā)者 1.瀏覽器是用戶體驗(yàn)的第一線。我們需要了解瀏覽器的工作原理,才能有效地設(shè)計(jì)和實(shí)現(xiàn)用戶界面,確保良好的用戶體驗(yàn)。 2.好的產(chǎn)品需要考慮瀏覽器兼容性
    的頭像 發(fā)表于 07-01 18:03 ?503次閱讀
    不只是前端,后端、產(chǎn)品和測(cè)試也需<b class='flag-5'>要了解</b>的瀏覽器知識(shí)

    基于GIS的SAR多目標(biāo)智能識(shí)別系統(tǒng)

    智慧華盛恒輝基于GIS的SAR多目標(biāo)智能識(shí)別系統(tǒng)是一個(gè)集成了合成孔徑雷達(dá)(SAR)和地理信息系統(tǒng)(GIS)技術(shù)的先進(jìn)系統(tǒng),旨在實(shí)現(xiàn)高分辨率雷達(dá)圖像中的多目標(biāo)智能識(shí)別。以下是該系統(tǒng)的詳細(xì)介紹: 智慧華
    的頭像 發(fā)表于 06-26 14:26 ?546次閱讀

    天津大學(xué)海洋學(xué)院聲光探測(cè)團(tuán)隊(duì)在水下激光雷達(dá)探測(cè)領(lǐng)域取得新進(jìn)展

    在海洋技術(shù)領(lǐng)域中,海洋探測(cè)技術(shù)是打破人類與海洋間屏障的關(guān)鍵手段,先進(jìn)的激光雷達(dá)(LiDAR)系統(tǒng)和算法對(duì)水下任務(wù)包括水下定位、目標(biāo)搜索和救援等方面具有重大的意義。其中距離信息作為最基本的物理參數(shù),可視為諸
    的頭像 發(fā)表于 06-23 15:48 ?439次閱讀
    天津大學(xué)海洋學(xué)院聲光探測(cè)團(tuán)隊(duì)在水下激光雷達(dá)探測(cè)<b class='flag-5'>領(lǐng)域</b>取得新進(jìn)展

    多目標(biāo)跟蹤算法總結(jié)歸納

    多目標(biāo)跟蹤是計(jì)算機(jī)視覺(jué)領(lǐng)域中的一個(gè)重要任務(wù),它旨在從視頻或圖像序列中準(zhǔn)確地檢測(cè)和跟蹤多個(gè)移動(dòng)目標(biāo)。不過(guò)在落地部署時(shí),有一些關(guān)鍵點(diǎn)需要解決。
    的頭像 發(fā)表于 04-28 09:42 ?2127次閱讀
    <b class='flag-5'>多目標(biāo)</b><b class='flag-5'>跟蹤</b><b class='flag-5'>算法</b>總結(jié)歸納

    RFID技術(shù)在人員定位和監(jiān)控方面相較于其他技術(shù)有何明顯優(yōu)勢(shì)?

    RFID技術(shù)在人員定位和監(jiān)控方面相較于其他技術(shù)具有顯著的優(yōu)勢(shì),包括非接觸式識(shí)別、快速識(shí)別、多目標(biāo)識(shí)別、強(qiáng)抗干擾能力、數(shù)據(jù)安全性高以及靈活性高等。這些優(yōu)勢(shì)使得RFID技術(shù)在人員定位和監(jiān)控領(lǐng)域
    的頭像 發(fā)表于 03-20 17:27 ?481次閱讀