0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí):多目標(biāo)跟蹤方向調(diào)研報(bào)告

新機(jī)器視覺(jué) ? 來(lái)源:新機(jī)器視覺(jué) ? 作者:Harlek@知乎 ? 2020-11-05 10:01 ? 次閱讀

導(dǎo)讀

本文是一篇多目標(biāo)跟蹤方向的調(diào)研報(bào)告,從相關(guān)方向、核心步驟、評(píng)價(jià)指標(biāo)和最新進(jìn)展等維度出發(fā),對(duì)MOT進(jìn)行了全面的介紹,不僅適合作為入門(mén)科普,而且能夠幫助大家加深理解。

最近做了一些多目標(biāo)跟蹤方向的調(diào)研,因此把調(diào)研的結(jié)果以圖片加文字的形式展現(xiàn)出來(lái),希望能幫助到入門(mén)這一領(lǐng)域的同學(xué)。也歡迎大家和我討論關(guān)于這一領(lǐng)域的任何問(wèn)題。

相關(guān)方向

這些是我所了解的多目標(biāo)跟蹤(MOT)的一些相關(guān)方向。其中單目標(biāo)跟蹤(VOT/SOT)、目標(biāo)檢測(cè)(detection)、行人重識(shí)別(Re-ID)都是非常熱門(mén)的方向。而偏視頻的相關(guān)方向就比較冷門(mén)。而且今年五月DukeMTMC因?yàn)殡[私問(wèn)題不再提供MTMCT的數(shù)據(jù)了,MTMCT的研究也是舉步維艱。

核心步驟

MOT算法的通常工作流程:(1)給定視頻的原始幀;(2)運(yùn)行對(duì)象檢測(cè)器以獲得對(duì)象的邊界框;(3)對(duì)于每個(gè)檢測(cè)到的物體,計(jì)算出不同的特征,通常是視覺(jué)和運(yùn)動(dòng)特征;(4)之后,相似度計(jì)算步驟計(jì)算兩個(gè)對(duì)象屬于同一目標(biāo)的概率;(5)最后,關(guān)聯(lián)步驟為每個(gè)對(duì)象分配數(shù)字ID。

因此絕大多數(shù)MOT算法無(wú)外乎就這四個(gè)步驟:①檢測(cè) ②特征提取、運(yùn)動(dòng)預(yù)測(cè) ③相似度計(jì)算 ④數(shù)據(jù)關(guān)聯(lián)。 其中影響最大的部分在于檢測(cè),檢測(cè)結(jié)果的好壞對(duì)于最后指標(biāo)的影響是最大的。 但是,多目標(biāo)追蹤的研究重點(diǎn)又在相似度計(jì)算和數(shù)據(jù)關(guān)聯(lián)這一塊。所以就有一個(gè)很大的問(wèn)題:你設(shè)計(jì)出更好的關(guān)聯(lián)算法可能就提升了0.1個(gè)點(diǎn),但別人用一些針對(duì)數(shù)據(jù)集的trick消除了一些漏檢可能就能漲好幾個(gè)點(diǎn)。所以研究更好的數(shù)據(jù)關(guān)聯(lián)的回報(bào)收益很低。因此多目標(biāo)追蹤這一領(lǐng)域雖然工業(yè)界很有用,但學(xué)術(shù)界里因?yàn)橹笜?biāo)數(shù)據(jù)集的一些原因,入坑前一定要三思。

評(píng)價(jià)指標(biāo)

關(guān)于評(píng)價(jià)指標(biāo): 第一個(gè)是傳統(tǒng)的標(biāo)準(zhǔn),現(xiàn)在已經(jīng)沒(méi)人用了,就不介紹了。 第二個(gè)是06年提出的CLEAR MOT?,F(xiàn)在用的最多的就是MOTA。但是這個(gè)指標(biāo)FN、FP的權(quán)重占比很大,更多衡量的是檢測(cè)的質(zhì)量,而不是跟蹤的效果。 第三個(gè)是16年提出的ID scores。因?yàn)槎际腔谄ヅ涞闹笜?biāo),所以能更好的衡量數(shù)據(jù)關(guān)聯(lián)的好壞。

數(shù)據(jù)集

數(shù)據(jù)集用的最多的是MOTChallenge,專注于行人追蹤的。 第二個(gè)KITTI的是針對(duì)自動(dòng)駕駛的數(shù)據(jù)集,有汽車也有行人,在MOT的論文里用的很少。 還有一些其他比較老的數(shù)據(jù)集現(xiàn)在都不用了。 15年的都是采集的老的數(shù)據(jù)集的視頻做的修正。 16年的是全新的數(shù)據(jù)集,相比于15年的行人密度更高、難度更大。特別注意這個(gè)DPM檢測(cè)器,效果非常的差,全是漏檢和誤檢。 17年的視頻和16年一模一樣,只是提供了三個(gè)檢測(cè)器,相對(duì)來(lái)說(shuō)更公平。也是現(xiàn)在論文的主流數(shù)據(jù)集。 19年的是針對(duì)特別擁擠情形的數(shù)據(jù)集,只有CVPR19比賽時(shí)才能提交。

這個(gè)是MOT16公開(kāi)檢測(cè)器上的結(jié)果??梢钥吹綇?7年開(kāi)始,MOTA就漲的很慢了。關(guān)注一下這個(gè)幀率有20Hz的算法MOTDT也是我后面要講的一個(gè)。

這個(gè)是MOT16私有檢測(cè)器上的結(jié)果??梢钥吹綑z測(cè)器性能的好壞對(duì)于結(jié)果的影響非常重要。SOTA算法換了私有檢測(cè)器后性能直接漲了快20個(gè)點(diǎn)。

這個(gè)是MOT17公開(kāi)檢測(cè)器上這幾年比較突出的算法。注意因?yàn)檫@個(gè)數(shù)據(jù)集用了三個(gè)檢測(cè)器,所以FP、FN這些指標(biāo)也都幾乎是16數(shù)據(jù)集的三倍。

SORT和DeepSORT

關(guān)鍵算法

從這兩個(gè)工業(yè)界關(guān)注度最高的算法說(shuō)起。 SORT作為一個(gè)粗略的框架,核心就是兩個(gè)算法:卡爾曼濾波和匈牙利匹配??柭鼮V波分為兩個(gè)過(guò)程:預(yù)測(cè)和更新。預(yù)測(cè)過(guò)程:當(dāng)一個(gè)小車經(jīng)過(guò)移動(dòng)后,且其初始定位和移動(dòng)過(guò)程都是高斯分布時(shí),則最終估計(jì)位置分布會(huì)更分散,即更不準(zhǔn)確;更新過(guò)程:當(dāng)一個(gè)小車經(jīng)過(guò)傳感器觀測(cè)定位,且其初始定位和觀測(cè)都是高斯分布時(shí),則觀測(cè)后的位置分布會(huì)更集中,即更準(zhǔn)確。匈牙利算法解決的是一個(gè)分配問(wèn)題。SK-learn庫(kù)的linear_assignment___和scipy庫(kù)的linear_sum_assignment都實(shí)現(xiàn)了這一算法,只需要輸入cost_matrix即代價(jià)矩陣就能得到最優(yōu)匹配。

不過(guò)要注意的是這兩個(gè)庫(kù)函數(shù)雖然算法一樣,但給的輸出格式不同。具體算法步驟也很簡(jiǎn)單,是一個(gè)復(fù)雜度的算法。 DeepSORT的優(yōu)化主要就是基于匈牙利算法里的這個(gè)代價(jià)矩陣。它在IOU Match之前做了一次額外的級(jí)聯(lián)匹配,利用了外觀特征和馬氏距離。外觀特征就是通過(guò)一個(gè)Re-ID的網(wǎng)絡(luò)提取的,而提取這個(gè)特征的過(guò)程和NLP里詞向量的嵌入過(guò)程(embedding)很像,所以后面有的論文也把這個(gè)步驟叫做嵌入(起源應(yīng)該不是NLP,但我第一次接觸embedding是從NLP里)。然后是因?yàn)闅W氏距離忽略空間域分布的計(jì)算結(jié)果,所以增加里馬氏距離作為運(yùn)動(dòng)信息的約束。

SORT

這個(gè)SORT的流程圖非常重要,可以看到整體可以拆分為兩個(gè)部分,分別是匹配過(guò)程和卡爾曼預(yù)測(cè)加更新過(guò)程,都用灰色框標(biāo)出來(lái)了。一定要把整個(gè)流程弄明白。后面的多目標(biāo)追蹤的大框架基本都由此而來(lái)。 關(guān)鍵步驟:軌跡卡爾曼濾波預(yù)測(cè)→ 使用匈牙利算法將預(yù)測(cè)后的tracks和當(dāng)前幀中的detecions進(jìn)行匹配(IOU匹配) → 卡爾曼濾波更新對(duì)于沒(méi)有匹配上的軌跡,也不是馬上就刪掉了,有個(gè)T_lost的保存時(shí)間,但SORT里把這個(gè)時(shí)間閾值設(shè)置的是1,也就是說(shuō)對(duì)于沒(méi)匹配上的軌跡相當(dāng)于直接刪了。 關(guān)于這點(diǎn)論文里的原話是:

首先,恒定速度模型不能很好地預(yù)測(cè)真實(shí)的動(dòng)力學(xué),其次,我們主要關(guān)注的是幀到幀的跟蹤,其中對(duì)象的重新識(shí)別超出了本文的范圍。

這篇文章的機(jī)翻在《SORT》論文翻譯

DeepSORT

這是DeepSORT算法的流程圖,和SORT基本一樣,就多了級(jí)聯(lián)匹配(Matching Cascade)和新軌跡的確認(rèn)(confirmed)。 這篇文章的機(jī)翻在《DeepSORT》論文翻譯 關(guān)鍵步驟:軌跡卡爾曼濾波預(yù)測(cè)→ 使用匈牙利算法將預(yù)測(cè)后的tracks和當(dāng)前幀中的detecions進(jìn)行匹配(級(jí)聯(lián)匹配和IOU匹配) → 卡爾曼濾波更新級(jí)聯(lián)匹配是核心,就是紅色部分,DeepSORT的絕大多數(shù)創(chuàng)新點(diǎn)都在這里面,具體過(guò)程看下一張圖。 關(guān)于為什么新軌跡要連續(xù)三幀命中才確認(rèn)?個(gè)人認(rèn)為有這樣嚴(yán)格的條件和測(cè)試集有關(guān)系。因?yàn)闇y(cè)試集給的檢測(cè)輸入非常的差,誤檢有很多,因此軌跡的產(chǎn)生必須要更嚴(yán)格的條件。

級(jí)聯(lián)匹配流程圖里上半部分就是特征提取和相似度估計(jì),也就是算這個(gè)分配問(wèn)題的代價(jià)函數(shù)。主要由兩部分組成:代表運(yùn)動(dòng)模型的馬氏距離和代表外觀模型的Re-ID特征。 級(jí)聯(lián)匹配流程圖里下半部分?jǐn)?shù)據(jù)關(guān)聯(lián)作為流程的主體。為什么叫級(jí)聯(lián)匹配,主要是它的匹配過(guò)程是一個(gè)循環(huán)。從missing age=0的軌跡(即每一幀都匹配上,沒(méi)有丟失過(guò)的)到missing age=30的軌跡(即丟失軌跡的最大時(shí)間30幀)挨個(gè)的和檢測(cè)結(jié)果進(jìn)行匹配。也就是說(shuō),對(duì)于沒(méi)有丟失過(guò)的軌跡賦予優(yōu)先匹配的權(quán)利,而丟失的最久的軌跡最后匹配。 論文關(guān)于參數(shù)λ(運(yùn)動(dòng)模型的代價(jià)占比)的取值是這么說(shuō)的:

在我們的實(shí)驗(yàn)中,我們發(fā)現(xiàn)當(dāng)相機(jī)運(yùn)動(dòng)明顯時(shí),將λ= 0設(shè)置是一個(gè)合理的選擇。

因?yàn)橄鄼C(jī)抖動(dòng)明顯,卡爾曼預(yù)測(cè)所基于的勻速運(yùn)動(dòng)模型并不work,所以馬氏距離其實(shí)并沒(méi)有什么作用。但注意也不是完全沒(méi)用了,主要是通過(guò)閾值矩陣(Gate Matrix)對(duì)代價(jià)矩陣(Cost Matrix)做了一次閾值限制。 關(guān)于DeepSORT算法的詳細(xì)代碼解讀我比較推薦:目標(biāo)跟蹤初探(DeepSORT) 但關(guān)于卡爾曼濾波的公式講的不是很詳細(xì),具體推導(dǎo)可以看看 Kalman Filter 卡爾曼濾波

改進(jìn)策略

看到這個(gè)DeepSORT的流程圖不知道大家可以想到什么優(yōu)化的地方?其實(shí)有幾個(gè)點(diǎn)是很容易想到的。

第一點(diǎn),把Re-ID網(wǎng)絡(luò)和檢測(cè)網(wǎng)絡(luò)融合,做一個(gè)精度和速度的trade off; 第二點(diǎn),對(duì)于軌跡段來(lái)說(shuō),時(shí)間越長(zhǎng)的軌跡是不是更應(yīng)該得到更多的信任,不僅僅只是級(jí)聯(lián)匹配的優(yōu)先級(jí),由此可以引入軌跡評(píng)分的機(jī)制; 第三點(diǎn),從直覺(jué)上來(lái)說(shuō),檢測(cè)和追蹤是兩個(gè)相輔相成的問(wèn)題,良好的追蹤可以彌補(bǔ)檢測(cè)的漏檢,良好的檢測(cè)可以防止追蹤的軌道飄逸,用預(yù)測(cè)來(lái)彌補(bǔ)漏檢這個(gè)問(wèn)題在DeepSORT里也并沒(méi)有考慮; 第四點(diǎn),DeepSORT里給馬氏距離也就是運(yùn)動(dòng)模型設(shè)置的系數(shù)為0,也就是說(shuō)在相機(jī)運(yùn)動(dòng)的情況下線性速度模型并不work,所以是不是可以找到更好的運(yùn)動(dòng)模型。

最新進(jìn)展

這是最近比較新的一些方法。 工業(yè)界青睞的算法在學(xué)術(shù)界其實(shí)并不重視,一方面是因?yàn)殚_(kāi)源的原因,另一方面可以看到頂會(huì)的算法都不是注重速度的,通常用了很復(fù)雜的模塊和trick來(lái)提升精度。 而且這些trick不是一般意義的trick了,是針對(duì)這個(gè)數(shù)據(jù)集的或者說(shuō)針對(duì)糟糕檢測(cè)器的一些trick, 對(duì)于實(shí)際應(yīng)用幾乎沒(méi)有幫助。 第一篇論文是基于DeepSORT改進(jìn)的,它的創(chuàng)新點(diǎn)在于引入了軌跡評(píng)分機(jī)制,時(shí)間越久的軌跡可信度就越高,基于這個(gè)評(píng)分就可以把軌跡產(chǎn)生的預(yù)測(cè)框和檢測(cè)框放一起做一個(gè)NMS,相當(dāng)于是用預(yù)測(cè)彌補(bǔ)了漏檢。 第二篇論文是今年9月份發(fā)在arxiv上的一篇論文,它的工作是把檢測(cè)網(wǎng)絡(luò)和嵌入網(wǎng)絡(luò)結(jié)合起來(lái),追求的是速度和精度的trade off。

MOTDT

這是剛才列舉的第一篇論文(MOTDT)的流程圖,大概和DeepSORT差不多。這個(gè)圖畫(huà)的比較簡(jiǎn)單,其實(shí)在NMS之前有個(gè)基于SqueezeNet的區(qū)域選擇網(wǎng)絡(luò)R-FCN和軌跡評(píng)分的機(jī)制。這兩個(gè)東西的目的就是為了產(chǎn)生一個(gè)統(tǒng)一檢測(cè)框和預(yù)測(cè)框的標(biāo)準(zhǔn)置信度,作為NMS的輸入。 這篇文章的翻譯在《Real-Time Multiple People Tracking With Deeply Learned Candidate Selection And Person Re-ID》論文翻譯

JDE

這是剛才第二篇論文(JDE)里的結(jié)構(gòu)圖。這個(gè)方法是基于YOLOv3和MOTDT做的。它網(wǎng)絡(luò)前面都和YOLOv3一樣的,主要就是在特征圖里多提取了一個(gè)嵌入(embedding)向量,采取的是類似于交叉熵的triplet loss。因?yàn)槭嵌嗳蝿?wù)學(xué)習(xí),這篇論文還用了一篇18年的論文提出來(lái)的自動(dòng)學(xué)習(xí)損失權(quán)重方案:通過(guò)學(xué)習(xí)一組輔助參數(shù)自動(dòng)地對(duì)非均勻損失進(jìn)行加權(quán)。最后的結(jié)果是精度上差不太多,F(xiàn)PS高了很多。 這篇文章的翻譯在 《Towards Real-Time Multi-Object Tracking》論文翻譯

未來(lái)展望

最后用多目標(biāo)追蹤未來(lái)的一些思考作為結(jié)尾,這句話是最近的一篇關(guān)于多目標(biāo)追蹤的綜述里的。 它在最后提出對(duì)未來(lái)的方向里有這樣一句話,用深度學(xué)習(xí)來(lái)指導(dǎo)關(guān)聯(lián)問(wèn)題。其實(shí)現(xiàn)在基于檢測(cè)的多目標(biāo)追蹤都是檢測(cè)模塊用深度學(xué)習(xí),Re-ID模塊用深度學(xué)習(xí),而最核心的數(shù)據(jù)關(guān)聯(lián)模塊要用深度學(xué)習(xí)來(lái)解決是很困難的?,F(xiàn)在有一些嘗試是用RNN,但速度慢、效果不好,需要走的路都還很長(zhǎng)。 我個(gè)人覺(jué)得短期內(nèi)要解決實(shí)際問(wèn)題,還是從Re-ID的方面下手思考怎樣提取更有效的特征會(huì)更靠譜,用深度學(xué)習(xí)的方法來(lái)處理數(shù)據(jù)關(guān)聯(lián)不是短時(shí)間能解決的。

參考文獻(xiàn):[1] Alex Bewley, Zongyuan Ge, Lionel Ott, Fabio Ramos, and Ben Upcroft. Simple online and realtime tracking. In2016 IEEE International Conference on Image Processing (ICIP), pages 3464–3468. IEEE, 2016. [2] Nicolai Wojke, Alex Bewley, and Dietrich Paulus. Simple online and realtime tracking with a deep associationmetric. In2017 IEEE International Conference on Image Processing (ICIP), pages 3645–3649. IEEE, 2017. [3] Chen Long, Ai Haizhou, Zhuang Zijie, and Shang Chong. Real-time multiple people tracking with deeplylearned candidate selection and person re-identification. InICME, 2018. [4] Zhongdao Wang, Liang Zheng, Yixuan Liu, Shengjin Wang. Towards Real-Time Multi-Object Tracking. arXiv preprint arXiv:1909.12605 [5] Gioele Ciaparrone, Francisco Luque Sánchez, Siham Tabik, Luigi Troiano, Roberto Tagliaferri, Francisco Herrera. Deep Learning in Video Multi-Object Tracking: A Survey. arXiv preprint arXiv:1907.12740

責(zé)任編輯:xj

原文標(biāo)題:基于深度學(xué)習(xí)的多目標(biāo)跟蹤(MOT)技術(shù)一覽

文章出處:【微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4699

    瀏覽量

    94765
  • 目標(biāo)跟蹤
    +關(guān)注

    關(guān)注

    2

    文章

    88

    瀏覽量

    15040
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5554

    瀏覽量

    122490

原文標(biāo)題:基于深度學(xué)習(xí)的多目標(biāo)跟蹤(MOT)技術(shù)一覽

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    分時(shí)電價(jià)下光伏園區(qū)電動(dòng)汽車有序充電多目標(biāo)優(yōu)化策略

    安科瑞徐赟杰18706165067 摘要: ? 以配電網(wǎng)負(fù)荷方差和用戶充電費(fèi)用為目標(biāo)函數(shù),提出一種分時(shí)電價(jià) 背景下光伏出力園區(qū)電動(dòng)汽車的有序充電策略。以多目標(biāo)優(yōu)化遺傳算法對(duì)某一特定 主 園區(qū)
    的頭像 發(fā)表于 04-18 09:07 ?258次閱讀
    分時(shí)電價(jià)下光伏園區(qū)電動(dòng)汽車有序充電<b class='flag-5'>多目標(biāo)</b>優(yōu)化策略

    使用RTSP攝像頭執(zhí)行多攝像頭多目標(biāo)Python演示,缺少輸出幀是怎么回事?

    使用 RTSP 攝像頭執(zhí)行 多攝像頭多目標(biāo) Python 演示 。 現(xiàn)場(chǎng)視頻每 5 秒出現(xiàn)一次啟動(dòng)和抖動(dòng),但幀缺失。 輸出生產(chǎn)低 FPS (1 至 0.3 FPS)。 人員檢測(cè)發(fā)生在各種位置,因?yàn)閷?shí)時(shí)視頻缺少幀。
    發(fā)表于 03-06 07:55

    淺談多目標(biāo)優(yōu)化約束條件下充電設(shè)施有序充電控制策略

    隨著電動(dòng)汽車的普及,充電設(shè)施的需求日益增長(zhǎng),如何在多目標(biāo)優(yōu)化約束下實(shí)現(xiàn)充電設(shè)施的有序充電成為亟待解決的問(wèn)題。新能源汽車的快速發(fā)展為清潔能源和可持續(xù)交通帶來(lái)了新機(jī)遇,但也引出了許多問(wèn)題。其中,充電設(shè)施的有序充電控制策略在多目標(biāo)優(yōu)化約束條件下顯得尤為重要。
    的頭像 發(fā)表于 01-07 13:17 ?418次閱讀
    淺談<b class='flag-5'>多目標(biāo)</b>優(yōu)化約束條件下充電設(shè)施有序充電控制策略

    視頻目標(biāo)跟蹤從0到1,概念與方法

    視覺(jué)目標(biāo)跟蹤的挑戰(zhàn)和算法模型,最后,我們將介紹最流行的基于深度學(xué)習(xí)目標(biāo)跟蹤方法,包括MDNET
    的頭像 發(fā)表于 11-20 01:06 ?832次閱讀
    視頻<b class='flag-5'>目標(biāo)</b><b class='flag-5'>跟蹤</b>從0到1,概念與方法

    NPU在深度學(xué)習(xí)中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其核心驅(qū)動(dòng)力之一,已經(jīng)在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和價(jià)值。NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理單元)是專門(mén)為深度學(xué)習(xí)
    的頭像 發(fā)表于 11-14 15:17 ?1712次閱讀

    使用STT全面提升自動(dòng)駕駛中的多目標(biāo)跟蹤

    3D多目標(biāo)跟蹤(3D MOT)在各種機(jī)器人應(yīng)用中發(fā)揮著關(guān)鍵作用,例如自動(dòng)駕駛車輛。為了在駕駛時(shí)避免碰撞,機(jī)器人汽車必須可靠地跟蹤道路上的物體,并準(zhǔn)確估計(jì)它們的運(yùn)動(dòng)狀態(tài),例如速度和加速度。
    的頭像 發(fā)表于 10-28 10:07 ?596次閱讀
    使用STT全面提升自動(dòng)駕駛中的<b class='flag-5'>多目標(biāo)</b><b class='flag-5'>跟蹤</b>

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU在深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識(shí)別 圖像識(shí)別是深度學(xué)習(xí)
    的頭像 發(fā)表于 10-27 11:13 ?1109次閱讀

    FPGA加速深度學(xué)習(xí)模型的案例

    FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)加速深度學(xué)習(xí)模型是當(dāng)前硬件加速領(lǐng)域的一個(gè)熱門(mén)研究方向。以下是一些FPGA加速深度學(xué)習(xí)模型的案例: 一、基于FPG
    的頭像 發(fā)表于 10-25 09:22 ?1078次閱讀

    深度識(shí)別與多目標(biāo)識(shí)別傳感器的區(qū)別

    深度識(shí)別與多目標(biāo)識(shí)別是兩個(gè)在計(jì)算機(jī)視覺(jué)和傳感器技術(shù)領(lǐng)域中非常重要的概念。它們?cè)谧詣?dòng)駕駛、機(jī)器人導(dǎo)航、工業(yè)自動(dòng)化、安防監(jiān)控等多個(gè)領(lǐng)域有著廣泛的應(yīng)用。 深度識(shí)別 深度識(shí)別,通常指的是通過(guò)傳
    的頭像 發(fā)表于 09-10 14:52 ?721次閱讀

    多目標(biāo)智能識(shí)別系統(tǒng)

    。以下是關(guān)于多目標(biāo)智能識(shí)別系統(tǒng)的詳細(xì)解析: 智慧華盛恒輝系統(tǒng)原理 多目標(biāo)智能識(shí)別系統(tǒng)的核心原理基于圖像處理、機(jī)器學(xué)習(xí)深度學(xué)習(xí)等技術(shù)。系統(tǒng)通
    的頭像 發(fā)表于 07-16 10:42 ?2.8w次閱讀

    深度學(xué)習(xí)中的時(shí)間序列分類方法

    的發(fā)展,基于深度學(xué)習(xí)的TSC方法逐漸展現(xiàn)出其強(qiáng)大的自動(dòng)特征提取和分類能力。本文將從多個(gè)角度對(duì)深度學(xué)習(xí)在時(shí)間序列分類中的應(yīng)用進(jìn)行綜述,探討常用的深度
    的頭像 發(fā)表于 07-09 15:54 ?1939次閱讀

    深度學(xué)習(xí)與nlp的區(qū)別在哪

    深度學(xué)習(xí)和自然語(yǔ)言處理(NLP)是計(jì)算機(jī)科學(xué)領(lǐng)域中兩個(gè)非常重要的研究方向。它們之間既有聯(lián)系,也有區(qū)別。本文將介紹深度學(xué)習(xí)與NLP的區(qū)別。
    的頭像 發(fā)表于 07-05 09:47 ?1514次閱讀

    基于深度學(xué)習(xí)的小目標(biāo)檢測(cè)

    )的廣泛應(yīng)用,小目標(biāo)檢測(cè)的性能得到了顯著提升。本文將詳細(xì)探討基于深度學(xué)習(xí)的小目標(biāo)檢測(cè)技術(shù),包括其定義、挑戰(zhàn)、常用方法以及未來(lái)發(fā)展方向
    的頭像 發(fā)表于 07-04 17:25 ?1901次閱讀

    基于GIS的SAR多目標(biāo)智能識(shí)別系統(tǒng)

    智慧華盛恒輝基于GIS的SAR多目標(biāo)智能識(shí)別系統(tǒng)是一個(gè)集成了合成孔徑雷達(dá)(SAR)和地理信息系統(tǒng)(GIS)技術(shù)的先進(jìn)系統(tǒng),旨在實(shí)現(xiàn)高分辨率雷達(dá)圖像中的多目標(biāo)智能識(shí)別。以下是該系統(tǒng)的詳細(xì)介紹: 智慧華
    的頭像 發(fā)表于 06-26 14:26 ?761次閱讀

    深度學(xué)習(xí)芯片組行業(yè)市場(chǎng)規(guī)模分析及發(fā)展趨勢(shì)預(yù)測(cè)報(bào)告

    據(jù)GIR (Global Info Research)調(diào)研,按收入計(jì),2023年全球深度學(xué)習(xí)芯片組收入大約3322.4百萬(wàn)美元,預(yù)計(jì)2030年達(dá)到27870百萬(wàn)美元,2024至2030期間,年復(fù)合
    的頭像 發(fā)表于 06-18 10:27 ?549次閱讀

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品