0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用光流 + CNN的方法來預(yù)測車輛的速度

新機器視覺 ? 來源:新機器視覺 ? 作者:Sharif Elfouly ? 2020-11-27 09:05 ? 次閱讀

導(dǎo)讀

使用光流 + CNN的方法來預(yù)測車輛的速度,用PyTorch實現(xiàn),有代碼。

代碼:https://github.com/SharifElfouly/vehicle-speed-estimation

我想要解決的問題是:在一輛車里有一個攝像頭,我想知道車開得有多快。你顯然不能看速度表,只能看視頻片段本身。深度學(xué)習(xí)魔法應(yīng)該能幫助我們。

數(shù)據(jù)

我有兩個不同的視頻。一個用于訓(xùn)練,另一個用于測試。訓(xùn)練視頻有20399幀,測試視頻有10797幀。視頻下載地址:https://github.com/commaai/speedchallenge。下面是一些例子:

視頻中的樣本圖像

訓(xùn)練視頻的標簽是a .txt文件,其中每一行對應(yīng)于特定幀的速度。

方法

這個問題最有趣的地方是你的神經(jīng)網(wǎng)絡(luò)輸入會是什么樣子。僅從一個靜態(tài)圖像計算速度是不可能的。一種有效的方法是將兩個或更多的圖像堆疊在一起,或者像LSTM或Transformer那樣連續(xù)地堆疊。另一個是計算光流,我決定用它。

什么是光流?它基本上是一種為每個像素計算矢量的方法,告訴你兩幅圖像之間的相對運動。有一個很棒的computerphile視頻:https://www.youtube.com/watch?v=4v_keMNROv4,你可以了解更多細節(jié)。有一些“經(jīng)典”的計算機視覺算法可以用來計算光流,但深度學(xué)習(xí)已經(jīng)變得更好了(這一點也不奇怪)。那么什么是SOTA方法,讓我們看看paperswithcode:

RAFT 看起來不錯,它還有PyTorch的實現(xiàn)。我forked原始存儲庫,并使其更簡單一些。我不需要訓(xùn)練,評估等等。我只會用它來推理。

計算光流

為了進行推斷,網(wǎng)絡(luò)將兩幅圖像拼接起來,并預(yù)測了一個維度為*(2, image_height, image_width)*的張量。如前所述,圖像中的每個像素對應(yīng)一個二維向量。我們將在實際訓(xùn)練中使用這些文件,因此我們將它們保存為.npy文件。如果你想象光流圖像它會是這樣的:

訓(xùn)練

記住我們訓(xùn)練的目的:

光流→模型→車速估計

我選擇的模型是EfficientNet。我非常喜歡它,因為它的可擴展性。它有8個不同的版本供你選擇,最大的一個,EfficientNet-B7仍然非常非常好。你可以從一個像B0這樣的小變體開始,然后如果一切工作正常,你有一個足夠好的GPU,你可以選擇一個更大的。還有一個PyTorch庫,我會使用它來非常容易地加載預(yù)先訓(xùn)練好的網(wǎng)絡(luò)模型,地址:https://github.com/lukemelas/effecentnet-PyTorch。如果你打開[train.ipynb](https://github.com/sharifelfouly/vehicle-speed - estimate),你就可以看到訓(xùn)練是如何運作的。

我總是從B0開始,然后放大到B3,因為我的GPU只有6 GB內(nèi)存。經(jīng)過訓(xùn)練,我得到如下結(jié)果(loss為均方誤差):

訓(xùn)練損失

驗證損失

很好,看起來一切都很正常!訓(xùn)練和驗證損失都在降低,網(wǎng)絡(luò)沒有過擬合。

結(jié)果如下:

雖然不完美,但它確實有一些用

總結(jié)

我通常不太喜歡特征工程,但我認為在這種情況下它做得很好。下一步是嘗試一些序列化的東西,比如Transformer或LSTM。

英文原文:https://medium.com/@selfouly/vehicle-speed-estimation-from-video-using-deep-learning-18b41babda4c

責(zé)任編輯:xj

原文標題:使用深度學(xué)習(xí)從視頻中估計車輛的速度

文章出處:【微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8420

    瀏覽量

    132685
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5503

    瀏覽量

    121206
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    352

    瀏覽量

    22231

原文標題:使用深度學(xué)習(xí)從視頻中估計車輛的速度

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    理解ECU數(shù)據(jù)的分析方法

    隨著汽車電子化程度的提高,ECU在車輛中扮演的角色越來越重要。它們不僅控制著發(fā)動機管理、變速箱、制動系統(tǒng)等關(guān)鍵功能,還涉及到車輛的舒適性和安全性。 ECU數(shù)據(jù)分析的重要性 故障診斷 :通過
    的頭像 發(fā)表于 11-05 11:07 ?438次閱讀

    一種創(chuàng)新的動態(tài)軌跡預(yù)測方法

    本文提出了一種動態(tài)軌跡預(yù)測方法,通過結(jié)合歷史幀和歷史預(yù)測結(jié)果提高預(yù)測的穩(wěn)定性和準確性。它引入了歷史預(yù)測
    的頭像 發(fā)表于 10-28 14:34 ?426次閱讀
    一種創(chuàng)新的動態(tài)軌跡<b class='flag-5'>預(yù)測</b><b class='flag-5'>方法</b>

    晶閘管電路中采用什么的方法來實現(xiàn)過保護

    晶閘管(Thyristor)是一種四層三端半導(dǎo)體器件,也稱為硅控整流器(SCR)。它具有單向?qū)щ娦裕S糜诮涣麟娐分械恼?、調(diào)壓、無觸點開關(guān)等應(yīng)用。由于晶閘管在導(dǎo)通后不受控制,因此需要采取過
    的頭像 發(fā)表于 09-30 17:09 ?445次閱讀

    THS4551是否可以通過在Vocm引腳處接入電阻調(diào)整分壓比例的方法來配置輸出共模電壓?

    引腳處接入電阻調(diào)整分壓比例的方法來配置輸出共模電壓。 打個比方,比如 Vs+ = 5V,Vs- = 0V (PD常On)時,是否可以如下圖所示,通過在Vocm和Vs-間接入300k電阻將輸出信號共模電壓調(diào)整值1.66V左右。
    發(fā)表于 08-06 07:14

    低成本微控芯片的加工與鍵合方法

    的微控芯片加工方法。其中,使用SU—8光刻膠作為模具對PDMS進行模塑成型較為常見,將SU—8光刻膠旋涂在硅片上并進行光刻,根據(jù)不同型號SU—8光刻膠和旋涂速度的控制,其厚度可以在十幾到一兩百微米范圍內(nèi)自由調(diào)節(jié);將PDMS主劑
    的頭像 發(fā)表于 07-23 16:46 ?755次閱讀
    低成本微<b class='flag-5'>流</b>控芯片的加工與鍵合<b class='flag-5'>方法</b>

    CNN的定義和優(yōu)勢

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)作為深度學(xué)習(xí)領(lǐng)域的核心成員,不僅在學(xué)術(shù)界引起了廣泛關(guān)注,更在工業(yè)界尤其是計算機視覺領(lǐng)域展現(xiàn)出了巨大的應(yīng)用價值。關(guān)于
    的頭像 發(fā)表于 07-05 17:37 ?4273次閱讀

    干貨分享 數(shù)據(jù)記錄儀自動測量與記錄加速度:振動,顛簸,沖擊和定位

    什么是加速度數(shù)據(jù)記錄儀?我們?nèi)绾斡涗浾駝??顛簸或沖擊是什么意思?我們可以使用什么方法來檢測因沖擊而造成的貨物損壞?“快速峰值”是什么意思?一篇文章讓你弄懂所有問題!
    的頭像 發(fā)表于 07-04 14:46 ?391次閱讀
    干貨分享  數(shù)據(jù)記錄儀自動測量與記錄加<b class='flag-5'>速度</b>:振動,顛簸,沖擊和定位

    cnn卷積神經(jīng)網(wǎng)絡(luò)分類有哪些

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像分類、目標檢測、語義分割等領(lǐng)域。本文將詳細介紹CNN在分類任務(wù)中的應(yīng)用,包括基本結(jié)構(gòu)、關(guān)鍵技術(shù)、常見網(wǎng)絡(luò)架構(gòu)以及實際應(yīng)用案例。 引言 1.1
    的頭像 發(fā)表于 07-03 09:28 ?629次閱讀

    常見的電機速度控制方法

      電機速度控制是電機應(yīng)用領(lǐng)域的核心技術(shù)之一,它直接關(guān)系到電機運行效率、穩(wěn)定性和使用壽命。隨著電機技術(shù)的不斷發(fā)展,電機速度控制方法也日益多樣化。本文將從電機速度控制的基本原理出發(fā),詳細
    的頭像 發(fā)表于 06-19 11:50 ?1708次閱讀

    使用psoc 4100s控制器和capsense csx測量方法來實現(xiàn)傳感器,如何從Capsense調(diào)諧器讀取idac值?

    我使用 psoc 4100s 控制器和 capsense csx 測量方法來實現(xiàn)傳感器。 到目前為止,代碼和其他一切正常。 為了計算 idac 電流, ,我需要 idac 值和 idac 增益因子
    發(fā)表于 05-30 06:08

    AD8338有沒有可行的方法來測量大增益?

    AD8338是一款VGA芯片,可變增益范圍為-10dB至70dB。然而,理論上的70dB增益過大,導(dǎo)致來自源的輸入信號非常小,容易受到干擾,導(dǎo)致70dB增益未得到驗證。有沒有可行的方法來測量大增益?
    發(fā)表于 05-21 07:06

    如果是使用六步方波的方法來控制電機,要如何實現(xiàn)過電流保護?

    請問一下如果是使用六步方波的方法來控制電機,要如何實現(xiàn)過電流保護? 以免電流過大造成板子損壞
    發(fā)表于 04-22 08:10

    看一下通過采用HPC方法來解決汽車行業(yè)工程挑戰(zhàn)的兩個具體實例

    大家可能都知道,將Ansys解決方案與高性能計算(HPC)相結(jié)合,可帶來巨大的投資回報(ROI)。接下來,讓我們來看一下通過采用HPC方法來解決汽車行業(yè)工程挑戰(zhàn)的兩個具體實例。
    的頭像 發(fā)表于 03-12 14:29 ?575次閱讀

    使用NVIDIA Triton推理服務(wù)器加速AI預(yù)測

    這家云計算巨頭的計算機視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器加速 AI 預(yù)測。
    的頭像 發(fā)表于 02-29 14:04 ?587次閱讀

    基于區(qū)塊鏈的自動駕駛車輛電池壽命預(yù)測方法

    基于區(qū)塊鏈的自動駕駛車輛電池壽命預(yù)測方法
    的頭像 發(fā)表于 01-05 10:27 ?451次閱讀
    基于區(qū)塊鏈的自動駕駛<b class='flag-5'>車輛</b>電池壽命<b class='flag-5'>預(yù)測</b><b class='flag-5'>方法</b>