0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深蘭科技DeepBlueAI團(tuán)隊(duì)斬獲低分辨率視頻行為識(shí)別挑戰(zhàn)賽的冠軍

深蘭科技 ? 來源:DeepBlue深蘭科技 ? 作者:DeepBlue深蘭科技 ? 2021-06-30 10:19 ? 次閱讀

導(dǎo)讀近日,全球三大計(jì)算機(jī)視覺頂級(jí)會(huì)議之一CVPR如期舉行,深蘭科技DeepBlueAI團(tuán)隊(duì)斬獲TinyAction Challenge(低分辨率視頻行為識(shí)別挑戰(zhàn)賽)的冠軍。

TinyAction Challenge是第六屆動(dòng)作識(shí)別國(guó)際挑戰(zhàn)賽系列競(jìng)賽之一,該系列競(jìng)賽由CVPR2021 International Challenge on Activity Recognition (ActivityNet) workshop 主辦,旨在推動(dòng)視頻理解的進(jìn)一步發(fā)展。

冠軍方案解讀

賽題介紹

TinyAction Challenge使用TinyVirat-v2[1]數(shù)據(jù)集,旨在提高低分辨率高噪聲等真實(shí)監(jiān)控場(chǎng)景下的視頻行為識(shí)別能力。比賽提供大量真實(shí)場(chǎng)景視頻片段及標(biāo)注,每個(gè)視頻片段中可能含有多個(gè)動(dòng)作,本質(zhì)是一個(gè)多標(biāo)簽的行為識(shí)別任務(wù),比賽結(jié)果采用precision、recall、F1-score等多個(gè)指標(biāo)來評(píng)測(cè)。

賽題難點(diǎn)

視頻分辨率很低,最小只有10x10像素尺度;

視頻尺度多樣,從10x10到128x128不等;

視頻質(zhì)量較差,含有大量噪聲;

視頻場(chǎng)景多樣,行為多樣,每個(gè)視頻可能含有多個(gè)行為。

解決方案

算法選擇上,團(tuán)隊(duì)廣泛嘗試了TSM[2]、TPN-Slowonly[3]等經(jīng)典算法,最終采用交互移除的CSN[4](ir-CSN)模型,在保證性能的前提下適當(dāng)減少計(jì)算量,同時(shí)減輕對(duì)數(shù)據(jù)的過擬合。

數(shù)據(jù)增強(qiáng)方面,訓(xùn)練時(shí)團(tuán)隊(duì)首先隨機(jī)調(diào)整尺度裁剪,再統(tǒng)一調(diào)整尺度到128x128,最后再隨機(jī)翻轉(zhuǎn)。而在測(cè)試時(shí),通過Tencrop,即對(duì)視頻幀及其水平翻轉(zhuǎn)在中心與四角區(qū)域分別裁剪求平均,有效提高了inference時(shí)單模型性能。

測(cè)試階段團(tuán)隊(duì)進(jìn)一步使用了五折交叉驗(yàn)證的模型融合方法。另外由于觀察到在比賽數(shù)據(jù)集的26類行為中有些類別是互斥的,因而對(duì)最終的結(jié)果添加了后處理規(guī)則,使得F1指標(biāo)進(jìn)一步提高0.6個(gè)點(diǎn)。通過一步步優(yōu)化,DeepBlueAI團(tuán)隊(duì)單模型的F1指標(biāo)即超過了第二名達(dá)到0.4447,并最終達(dá)到0.4782,實(shí)現(xiàn)大幅度領(lǐng)先。

總結(jié)

在本次比賽中,團(tuán)隊(duì)對(duì)任務(wù)及數(shù)據(jù)做了仔細(xì)的分析,合理地選擇了模型算法,進(jìn)行了精細(xì)的模型訓(xùn)練,同時(shí)在數(shù)據(jù)的后處理上做了大量的優(yōu)化,有效實(shí)現(xiàn)了低分辨率高噪聲視頻中行為識(shí)別,并最終獲得冠軍。相信隨著計(jì)算機(jī)視覺及多模態(tài)技術(shù)的深入發(fā)展,行為識(shí)別等視頻理解問題能夠得到更好的解決,并獲得越來越廣泛的實(shí)際應(yīng)用。

參考文獻(xiàn):

[1] Demir U, Rawat Y S, Shah M. TinyVIRAT: low-resolution video action recognition[C]//2020 25th International Conference on Pattern Recognition (ICPR)。 IEEE, 2021: 7387-7394

[2] Yang C, Xu Y, Shi J, et al. Temporal pyramid network for action recognition[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 591-600.

[3] Lin J, Gan C, Han S. TSM: Temporal Shift Module for Efficient Video Understanding[C]// 2019 IEEE/CVF International Conference on Computer Vision (ICCV)。 IEEE, 2019.

[4] Du T, Wang H, Feiszli M, et al. Video Classification With Channel-Separated Convolutional Networks[C]// International Conference on Computer Vision. 0.

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1698

    瀏覽量

    46024
  • 高噪聲率
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    5998
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1208

    瀏覽量

    24727
  • CSN
    CSN
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    8819
  • 深蘭科技
    +關(guān)注

    關(guān)注

    1

    文章

    56

    瀏覽量

    5996

原文標(biāo)題:賽道 | CVPR2021深蘭冠軍方案解讀- TinyAction Challenge低分辨率視頻行為識(shí)別挑戰(zhàn)賽

文章出處:【微信號(hào):kmdian,微信公眾號(hào):深蘭科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    如何選擇掃描電鏡的分辨率

    選擇掃描電鏡的分辨率需要綜合考慮多個(gè)因素。首先是研究目的。如果只是需要對(duì)樣品的大致形貌進(jìn)行觀察,例如查看較大顆粒的分布或者材料表面的宏觀缺陷,較低分辨率(如3-10nm)可能就足夠了。但如果要觀察
    的頭像 發(fā)表于 12-25 14:29 ?186次閱讀
    如何選擇掃描電鏡的<b class='flag-5'>分辨率</b>?

    芯華章持續(xù)助力EDA精英挑戰(zhàn)賽

    日前,2024中國(guó)研究生創(chuàng)“芯”大賽·EDA精英挑戰(zhàn)賽(以下簡(jiǎn)稱EDA競(jìng)賽)決賽在南京江北新區(qū)舉辦。今年EDA競(jìng)賽首次升級(jí)為國(guó),在全國(guó)超過500個(gè)參賽隊(duì)伍中,來自華南理工大學(xué)的"EDA240931參賽隊(duì)"從芯華章賽道脫穎而出,斬獲
    的頭像 發(fā)表于 12-17 15:47 ?268次閱讀

    EDA精英挑戰(zhàn)賽果公布!思爾芯“戰(zhàn)隊(duì)”薪火相承斬獲“麒麟杯”

    2024中國(guó)研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽12月7-8日,2024中國(guó)研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽(原“集成電路EDA設(shè)計(jì)精英挑戰(zhàn)賽”)總決賽及頒獎(jiǎng)典禮在南京成功舉辦。此次大賽,思爾芯作為核心
    的頭像 發(fā)表于 12-11 01:03 ?363次閱讀
    EDA精英<b class='flag-5'>挑戰(zhàn)賽</b><b class='flag-5'>賽</b>果公布!思爾芯“戰(zhàn)隊(duì)”薪火相承<b class='flag-5'>斬獲</b>“麒麟杯”

    HDMI接口支持哪些視頻分辨率

    HDMI(High-Definition Multimedia Interface)接口支持的視頻分辨率因版本不同而有所差異。以下是HDMI接口不同版本所支持的視頻分辨率的概述: HD
    的頭像 發(fā)表于 11-27 14:14 ?1977次閱讀

    視頻處理器的分辨率是如何管理的

    ? ? 隨著電子應(yīng)用技術(shù)和消費(fèi)市場(chǎng)的不斷發(fā)展,LED顯示屏的顯示單元之間的間距正在逐漸縮小,然而,顯示屏的整體面積卻在不斷擴(kuò)大。為了滿足這一趨勢(shì)下對(duì)超大輸出分辨率的需求,視頻處理器和拼接器變得
    的頭像 發(fā)表于 11-11 15:25 ?285次閱讀
    <b class='flag-5'>視頻</b>處理器的<b class='flag-5'>分辨率</b>是如何管理的

    冠軍說|第二屆OpenHarmony競(jìng)賽訓(xùn)練營(yíng)冠軍團(tuán)隊(duì)專訪

    實(shí)現(xiàn)技術(shù)創(chuàng)新,解決現(xiàn)實(shí)問題的呢? 高校創(chuàng)新技術(shù)人才又將如何助力OpenHarmony技術(shù)生態(tài)的繁榮與活力? 點(diǎn)擊下方視頻一起聽冠軍說 探秘冠軍團(tuán)隊(duì)與老師的獨(dú)家幕后分享 OpenHarmony 競(jìng)賽
    發(fā)表于 10-28 17:11

    2024年ICPC與華為挑戰(zhàn)賽冠軍杯圓滿落幕

    近日,2024年ICPC&華為挑戰(zhàn)賽冠軍杯在深圳圓滿落幕。該活動(dòng)由華為和ICPC聯(lián)合舉辦,匯聚全球頂尖的編程人才,共同探討和解決具有挑戰(zhàn)性的工業(yè)界真實(shí)問題,并對(duì)未來技術(shù)發(fā)展趨勢(shì)及關(guān)鍵挑戰(zhàn)
    的頭像 發(fā)表于 10-27 16:00 ?800次閱讀

    視頻超分技術(shù)是指什么?

    ??超分辨率技術(shù)(SuperResolution),是通過硬件或軟件的方法提高圖像或視頻幀的分辨率,通過一系列低分辨率圖像獲取到高分辨率圖像
    的頭像 發(fā)表于 09-04 08:05 ?414次閱讀
    <b class='flag-5'>視頻</b>超分技術(shù)是指什么?

    VR顯示器分辨率的選擇

    顯示器能夠提供更加清晰、細(xì)膩的畫面,讓用戶在虛擬現(xiàn)實(shí)世界中獲得更加真實(shí)的感受。 1.2 分辨率與舒適度 除了視覺體驗(yàn)外,分辨率還與用戶的舒適度密切相關(guān)。低分辨率的VR顯示器容易產(chǎn)生紗窗效應(yīng)(Screen Door Effect)
    的頭像 發(fā)表于 07-08 10:29 ?1124次閱讀

    格靈深瞳斬獲首屆花樣滑冰動(dòng)作識(shí)別競(jìng)賽奪冠

    近日,第一屆花樣滑冰動(dòng)作識(shí)別挑戰(zhàn)賽公布了本次競(jìng)賽的結(jié)果,格靈深瞳憑借領(lǐng)先的算法能力斬獲冠軍,并包攬了本次挑戰(zhàn)賽的前兩名。
    的頭像 發(fā)表于 05-13 14:04 ?424次閱讀
    格靈深瞳<b class='flag-5'>斬獲</b>首屆花樣滑冰動(dòng)作<b class='flag-5'>識(shí)別</b>競(jìng)賽奪冠

    基于CNN的圖像超分辨率示例

    考慮單個(gè)低分辨率圖像,首先使用雙三次插值將其放大到所需的大小,這是執(zhí)行的唯一預(yù)處理。將插值圖像表示為Y。我們的目標(biāo)是從Y中恢復(fù)與真實(shí)高分辨率圖像X盡可能相似的圖像F (Y) 。
    的頭像 發(fā)表于 03-11 11:40 ?717次閱讀
    基于CNN的圖像超<b class='flag-5'>分辨率</b>示例

    EVAL_PASCO2_SENSOR為什么無(wú)法從較低的分辨率高速獲得更高的分辨率?

    捕獲,同時(shí)高速傳輸較低分辨率(640x480,1280x720,1920x1080)時(shí),靜止請(qǐng)求被觸發(fā),它正在從一種分辨率轉(zhuǎn)移到另一種分辨率,但無(wú)法進(jìn)行靜態(tài)捕獲。 我在調(diào)試時(shí)觀察到了以下幾點(diǎn): 1
    發(fā)表于 02-22 07:58

    編碼器分辨率是什么意思 編碼器分辨率和脈沖數(shù)的關(guān)系

    按照編碼器支持的分辨率可以把編碼器分成標(biāo)清編碼器、高清編碼器、全高清編碼器,分辨率越高幀率越高視頻就越清楚。 1.編碼器的分辨率是什么意思 編碼器的
    的頭像 發(fā)表于 02-21 18:07 ?4298次閱讀
    編碼器<b class='flag-5'>分辨率</b>是什么意思 編碼器<b class='flag-5'>分辨率</b>和脈沖數(shù)的關(guān)系

    什么是DSR(動(dòng)態(tài)超級(jí)分辨率)?DSR是做什么的?如何開啟DSR技術(shù)?

    使用高分辨率渲染來模擬更高的顯示分辨率,然后重采樣到實(shí)際的顯示分辨率,以提供更高質(zhì)量的圖像。 DSR的主要目標(biāo)是在較低分辨率的情況下提供更好的圖像質(zhì)量。傳統(tǒng)上,較低的
    的頭像 發(fā)表于 01-17 11:17 ?1.5w次閱讀

    鏡頭分辨率簡(jiǎn)述

    分辨率可以從顯示分辨率與圖像分辨率兩個(gè)方向來分類。
    的頭像 發(fā)表于 01-15 11:12 ?954次閱讀