0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

全面解讀CVPR2021-MMAct挑戰(zhàn)賽跨模態(tài)動(dòng)作識(shí)別雙冠方案

深蘭科技 ? 來(lái)源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-06-25 10:53 ? 次閱讀

導(dǎo)讀

日前,計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域的三大頂級(jí)會(huì)議之一CVPR正在進(jìn)行中,深蘭DeepBlueAI團(tuán)隊(duì)在動(dòng)作識(shí)別國(guó)際挑戰(zhàn)賽 (ActivityNet) 研討會(huì)上,參加了 MMAct 挑戰(zhàn)賽中僅設(shè)的兩個(gè)賽道——“跨模態(tài)裁剪動(dòng)作識(shí)別”和“跨模態(tài)未裁剪動(dòng)作時(shí)序定位”,并均以大比分領(lǐng)先取得第一。

冠軍方案解讀

競(jìng)賽要求參賽者提出跨模態(tài)視頻動(dòng)作識(shí)別/定位方法,以彌補(bǔ)使用 MMAct[1] 數(shù)據(jù)集的純視覺(jué)方法的缺點(diǎn)。此任務(wù)的目標(biāo)是利用基于傳感器的,例如穿戴式傳感器數(shù)據(jù)作為特權(quán)信息,以及基于視覺(jué)的模態(tài),其方式可以克服訓(xùn)練(傳感器 + 視頻)和測(cè)試(僅視頻)階段之間模態(tài)差異所帶來(lái)的限制。用于此競(jìng)賽的多模態(tài)數(shù)據(jù)包括:加速度、方向、陀螺儀、RGB 視頻和人體關(guān)鍵點(diǎn)。

挑戰(zhàn)賽促進(jìn)了關(guān)于如何通過(guò)使用跨模態(tài)方法解決視覺(jué)挑戰(zhàn)的另一種觀點(diǎn),希望擴(kuò)大對(duì)視頻動(dòng)作理解的研究,以進(jìn)一步利用日常使用的智能設(shè)備(例如智能手機(jī))中的傳感器。

賽題一

跨模態(tài)裁剪動(dòng)作識(shí)別

Cross-Modal Trimmed Action Recognition

在此任務(wù)中,參與者使用來(lái)自MMAct 的修剪視頻以及配對(duì)的傳感器數(shù)據(jù),在數(shù)據(jù)中包含交叉視角和交叉場(chǎng)景兩種類(lèi)型的數(shù)據(jù),共35個(gè)動(dòng)作類(lèi)別。任務(wù)允許參與者使用修剪過(guò)的傳感器數(shù)據(jù)和修剪過(guò)的視頻進(jìn)行訓(xùn)練,但不能同時(shí)使用交叉視角和交叉場(chǎng)景的數(shù)據(jù),且僅對(duì)修剪過(guò)的視頻進(jìn)行測(cè)試以進(jìn)行動(dòng)作識(shí)別,并采用mAP作為評(píng)價(jià)指標(biāo)。

賽題難點(diǎn):

不同視頻等多模態(tài)數(shù)據(jù)時(shí)序長(zhǎng)度變化大,從幾秒到幾分鐘不等;

測(cè)試階段只提供了視頻數(shù)據(jù)。

應(yīng)用場(chǎng)景:

視頻監(jiān)控、異常行為識(shí)別

解決方案:

考慮到視頻長(zhǎng)度較長(zhǎng),為了有效地捕獲視頻中的動(dòng)作信息,團(tuán)隊(duì)優(yōu)先采用了等間隔采樣的方式對(duì)每個(gè)視頻進(jìn)行采樣,然后采用隨機(jī)尺度裁剪、水平翻轉(zhuǎn)等數(shù)據(jù)增強(qiáng)方式進(jìn)行增強(qiáng)。

算法選型上,團(tuán)隊(duì)優(yōu)先采用了TSM[2]進(jìn)行實(shí)驗(yàn),它具有高效率和高性能。具體來(lái)說(shuō),它可以達(dá)到 3D CNN 的性能,但保持 2D CNN 的復(fù)雜性。TSM 沿時(shí)間維度移動(dòng)部分通道,從而促進(jìn)相鄰幀之間的信息交換,它還可以插入到 2D CNN 中以實(shí)現(xiàn)零計(jì)算和零參數(shù)的時(shí)間建模。

作為對(duì)比,團(tuán)隊(duì)同時(shí)采用了滑動(dòng)窗口的形式進(jìn)行幀數(shù)據(jù)采樣,并采用ir-CSN[3]進(jìn)行實(shí)驗(yàn)。CSN探索了通道之間交互的重要性,并達(dá)到了節(jié)省計(jì)算參數(shù)和通道之間交互的平衡,網(wǎng)絡(luò)具有結(jié)構(gòu)精簡(jiǎn)、計(jì)算量小、速度快、準(zhǔn)確率好的優(yōu)點(diǎn),并且還有一定的正則化能力。

最后,在進(jìn)行了為每個(gè)視頻采樣不同的幀數(shù),是否添加Non-Local模塊,以及MixUp與ColorJitter數(shù)據(jù)增強(qiáng)的實(shí)驗(yàn)之后,團(tuán)隊(duì)采用TSM,以ResNet50作為Backbone, 并以等間隔采樣的方式采樣32幀,最終取得了最好的單模成績(jī)。在融合ir-CSN結(jié)果后,取得了最好的線(xiàn)上成績(jī)。

賽題二

跨模態(tài)未裁剪動(dòng)作時(shí)序定位

Cross-Modal Untrimmed Action Temporal Localization,在這項(xiàng)任務(wù)中,參與者使用來(lái)自MMAct 的未修剪視頻以及配對(duì)的傳感器數(shù)據(jù),在數(shù)據(jù)中包含交叉視角和交叉場(chǎng)景兩種類(lèi)型的數(shù)據(jù),共35個(gè)動(dòng)作類(lèi)別。參與者允許使用未修剪的配對(duì)傳感器數(shù)據(jù)和視頻進(jìn)行訓(xùn)練,然后在僅包含未修剪的視頻數(shù)據(jù)的測(cè)試集上進(jìn)行時(shí)間動(dòng)作定位,輸出未修剪視頻中識(shí)別的動(dòng)作類(lèi)別及其開(kāi)始和結(jié)束時(shí)間,并采用AP作為評(píng)價(jià)指標(biāo)。

賽題難點(diǎn):

視頻時(shí)長(zhǎng)較長(zhǎng),從幾分鐘到十幾分鐘不等;

測(cè)試階段只提供了視頻數(shù)據(jù)。

應(yīng)用場(chǎng)景:

視頻監(jiān)控、異常行為識(shí)別、定位

解決方案:

考慮到在測(cè)試集中只提供了視頻數(shù)據(jù),因此團(tuán)隊(duì)的實(shí)現(xiàn)方案主要在視頻數(shù)據(jù)上進(jìn)行實(shí)驗(yàn)。在時(shí)序動(dòng)作定位相關(guān)的工作中,主流的方法如BSN[5]、BMN[6]等。需要經(jīng)過(guò):視頻抽幀-》提取光流-》行為識(shí)別算法進(jìn)行特征提取-》時(shí)序動(dòng)作定位算法進(jìn)行動(dòng)作定位-》行為識(shí)別算法進(jìn)行動(dòng)作識(shí)別等多個(gè)環(huán)節(jié),整個(gè)方案實(shí)現(xiàn)流程十分繁雜。

在實(shí)現(xiàn)方案中為了簡(jiǎn)化方案流程,采用AFSD[7]作為算法實(shí)現(xiàn)。這是一個(gè)anchor-free的時(shí)序定位框架,并且是一個(gè)end-to-end使用視頻幀作為輸入而不是特征作為輸入的算法。

為了獲得模型的輸入,團(tuán)隊(duì)對(duì)每個(gè)視頻以動(dòng)態(tài)幀率采樣2304幀,并進(jìn)行光流計(jì)算,這樣可以保證10分鐘以上的視頻有大約3幀的采樣幀率,不至于丟失過(guò)多的視頻信息。最后再分別采用RGB數(shù)據(jù)和光流數(shù)據(jù)進(jìn)行訓(xùn)練,并融合兩種類(lèi)型的預(yù)測(cè)結(jié)果后,取得了團(tuán)隊(duì)最好成績(jī)。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • RGB
    RGB
    +關(guān)注

    關(guān)注

    4

    文章

    800

    瀏覽量

    58600
  • 計(jì)算機(jī)視覺(jué)

    關(guān)注

    8

    文章

    1699

    瀏覽量

    46052
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1208

    瀏覽量

    24749
  • 深蘭科技
    +關(guān)注

    關(guān)注

    1

    文章

    58

    瀏覽量

    6006

原文標(biāo)題:賽道 | CVPR2021-MMAct挑戰(zhàn)賽跨模態(tài)動(dòng)作識(shí)別雙冠方案解讀

文章出處:【微信號(hào):kmdian,微信公眾號(hào):深蘭科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    優(yōu)秀獎(jiǎng)及決賽陣容震撼公布 第二屆OpenHarmony創(chuàng)新應(yīng)用挑戰(zhàn)賽決戰(zhàn)在即

    創(chuàng)意和技術(shù)潛力。2024年10月21日,第二屆OpenHarmony創(chuàng)新應(yīng)用挑戰(zhàn)賽正式啟動(dòng),題總獎(jiǎng)金高達(dá)50萬(wàn)元,吸引了全國(guó)各地418支參賽隊(duì)伍的積極參與。 歷經(jīng)兩個(gè)月的激烈角逐,12支團(tuán)隊(duì)脫穎而出,晉級(jí)決賽。截至2025年
    的頭像 發(fā)表于 01-14 09:07 ?97次閱讀
    優(yōu)秀獎(jiǎng)及決賽陣容震撼公布  第二屆OpenHarmony創(chuàng)新應(yīng)用<b class='flag-5'>挑戰(zhàn)賽</b>決戰(zhàn)在即

    探索具身智能邊界,地瓜機(jī)器人邀你共戰(zhàn)ICRA 2025 Sim2Real挑戰(zhàn)賽

    探索具身智能邊界,地瓜機(jī)器人邀你共戰(zhàn)ICRA 2025 Sim2Real挑戰(zhàn)賽
    的頭像 發(fā)表于 01-13 20:18 ?42次閱讀
    探索具身智能邊界,地瓜機(jī)器人邀你共戰(zhàn)ICRA 2025 Sim2Real<b class='flag-5'>挑戰(zhàn)賽</b>

    芯華章持續(xù)助力EDA精英挑戰(zhàn)賽

    日前,2024中國(guó)研究生創(chuàng)“芯”大賽·EDA精英挑戰(zhàn)賽(以下簡(jiǎn)稱(chēng)EDA競(jìng)賽)決賽在南京江北新區(qū)舉辦。今年EDA競(jìng)賽首次升級(jí)為國(guó),在全國(guó)超過(guò)500個(gè)參賽隊(duì)伍中,來(lái)自華南理工大學(xué)的"EDA240931參賽隊(duì)"從芯華章賽道脫穎而出,斬獲僅有2支隊(duì)伍能獲得的菁英杯大獎(jiǎng),祝賀!
    的頭像 發(fā)表于 12-17 15:47 ?316次閱讀

    EDA精英挑戰(zhàn)賽果公布!思爾芯“戰(zhàn)隊(duì)”薪火相承斬獲“麒麟杯”

    2024中國(guó)研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽12月7-8日,2024中國(guó)研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽(原“集成電路EDA設(shè)計(jì)精英挑戰(zhàn)賽”)總決賽及頒獎(jiǎng)典禮在南京成功舉辦。此次大賽,思爾芯作為核心
    的頭像 發(fā)表于 12-11 01:03 ?388次閱讀
    EDA精英<b class='flag-5'>挑戰(zhàn)賽</b><b class='flag-5'>賽</b>果公布!思爾芯“戰(zhàn)隊(duì)”薪火相承斬獲“麒麟杯”

    e絡(luò)盟社區(qū)攜手恩智浦發(fā)起智能空間樓宇自動(dòng)化挑戰(zhàn)賽

    安富利旗下全球電子元器件產(chǎn)品與解決方案分銷(xiāo)商e絡(luò)盟社區(qū)與恩智浦聯(lián)合發(fā)起圍繞智能空間樓宇自動(dòng)化設(shè)計(jì)的全新挑戰(zhàn)賽。本次挑戰(zhàn)賽邀請(qǐng)工程師和技術(shù)愛(ài)好者利用恩智浦FRDM MCX A 系列(A15X)開(kāi)發(fā)套件,開(kāi)發(fā)創(chuàng)新的解決
    的頭像 發(fā)表于 11-14 10:44 ?262次閱讀
    e絡(luò)盟社區(qū)攜手恩智浦發(fā)起智能空間樓宇自動(dòng)化<b class='flag-5'>挑戰(zhàn)賽</b>

    2024年ICPC與華為挑戰(zhàn)賽冠軍杯圓滿(mǎn)落幕

    近日,2024年ICPC&華為挑戰(zhàn)賽冠軍杯在深圳圓滿(mǎn)落幕。該活動(dòng)由華為和ICPC聯(lián)合舉辦,匯聚全球頂尖的編程人才,共同探討和解決具有挑戰(zhàn)性的工業(yè)界真實(shí)問(wèn)題,并對(duì)未來(lái)技術(shù)發(fā)展趨勢(shì)及關(guān)鍵挑戰(zhàn)展開(kāi)討論。今年的
    的頭像 發(fā)表于 10-27 16:00 ?836次閱讀

    PI助力aCentauri車(chē)隊(duì)在太陽(yáng)能車(chē)挑戰(zhàn)賽中大放異彩

    在2023年10月,Power Integrations (PI) 為當(dāng)時(shí)舉行的普利司通世界太陽(yáng)能車(chē)挑戰(zhàn)賽提供了先進(jìn)的技術(shù)和支持。
    的頭像 發(fā)表于 10-27 14:08 ?329次閱讀
    PI助力aCentauri車(chē)隊(duì)在太陽(yáng)能車(chē)<b class='flag-5'>挑戰(zhàn)賽</b>中大放異彩

    50萬(wàn)獎(jiǎng)金池!開(kāi)放原子大賽——第二屆OpenHarmony創(chuàng)新應(yīng)用挑戰(zhàn)賽正式啟動(dòng)

    第二屆OpenHarmony創(chuàng)新應(yīng)用挑戰(zhàn)賽作為開(kāi)放原子大賽旗下的重要項(xiàng),聚焦 OpenHarmony應(yīng)用開(kāi)發(fā),致力提升開(kāi)發(fā)者的動(dòng)手實(shí)踐能力與開(kāi)發(fā)創(chuàng)新應(yīng)用的能力。 項(xiàng)要求開(kāi)發(fā)者
    發(fā)表于 10-24 15:40

    NVIDIA Research端到端自動(dòng)駕駛模型引領(lǐng)國(guó)際挑戰(zhàn)賽

    NVIDIA 在國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議(CVPR)上展示了用于自動(dòng)駕駛汽車(chē)開(kāi)發(fā)的加速計(jì)算和生成式 AI 的突破技術(shù)。
    的頭像 發(fā)表于 09-09 10:11 ?536次閱讀

    NVIDIA為AI城市挑戰(zhàn)賽構(gòu)建合成數(shù)據(jù)集

    在一年一度的 AI 城市挑戰(zhàn)賽中,來(lái)自世界各地的數(shù)百支參賽隊(duì)伍在 NVIDIA Omniverse 生成的基于物理學(xué)的數(shù)據(jù)集上測(cè)試了他們的 AI 模型。
    的頭像 發(fā)表于 09-09 10:04 ?513次閱讀

    AI4Science黑客松光子計(jì)算挑戰(zhàn)賽成功舉辦

    經(jīng)過(guò)數(shù)月角逐,第二屆AI4Science黑客松競(jìng)賽日前落下帷幕。在曦智科技主持的光子計(jì)算挑戰(zhàn)賽中,參賽選手何自強(qiáng)和來(lái)自東北大學(xué)的參賽隊(duì)伍T(mén)he Power of Light獲得完優(yōu)勝獎(jiǎng)。
    的頭像 發(fā)表于 08-07 09:58 ?563次閱讀

    思爾芯題正式發(fā)布,邀你共戰(zhàn)EDA精英挑戰(zhàn)賽!

    題發(fā)布COMPETITIONRELEASE2024中國(guó)研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽(原“集成電路EDA設(shè)計(jì)精英挑戰(zhàn)賽”)現(xiàn)已正式拉開(kāi)帷幕。作為核心出題企業(yè)之一思爾芯(S2C),已經(jīng)為你們準(zhǔn)備了
    的頭像 發(fā)表于 08-03 08:24 ?704次閱讀
    思爾芯<b class='flag-5'>賽</b>題正式發(fā)布,邀你共戰(zhàn)EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>!

    浪潮信息獲CVPR2024自動(dòng)駕駛挑戰(zhàn)賽&quot;Occupancy&amp; Flow&quot;冠軍

    北京2024年6月25日 /美通社/ -- 近日,在全球權(quán)威的CVPR 2024自動(dòng)駕駛國(guó)際挑戰(zhàn)賽(Autonomous Grand Challenge)中,浪潮信息AI團(tuán)隊(duì)所提交的"F-OCC
    的頭像 發(fā)表于 06-25 20:29 ?403次閱讀
    浪潮信息獲<b class='flag-5'>CVPR</b>2024自動(dòng)駕駛<b class='flag-5'>挑戰(zhàn)賽</b>&quot;Occupancy&amp; Flow&quot;冠軍

    格靈深瞳斬獲首屆花樣滑冰動(dòng)作識(shí)別競(jìng)賽奪冠

    近日,第一屆花樣滑冰動(dòng)作識(shí)別挑戰(zhàn)賽公布了本次競(jìng)賽的結(jié)果,格靈深瞳憑借領(lǐng)先的算法能力斬獲了冠軍,并包攬了本次挑戰(zhàn)賽的前兩名。
    的頭像 發(fā)表于 05-13 14:04 ?435次閱讀
    格靈深瞳斬獲首屆花樣滑冰<b class='flag-5'>動(dòng)作</b><b class='flag-5'>識(shí)別</b>競(jìng)賽奪冠

    觸景無(wú)限榮獲英特爾邊緣挑戰(zhàn)賽全球Top10,致力發(fā)展工業(yè)新生產(chǎn)力

    近日,觸景無(wú)限科技憑借卓越的技術(shù)實(shí)力和創(chuàng)新的解決方案:《電廠熱力管道監(jiān)測(cè)》(OCR賽道)與《尾礦庫(kù)風(fēng)險(xiǎn)監(jiān)測(cè)》(缺陷檢測(cè)賽道),在2023英特爾邊緣解決方案挑戰(zhàn)賽中喜獲殊榮,成功入選全球Top10。
    的頭像 發(fā)表于 02-25 15:24 ?1104次閱讀