国产亚洲一区二区手机在线观看,97人人人人免费,亚洲va久久久噜噜噜久

眾所周知：視頻是可以P的。

這不，在CVPR 2022收錄的論文中，就出現(xiàn)了這么一個P圖神器，它可以分分鐘給你上演各種人像消失大法，不留任何痕跡。

去水印、填補缺失更是不在話下，并且各種分辨率的視頻都能hold住。

正如你所見，這個模型如此絲滑的表現(xiàn)讓它在兩個基準數(shù)據(jù)集上都實現(xiàn)了SOTA性能。

△與SOTA方法的對比

同時它的推理時間和計算復雜表現(xiàn)也很搶眼：

前者比此前的方法快了近15倍，可以在Titan XP GPU上以每幀0.12秒的速度處理432 × 240的視頻；后者則是在所有比較的SOTA方法中實現(xiàn)了最低的FLOPs分數(shù)。

如此神器，什么來頭？

改善光流法

目前很多視頻修復算法利用的都是光流法（Optical flow）。

也就是利用圖像序列中像素在時間域上的變化以及相鄰幀之間的相關性，找到上一幀跟當前幀之間存在的對應關系，從而計算出相鄰幀之間物體的運動信息。

這個方法的缺點很明顯：計算量大、耗時長，也就是效率低。

為此，研究人員設計了三個可訓練模塊，分別為流完成（flow completion）、特征傳播（feature propagation）和內容幻想（content hallucination），提出了一個流引導（flow-guided）的端到端視頻修復框架：

E2FGVI。

這三個模塊與之前基于光流的方法的三個階段相對應，不過可以進行聯(lián)合優(yōu)化，從而實現(xiàn)更高效的修復過程。

具體來說，對于流完成模塊，該方法直接在mask viedo中一步完成操作，而不是像此前方法采用多個復雜的步驟。

對于特征傳播模塊，與此前的像素級傳播相比，該方法中的流引導傳播過程在特征空間中借助可變形卷積進行。

通過更多可學習的采樣偏移和特征級操作，傳播模塊釋放了此前不能準確進行流估計的壓力。

對于內容幻想模塊，研究人員則提出了一種時間焦點Transformer來有效地建?？臻g和時間維度上的長程依賴關系。

同時該模塊還考慮了局部和非局部時間鄰域，從而獲得更具時間相關性的修復結果。

作者：希望成為新基線

定量實驗：

研究人員在數(shù)據(jù)集YouTube VOS和DAVIS上進行了定量實驗，將他們的方法與之前的視頻修復方法進行了比較。

如下表所示，E2FGVI在全部四個量化指標上都遠遠超過了這些SOTA算法，能夠生成變形更少（PSNR和SSIM）、視覺上更合理（VFID）和時空一致性更佳（Ewarp）的修復視頻，驗證了該方法的優(yōu)越性。

此外，E2FGVI也具有最低的FLOPs值（計算復雜度），盡管訓練是在432 × 240分辨率的視頻上進行，它的HQ版本做到了支持任意分辨率。

定性實驗：

研究人員首先選擇了三種最有代表性的方法，包括CAP、FGVC（基于光流法）和Fuseformer（入選ICCV 2021），進行對象移除（下圖前三行）和缺失補全（下圖后兩行）的效果比較。

可以發(fā)現(xiàn)，前三種方法很難在遮擋區(qū)域恢復出合理的細節(jié)、擦除人物也會造成模糊，但E2FGVI可以生成相對真實的紋理和結構信息。

此外，它們還選用了5種方法進行了用戶研究，結果大部分人都對E2FGVI修復后的效果更滿意。

綜上，研究人員也表示，希望他們提出的方法可以成為視頻修復領域新的強大基線。

作者介紹

E2FGVI由南開大學和海思合作完成。

一作Li Zhen為南開大學博士生，共同一作Lu ChengZe也來自南開。

通訊作者為南開大學計算機學院教授程明明，主要研究方向是計算機視覺和圖形學。

目前，E2FGVI的代碼已經(jīng)開源，作者也提供了Colab實現(xiàn)，未來還將在Hugging Face給出demo。

論文地址： https://arxiv.org/abs/2204.02663

GitHub主頁： https://github.com/MCG-NKU/E2FGVI

審核編輯：李倩

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

計算機視覺

計算機視覺

+關注

關注
8

文章
1702

瀏覽量
46225
數(shù)據(jù)集

數(shù)據(jù)集

+關注

關注
4

文章
1212

瀏覽量
24964

原文標題：CVPR 2022 | 視頻P圖新SOTA：推理速度快近15倍，任意分辨率均可上演人像消失大法

文章出處：【微信號：CVSCHOOL，微信公眾號：OpenCV學堂】歡迎添加關注！文章轉載請注明出處。

搜索歷史

視頻P圖新SOTA：推理速度快近15倍

評論

DeepSeek最新論文：訓練速度提升9倍，推理速度快11倍！

使用修改后的基準C++工具推斷灰度圖像時的推理速度慢怎么解決？

k230如何將yolo分類視頻流推理后的視頻結果保存到本地？

在ARM上實現(xiàn)模擬視頻的實時解碼，模擬相機的速度為1080p 30fps，TVP5150能達到這個速度嗎？

谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍

6G測試速度達938Gbps,比5G速度快5000倍

內存儲器的特點是速度快成本低容量小對嗎

Anthropic 發(fā)布Claude 3.5 Sonnet模型運行速度是Claude 3 Opus的兩倍

NB81是否支持OneNet SOTA功能？應該如何激活SOTA？

旋變位置不變的情況下，當使能SOTA功能與關閉SOTA功能時，APP中DSADC采樣得到的旋變sin和cos兩者值不一樣，為什么？

OpenAI全新GPT-4o能力炸場！速度快/成本低，能讀懂人類情緒

眾鑫創(chuàng)展----1080P十倍光學變焦攝像頭方案

STM32f103系列8位并口與硬件SPI驅動1.8TFT的屏幕，哪個速度快？

flash激光雷達組成及優(yōu)勢

指紋掛鎖方案——采用ACH512或ACM32FP4指紋芯片和88*112傳感器，指紋識別速度快，BOM成本低