基于深度學習的光流計算技術應用

作者：崔毅博，湯仁東，邢大軍，王雋，李尚生

01??引言

光流計算作為計算機視覺的一個長期基本任務，其重要性顯而易見。由于運動視覺處理的特殊性，光流作為后面高級視覺處理的輸入，對其準確度、實時性都有著極高的要求，光流計算的性能會直接影響其后的高級視覺處理。

光流計算技術在計算機視覺的各主要研究方向如檢測、分割、導航、位姿估計、3維重建等領域中都有著重要的應用，其相關算法在更上層的應用場景如自動駕駛、氣象預報、雷達信息處理、衛(wèi)星及航空影像分析、同步定位與地圖構(gòu)建( SLAM)、視覺神經(jīng)科學相關領域以及軍事應用領域等前沿熱點方向更是有著重要的研究價值與應用價值。由此可見光流計算技術的發(fā)展對于計算機視覺領域的重要意義。

本文按照傳統(tǒng)光流計算技術的主要發(fā)展過程(第2節(jié))、基于深度學習的光流計算技術發(fā)展過程(第3節(jié))、光流測試相關數(shù)據(jù)集和性能評價指標(第4節(jié))、光流計算技術的具體應用(第5節(jié))、總結(jié)及光流計算技術未來發(fā)展趨勢展望(第6節(jié))的順序安排各節(jié)內(nèi)容。

02??傳統(tǒng)光流計算技術的主要發(fā)展過程

通過圖像計算光流，自20世紀80年代興起，其中具有代表性的經(jīng)典算法為Horn等人[1]提出的HS(Horn-Schunck)光流算法與Lucas等人[2]提出的LK(Lucas-Kanade)光流算法，而后基于這兩種算法的各種改進版本有許多。其中HS算法是基于變分法求解光流，LK算法是基于差分法求解光流，但二者都基于兩個共同的假設：

假設1　亮度恒定假設：同一目標在不同幀間運動時，其亮度不會發(fā)生改變。

假設2　小運動假設：短時間像素的位置不會劇烈變化，即相鄰幀之間像素距離變化較小。

用數(shù)學模型說明如下：若表示t時刻位置的像素在圖像上的亮度，則根據(jù)假設1和假設2得到

若，分別為像素沿x與y軸的速度，對式(1)進行泰勒展開，忽略高階無窮小后對t求導，而后代入，則可得

式(2)就是由光流的基本假設推出的光流基本方程。在其基礎上通過加入不同的約束、改變求解方式，得到像素的值即圖像相鄰幀之間的光流。

2.1 HS光流算法

HS光流算法是一種優(yōu)化算法，通過在假設1、假設2的基礎上加入全局平滑約束條件，即假設值小范圍內(nèi)變化很小，其加入的全局平滑約束項為

此約束項表征光流的連續(xù)性即平滑(其為0時代表光流在任意方向無變化)，結(jié)合光流基本方程建立平滑約束下光流優(yōu)化方程(也稱能量函數(shù))

其中，是平滑項的權(quán)重，根據(jù)假設最小化此方程，利用歐拉-拉格朗日(Euler-Lagrange)方程求解，經(jīng)迭代至收斂得到光流信息。此類優(yōu)化方法易陷入局部極值，其初始值很重要，而實際使用時往往無法獲得初始值，這就導致此類算法在新場景下會有一段不穩(wěn)定期。

2.2 LK光流算法

LK光流在假設1和假設2的基礎上增加假設3：

假設3　空間一致性：某一個小窗口內(nèi)的像素短時間內(nèi)具有相同的運動(即相同)。

若小窗口為，則其中有個像素，則可根據(jù)式(2)列出超定方程并用最小二乘法解此方程即可求出這個窗口的光流值。由于此類方法在大窗口下無法保證相同運動方向和假設2這個微分條件的成立，需利用圖像金字塔技術[3]把圖像分層壓縮到低分辨率，把大位移運動變成了高層金字塔的小位移運動，進而配合插值算法逐層應用此方法求解光流。

在以上兩種算法的基礎上，針對光流的不同問題有相應的改進方法，如：為解決算法易陷入局部極值問題而提出的前后向光流法[4]，為解決遮擋問題而融合卡爾曼濾波運動預測的LK改進算法[5]，以及各類通過改進定位角點準確度與匹配準確度來提升光流準確性的改進方法等。

隨著深度學習的興起，利用卷積神經(jīng)網(wǎng)絡來進行光流估計已經(jīng)成為一種重要方法，與計算機視覺其他領域橫向比較，基于深度學習的光流計算方法在準確度、魯棒性、實時性等方面有著天然的優(yōu)勢。因此基于深度學習的光流計算通常被認為是有別于經(jīng)典算法的一種新模式，也是一個極具發(fā)展前景的技術方向。

03??基于深度學習的光流計算技術發(fā)展

有別于傳統(tǒng)人工設計的方法來求解光流，深度學習從數(shù)據(jù)的角度出發(fā)，利用數(shù)據(jù)訓練相關模型，從而得到可以準確進行光流估計的模型，并利用此模型在應用場景中對光流進行估計。隨著GPU以及計算機算力的不斷發(fā)展，目前基于深度學習的光流計算無論在準確度還是實時性上都已經(jīng)超過經(jīng)典算法。

Dosovitskiy等人[6]在2015年首次提出的基于卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks, CNN)的FlowNet實現(xiàn)了利用卷積神經(jīng)網(wǎng)絡進行光流的估計(第1代監(jiān)督模型)，為訓練所提出的模型同時開發(fā)了Flying Chairs數(shù)據(jù)集，F(xiàn)lowNet的提出表明了完全基于卷積神經(jīng)網(wǎng)絡端到端的架構(gòu)有能力解決光流估計的相關問題。此后基于深度學習的模型逐步在性能上趕超經(jīng)典算法。其中主要可以分為兩個大類：基于監(jiān)督學習的光流估計模型和自監(jiān)督學習的光流估計模型。下面分別進行介紹。

3.1 基于監(jiān)督學習的光流估計模型

監(jiān)督學習模型往往需要結(jié)合相關領域知識，利用監(jiān)督學習的方式來對模型進行訓練，其中結(jié)合領域知識方面主要有兩種途徑：

第1種是結(jié)合數(shù)據(jù)相關知識。普遍的做法就是通過把領域知識制作成光流相關數(shù)據(jù)集，使得神經(jīng)網(wǎng)絡可以利用這類數(shù)據(jù)集進行訓練和評估，從而使得訓練出的深度學習模型可以進行光流估計。相關數(shù)據(jù)集介紹詳見第4節(jié)。

第2種是借鑒之前已有經(jīng)典算法的約束條件與計算框架。結(jié)合卷積神經(jīng)網(wǎng)絡可以提取圖像高維度特征以及可以進行并行計算的特點，進而得到光流在準確率和實時性上的提升，其中比較有代表性的就是 DCflow[7]，上述兩種領域知識結(jié)合方法在監(jiān)督學習中可以同時使用。

DCflow參考FullFlow[8]提出的代價體(cost volume)以及由粗糙到精細的(Coarse-To-Fine, CTF)范式，這種CTF范式結(jié)構(gòu)主要分為4步：特征提取(features)、構(gòu)建代價體(cost volume)、代價體處理與光流后處理。

CTF范式的主要計算量在計算和優(yōu)化代價體以及后處理上，代價體表示了每個位置提取出的高維特征之間的聯(lián)系，在FlowNet2.0[9](把FlowNetS/C相關模塊進行了組合堆疊實驗)中作者也支持顯示地構(gòu)建代價體，稱其往往比隱式的效果要好。繼FlowNet2.0之后，深度學習算法在實時性和精度上都開始超越經(jīng)典算法，其中較為重要的借鑒經(jīng)典算法結(jié)構(gòu)的深度卷積網(wǎng)絡模型是基于CTF范式的PWC-Net(Pyramid, Warping, and Cost volume, PWC)[10](第2代監(jiān)督模型)，其框架如圖1所示。

圖1 傳統(tǒng)框架與PWC-Net框架圖對比圖(圖片改繪自文獻[10])

PWC-Net相較于FlowNet2.0，準確率更高且速度更快，改進了FlowNet2.0模型參數(shù)量大且訓練繁瑣的問題(速度快2倍參數(shù)量下降17倍)。其主要結(jié)構(gòu)借鑒傳統(tǒng)基于能量最小化的CTF光流計算框架(如圖1)，與傳統(tǒng)方法不同的是，其先利用卷積層進行圖像金字塔計算；再利用warp層模仿warp算法把第2幀圖像利用上一幀光流扭曲(warp)到第1幀；然后對金字塔每一層利用卷積提取的特征(features)構(gòu)建代價體(cost volume)找到特征之間的關系，把第1幀圖像的特征、代價體、上一幀的光流輸入到光流估計層得到光流估計；對應傳統(tǒng)光流計算的后處理模塊，最后用基于空洞卷積的上下文網(wǎng)絡進行后處理，這個網(wǎng)絡輸入上一層的光流估計值和光流估計值的倒數(shù)第2層特征，可以優(yōu)化并把光流放大到所需大小，類似經(jīng)典算法結(jié)構(gòu)的深度學習光流模型還有許多[11]。對PWC-Net進行改進效果較好的是利用迭代殘差細化(Iterative Residual Refinement,IRR)方法的IRR-PWC模型[12]，這種方法可以在維持參數(shù)數(shù)量的情況下提高準確率，在附加去遮擋模塊后，可以對遮擋情況下的光流預測更加準確。PWC-Net整體架構(gòu)如圖1所示。

圖1(b)中warp層的數(shù)學表達式為

其中，代表t時刻圖像在圖像金字塔第層的特征，是像素坐標(包括橫縱坐標)，是層的光流，是對應位置上采樣的層的光流，式(5)表達的意思是如果光流估計準確，則在處特征應與在處特征相同。

代價體(cost volume)的數(shù)學表達式可以表示為

其中，為超參，表征最大相關距離。這部分就是利用向量點積來進行特征相關性計算，從而計算出特征之間的相似性，代價體即表征這種特征之間相似性的映射。

在監(jiān)督模型中，RAFT(Recurrent All-pairs Field Transforms for optical flow)[13]是十分重要的模型(第3代監(jiān)督模型)，其框架如圖2所示。這個模型實現(xiàn)了整個網(wǎng)絡端到端訓練的同時，在效果上超過了PWC-Net和IRR-PWC，且實現(xiàn)了模型的輕量化。其主要思路是利用卷積提取兩幀圖像的特征，而后對特征做內(nèi)積得到4D代價體(4D cost volumes)作為兩個特征之間相似性的度量空間，有別于其他算法，光流會通過一個門控循環(huán)單元(Gated Recurrent Unit, GRU)的一個輸出，在4D 代價體空間內(nèi)進行查詢，查詢結(jié)果將用來更新GRU進行迭代細化，這樣就可以有效利用上下文信息，通過GRU最終輸出精細化后的光流，最后通過利用周圍像素上采樣恢復光流到原圖像分辨率。RAFT模型表明了端到端的深度學習模型在性能上可以超越人為模塊化設計的模型，并且截至本文成稿時間，仍是深度學習模型性能進行比較的一個基準。

圖2 RATF模型框架圖(圖片改繪自文獻[13])

以PWC-Net, RATF為代表的這種CTF范式的神經(jīng)網(wǎng)絡模型可以提高性能的主要途徑是優(yōu)化后3步，以減少計算量、提高精度及其抗噪性能。當然還有借鑒其他范式的模型，如經(jīng)典算法EpicFlow[14]的由稀疏到稠密(Sparse-To-Dense, STD)范式，其主要步驟為：計算稀疏匹配集、計算光流稀疏到稠密的插值、后處理以及優(yōu)化得到光流。

另一種光流計算重要范式是STD。如PatchBatch[15]在經(jīng)典EpicFlow的基礎上利用神經(jīng)網(wǎng)絡提取高維度特征來計算稀疏匹配集，提高了匹配集的質(zhì)量，結(jié)合EpicFlow的稠密插值最終得到光流。FTDM(Fully-Trainable Deep Matching)[16]通過訓練一個u型拓撲的CNN來等效深度匹配(Deep Matching, DM)算法，從而計算出稀疏匹配集，而后利用EpicFlow稠密插值得到光流。此類方法主要改進方向在于計算稀疏匹配集、計算稀疏到稠密的插值這兩個步驟上，即如何在低算力的情況下找到質(zhì)量更高的稀疏匹配集，以及如何進行更好的插值計算。

以上兩種框架都是基于CNN的，而也有部分方法致力于改進CNN卷積模型本身性能，使其更適用于光流估計任務，從而在本質(zhì)上提高光流估計的性能，如模型PPAC-HD3[17]，利用概率像素自適應卷積提高模型性能，優(yōu)化光流的邊緣及精度。

隨著深度學習模型的性能不斷提升，目前基于Transformer的模型在語言、圖像以及多模態(tài)處理方面表現(xiàn)出了突出的性能。截至2022年10月KITTI數(shù)據(jù)集上表現(xiàn)最優(yōu)的純視覺光流估計模型是基于Transformer的GMFlow (Global Matching, GM)[18]作為第4代監(jiān)督模型，其框架如圖3所示，其改進版GMFlow+實現(xiàn)了多模態(tài)處理。GMFlow主要利用attention技術優(yōu)化了利用卷積處理代價體自帶的局部局限性問題，可以做到全局匹配，所以在處理大位移上優(yōu)勢明顯，其基于Transformer架構(gòu)的處理方法是短期內(nèi)的主流方向。

圖3 GMFlow的框架圖(圖片改繪自文獻[18])

Transformer等利用self-attention技術的深度學習模型，其核心公式表示為

其中，為基于圖像的嵌入向量，是K的維度，self-attntion其本質(zhì)是找到相關特征，并有針對性地強化高維特征向量，從而使得所需相關特征突出出來，與代價體本質(zhì)一致但不會受到距離限制，利用深度學習框架并行計算的優(yōu)勢在計算速度上相較于代價體更快。

除主要創(chuàng)新及作為行業(yè)基準的模型外，每年還有大量基于以上模型的改進模型。近3年基于RAFT的改進居多，效果也日益增強，基于Transfomer架構(gòu)的模型也逐步體現(xiàn)出其優(yōu)勢，結(jié)合圖神經(jīng)網(wǎng)絡技術解決卷積固有的相關缺陷是未來發(fā)展的主要方向之一。各類模型主要解決的問題和特點詳見表1，其中淺灰色為CTF范式模型，淺藍色為STD范式模型，加粗字體為行業(yè)廣泛認可的基準模型。

表1 光流估計監(jiān)督模型匯總

由于域差(domain gap)，以及制作光流訓練的數(shù)據(jù)集本身成本與技術難度很高，除監(jiān)督學習外深度學習光流模型的另一種主要模式是自監(jiān)督學習模型，不利用人工標注的數(shù)據(jù)集進行學習，可以極大降低訓練模型的成本，若可以直接利用真實數(shù)據(jù)進行自監(jiān)督訓練，則可有效避免數(shù)據(jù)集與真實數(shù)據(jù)之間域差問題。

3.2 基于自監(jiān)督學習的光流估計模型

在2016年Long等人[23]利用簡單的編碼解碼器(Encoder-Decoder)神經(jīng)網(wǎng)絡MIND來對前后兩幀之間的關聯(lián)關系進行學習，并認為光流估計是這種求解關聯(lián)關系的一個子問題，其方法就是取視頻流前后3幀圖像，利用第1幀和第3幀來對第2幀進行估計，并用夏博尼爾損失(Charbonnier loss)()作為損失函數(shù)(Loss)進行訓練，成功表明了自監(jiān)督學習可以有效學習前后兩幀之間的關聯(lián)關系。

同年，Yu等人[24]提出了基于光度誤差(photometric loss，用以衡量經(jīng)推測的光流扭曲(warp)后的第2幀和第1幀的差異)與平滑誤差(smoothness loss，衡量空間相鄰光流預測之間的差異)類似FlowNet的端到端自監(jiān)督訓練模型UnsupervisedFlowNet，并達到了當時KITTI數(shù)據(jù)集的最佳效果。UnFlow[25]在其誤差計算的基礎上，利用交換前后兩幀順序，送入CNN預測前后雙向光流并計算誤差的方法(理論上這兩個光流方向是相反的)，進一步提高了訓練模型的預測精度。DDFlow[26]在UnFlow的基礎上，采用了知識蒸餾結(jié)構(gòu)，其中老師網(wǎng)絡與UnFlow類似，但在學生網(wǎng)絡中增加了對遮擋相關的損失函數(shù)(Loss)，可以對遮擋進行學習，而非簡單剔除。對于遮擋問題， SelFlow[27]在PWC-Net的基礎上結(jié)合光度誤差，提出了一個自監(jiān)督的模型，其主要思想是首先訓練一個無遮擋情況下光流預測的CNN，而后對圖像進行超像素分割(防止分割形式單一)并按分割隨機分配噪聲遮擋，用第1個CNN對光流的預測結(jié)果來指導第2個有遮擋情況下的CNN訓練，從而提高第2個模塊的抗遮擋能力。

UFlow[28]綜合了之前所提出的各類方法，并對各類方法中所有組件進行了評估測試，從而選擇出最優(yōu)組合，并通過總結(jié)得到了4種模型優(yōu)化方法：代價體歸一化、遮擋梯度停止、同級流分辨率下應用平滑度、調(diào)整圖像大小用以自監(jiān)督訓練，從而提高了模型性能。在UFlow的基礎上， UPFlow[29]通過把傳統(tǒng)上采樣用到的雙線性插值優(yōu)化為可學習的雙線性插值，降低了以往CTF模式上采樣造成的誤差，合并其提出的模型蒸餾損失，使得光流預測的邊緣更加清晰。直到目前較新的SMURF[30]實現(xiàn)了RAFT架構(gòu)自監(jiān)督的方法，自監(jiān)督光流性能已經(jīng)超越之前監(jiān)督模型的基準(PWC-Net和FlowNet2)。自監(jiān)督模型相關進展總結(jié)如表2，其中加粗字體為基準模型。

表2 光流估計自監(jiān)督模型匯總

除監(jiān)督與自監(jiān)督模型之外，還有半監(jiān)督模型，這類模型可以充分利用監(jiān)督數(shù)據(jù)提高模型的精度，同時擁有自監(jiān)督模型訓練數(shù)據(jù)易于獲取的優(yōu)點，但從另一個角度看，這類模型也同時有著這兩類模型的缺點。其中比較有代表性的是SSFlow(Semi-Supervised, SS)[33]，其主要思想是利用生成對抗神經(jīng)網(wǎng)絡(Generative Adversative Nets, GAN)，通過真實數(shù)據(jù)和合成數(shù)據(jù)同時訓練，GAN的判斷模塊可以學習到合成數(shù)據(jù)與真實數(shù)據(jù)之間的域差(domain gap)，從而指導生成器生成的光流更加準確，但GAN模型往往難以訓練。

以上是基于深度學習的光流計算技術的大致發(fā)展過程，基于深度學習的模型很大程度上解決了經(jīng)典算法中不滿足假設1和假設2的相關的問題，例如遮擋或物體存在變形的情況下，則亮度恒定假設無法保證；物體位移較大的情況下，光流變化無法滿足假設2，因此傳統(tǒng)基于變分與優(yōu)化的方法無法滿足微分條件等。而且由于計算機分布式計算性能的提升，基于深度學習的方法在實時性上往往優(yōu)于經(jīng)典算法，所以在2017年后深度學習逐漸成為光流估計方面的主流算法。

04??光流測試相關數(shù)據(jù)集和性能評價指標

數(shù)據(jù)集對于訓練深度學習模型非常重要，深度學習也可以認為是由數(shù)據(jù)驅(qū)動的一種算法，數(shù)據(jù)集的質(zhì)量直接影響訓練出的模型的性能，常用的用于訓練和測試的公開數(shù)據(jù)集包括：簡單但實用、利用椅子模型和隨機圖像生成的合成光流數(shù)據(jù)集(FlowNet驗證過的)FlyingChairs[6]，主要用于車輛自動駕駛方面包含激光雷達和真實場景光流的KITTI Flow數(shù)據(jù)集[34,35]，城市自動駕駛數(shù)據(jù)集HD1K，廣為使用的合成動畫數(shù)據(jù)集MPI-Sintel[36]，密集小目標行人運動數(shù)據(jù)集Crowd-Flow[37]，可以根據(jù)需求生成虛擬數(shù)據(jù)集的無人機模擬平臺AirSim以及基于動畫引擎Unreal Engine 4生成的高質(zhì)量虛擬駕駛場景的模擬平臺Carla。光流數(shù)據(jù)集的發(fā)展促進了光流相關算法的發(fā)展，相關模型與算法的性能可以在數(shù)據(jù)集上得到驗證，在公開數(shù)據(jù)集上的測試結(jié)果往往作為評價光流算法與模型效果的重要參考。

常用的評估數(shù)據(jù)集，也是公認的模型評價標準，通常有以下幾個(見表3)。

表3 光流估計模型評估公開數(shù)據(jù)集

在光流計算性能指標上，5個最重要的指標分別是端點誤差(End-Point Error, EPE)、平均端點誤差(Average End-Point Error, AEPE)、每秒幀速率(Frame Per Second,FPS)、角度誤差(Angular Error,AE)和平均角度誤差(Average Angular Error,AAE)。其中EPE為估計光流和真實光流之間的歐氏距離，用來衡量光流估計的準確程度，AE常用于評估角度誤差，二者是互補的，AE對小幅度運動誤差敏感，EPE對大幅度運動誤差敏感。其定義分別為

其中，表示第個像素的估計光流值，表示第個像素光流真值，為總像素個數(shù)。AEPE與AAE越小說明估計的光流值與標準值誤差越小，即越準確。FPS則是衡量實時性能的指標，其值越大代表方法的實時性越強，也常用1/FPS(即處理每一幀所用時間)來衡量此項性能。

在上述指標中EPE, AEPE是最常用的比較算法準確度的性能指標，在所有數(shù)據(jù)集上通用，可以對模型整體性能進行評估，但無法衡量在某單一方面的性能。目前模型評估普遍利用的是KITTI2012, KITTI2015, Sintel Clean, Sintel Final 4個數(shù)據(jù)集。由于不同數(shù)據(jù)集數(shù)據(jù)分布以及對光流的衡量指標不一致，同一模型在不同數(shù)據(jù)集的性能也不同，但整體與表格所列順序正相關。詳細信息以及各類模型與算法準確度排名各類數(shù)據(jù)集官網(wǎng)都有實時更新，僅以本文介紹的部分模型及其改進型為例，準確率以Sintel 與KITTI數(shù)據(jù)集官網(wǎng)截至成稿時公布數(shù)據(jù)為準，其性能如表4所示。

表4 部分模型在Sintel及KITTI數(shù)據(jù)集上的性能(截至2023年3月)

05??光流計算技術的具體應用

光流計算技術在實際應用時，常作為一個單獨模塊來使用，也可以和其他模塊組合使用，準確的光流可以提供物體有效的運動、結(jié)構(gòu)等信息。

在視頻處理方面，常常直接利用光流信息。如在視頻檢測領域，常利用光流信息來進行特征聚合以及特征在非關鍵幀之間傳播；在視頻跟蹤領域，比較經(jīng)典的跟蹤-學習-檢測(Tracking-Learning-Detection, TLD)算法[42]分為跟蹤模塊、學習模塊、檢測模塊3大部分，其中的跟蹤模塊最早就是基于光流計算技術的經(jīng)典LK算法來估計物體運動的，隨著光流計算技術的發(fā)展，此框架下的光流模塊也可以被更先進的模塊替換；基于雙流框架的視頻檢測與行為識別也常利用光流作為輸入之一，以光流提供的物體運動信息來輔助進行行為識別；基于光流的運動信息，也可以為人面部表情識別、手勢識別、動作識別等相關技術提供有效信息等。

光流在視頻跟蹤技術的具體應用場景也有很多，在交通監(jiān)控上，對車輛、行人的異常行為進行檢測，用以檢測可疑滯留物、人群異常聚集、突發(fā)火情等；在體育比賽中，可以利用此項技術進行運動員跟蹤；在軍事領域，目標的鎖定與跟蹤應用更加廣泛，各類基于視頻的武器平臺與彈藥的導引頭都需要視頻跟蹤技術，尤其是目前許多國家出現(xiàn)了智能化的無人武器平臺，其中利用視頻進行檢測跟蹤鎖定目標已經(jīng)是此類武器平臺的重要組件之一。

基于光流的動作識別技術的應用場景也很廣泛，如在安防監(jiān)控領域，可以利用動作識別來預防公共場所的突發(fā)事件，若利用人工監(jiān)控，則往往成本高、效率低；在視頻檢索中應用動作識別，根據(jù)視頻動作分析其視頻行為，進而對相關視頻進行檢索與推薦；在人機交互領域用動作識別技術完成人機對話，目前已經(jīng)在許多游戲中廣泛使用等。

在實時定位與地圖構(gòu)建(SLAM)中，可以利用光流信息配合相機模型的3維運動約束，經(jīng)過優(yōu)化算法，可以從光流中得到相機的3維位姿進而確定與其連接的物體的位姿，這種基于光流的位姿測量技術常被用于無人機、自動駕駛等領域，許多基于視覺導航的機器人也是利用此項技術進行實時導航，尤其是在紋理豐富的室內(nèi)場景較為常用，與基于慣導與GPS的導航不同，基于計算機視覺的導航無需接受其他任何信號且沒有慣導那種累積誤差，在軍事領域的具體應用場景有無人飛行器自動著陸、導彈精確導航、基于光流的目標鎖定跟蹤技術、爆炸云分析、與陀螺儀結(jié)合進行彈體高度估計等應用也比較普遍等。視覺SLAM定位及點云生成效果如圖4所示。

圖4 光流SLAM效果圖(圖片出自文獻[43])

與此技術相關的還有基于光流的3維重建技術，其基本原理也是通過光流解算相機位姿，而后基于不同視角的相機位姿利用幾何約束生成點云以實現(xiàn)物體的3維重建等，此項技術的具體應用場景包括文物3D數(shù)據(jù)錄入、3D動畫建模、醫(yī)療影像、3D光流(場景流)、軍事戰(zhàn)場測繪等領域。

此外，在氣象預報方面，基于雷達數(shù)據(jù)的雷暴識別追蹤和外推預報技術，可以利用光流替代交叉相關法，對云團等進行外推預報，提高天氣預報的準確度；在醫(yī)學上，3維光流可以用于器官運動估計，以及基于光流場的圖像配準等應用；由于光流相關算法部分基于變分優(yōu)化，在紅外圖像配準方面也有相關算法的應用；在軍事應用方面基于光流的目標鎖定跟蹤技術、爆炸云分析、與陀螺儀結(jié)合進行彈體高度估計等應用也比較普遍；在火災煙霧預防檢測等領域，光流法也有著重要的應用；自動駕駛領域光流與激光雷達的組合達到了KITTI數(shù)據(jù)集光流最佳效果，這種多傳感器融合也是光流計算技術應用的一個重要方面等等。

光流計算技術的進展與腦科學視覺運動感知等領域既相互交叉也相互啟發(fā)，大腦對視覺進行編碼的過程在某些方面與深度神經(jīng)網(wǎng)絡類似。如Mountcastle (1957), Hubel(1962)以及 Wiesel (1963)等人研究發(fā)現(xiàn)，在大腦皮層若干區(qū)域，反應特性上表現(xiàn)出相似選擇性的細胞聚集在一起，這與卷積神經(jīng)網(wǎng)絡中卷積核提取某一高維特征的特點類似。通過和其他動物實驗數(shù)據(jù)比對發(fā)現(xiàn)，不同物種和皮質(zhì)區(qū)域的組織類型的相似性表明存在著將方向和旋轉(zhuǎn)域映射到皮層表面的普遍原則(即運動感知)，而光流計算技術可以認為是對這種映射原則的一種模擬。

除上述外光流的應用場景可以覆蓋基于計算機視覺技術的大部分領域，相關算法在其他場景的應用也很多。作為計算機視覺的基本問題之一，光流計算技術的發(fā)展有助于其所覆蓋相關領域的技術進步與性能提高。

06??總結(jié)與發(fā)展趨勢展望

本文介紹了光流相關的基礎知識，總結(jié)了光流計算技術主要的技術發(fā)展路線，對技術發(fā)展過程中比較典型的算法與模型進行了簡要的闡述，對相關算法的核心創(chuàng)新點與思路進行了歸納，對光流評估數(shù)據(jù)集與指標方面做了簡要分析，并對光流的應用場景進行了簡要總結(jié)。

光流計算技術結(jié)合深度學習是目前光流計算的主要發(fā)展趨勢，其主要的技術方向是獲得一種可以適用于任何場景快速且精確的光流估計方法，個人認為其中主流技術的發(fā)展趨勢是利用更加先進的深度學習架構(gòu)如圖神經(jīng)網(wǎng)絡、transformer架構(gòu)、3D卷積模型等，提高模型預測的準確度，強化模型的泛化能力和推理能力，解決諸如遮擋、小目標、大位移、光照、邊界模糊、形變、噪聲等方向的光流計算問題。

從目前光流計算的發(fā)展來看，利用深度學習模型來進行更準確、實時性更好的光流預測依舊是光流計算發(fā)展的長期目標；在基于現(xiàn)有深度學習的模型上進行優(yōu)化，在保證精度的同時加強實時性與降低模型參數(shù)的規(guī)模，這也是基于深度學習的光流模型可以繼續(xù)優(yōu)化的方向；2D光流相關算法可以結(jié)合深度信息，向3D光流(場景流)方向發(fā)展，加強動態(tài)環(huán)境中對3D運動的理解；隨著腦科學的發(fā)展，人類視覺機制將被進一步解析，利用仿生模擬人類視覺過程，如利用神經(jīng)動力學模型結(jié)合深度學習對物體運動進行預測，也是目前重要的發(fā)展方向之一；生物視覺具有高穩(wěn)定性、高適應性和低功耗等特點，是下一代人工智能算法開發(fā)的重要參考借鑒對象，生物視覺系統(tǒng)中存在專門處理運動信息的神經(jīng)元和神經(jīng)環(huán)路[44,45]，相關神經(jīng)機制也得到了初步解析[46,47]，如何借鑒相關機制，開發(fā)出性能更優(yōu)的類腦算法，將是光流計算領域極具潛力的發(fā)展方向之一。

編輯：黃飛

閱讀全文

神經(jīng)網(wǎng)絡(98386) 神經(jīng)網(wǎng)絡(98386)
人工智能(229987) 人工智能(229987)
深度學習(119798) 深度學習(119798)
卷積神經(jīng)網(wǎng)絡(11634) 卷積神經(jīng)網(wǎng)絡(11634)

物聯(lián)網(wǎng)及云計算技術在自動化生產(chǎn)中的應用

以虛擬化技術與應用、數(shù)據(jù)庫及中間件水平擴展、多租戶開發(fā)技術以及云管理平臺一為核心技術的云計算技術，在寶鋼也得到了深入的應用。寶鋼和寶山區(qū)采用RFID自動識別輻射危險源，GPS跟蹤和定位輻射危險源

2013-02-20 13:59:01

2438

淺談可穿戴計算技術及其應用

可穿戴計算技術是一種將計算機“穿戴”在人體上進行各種應用的國際性前沿計算機技術，是智能環(huán)境的一個主要研究課題。

2014-01-14 11:35:07

2469

汽車成計算技術應用新平臺

最新一期出版的《巴倫周刊》撰文分析了移動計算技術在汽車產(chǎn)品中的應用前景?！栋蛡愔芸穼谧骷业贍柲?雷（Tiernan Ray）在文章中指出，汽車已經(jīng)超越智能手機成為各大科技公司爭搶的新計算平臺，而競爭中的潛在贏家包括移動芯片公司高通和英偉達以及傳統(tǒng)科技巨頭蘋果和谷歌。

2014-07-07 09:14:52

682

2017全國深度學習技術應用大會

的一種仿生模擬。深度學習在一些應用的突破從一個側(cè)面展示了腦機理的研究對于智能技術發(fā)展的重要性。智能的本質(zhì)來源于腦的工作機理，我們對于腦不斷的認識、不斷的理解，應用到我們的計算技術中，這就是腦啟發(fā)計算

2017-03-22 17:16:00

學習臺燈&攝影補光燈專用無頻閃調(diào)光方案

%。FP7103：適用2.7-24V供電，壓差=輸入*0.1，恒流3A以內(nèi)，,調(diào)光深度1%，恒流精度2%。五．市場應用1、學習臺燈 2、攝影補光燈聯(lián)系人陳R 131 286 36973

2021-08-17 09:44:58

學習臺燈&攝影補光燈專用無頻閃調(diào)光方案

，壓差=輸入*0.1，恒流2A以內(nèi),調(diào)光深度1%，恒流精度2%。FP7103：適用2.7-24V供電，壓差=輸入*0.1，恒流3A以內(nèi)，,調(diào)光深度1%，恒流精度2%。五．市場應用1、學習臺燈2、攝影補光燈

2021-05-27 11:29:41

深度學習技術的開發(fā)與應用

降落任務1.DQN/Double DQN/Dueling DQN2.PER高頻問題：1.深度強化學習網(wǎng)絡訓練穩(wěn)定性 2.探索與利用關鍵點：1.經(jīng)驗回放技術的實現(xiàn)2.目標網(wǎng)絡更新實操解析與訓練四實驗

2022-04-21 14:57:39

深度學習DeepLearning實戰(zhàn)

一：深度學習DeepLearning實戰(zhàn)時間地點：1 月 15日— 1 月18 日二：深度強化學習核心技術實戰(zhàn)時間地點： 1 月 27 日— 1 月30 日(第一天報到授課三天；提前環(huán)境部署電腦

2021-01-09 17:01:54

深度學習與傳統(tǒng)計算機視覺簡介

文章目錄1 簡介1.1 深度學習與傳統(tǒng)計算機視覺1.2 性能考量1.3 社區(qū)支持2 結(jié)論3 參考在計算機視覺領域中，不同的場景不同的應用程序需要不同的解決方案。在本文中，我們將快速回顧可用于在

2021-12-23 06:17:19

深度學習介紹

汽車安全系統(tǒng)的發(fā)展進步中發(fā)揮重要的作用。而這些系統(tǒng)遠不止僅供典型消費者群體掌握和使用。深度學習這一概念在幾十年前就已提出，但如今它與特定的應用程序、技術以及通用計算平臺上的可用性能更密切相關。深度學習

2022-11-11 07:55:50

深度學習在計算機視覺領域圖像應用總結(jié) 精選資料下載

簡單的回顧的話，2006年Geoffrey Hinton的論文點燃了“這把火”，現(xiàn)在已經(jīng)有不少人開始潑“冷水”了，主要是AI泡沫太大，而且深度學習不是包治百病的藥方。計算機視覺不是深度學習最早看到

2021-07-28 08:22:12

深度學習在汽車中的應用

安全系統(tǒng)的發(fā)展進步中發(fā)揮重要的作用。而這些系統(tǒng)遠不止僅供典型消費者群體掌握和使用。深度學習這一概念在幾十年前就已提出，但如今它與特定的應用程序、技術以及通用計算平臺上的可用性能更密切相關。深度學習

2019-03-13 06:45:03

深度學習在預測和健康管理中的應用

深度學習在預測和健康管理中的應用綜述摘要深度學習對預測和健康管理（PHM）引起了濃厚的興趣，因為它具有強大的表示能力，自動化的功能學習能力以及解決復雜問題的一流性能。本文調(diào)查了使用深度學習在PHM

2021-07-12 06:46:47

深度學習存在哪些問題？

深度學習常用模型有哪些？深度學習常用軟件工具及平臺有哪些？深度學習存在哪些問題？

2021-10-14 08:20:47

深度學習推理和計算-通用AI核心

摘要與深度學習算法的進步超越硬件的進步，你如何確保算法明天是一個很好的適合現(xiàn)有的人工智能芯片下發(fā)展？，這些人工智能芯片大多是為今天的人工智能算法算法進化，這些人工智能芯片的許多設計都可能成為甚至在

2020-11-01 09:28:57

深度學習是什么

創(chuàng)客們的最酷“玩具”　　智能無人機、自主機器人、智能攝像機、自動駕駛……今年最令硬件創(chuàng)客們著迷的詞匯，想必就是這些一線“網(wǎng)紅”了。而這些網(wǎng)紅的背后，幾乎都和計算機視覺與深度學習密切相關?！　?b class="flag-6" style="color: red">深度學習

2021-07-19 06:17:28

深度學習框架只為GPU?

CPU優(yōu)化深度學習框架和函數(shù)庫機器學***器

2021-02-22 06:01:02

深度學習線下技術知識講座

深度學習應用在測量與測繪技術

2019-05-16 17:21:50

深度強化學習實戰(zhàn)

2021-01-10 13:42:26

計算機視覺應用深度學習

怎樣從傳統(tǒng)機器學習方法過渡到深度學習？

2021-10-14 06:51:23

ARM DynamIQ計算技術介紹

ARM DynamIQ全新時代的計算技術

2021-02-03 06:49:07

HDC2021技術分論壇：跨端分布式計算技術初探

帶來易協(xié)同、低延遲和高穩(wěn)定的分布式體驗。下面，我們將對跨端分布式計算技術進行詳細的分析。一、跨端分布式算力技術介紹跨端分布式計算是HarmonyOS系統(tǒng)利用分布式軟總線和分布式計算引擎，提供多設備協(xié)同

2021-11-23 17:06:24

HDC2021技術分論壇：跨端分布式計算技術初探

，我們將對跨端分布式計算技術進行詳細的分析。一、跨端分布式算力技術介紹跨端分布式計算是HarmonyOS系統(tǒng)利用分布式軟總線和分布式計算引擎，提供多設備協(xié)同的跨端分布式計算能力。允許多個HarmonyOS

2021-11-15 14:54:29

Nanopi深度學習之路(1)深度學習框架分析

學習，也就是現(xiàn)在最流行的深度學習領域，關注論壇的朋友應該看到了，開發(fā)板試用活動中有【NanoPi K1 Plus試用】的申請，介紹中NanopiK1plus的高大上優(yōu)點之一就是“可運行深度學習算法的智能

2018-06-04 22:32:12

PCB制作技術：CAD/CAM和光繪技術

計算機輔助制造處理技術有什么作用？光繪工藝有哪些基本流程？

2021-04-21 06:55:09

Vector向量計算技術與SIMD技術的對比

什么是向量計算技術？什么是SIMD技術？它們之間有什么區(qū)別？看到這個標題的時候，可能各位讀者都會有各種各樣的疑問。那么本文，筆者將基于RISC-V指令集，盡量以簡單易懂的方式，向大家介紹二者的聯(lián)系和區(qū)別，并

2021-09-01 15:09:14

Vector向量計算技術與SIMD技術的對比簡述

什么是向量計算技術？什么是SIMD技術？它們之間有什么區(qū)別？看到這個標題的時候，可能各位讀者都會有各種各樣的疑問。那么本文，筆者將基于RISC-V指令集，盡量以簡單易懂的方式，向大家介紹二者的聯(lián)系

2022-03-09 07:59:03

　　華為云深度學習服務，讓企業(yè)智能從此不求人

深度學習訓練的第一個困難是技術難度高。企業(yè)要進行深度學習的模型訓練，有很高的技術門檻。比如要自己搭建深度學習平臺，要有懂得編程的技術人員，還要有海量的訓練數(shù)據(jù)等等。而華為云深度學習服務，可以提供深度

2018-08-02 20:44:09

【米爾FZ3深度學習計算卡試用體驗】FZ3深度學習計算卡總結(jié)篇

`FZ3深度學習計算卡總結(jié)篇幾個月的試用即將結(jié)束，也通過這個板子完成了自己的項目，具體的不方便公開，有網(wǎng)友私聊我相關資料，因此這里做一個統(tǒng)一的說明，能公開的帖子里面都發(fā)布了，其他的項目結(jié)束之后，會考

2021-01-10 14:39:17

【詳解】FPGA：深度學習的未來？

的做法被計算機從大量數(shù)據(jù)中自動習得可組合系統(tǒng)的能力所取代，使得計算機視覺、語音識別、自然語言處理等關鍵領域都出現(xiàn)了重大突破。深度學習是這些領域中所最常使用的技術，也被業(yè)界大為關注。然而，深度學習模型

2018-08-13 09:33:30

為什么說FPGA是機器深度學習的未來？

都出現(xiàn)了重大突破。深度學習是這些領域中所最常使用的技術，也被業(yè)界大為關注。然而，深度學習模型需要極為大量的數(shù)據(jù)和計算能力，只有更好的硬件加速條件，才能滿足現(xiàn)有數(shù)據(jù)和模型規(guī)模繼續(xù)擴大的需求?！　?FPGA

2019-10-10 06:45:41

云計算、大數(shù)據(jù)處理技術交流

云計算、大數(shù)據(jù)處理技術交流圖形圖像是數(shù)據(jù)處理量最大的版塊之一，也是當今云計算的重要課題之一，圖形圖像處理大會給大家?guī)碇T多名家方案，探究大數(shù)據(jù)圖像圖形處理、識別與應用，關注中國電子學會2013年度盛會---圖形圖像處理技術大會。什么是云計算技術 云計算技術及應用計算機圖形圖像技術大會

2013-09-16 14:18:22

云計算技術特點

。8. 自動化云計算不論是應用、服務和資源的部署，還是軟硬件的管理，都主要通過自動化的方式來執(zhí)行和管理，從而極大地降低整個云計算中心龐大的人力成本。9. 節(jié)能環(huán)保云計算技術能將許許多多分散在低利

2018-03-20 15:05:59

什么是深度學習？

深度學習是什么意思

2020-11-11 06:58:03

什么是深度學習？使用FPGA進行深度學習的好處？

上述分類之外，還被用于多項任務（下面顯示了四個示例）。在 FPGA 上進行深度學習的好處我們已經(jīng)提到，許多服務和技術都使用深度學習，而 GPU 大量用于這些計算。這是因為矩陣乘法作為深度學習中的主要

2023-02-17 16:56:59

什么是人工智能、機器學習、深度學習和自然語言處理？

領域，包括機器學習、深度學習、數(shù)據(jù)挖掘、計算機視覺、自然語言處理和其他幾個學科。首先，人工智能涉及使計算機具有自我意識，利用計算機視覺、自然語言理解和模仿其他感官。其次，人工智能涉及模仿人類的認知功能

2022-03-22 11:19:16

可重構(gòu)計算技術在汽車電子領域面臨哪些問題？

可重構(gòu)計算技術在汽車電子領域的應用前景可重構(gòu)計算技術在汽車電子領域面臨的問題

2021-05-12 06:40:18

基于深度學習技術的智能機器人

——工業(yè)機器人的智能化程度要求也越來越高，采用深度學習技術為工業(yè)機器人賦能是目前各大廠商的統(tǒng)一認知。本文結(jié)合實際案例，簡要說明一下智能機器人的實現(xiàn)流程。一、智能機器人概念人工智能技術，其主要作用就是用

2018-05-31 09:36:03

基于深度學習的異常檢測的研究方法

ABSTRACT1.基于深度學習的異常檢測的研究方法進行結(jié)構(gòu)化和全面的概述2.回顧這些方法在各個領域這個中的應用情況，并評估他們的有效性。3.根據(jù)基本假設和采用的方法將最先進的深度異常檢測技術分為

2021-07-12 06:36:22

如何去實現(xiàn)一種分布式計算技術

分布式計算技術是什么？如何去實現(xiàn)一種分布式計算技術？

2021-09-24 07:52:34

請問計算機視覺與深度學習要看什么書？

計算機視覺與深度學習，看這本書就夠了

2020-05-21 12:43:42

量子計算機未來希望

自己從事語音識別產(chǎn)品設計開發(fā)，而量子技術和量子計算機必將在自然語言處理方面實現(xiàn)重大突破，想通過此書學習量子計算技術，儲備知識，謝謝！

2024-02-01 12:51:50

可擴展并行計算技術、結(jié)構(gòu)與編程

可擴展并行計算技術、結(jié)構(gòu)與編程

2006-03-25 16:43:55

可重構(gòu)計算技術在汽車電子領域的應用探討

汽車電子產(chǎn)品是當前汽車工業(yè)發(fā)展的熱點之一，具有很多特殊的應用需求?？芍貥?gòu)計算作為一項新興的計算技術，其高效靈活的計算模式可以極大地滿足汽車電子產(chǎn)品的需求。

2009-05-16 10:04:14

388

IBM加速完善云計算技術平臺

IBM加速完善云計算技術平臺最近的一系列市場活動表明，在完善云計算技術平臺的道路上，藍色巨人正在邁開大步。在不久前剛剛發(fā)布了一款生成能夠幫助用戶更高效

2009-11-06 08:49:52

356

三星推出運用了優(yōu)必達云計算技術的廣泛媒體應用

三星推出運用了優(yōu)必達云計算技術的廣泛媒體應用韓國首爾與臺北2009年12月2日電 -- 領先全球的手機供應商三星電子與優(yōu)必達科技有

2009-12-03 17:13:26

613

迅馳移動計算技術

迅馳移動計算技術 迅馳的概念：英特爾迅馳移動計算技術是英特爾最出色的筆記本電腦技術。它不僅僅是一枚處理器，同時還具備集成的無線

2009-12-18 09:51:33

324

計算技術推動電信業(yè)務架構(gòu)創(chuàng)新

計算技術推動電信業(yè)務架構(gòu)創(chuàng)新在全IP網(wǎng)絡環(huán)境下，結(jié)合云計算的技術特點，分析和探討云計算技術在電信業(yè)務網(wǎng)絡的創(chuàng)新應用。隨著客戶化、定制化、個性化成

2010-03-13 09:32:40

1145

3G與云計算技術對移動學習研究

科技的迅速發(fā)展已經(jīng)引發(fā)了教育一次次的變革，新技術的興起與廣泛應用也日漸成為教育技術領域研究的熱點問題，基于諸多文獻，從3G 與云計算這兩種新技術的解密出發(fā)，并探討其在

2011-11-09 14:45:09

云計算技術落地遭遇瓶頸云計算未來何在？

近年來，云計算技術得到蓬勃發(fā)展，增長快速。云計算已經(jīng)成為當前信息技術產(chǎn)業(yè)發(fā)展和應用創(chuàng)新的熱點。在我國，云計算已度過了初期的市場培育、概念炒作階段，目前進入到了具體的產(chǎn)品服務階段。云計算技術落地遭遇瓶頸云計算未來何在？

2016-12-15 14:23:11

1054

云計算技術及應用

云計算技術及應用

2017-01-22 13:38:08

云計算技術與圖書館信息服務研究_付凱東

云計算技術與圖書館信息服務研究_付凱東

2017-03-20 09:25:55

哈希法讓深度學習告別密集計算

中。這些矩陣運算（深度網(wǎng)絡的訓練和測試都需要）在計算和功耗上都有很高的成本。我們提出了一種全新的基于哈希法（hashing）的技術，可以極大地減少深度網(wǎng)絡的訓練和測試所需的計算量。我們的方法結(jié)合了自適應dropout（adap

2017-09-29 18:53:32

云計算是什么意思_云計算技術架構(gòu)_云計算和大數(shù)據(jù)的區(qū)別

本文首先介紹了什么是云計算和云計算的特點，其次詳細的介紹了云計算技術的幾個架構(gòu)層，最后介紹了云計算和大數(shù)據(jù)它們兩者之間的區(qū)別。

2018-01-11 14:31:01

11099

袁進輝：分享了深度學習框架方面的技術進展

1月17日，院友袁進輝博士回到微軟亞洲研究院做了題為《打造最強深度學習引擎》的報告，分享了深度學習框架方面的技術進展。

2018-01-25 09:23:45

4492

深度學習的概念、發(fā)展狀況以及和機器學習的區(qū)別和應用

一般來說，深度學習適用于計算量更大的情況，而機器學習技術相對更易于使用。

2018-02-09 14:41:58

7552

深度學習不能取代計算機視覺技術背后的真正原因

深度學習只是一種計算機視覺工具，而不是包治百病的良藥，不要因為流行就一味地使用它。傳統(tǒng)的計算機視覺技術仍然可以大顯身手，了解它們可以為你省去很多的時間和煩惱；并且掌握傳統(tǒng)計算機視覺確實可以讓你在

2018-04-05 11:37:00

4520

云計算技術應用逐漸廣泛，那么云計算網(wǎng)絡安全知識你們又知道多少？

然而，許多企業(yè)主和管理人員都在懷疑所采用的云計算是否安全，能否免受網(wǎng)絡攻擊。就像其他任何類型的技術一樣，云計算技術也是脆弱的。但是，其安全漏洞的風險很小。為了理解云計算中的網(wǎng)絡安全，人們應該學習和了解一些關于云計算中的網(wǎng)絡安全的內(nèi)容。

2018-08-06 17:23:23

844

量子計算技術離我們究竟還有多遠呢？

量子計算是當之無愧的次世代計算技術，憑借著量子的不確定性，量子計算有著超越現(xiàn)代計算機數(shù)十倍的計算能力，它也是無數(shù)公司學者渴求的科研明珠。

2018-09-10 10:59:05

2665

技術 | 深度學習在計算機視覺領域的瓶頸已至

霍金的弟子，約翰霍普金斯大學教授Alan Yuille提出“深度學習在計算機視覺領域的瓶頸已至。

2019-07-05 10:07:38

2310

華為云計算技術有限公司正式成立

信息顯示，華為云計算技術有限公司注冊地址為貴州省貴安新區(qū)金馬大道交天府路華為云數(shù)據(jù)中心，注冊資本為5000萬元。

2019-12-12 11:15:19

1630

NVIDIA的GPU加速將有望突破基因測序分析的瓶頸

在NVIDIA的深度學習和加速計算技術的幫助下，基因組學將有望成為主流。

2020-03-21 09:47:22

788

一個全新的深度學習框架——計圖

清華大學計算機系胡事民教授研究團隊提出了一個全新的深度學習框架——計圖（Jittor）。Jittor是一個采用元算子表達神經(jīng)網(wǎng)絡計算單元、完全基于動態(tài)編譯（Just-in-Time）的深度學習框架。

2020-03-26 15:50:29

6456

深度學習正在逼近計算極限

近日，MIT卻發(fā)出警告：深度學習正在接近計算極限，必須轉(zhuǎn)變現(xiàn)有技術「大幅」提高計算效率。

2020-07-21 09:31:28

721

云計算就業(yè)前景_云計算技術就業(yè)方向

本文主要分析了云計算就業(yè)前景及云計算技術就業(yè)方向。

2020-07-24 15:01:53

11749

深度學習在計算機視覺上的四大應用

計算機視覺中比較成功的深度學習的應用，包括人臉識別，圖像問答，物體檢測，物體跟蹤。

2020-08-24 16:16:19

3971

如何在遠程工作環(huán)境中利用云計算技術？

企業(yè)如何在遠程工作環(huán)境中利用云計算技術？以下是組織快速將其員工轉(zhuǎn)換為在家遠程工作的一些優(yōu)秀實踐。

2020-09-09 14:13:21

1772

NVIDIA首席科學家Bill Dally將于GTC 中國線上大會首日發(fā)表主題演講

全球最負盛名的計算機科學家之一、NVIDIA研究院負責人Bill Dally將于GTC 中國線上大會發(fā)表主題演講, GTC中國線上大會是近期聚焦AI、深度學習、高性能計算技術的全球頂級會議。br

2020-12-11 15:43:26

1456

2021年占據(jù)主導地位四種新興云計算技術

盡管人們已經(jīng)熟悉了云計算技術在IT公司中的重要性，但今年可能會出現(xiàn)新的市場需求。我們生活在一個瞬息萬變的世界中。市場的確需要創(chuàng)新，并帶來業(yè)務范式的新變化，這就是為什么冠狀病毒疫情是2020年顛覆性

2021-01-07 10:09:53

2046

預測2021年四個的主流云計算技術

盡管人們已經(jīng)熟悉了云計算技術在IT公司中的重要性，但今年可能會出現(xiàn)新的市場需求。

2021-01-07 16:50:56

2172

機器學習和深度學習有什么區(qū)別？

覺信息的理解可以被再現(xiàn)甚至超越。借助深度學習，作為機器學習的一部分，可以在應用實例的基礎上學習和訓練復雜的關系。機器學習中的另一種技術是例如“超級矢量機”。與深度學習相比，必須手動定義和驗證功能。在深度學習中

2021-03-12 16:11:00

7763

基于深度學習的手語計算的發(fā)展趨勢及研究分析

手語信息處理卻嚴重滯后，處于空白起步階段。究其原因，主要是缺乏用于機器學習的具有一定規(guī)模的手語語料庫資源，同時傳統(tǒng)的語言計算技術也存在不足，這些都阻礙了手語機器翻譯、手語冋答系統(tǒng)、手語信息檢索等信息處理的

2021-03-31 11:19:13

基于深度學習的道路表面裂縫檢測技術

2021-07-05 16:30:30

云計算技術為用戶提供藥物治療“最優(yōu)解”方案

面對快速發(fā)展的當今社會，唯有借助尖端技術，才能取得革命性的突破，從而助推人類社會不斷超前發(fā)展，而云計算技術，無疑就是這樣一種尖端技術。深圳北鯤云計算有限公司（以下簡稱 “北鯤云”）認為，云計算技術

2021-07-29 09:33:02

391

5G和邊緣計算技術助推工業(yè)智能網(wǎng)關發(fā)展

物通博聯(lián)推出的WG593系列工業(yè)智能網(wǎng)關又叫邊緣計算網(wǎng)關擁有強大的邊緣計算能力，隨著5G網(wǎng)絡的不斷發(fā)展，也加速了邊緣計算的應用。5G通信技術與邊緣計算技術的結(jié)合，讓工業(yè)智能網(wǎng)關的邊緣計算能力不斷

2021-12-31 17:07:06

415

基于鯤鵬計算技術助力北京計算產(chǎn)業(yè)發(fā)展

鯤鵬應用創(chuàng)新大賽2022旨在鼓勵開發(fā)者基于鯤鵬計算技術，打造各類軟、硬件解決方案，實現(xiàn)技術與商業(yè)創(chuàng)新，為鯤鵬客戶帶來更多高價值應用產(chǎn)品與解決方案。

2022-09-06 09:53:41

746

光學薄膜特性計算技術干貨

光學薄膜特性計算技術干貨來了！我們先用一組PPT讓您了解相關技術。請先看看下面的內(nèi)容。 ? ? ? 審核編輯：彭靜

2022-11-03 14:43:00

600

深度學習和傳統(tǒng)計算機視覺技術在新興領域的比較

是不是深度學習就可以解決所有問題呢？是不是它就比傳統(tǒng)計算機視覺方法好呢？但是深度學習無法解決所有的問題，在一些問題上，具備全部特征的傳統(tǒng)技術仍是更好的方案。此外，深度學習可以和傳統(tǒng)算法結(jié)合，以克服深度學習帶來的計算力，時間，特點，輸入的質(zhì)量等方面的挑戰(zhàn)。

2022-11-28 11:01:15

1133

《量子計算技術及市場-2022版》

預計到2043年，量子計算硬件市場規(guī)模將增長至29億美元。這一增長將源自制藥、化學、航空航天和金融機構(gòu)的早期應用，進而推動越來越多的量子計算硬件進入代管數(shù)據(jù)中心和類似的專用網(wǎng)絡。對于報告所覆蓋的每種量子計算技術，其營收和銷售量提供了八條預測線。

2023-01-03 14:34:21

421

讀懂深度學習，走進“深度學習+”階段

人工智能的概念在1956年就被提出，如今終于走入現(xiàn)實，離不開一種名為“深度學習”的技術。深度學習的運作模式，如同一場傳話游戲。給神經(jīng)網(wǎng)絡輸入數(shù)據(jù)，對數(shù)據(jù)的特征進行描述，在神經(jīng)網(wǎng)絡中層層傳遞，最終

2023-01-14 23:34:43

588

如何使用FPGA加速深度學習計算？

當今的深度學習應用如此廣泛，它們能夠為醫(yī)療保健、金融、交通、軍事等各行各業(yè)提供支持，但是大規(guī)模的深度學習計算對于傳統(tǒng)的中央處理器（CPU）和圖形處理器（GPU）來說是非常耗時和資源密集的。

2023-03-09 09:35:24

1941

深度學習中的圖像分割

深度學習可以學習視覺輸入的模式，以預測組成圖像的對象類。用于圖像處理的主要深度學習架構(gòu)是卷積神經(jīng)網(wǎng)絡(CNN)，或者是特定的CNN框架，如AlexNet、VGG、Inception和ResNet。計算機視覺的深度學習模型通常在專門的圖形處理單元(GPU)上訓練和執(zhí)行，以減少計算時間。

2023-05-05 11:35:28

729

深度學習算法簡介深度學習算法是什么深度學習算法有哪些

深度學習算法簡介深度學習算法是什么?深度學習算法有哪些?? 作為一種現(xiàn)代化、前沿化的技術，深度學習已經(jīng)在很多領域得到了廣泛的應用，其能夠不斷地從數(shù)據(jù)中提取最基本的特征，從而對大量的信息進行機器學習

2023-08-17 16:02:56

6010

深度學習是什么領域

深度學習是什么領域? 深度學習是機器學習的一種子集，由多層神經(jīng)網(wǎng)絡組成。它是一種自動學習技術，可以從數(shù)據(jù)中學習高層次的抽象模型，以進行推斷和預測。深度學習廣泛應用于計算機視覺、語音識別、自然語言處理

2023-08-17 16:02:59

995

什么是深度學習算法？深度學習算法的應用

什么是深度學習算法？深度學習算法的應用深度學習算法被認為是人工智能的核心，它是一種模仿人類大腦神經(jīng)元的計算模型。深度學習是機器學習的一種變體，主要通過變換各種架構(gòu)來對大量數(shù)據(jù)進行學習以及分類處理

2023-08-17 16:03:04

1305

深度學習框架的作用是什么

深度學習框架的作用是什么深度學習是一種計算機技術，它利用人工神經(jīng)網(wǎng)絡來模擬人類的學習過程。由于其高度的精確性和精度，深度學習已成為現(xiàn)代計算機科學領域的重要工具。然而，要在深度學習中實現(xiàn)高度復雜

2023-08-17 16:10:57

1072

深度學習算法庫框架學習

深度學習算法庫框架學習深度學習是一種非常強大的機器學習方法，它可以用于許多不同的應用程序，例如計算機視覺、語言處理和自然語言處理。然而，實現(xiàn)深度學習技術需要使用一些算法庫框架。在本文中，我們將探討

2023-08-17 16:11:07

412

深度學習框架連接技術

深度學習框架連接技術深度學習框架是一個能夠幫助機器學習和人工智能開發(fā)人員輕松進行模型訓練、優(yōu)化及評估的軟件庫。深度學習框架連接技術則是需要使用深度學習模型的應用程序必不可少的技術，通過連接技術

2023-08-17 16:11:16

443

深度學習框架和深度學習算法教程

深度學習框架和深度學習算法教程深度學習是機器學習領域中的一個重要分支，多年來深度學習一直在各個領域的應用中發(fā)揮著極其重要的作用，成為了人工智能技術的重要組成部分。許多深度學習算法和框架提供

2023-08-17 16:11:26

638

深度學習服務器怎么做深度學習服務器diy 深度學習服務器主板用什么

深度學習服務器怎么做深度學習服務器diy 深度學習服務器主板用什么? 隨著人工智能的飛速發(fā)展，越來越多的人開始投身于深度學習領域。但是，隨著深度學習的算法越來越復雜，需要更大的計算能力才能運行

2023-08-17 16:11:29

489

計算機視覺中的九種深度學習技術

計算機視覺中仍有許多具有挑戰(zhàn)性的問題需要解決。然而，深度學習方法正在針對某些特定問題取得最新成果。在最基本的問題上，最有趣的不僅僅是深度學習模型的表現(xiàn);事實上，單個模型可以從圖像中學習意義并執(zhí)行視覺任務，從而無需使用專門的手工制作方法。

2023-08-21 09:56:05

306

機器學習和深度學習的區(qū)別

　　機器學習和深度學習是當今最流行的人工智能(AI)技術之一。這兩種技術都有助于在不需要人類干預的情況下讓計算機自主學習和改進預測模型。本文將探討機器學習和深度學習的概念以及二者之間的區(qū)別。

2023-08-28 17:31:09

891

【解決方案】基于邊緣計算技術的安科瑞綜合管廊能效管理平臺

基于邊緣計算技術的安科瑞綜合管廊能效管理平臺

2023-11-28 17:19:26

201

虹軟空間計算技術推動XR領域發(fā)展

在過去的二十年中，移動計算技術的迅猛發(fā)展使智能手機嶄露頭角，成為主流的移動智能終端。雖然科技不斷進步，智能手機所面臨的可視空間受限、交互單一等局限問題仍待突破。隨著傳感器技術的提升、空間感知技術

2024-01-26 10:15:44

308

什么是邊緣計算？邊緣計算技術有哪些優(yōu)缺點？

什么是邊緣計算？邊緣計算技術有哪些優(yōu)缺點？邊緣計算是一種將計算和數(shù)據(jù)處理能力從傳統(tǒng)的云計算數(shù)據(jù)中心移動到離數(shù)據(jù)源更接近的位置的計算模型。在邊緣計算中，數(shù)據(jù)處理和分析都在離數(shù)據(jù)產(chǎn)生的地方進行

2024-02-06 14:38:12

280

已全部加載完成

搜索歷史

基于深度學習的光流計算技術應用

評論