基于BlackfinBF533處理器對H.264去方塊濾波器性能進行優(yōu)化

引言

在已有的基于塊的視頻編解碼系統(tǒng)中，當碼率較低時都存在方塊效應(yīng)，新的視頻編碼標準H.264中亦是如此。產(chǎn)生這種方塊效應(yīng)的主要原因有兩個：一是由于對變換后的殘差系數(shù)進行的基于塊的整數(shù)變換后，以大的量化步長對變換系數(shù)進行量化會使得解碼后的重建圖像的方塊邊緣出現(xiàn)不連續(xù)；二是在運動補償中插值運算引起的誤差使得編解碼器反變換后的重建圖像會出現(xiàn)方塊效應(yīng)。如果不進行處理，方塊效應(yīng)還會隨著重構(gòu)幀積累下去，從而嚴重地影響圖像的質(zhì)量和壓縮效率。為了解決這一問題，H.264中的去方塊濾波技術(shù)采用較為復(fù)雜的自適應(yīng)濾波器來有效地去除這種方塊效應(yīng)。因此，如何在實時視頻解碼中優(yōu)化去方塊濾波算法，降低計算復(fù)雜度，提高重建圖像質(zhì)量，就成了H.264解碼的一個關(guān)鍵問題。

1、 H.264的去方塊濾波

1.1 濾波原理

大的量化步長會造成相對較大的量化誤差，這就可能將原來相鄰塊“接壤”處像素間灰度的連續(xù)化變成了“臺階”變化，主觀上就有”偽邊緣”的方塊效應(yīng)。去方塊效應(yīng)的方法就是在保持圖像總能量不變的條件下，把這些臺階狀的階躍灰度變化重新復(fù)原成臺階很小或者近似連續(xù)的灰度變化，同時還必須盡量減少對真實圖像邊緣的損傷。

1.2 自適應(yīng)濾波過程

在H.264中，去方塊濾波器是按照16×16像素的宏塊為單位順序進行的，在宏塊中按照每個4×4子塊之間的邊緣以先垂直后水平的順序進行，從而對整個重建圖像中的所有邊緣（圖像邊緣除外）進行濾波。具體的邊緣示意圖如圖1所示。對于16×16像素的亮度宏塊，共有4條垂直邊緣，4條水平邊緣，每條邊緣又分為16條像素邊緣。而對應(yīng)8×8像素的色度宏塊有垂直邊緣和水平邊緣各2條，每條邊緣分為8條像素邊緣。像素邊緣是進行濾波的基本單元。

基于BlackfinBF533處理器對H.264去方塊濾波器性能進行優(yōu)化

1.2.1 濾波器在兩個層次上的自適應(yīng)性

H.264中的去方塊濾波所以有較好的濾波效果，是由于它在以下兩個層次上的自適應(yīng)性。

1）濾波器在4×4子塊級別的自適應(yīng)性

濾波是基于各個子塊中的像素邊緣進行的，通過對每一條像素邊緣定義一個參數(shù)BS（邊緣強度）來自適應(yīng)地調(diào)節(jié)濾波的強弱和涉及的像素點。色度塊的像素邊緣強度與相應(yīng)的亮度像素邊緣強度相同。假設(shè)P和Q為兩個相鄰的4×4子塊，其中的像素邊緣強度通過圖2的步驟獲得。BS的值越大，則對相應(yīng)的邊緣兩側(cè)進行的濾波越強，這是根據(jù)產(chǎn)生方塊效應(yīng)的原因來設(shè)定的，如采用幀內(nèi)預(yù)測模式的子塊的方塊現(xiàn)象較明顯，則對該子塊中的對應(yīng)邊緣設(shè)定較大的像素邊緣強度值來進行強濾波。

2）濾波器在像素點級別上的白適應(yīng)性

正確區(qū)分由于量化誤差、運動補償產(chǎn)生的虛假邊緣和圖像中的真實邊界才能得到好的濾波效果。通常，真實邊界兩側(cè)的像素梯度差值要比虛假邊界兩側(cè)的像素梯度差值大，因此，濾波器通過對邊緣兩側(cè)像素點的灰度值的梯度差值設(shè)定門限α、對同一側(cè)的相鄰像素點的灰度值的梯度差值設(shè)定門限β來進行真?zhèn)芜吔绲呐卸?。α和β的值主要與量化步長有關(guān)，當量化步長大時，量化誤差也大，方塊效應(yīng)就明顯，易產(chǎn)生虛假邊界，因此門限值隨之變大，放寬濾波條件。反之，量化步長小時門限值也變小，體現(xiàn)了自適應(yīng)性。采樣點的設(shè)置見圖3。若條件都滿足，則進開始濾波。

除了這兩種自適應(yīng)性，還可以通過設(shè)置位于片級的系數(shù)LoopFilterAlphaC0Offset、LoopFilterBetaOffset來調(diào)整濾波的強度。例如當傳輸碼率較低時，方塊效應(yīng)較明顯，接收端想要主觀質(zhì)量相對較好的圖像，則編碼端可通過設(shè)置位于片頭信息中的濾波偏移量LoopFil-terAlphaC0Offset，LoopFilterBetaOffset為正值，以此增大α和β來加強濾波，通過去除方塊效應(yīng)來提高圖像主觀質(zhì)量?；蛘邔τ诟叻直媛实膱D像，可以通過傳送負值偏移來減弱濾波，盡量保持圖像的細節(jié)。

1.2.2 依據(jù)各像素邊緣BS值對相鄰的像素濾波

若當前像素邊緣符合濾波條件，則根據(jù)其相應(yīng)的BS值選取對應(yīng)的濾波器進行濾波并且進行適當?shù)募羟胁僮鳎苑乐箞D像的模糊。

當BS值是1，2，3時，采用一個4抽頭的線性濾波器，對輸入的P1、P0、Q0、Q1進行濾波調(diào)整得到新的Q0、P0，如果內(nèi)部有虛假邊界，則進一步調(diào)整Q1、P1的值。

當BS值是4時，則對應(yīng)的是采用幀內(nèi)編碼模式的宏塊邊緣，應(yīng)采用較強的濾波以達到增強圖像質(zhì)量的目的。對于亮度分量，若條件（| P0～Q0 | 《（（α》2）+2））&abs（P2-P0）成立，則選擇5拙頭濾波器對P0、P2進行濾波，使用較強的4抽頭濾波器對P1進行濾波；若條件不成立，則只使用較弱的3抽頭濾波器對P0進行濾波，而P1、P2的值保持不變。對于色度分量，若上述條件滿足，則對P0進行3抽頭濾波，若條件不滿足，則所有的像素值都不修改。對Q0、Q1、Q2的濾波操作與P0、P1、P2的濾波操作相同。

2、 BF533的特點和結(jié)構(gòu)

我們的H.264去方塊濾波是在ADI 公司的Blackfin ADSP-BF533處理器上實現(xiàn)的。Blackfin系列DSP主要具有以下特點：

a）高度并行的計算單元。Blackfin系列DSP體系架構(gòu)的核心是DAU（數(shù)據(jù)算術(shù)單元），包括2個16位的MAC（乘法累加器）、2個40位的ALU（算術(shù)邏輯單元），1個40位單桶形的移位器，4個8位視頻ALU。每個MAC能在單一時鐘周期內(nèi)對4個獨立的數(shù)據(jù)操作數(shù)執(zhí)行16位乘16位的乘法運算。40位的ALU可累加2個40位的數(shù)字或者4個16位的數(shù)字。這種體系架構(gòu)可靈活地進行8值、16位、32位的數(shù)據(jù)運算。

b）動態(tài)電源管理。處理器可以通過改變電壓和工作頻率，消耗比其他DSP更少的功耗。Blackfin系列DSP體系架構(gòu)的允許電壓和頻率獨立調(diào)整，使得每一項任務(wù)的消耗能量最小，在性能和功耗間有較好的平衡，適合實時視頻編／解碼器的開發(fā)，特別是對功耗有嚴格要求的實時運動視頻處理。

c）高性能的地址產(chǎn)生器。具有2個DAG（數(shù)據(jù)地址產(chǎn)生器），用于產(chǎn)生支持高級DSP濾波運算的地址的復(fù)合裝入或存儲單元。支持位倒序?qū)ぶ泛脱h(huán)緩沖以及其他多種尋址方式，提高了編程的靈活性。

d）分層結(jié)構(gòu)的內(nèi)存。分層結(jié)構(gòu)的內(nèi)存縮短了內(nèi)核對內(nèi)存的訪問時間，以獲得最大的數(shù)據(jù)吞吐量、較少的延遲和縮短的處理空載時間。

e）特有的視頻操作指令。提供適合DCT（離散余弦變換）、霍夫曼編碼等視頻壓縮標準中常用的操作指令，這些視頻指令還消除了主處理器與一個獨立的視頻編解碼器之間的復(fù)雜和易混和通信問題。這些特點有助于為終端應(yīng)用縮短產(chǎn)品上市時間，同時降低了系統(tǒng)的總體成本。

我們使用的ADSP-BF533可以實現(xiàn)600 MHz的持續(xù)工作，具有：4 GB的統(tǒng)一尋址空間；80 kB SRAM的L1指令指令存儲器，其中16 kB可配置成4路的聯(lián)合Cache；2個32 kB SRAM的L1數(shù)據(jù)存儲器，其中一半可配置為Cache；集成豐富的外圍設(shè)備和接口。

3 、基于BF533的H.264去方塊濾波優(yōu)化實現(xiàn)

去方塊濾波器在Blackfin BF533優(yōu)化實現(xiàn)主要分為系統(tǒng)級別的優(yōu)化、算法級別的優(yōu)化、匯編級別的優(yōu)化3個級別。

3.1 系統(tǒng)級別的優(yōu)化

打開DSP平臺中編譯器的優(yōu)化選項并將優(yōu)化速度設(shè)置為最快，打開Automatic Inlining開關(guān)（自動內(nèi)聯(lián)開關(guān)）以及Interprocedural optimization開關(guān)（優(yōu)化過程開關(guān)），通過以上的一些設(shè)置充分發(fā)揮Blackfin BF533的硬件性能。

3.2 算法級別的優(yōu)化

將JM8.6參考模型中的去方塊濾波部分進行適當?shù)南到y(tǒng)修改，移植到原有的基于Blackfin BF533的H.264基本擋次的解碼器中，并通過圖像序列對其進行耗時分析。選用碼率為400 kbit／s左右的Paris.cif、Mobile.cif、Foreman.cif、Claire.cif序列，去方塊濾波所耗費的時鐘周期約為1 600 MHz～1 800 MHz，即使在經(jīng)過系統(tǒng)優(yōu)化后，計算復(fù)雜度仍然相當大，效率很低，對于Blackfin BF533處理器600 MHz的持續(xù)工作頻率是相當大的負擔(dān)。

通過分析JM8.6中去方塊濾波程序，其效率低下的主要原因是：

a）算法中的函數(shù)邏輯關(guān)系復(fù)雜，判斷、跳轉(zhuǎn)、函數(shù)調(diào)用等情況特別多；

b）最耗時的部分，即函數(shù)循環(huán)的內(nèi)部存在大量的重復(fù)計算，造成計算復(fù)雜度劇增；

c）算法中用到的不少數(shù)據(jù)，例如運動矢量、圖像的亮度和色度數(shù)據(jù)等存放在速度較慢的片外SDRAM中，但在濾波過程中的頻繁調(diào)用，使數(shù)據(jù)搬運時間劇增。

針對耗時的原因，對算法進行了以下改進：

3.2.1 將原程序中復(fù)雜的函數(shù)及循環(huán)簡單化

指令長度和運算速度是相互制約的，往往將代碼通過條件判斷可以進行高度精簡，但由于增加了機器的判斷工作量而使得速度變慢；反之，將代碼中的判斷去除，程序進行展開，往往可以減少耗費的指令周期，但代碼長度會增加。JM8.6中的去方塊濾波代碼較短，將其中的函數(shù)間關(guān)系簡單化，以代碼長度增加換取執(zhí)行速度的增加。

對于系統(tǒng)運行最耗時的循環(huán)體，采取適當改寫循環(huán)形式、多重循環(huán)體展開等方法有效地減少運算的復(fù)雜度。此外，減少調(diào)用函數(shù)次數(shù)，改寫if-else語句也是有效的優(yōu)化手段。

3.2.2 去除參考代碼中的大量冗余代碼和重復(fù)計算

a）因為使用的參考代碼是JM8.6中的去方塊濾波模塊，該模塊可以對H.264的各種擋次和級別的碼流進行濾波，而解碼器是基于基本擋次的，僅僅涉及到I幀、P幀的濾波操作，因此可以將參考代碼中的關(guān)于B幀、SP／SI幀、場模式和幀場自適應(yīng)模式的相關(guān)濾波部分去除。

b）程序在獲取濾波強度BS和進行亮度／色度的濾波過程中，都要獲取當前子塊所在的宏塊的相鄰宏塊的可達性的信息（即這個宏塊能否被使用，通過調(diào)用GetNeighbour 函數(shù)實現(xiàn)），由于濾波是按照宏塊中的邊緣先垂直后水平進行的，對于一條邊緣獲取的信息是相同的，因此這個操作可以對每條邊緣獲取一次即可，不必在循環(huán)內(nèi)部反復(fù)判斷。同時在濾波算法中，僅需要獲取在當前宏塊上面和左邊的宏塊的可達性信息，可將獲取當前宏塊的左上及右上角宏塊信息的冗余操作去除。同時，獲取水平方向的濾波強度的函數(shù)調(diào)用getNeighbour時，getNeighbour參數(shù)的取值分別是luma為定值1，xN是［-1，3，7，11］，yN是［0-15］，此時函數(shù)getNeighbour中的很多if-else語句是無效的判斷，這些冗余判斷占用了大量的時鐘周期。此外，對各個分支的概率進行分析，將概率最大的判斷分支放在前面執(zhí)行，也提高了函數(shù)執(zhí)行的速度。

以下是精簡后的GetNeighbour函數(shù)代碼，僅有數(shù)條語句，大大減少了運算量。

c）在JM86參考代碼中對于一個亮度宏塊的16×4共64條像素邊緣的BS值逐條獲取，而通過對BS獲取條件進行分析可知，處于兩個子塊間垂直邊緣或水平邊緣的4條像素邊緣的BS值分別是相等的。因此，對一條邊緣僅要進行獲取第1、5、9、13條像素邊緣的BS值，再賦給相應(yīng)的其他像素邊緣即可，由于獲取BS值的操作位于循環(huán)中，需要經(jīng)過許多判斷及運算，通過這一改進，大大簡化了計算復(fù)雜度。

d）參考代碼中的循環(huán)內(nèi)部有很多語句與循環(huán)參數(shù)無關(guān)，可以將這些語句調(diào)整至循環(huán)外部，避免了冗余計算。

3.2.3 利用BPP分塊處理技術(shù)解決片外數(shù)據(jù)頻繁調(diào)用的問題

針對頻繁調(diào)用片外數(shù)據(jù)影響了程序的運行速度的問題，采用BPP分塊技術(shù)進行優(yōu)化。在片內(nèi)的L1緩存中開辟3塊空間分別存放待濾波的亮度分量、色度U分量、色度V分量。根據(jù)每個宏塊進行濾波時可能涉及的像素范圍，在對CIF圖像進行濾波時，將一幀的396個宏塊分成4類：A類為第1個宏塊，其上邊緣和左邊緣都是圖像邊緣，對其濾波前讀入的亮度數(shù)據(jù)是16×16，色度數(shù)據(jù)是2個8×8；B類為第1個宏塊行中除去第1個宏塊的其余宏塊，其上邊緣是圖像邊緣，對其濾波前讀入的亮度數(shù)據(jù)是16×20，色度數(shù)據(jù)是兩個8×12；C類是第1個宏塊列中除去第1個宏塊的其余宏塊，其左邊緣是圖像邊緣，對其濾波前讀人的亮度數(shù)據(jù)是20×16，色度數(shù)據(jù)是2個12×8；D類是除掉A、B、C這3類宏塊的其余宏塊，也就是上邊緣和左邊緣都在當前圖像內(nèi)的宏塊，對其濾波前讀入的亮度數(shù)據(jù)是20×20，色度數(shù)據(jù)是2個12×12。

進行濾波時，首先按宏塊的類型以不同的數(shù)量從片外的數(shù)據(jù)緩存中整塊地讀入亮度和色度數(shù)據(jù)到片上的3塊濾波緩存，然后進行濾波處理，并將結(jié)果數(shù)據(jù)重新存儲到片外存儲空間中。通過這種方法，一方面在一定程度上減少了頻繁調(diào)用片外數(shù)據(jù)的時間，提高了運行速度；另一方面通過對待濾波宏塊的細分，減少了參考代碼中的判斷引起的流水線中斷，也在一定程度上提升了程序速度。

3.3 匯編級別的優(yōu)化

BlackfinBF533處理器的內(nèi)核支持C或C++語言，但由系統(tǒng)自動將C程序翻譯成匯編語言效率比較低下，因此對一些系統(tǒng)調(diào)用比較頻繁、耗時較多的模塊，可以用人工將其轉(zhuǎn)化成高效率的匯編語言來提高運行速度。主要通過以下幾個方面來提高程序的速度：

a）以寄存器變量代替局部變量。在C語言中，子程序和函數(shù)中往往使用局部變量來暫時存放數(shù)據(jù)。當程序運行時，編譯器為聲明的所有局部變量開辟臨時內(nèi)存空間，對于局部變量的存取操作都涉及到內(nèi)存的存取，而內(nèi)存訪問的速度相對于寄存器訪問是很慢的。因此，可以利用系統(tǒng)中的數(shù)據(jù)寄存器、指針寄存器來替代僅僅起暫存作用的局部變量，從而大大節(jié)省系統(tǒng)訪問內(nèi)存帶來的時間延遲。但由于系統(tǒng)中的寄存器數(shù)量對于局部變量來說相當有限，因此必須合理高效地使用寄存器。

b）以硬件循環(huán)代替軟件循環(huán)。軟件循環(huán)是指在for或while等循環(huán)的開始或結(jié)尾處設(shè)置判斷條件來控制循環(huán)的開始、繼續(xù)、結(jié)束。軟件循環(huán)的條件判斷指令會動態(tài)地選擇分支，一旦發(fā)生跳轉(zhuǎn)，會阻塞流水線，而保持流水線的暢通是保持高效運行的關(guān)鍵因素。Blackfin處理器有專用的硬件支持兩級嵌套的零開銷硬件循環(huán)，這種方式不需要判斷條件轉(zhuǎn)移，DSP硬件根據(jù)預(yù)定的循環(huán)次數(shù)自動執(zhí)行循環(huán)并結(jié)束循環(huán)，從而保證了流水線的暢通，提高速度。

c）充分利用數(shù)據(jù)總線寬度。Blackfin533外部數(shù)據(jù)總線寬度32位，一次可存取4字節(jié)。因此，充分利用數(shù)據(jù)總訪問寬度，特別在操作大量數(shù)據(jù)時，保持一次存取4字節(jié)，可減少指令周期數(shù)，從而提高執(zhí)行速度。

d）高效使用并行指令和向量指令。并行指令和向量指令是Blackfin系列DSP的一大特點。通過對并行指令的使用，可以充分發(fā)揮Blackfin處理器的SIMD系統(tǒng)結(jié)構(gòu)的優(yōu)點及硬件資源的并行處理能力，減少指令數(shù)，從而提高程序執(zhí)行效率。往往通過對程序的合理安排可以做到使用1條并行指令來替代2條或3條非并行指令。向量指令則充分利用指令寬度，同時對多個數(shù)據(jù)流進行相同操作，如要進行2個16位的算術(shù)或移位操作，完全可以通過1個32位的向量指令來實現(xiàn)，從而以1個時鐘周期來實現(xiàn)原來2個周期的工作。例如R3=abs R1（V）就用1個指令周期同時實現(xiàn)2個16位數(shù)據(jù)的求絕對值操作。

e）合理配置數(shù)據(jù)存儲空間。限于DSP片內(nèi)和片外數(shù)據(jù)存儲空間的訪問速度和容量特點，片內(nèi)空間存取速度快但容量很小，而片外空間較大但訪問速度慢，因此，合理地分配數(shù)據(jù)存放位置對于提高程序的運行速度是十分關(guān)鍵的。對于使用頻率高的數(shù)據(jù)盡量放在片內(nèi)空間中，而不常用的數(shù)據(jù)放在片外空間中。若要存取位于片外的數(shù)據(jù)時，應(yīng)將待存取的數(shù)據(jù)盡量安排成連續(xù)分布，一次將大塊的片外數(shù)據(jù)讀進片內(nèi)緩存，避免頻繁讀取片外數(shù)據(jù)帶來的時間浪費。

4、優(yōu)化實現(xiàn)的結(jié)果

測試優(yōu)化效果的方法是將參考代碼JM8.6中的去方塊濾波C程序模塊加到原有的解碼器中進行測試，并與經(jīng)過系統(tǒng)、算法、匯編3個級別優(yōu)化的去方塊濾波匯編程序模塊的測試周期進行對比。選擇的測試圖像序列為Clarie.cif、Paris.cif、Mobile.cif，測試數(shù)據(jù)見表1。

由表1可以看出，與未優(yōu)化前的JM8.6中的C程序代碼相比，經(jīng)過優(yōu)化后的去方塊濾波匯編模塊效率提高了7倍左右。

5 、結(jié)束語

本文通過系統(tǒng)、算法及匯編3個級別優(yōu)化實現(xiàn)了H.264中的去方塊濾波功能，特別是通過改進去方塊濾波的實現(xiàn)算法，對待濾波的宏塊進行分類以及充分地利用并行指令、向量指令等匯編級別的優(yōu)化手段，取得了較好的優(yōu)化效果。優(yōu)化實現(xiàn)的去方塊濾波模塊，基于原有的H.264解碼器上對一個25幀約400 kbit／s的圖像序列進行濾波，大概需要250 MHz的時鐘周期，而解碼器的總周期約為700 MHz的時鐘周期，從而使得解碼器的解碼速度達到約20幀／s，基本達到準實時解碼的要求。

該實現(xiàn)方法相對于參考模塊進行了較好的優(yōu)化，但通過對程序進行耗時分析，在讀取待濾波數(shù)據(jù)和重新寫入已濾波的數(shù)據(jù)，獲取BS值的GetBs函數(shù)和進行濾波的EdgeLoop函數(shù)方面都還有進一步提升的空間。對于片外片內(nèi)數(shù)據(jù)的交互可以采用DMA技術(shù)，在濾波的同時進行數(shù)據(jù)讀寫，從而抵消數(shù)據(jù)搬移消耗的時鐘周期；對于GetBs和EdgeLoop中的匯編代碼實現(xiàn)效率還有進一步改進的空間；這兩方面也是下一步的改進方向。

責(zé)任編輯：gt

閱讀全文

處理器(221451) 處理器(221451)
濾波器(174522) 濾波器(174522)
編解碼器(23963) 編解碼器(23963)

32位處理器的開發(fā)與8位處理器的開發(fā)有哪些明顯的不同？

32位處理器的開發(fā)與8位處理器的開發(fā)有哪些明顯的不同？開發(fā)一個32位的嵌入式系統(tǒng)需要哪些工具和環(huán)境呢？32位嵌入式系統(tǒng)的開發(fā)過程中存在哪些技術(shù)難點？有什么方法去應(yīng)對呢？

2021-04-19 08:11:43

8086處理器有何功能

8086處理器有何功能？中斷系統(tǒng)的功能都有哪些呢？

2021-10-29 07:07:41

H.264/AVC是什么？ H.264/AVC有哪些核心技術(shù)？

H.264/AVC是什么？H.264/AVC有哪些核心技術(shù)？

2021-06-02 07:15:28

H.264標準詳細介紹

像素為基本單位的。顯然，運動矢量位移的精度越高，則幀間剩余誤差越小，傳輸碼率越低，即壓縮比越高?！　≡?b class="flag-6" style="color: red">H.264中采用了6階FIR濾波器的內(nèi)插獲得1/2像素位置的值。當1/2像素值獲得后， 1/4像素值

2008-06-04 14:29:02

H.264的編碼如何在嵌入式設(shè)備中實現(xiàn)

比特率應(yīng)用時, 建議不分塊或者分成較大的塊,以保證良好的率失真性能, 但運算復(fù)雜性和存儲器需求都極高。視頻編碼新標準H.264代表著繼MPEG1/2和MPEG4后的第三代視頻編碼標準。H.264比以前

2019-08-06 06:37:38

H.264視頻編碼傳輸?shù)腝oS特性是什么

本文針對最新推出的視頻編解碼標準H.264的抗誤碼性能進行了分析，可以看到H.264/AVC標準除了擁有高效編碼的特性，還引入了一些新工具用于提高錯誤恢復(fù)能力。

2021-06-07 06:46:55

H.265與H.264對比分析

專家組（VCEG）和ISO/IEC動態(tài)圖像專家組（MPEG）聯(lián)合組成的聯(lián)合視頻組（JVT，Joint Video Team）提出的高度壓縮數(shù)字視頻編解碼器標準。這個標準通常被稱之為H.264/AVC

2020-12-11 15:45:33

A4處理器是如何去定義的

A4處理器 (A4 Processor)A4 Processor, designed by Apple Inc. on 27th January 2010 is billed

2022-01-25 07:26:51

AM3517視頻性能，AM3517內(nèi)部有POWERVR SGX視頻加速處理器,請問支持DVD格式,H.264格式視頻,720P,RMVB播放嗎？

本帖最后由一只耳朵怪于 2018-6-5 09:04 編輯 AM3517內(nèi)部有POWERVR SGX視頻加速處理器,不知道它是否支持DVD格式,H.264格式視頻,720P,RMVB播放

2018-06-04 09:32:53

ARM Cortex-A9處理器

類別：嵌入式系統(tǒng)處理器知識產(chǎn)權(quán)許可商ARMHoldingsplc已經(jīng)成功開發(fā)出雙內(nèi)核Cortex-A9處理器設(shè)計（被稱為Osprey）的兩個實現(xiàn)。Cortex-A9處理器能與其他Cortex系列

2018-09-06 09:27:22

ARM Cortex-M23處理器主要有哪些特色？

新Cortex-M23處理器的強大特色有哪些？

2021-04-02 06:19:51

ARM Cortex-M23處理器技術(shù)參考手冊

Cortex-M23處理器是一款低門數(shù)、兩級和高能效處理器。它適用于微控制器和深度嵌入式應(yīng)用，這些應(yīng)用需要在安全性是重要考慮因素的環(huán)境中使用區(qū)域優(yōu)化的低功耗處理器。

2023-08-17 07:28:12

ARM Cortex-M85處理器技術(shù)參考手冊

Cortex?-M85處理器是一款完全可合成的高性能微控制器類處理器，它實現(xiàn)ARM?v8.1-M主線架構(gòu)，其中包括對M-Profile向量擴展(MVE)的支持。該處理器還支持以前ARM?V8-M架構(gòu)

2023-08-09 07:28:27

ARM Cortex-M85處理器軟件優(yōu)化指南

Cortex?-M85處理器是一款完全可合成的高性能微控制器級處理器，實現(xiàn)了Arm?v8.1?M主線架構(gòu)，其中包括對M?profile矢量擴展（MVE）的支持。該處理器還支持以前的Arm?v8?M

2023-08-10 07:43:12

ARM Cortex－M23處理器的特色是什么？

ARM?Cortex?-M23采用***?技術(shù)，是尺寸最小、能效最高的處理器。小型嵌入式應(yīng)用對芯片的安全性能有嚴格要求，基于ARMv8-M基線架構(gòu)的Cortex-M23處理器則是最佳解決方案。

2019-10-11 07:38:45

Arm Cortex-M55處理器數(shù)據(jù)集

能力的Cortex-M處理器，提供增強的、高能效的數(shù)字信號處理(DSP)和機器學(xué)習(xí)(ML)性能。 Cortex-M55處理器實現(xiàn)了標量和向量運算的高計算性能，同時保持了較低的能耗

2023-08-25 07:46:47

Arm Cortex-R82處理器技術(shù)參考手冊

Cortex?-R82處理器是一款中等性能的多核有序超標量處理器，適用于實時嵌入式應(yīng)用。 Cortex?-R82處理器采用ARM?V8-R AArch64架構(gòu)。 ARM?V8-R AArch64

2023-08-17 07:45:14

Arm Cortex-R82處理器技術(shù)參考手冊

?-R82處理器的專用調(diào)試組件。 DebugBlock被實例化為單獨的頂級單元，以允許您在始終在線的POWER域中實現(xiàn)調(diào)試組件。盡管DebugBlock作為一個單獨的單元進行了實例化，但它仍然是Cortex?-R82處理器的一部分。

2023-08-17 08:02:29

Core8051處理器有什么特點？

愛特公司 (Actel Corporation) 宣布擴展 Core8051處理器以支持其高可靠性Axcelerator? 及低功耗 IGLOO? 系列FPGA，繼續(xù)為嵌入產(chǎn)品設(shè)計人員提供高性能

2019-09-24 07:45:20

Cortex-A9處理器的精妙應(yīng)用

和 Cortex-A5 處理器?！　《鳦ortex-A9被評價為可伸縮的，當然指的是其處理器可分為單核與多核，更好地適應(yīng)市場上得需求。三、產(chǎn)品應(yīng)用　　ARM Cortex-A9處理器由于其性能靈活性高

2014-11-03 17:02:32

Cortex-M0處理器的基礎(chǔ)知識

Cortex-M0處理器介紹

2021-02-26 06:03:34

Cortex-M3處理器是什么

STM32單片機STM32的核心Cortex-M3處理器是一個標準化的微控制器結(jié)構(gòu)，希望思考一下，何為標準化？簡言之，Cortex-M3處理器擁有32位CPU，并行總線結(jié)構(gòu)，嵌套中斷向量

2021-07-16 06:33:15

Cortex?-M3處理器

2.1STM32F103xx增強型LQFP48引腳分布2.2 STM32F103xx概述2.2.1ARM?的Cortex?-M3核心并內(nèi)嵌閃存和SRAMARM的Cortex?-M3處理器是最新一代

2021-08-11 07:03:10

D-2700和D-1700處理器產(chǎn)品資料

IntelXeon@D-2700和D-1700處理器為云、邊緣和5G網(wǎng)絡(luò)提供突破性的、密度優(yōu)化的性能、可擴展性和價值。intel Xeon D集成了以太網(wǎng)和加速器的處理器，用于支持網(wǎng)絡(luò)、存儲、工業(yè)loT、數(shù)據(jù)中心邊緣等。

2023-08-04 07:07:26

MSM8940處理器有哪些特點

MSM8940處理器是什么？MSM8940處理器有哪些特點？

2021-11-09 07:09:11

MT7628處理器是什么

MT7628處理器：MT7628nn/mt7628an 系列產(chǎn)品是新一代2T2R 802.11n Wi-Fi AP / 路由器 (系統(tǒng)單芯片)。 MT7628可提升射頻效能表現(xiàn)、減低功耗，并將整體

2021-07-22 06:19:16

MT7628處理器有哪些特點呢

什么是MT7628處理器呢？MT7628處理器有哪些特點呢？

2021-11-09 06:13:35

RK3126處理器是什么？有何作用

RK3188處理器有哪些特性呢？RK3168處理器具備哪幾大特點呢？RK3126處理器是什么？有何作用？

2022-02-18 07:21:37

RK3188處理器特征是什么？

2021-10-26 07:38:16

RK3399處理器與AR9201處理器有哪些不同之處呢

RK3399處理器與AR9201處理器有哪些不同之處呢？hi3559A處理器與RV1126處理器有哪些不同之處呢？

2022-02-21 07:29:27

RK3399處理器的性能優(yōu)勢有哪些？

2022-03-08 06:46:45

RK3399是什么？RK3399處理器有哪些功能呢

RK3399是什么？RK3399處理器有哪些功能呢？

2022-03-09 06:37:42

S3C2410處理器

S3C2410處理器通過GPD端口連接LED1-4四個燈，試著畫出其電路連接圖，并變成實現(xiàn)其逐一點亮功能。

2016-11-23 21:50:59

STM32處理器的啟動方式是什么？

2021-11-29 07:48:02

STM32的處理器是怎樣與外部進行通信的

STM32處理器與外部通信的兩種方式分別是什么？STM32的處理器是怎樣與外部進行通信的？

2021-11-23 08:06:38

Sitara AM62處理器的資料分享

和小型人機界面 (HMI) 應(yīng)用。TI 將于2022年6月21日至23日在德國紐倫堡的Embedded World展會（215號展位）上展出全新的AM62處理器，并演示適用于邊緣AI和電動汽車充電HMI

2022-11-03 06:11:50

TI DAVINCI的商業(yè)級H.264 視頻編碼器源碼供應(yīng)

80kbps ，非常適合3G信道傳輸圖像濾波：使用了消除塊效應(yīng)的 deblocking 濾波；完美消除H.264之前的壓縮算法帶來的方塊效應(yīng)宏塊模式：運用了所有的宏塊模式，包括幀內(nèi) I16x16

2009-12-02 14:10:03

TMS320C6678處理器的性能怎么樣？

TMS320C6678處理器的性能怎么樣？怎么探討TMS320C6678處理器的VLFFT演示？

2021-04-19 10:53:46

TWR-P1025處理器模塊目標應(yīng)用是什么？

飛思卡爾塔式系統(tǒng)是什么？TWR-P1025處理器模塊目標應(yīng)用是什么？

2021-05-25 06:36:00

[推薦]imx27開發(fā)平臺，H.264硬件編解碼，高清視頻首選

復(fù)雜的視頻前和視頻后處理。i.MX27處理器能在手持設(shè)備上實現(xiàn)真正的高清視頻播放, 是目前市面上比較少有的使用arm9內(nèi)核達到真正H.264全雙工編解碼功能的處理芯片，并且在處理H.264的同時幾乎不

2009-04-07 14:02:49

[推薦]imx27開發(fā)平臺，H.264硬件編解碼，高清視頻首選

2009-04-07 14:11:32

[求助]imx27開發(fā)平臺，H.264硬件編解碼，在視頻傳輸方面有什么特別之處詳

后處理。i.MX27處理器能在手持設(shè)備上實現(xiàn)真正的高清視頻播放, 是目前市面上比較少有的使用arm9內(nèi)核達到真正H.264全雙工編解碼功能的處理芯片，并且在處理H.264的同時幾乎不占用CPU的資源從而

2009-04-02 17:23:40

kirin659處理器和麒麟960的區(qū)別在哪

kirin659處理器和麒麟960的區(qū)別在哪?

2018-07-13 16:24:01

mt7628處理器

mt7628處理器：MT7628nn/mt7628an 系列產(chǎn)品是新一代2T2R 802.11n Wi-Fi AP / 路由器 (系統(tǒng)單芯片)。 MT7628可提升射頻效能表現(xiàn)、減低功耗，并將整體

2021-07-30 06:23:52

分享一下RK3399處理器的GPU和CPU性能方法

2022-03-07 06:36:23

基于ARM Cortex-M3內(nèi)核的STM32處理器有何性能

一、背景如果你正為項目的處理器而進行艱難的選擇：一方面抱怨16位單片機有限的指令和性能，另一方面又抱怨32位處理器的高成本和高功耗。那么，基于 ARM Cortex-M3內(nèi)核的STM32系列處理器

2021-12-06 07:20:56

基于Blackfin533的H.264編碼

濾波是H.264編碼的瓶頸,需要對這兩部分進行優(yōu)化。　　進行模式選擇時會調(diào)用絕對差值求和函數(shù)(SAD)及hadamard變換后再絕對值求和函數(shù)(SATD)。這兩個函數(shù)雖然較簡單,但調(diào)用較頻繁

2011-07-13 17:12:01

基于Cortex-A8處理器的嵌入式wince工控機

MIPS的性能優(yōu)化的消費類應(yīng)用的要求?？上攵珹8處理器剛開始主要是用在消費類電子而設(shè)計，但這些只是它的一個應(yīng)用領(lǐng)域而已！如果把它的優(yōu)勢用到工業(yè)控制方面，將會是什么情況？就整個工控市場來看，工控機普遍

2012-04-06 17:08:40

基于RK3399處理器設(shè)計的RK3399開發(fā)板有哪些配置呢

基于RK3399處理器設(shè)計的RK3399開發(fā)板有哪些配置呢？基于RK3399處理器設(shè)計的RK3399開發(fā)板有哪些應(yīng)用呢？

2022-03-07 06:34:49

基于嵌入式平臺的視頻編碼器的實現(xiàn)

中的每個像素都可用17個最接近先前已編碼的像素的不同加權(quán)和來進行幀內(nèi)預(yù)測。（6）環(huán)路去方塊濾波器。h.264／AVC把去方塊濾波引入運動估計預(yù)測環(huán)路中，既可去除方塊效應(yīng)，又能保護圖像細節(jié)邊緣，同時亦

2011-08-24 08:59:17

如何去實現(xiàn)并優(yōu)化H.264解碼器算法？

網(wǎng)絡(luò)視頻開發(fā)平臺NVDK是什么？H.264主要有哪些新特點？H.264解碼器算法的DSP實現(xiàn)和優(yōu)化

2021-06-02 06:25:40

如何去實現(xiàn)并優(yōu)化一種H.264視頻編碼器？

什么是H.264視頻編碼技術(shù)？如何去實現(xiàn)并優(yōu)化一種H.264視頻編碼器？

2021-06-03 07:00:52

如何去設(shè)計一種基于RK3399處理器的RT* u*轉(zhuǎn)網(wǎng)口驅(qū)動呢

如何去設(shè)計一種基于RK3399處理器的RT*** u***轉(zhuǎn)網(wǎng)口驅(qū)動呢？

2022-03-04 09:55:28

如何去降低H.264 INTRA幀編碼的運算復(fù)雜性？

如何去降低H.264 INTRA幀編碼的運算復(fù)雜性和存儲器需求？

2021-06-07 06:20:45

如何利用ARM9處理器如何設(shè)計一種SD卡電路呢？

2022-07-19 14:24:57

如何基于OMAPL138處理器實現(xiàn)藍牙+WiFi功能

我們目前使用的是OMAPL138處理器，然后在處理器上運行嵌入式Linux系統(tǒng)；在這個平臺基礎(chǔ)上，我們希望使用藍牙+WiFi功能。 1、請問我們可以使用什么模塊進行操作？ 2、考慮過WL1831mod模塊，但是這個模塊好像只支持AM335X系列，不支持OMAPL138處理器。謝謝。

2018-06-21 03:55:06

對于HDVICP和MJCP的使用和H.264的視頻壓縮該怎樣處理有很多疑惑，求解答

我剛開始學(xué)習(xí)DM368芯片，存在很多困惑和問題： 1.VPSS視頻模塊子系統(tǒng)是不是只能對進來的視頻進行處理，不能進行H.264的壓縮編碼嗎？ 2.怎樣進行壓縮編碼，該怎么使用HDVICP和MJCP

2018-05-28 03:15:04

應(yīng)用MAX264設(shè)計程控濾波器設(shè)計

應(yīng)用MAX264設(shè)計程控濾波器設(shè)計本設(shè)計應(yīng)用集成芯片MAX264設(shè)計一個程控濾波器。該濾波器主要由3個模塊組成：前置放大、濾波電路、單片機顯示與控制電路等。前置放大采用集成運放AD620構(gòu)成；濾波器

2009-12-16 11:17:20

怎么利用Geode TMGX1處理器設(shè)計嵌入式系統(tǒng)？

介紹國家半導(dǎo)體公司(NS)的Geode TMGX1處理器及協(xié)同芯片，說明如何利用該芯片組進行嵌入式系統(tǒng)設(shè)計，并討論一些設(shè)計難點的處理。

2019-09-05 07:30:36

怎么設(shè)計基于DSP的H.264編碼器電路？

足H.264標準的編解碼運算速度要求。因此，在穩(wěn)定的媒體處理器平臺上實現(xiàn)H.264標準有著較好的工程意義和應(yīng)用前景。

2019-09-04 06:19:09

怎樣去搭建RK3328處理器的編譯環(huán)境呢

RK3328處理器主要有哪些功能呢？RK3328處理器有哪些基本參數(shù)呢？怎樣去搭建RK3328處理器的編譯環(huán)境呢？

2022-03-09 06:50:34

怎樣去設(shè)計一種低碼率實時H.264視頻編碼器？

一種基于NiosII的低碼率實時H.264視頻編碼器設(shè)計

2021-06-07 07:06:49

怎樣去設(shè)計一種基于STMF103處理器的微型四軸飛行器呢

怎樣去使用STMF103的處理器和外設(shè)呢？怎樣去設(shè)計一種基于STMF103處理器的微型四軸飛行器呢？

2021-11-09 07:07:08

怎樣去降低H.264 INTRA幀編碼的運算復(fù)雜性和存儲器需求？

怎樣去降低H.264 INTRA幀編碼的運算復(fù)雜性和存儲器需求？

2021-04-21 07:17:16

新一代視頻編碼標準H.264在高速DSP平臺上的實現(xiàn)與優(yōu)化

參考。還有采用1/4或1/8精度的亞像素運動估計，以往標準至多采用1/2精度亞像素搜索，而且不是必選選項。為了消除視頻編碼中常出現(xiàn)的塊效應(yīng)，H.264使用了去塊效應(yīng)濾波器。它還采用整數(shù)DCT變換，以提高

2008-06-25 10:35:31

求大佬分享中容量STM32處理器啟動代碼

2021-11-30 07:19:41

瑞星微3288處理器的主要硬件指標有哪些？

2022-03-03 07:29:09

請問RISC處理器和ARM7處理器的區(qū)別在哪

請問RISC處理器和ARM7處理器的區(qū)別在哪？求大神解答

2022-06-30 17:51:06

請問如何實現(xiàn)H.264去方塊濾波的優(yōu)化設(shè)計？

如何在實時視頻解碼中優(yōu)化去方塊濾波算法？如何實現(xiàn)H.264去方塊濾波的優(yōu)化設(shè)計？

2021-04-20 06:24:06

請問怎樣實現(xiàn)H.264的量化？

量化的功能有哪些？量化的算法是什么？怎樣用Verilog語言實現(xiàn)H.264的量化？如何運用Modelsim對H.264進行仿真？

2021-04-28 06:12:51

麒麟950處理器有哪些地方有提升？

關(guān)于麒麟950處理器哪些是它的提升之處，何時才能進行大批量的裝機上市？

2021-04-02 06:39:45

麒麟980/麒麟970/麒麟960處理器怎么樣

麒麟980/麒麟970/麒麟960處理器怎么樣？有什么區(qū)別？有什么差距？

2021-10-20 07:56:01

基于FPGA的H.264去塊濾波系統(tǒng)的優(yōu)化設(shè)計

提出一種H.264去塊濾波系統(tǒng)的優(yōu)化設(shè)計方法。通過合理設(shè)計流水線級數(shù)提高并行性，適當增加內(nèi)部SRAM來提高系統(tǒng)速度和總線利用率，使用一種層次化的有限狀態(tài)機設(shè)計方法，實現(xiàn)對

2009-04-21 09:07:15

基于ADSP-BF533處理器的去方塊濾波器的實現(xiàn)及優(yōu)化

基于ADSP-BF533 處理器的去方塊濾波器的實現(xiàn)及優(yōu)化關(guān)鍵詞：視頻編解碼，去方塊濾波，ADSP-BF533 處理器摘要：本文通過系統(tǒng)、算法及匯編3 個級別優(yōu)化實現(xiàn)了H.264 中的去方塊濾波

2010-01-26 17:58:39

H．264解碼器中一種新穎的去塊效應(yīng)濾波器設(shè)計

H．264解碼器中一種新穎的去塊效應(yīng)濾波器設(shè)計引言　　圖像的編解碼技術(shù)是多媒體技術(shù)的關(guān)鍵，H．264／AVC是國際上最先進的視頻壓縮技術(shù)，其主要特點是采用

2009-11-21 09:37:29

793

已全部加載完成

搜索歷史

基于BlackfinBF533處理器對H.264去方塊濾波器性能進行優(yōu)化

評論