0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

采用FPGA器件實(shí)現(xiàn)并行偵測(cè)多路可變長(zhǎng)編碼

電子設(shè)計(jì) ? 來(lái)源:郭婷 ? 作者:電子設(shè)計(jì) ? 2019-04-24 08:19 ? 次閱讀

可變長(zhǎng)編碼(VLC)是一種無(wú)損熵編碼,它廣泛應(yīng)用于多媒體信息處理等諸多領(lǐng)域。在H.261/263、MPEG1/2/3等國(guó)際標(biāo)準(zhǔn)中,VLC占有重要地位。VLC的基本思想是對(duì)一組出現(xiàn)概率各不相同的信源符號(hào),采用不同長(zhǎng)度的碼字表示,對(duì)出現(xiàn)概率高的信源符號(hào)采用短碼字,對(duì)出現(xiàn)概率低的信源符號(hào)采用長(zhǎng)碼字。Huffman編碼是一種典型的VLC,其編碼碼字的平均碼長(zhǎng)非常接近于數(shù)據(jù)壓縮的理論極限——熵。

可變長(zhǎng)解碼(VLD)是VLC的逆過(guò)程,它從一組連續(xù)的碼流中提取出可變長(zhǎng)碼字,并將之轉(zhuǎn)換為對(duì)應(yīng)的信源符號(hào)。由于在VLC過(guò)程中,碼字之間通常不會(huì)加入任何分隔標(biāo)識(shí),這就造成了在解碼過(guò)程中識(shí)別碼字的困難。因此,在VLD過(guò)程中,變長(zhǎng)碼字必須逐一識(shí)別,只有碼流中居前的碼字被識(shí)別之后,才能定位后序碼字的起始位置,這一點(diǎn)在很大程度上限制了VLD運(yùn)行的效率。

本文討論一種新型的VLD解碼結(jié)構(gòu),它通過(guò)并行偵測(cè)多路碼字,將Buffer中的多個(gè)可變長(zhǎng)碼一次讀出,這將極大地提高VLD的吞吐量和執(zhí)行效率。然后采用FPGA對(duì)這種并行VLD算法的結(jié)構(gòu)進(jìn)行驗(yàn)證,最終得出相應(yīng)結(jié)論。

1 算法描述

由于碼流中的可變長(zhǎng)碼之間具有前向依賴性,因此如何確定可變長(zhǎng)碼碼字在連續(xù)碼流中的起始位置是VLD的關(guān)鍵所在。傳統(tǒng)的VLD解碼方案主要為位串行解碼方案和位并行解碼方案兩種。

在位串行解碼方案中,碼流逐位送入解碼器,解碼器通過(guò)逐位匹配實(shí)現(xiàn)可變長(zhǎng)碼的解碼。這種過(guò)程實(shí)質(zhì)上是一種建造Huffman樹的反過(guò)程,從根節(jié)點(diǎn)出發(fā),直至葉子節(jié)點(diǎn)為止。由于這種方式采用逐位操作方式,而可變長(zhǎng)碼的碼長(zhǎng)又各不相同,使得碼字識(shí)別所需的運(yùn)行周期也不相同。在解碼長(zhǎng)較短的碼字時(shí),其解碼速度較快,而在解碼長(zhǎng)較長(zhǎng)的碼字時(shí),其解碼速度較慢。顯然,位串行解碼方案效率相對(duì)較低,解碼速度因碼字長(zhǎng)度不同而不同,無(wú)法滿足某些對(duì)實(shí)時(shí)性要求較高的應(yīng)用場(chǎng)合。

針對(duì)位串行解碼方案的不足,多種位并行解碼方案被提出。位并行解碼方案采用并行方式工作,通過(guò)對(duì)可變長(zhǎng)碼的碼字進(jìn)行排序(Ordering)、分割(Partitioning)和簇化(Clustering),采用基于邏輯塊的匹配模式中其它樹的匹配模式來(lái)實(shí)現(xiàn)。并行解碼方案大大提高了可變長(zhǎng)碼的解碼效率,而且可以確何每個(gè)運(yùn)行周期輸出一個(gè)解碼碼字,實(shí)現(xiàn)穩(wěn)定的解碼輸出。在高級(jí)的位并行解碼方案中,還可以將解碼過(guò)程分解為若干階段,引入流水線操作,進(jìn)一步提高解碼效率。

在傳統(tǒng)的VLD解碼方案的基礎(chǔ)之上,采用并行操作方式,增加硬件資源和相應(yīng)的控制邏輯,可實(shí)現(xiàn)一個(gè)運(yùn)行周期輸出多個(gè)解碼碼字,使可變長(zhǎng)碼的解碼效率進(jìn)一步得到提高。

由于可變長(zhǎng)碼長(zhǎng)度不同,在解碼過(guò)程中碼字存在前向依賴性。如果采用多路并行操作方式,在所有可能成為可變長(zhǎng)碼碼字的起始位置同時(shí)進(jìn)行預(yù)測(cè),然后通過(guò)后續(xù)控制篩選出合法的碼字,就可以對(duì)多個(gè)可變長(zhǎng)碼實(shí)現(xiàn)同時(shí)解碼。這就是多符號(hào)可變長(zhǎng)并行解碼方案的基本思想。

具體說(shuō)明如下:假設(shè)某個(gè)信源符號(hào)集有K個(gè)符號(hào),K個(gè)符號(hào)所對(duì)應(yīng)的變長(zhǎng)碼字用Ck=(cok,…,cimk-1)|ckl∈{0,1},k=0,…,k-1表示,這些變長(zhǎng)碼的長(zhǎng)度為集合L,其中最長(zhǎng)的碼長(zhǎng)用ln表示,最短的碼長(zhǎng)用l1表示;具有相同碼長(zhǎng)的碼字最多為dmax個(gè)?,F(xiàn)采用分頁(yè)方式重新組織這些可變長(zhǎng)碼,將具有相同碼長(zhǎng)的碼字存入一個(gè)頁(yè)內(nèi),那么易知一個(gè)頁(yè)內(nèi)最多可能擁有dmax個(gè)碼字。為了識(shí)別一個(gè)頁(yè)內(nèi)的不同碼字,還需要引入頁(yè)內(nèi)偏移量,然后采用線性結(jié)構(gòu)將這些頁(yè)面重新組合。

下面給出一個(gè)依據(jù)該思想重新組織信源符號(hào)的實(shí)例:

對(duì)于存儲(chǔ)在Buffer中的等待解碼的數(shù)據(jù)碼流X,用滑動(dòng)窗口從中截取前N位,這里的N應(yīng)當(dāng)大于或等于可變長(zhǎng)碼中最長(zhǎng)碼字的碼長(zhǎng),即N≥ln。由于可變長(zhǎng)碼最短的碼長(zhǎng)為l1,因此在這N位碼流中,最多可包含M=[N/l1]個(gè)可變長(zhǎng)碼。為了表示方便,這里用Wi(i=0,1,…,M-1)表示這M個(gè)可變長(zhǎng)碼。

雖然,對(duì)于W0,其起始位置必然為0;如果W0的碼長(zhǎng)為L(zhǎng)0,那么W1的起始位置則為L(zhǎng)0;如果W1的碼長(zhǎng)為L(zhǎng)1,那么W2的起始位置為L(zhǎng)0+L1,依此類推。由于在解碼開始時(shí),L0的取值無(wú)法明確,其可能取值范圍是l1≤L0≤Ln,因此每個(gè)Wi的可能起始位置分別由一組值組成。

為了實(shí)現(xiàn)并行解碼,采用多個(gè)可變長(zhǎng)碼檢測(cè)單元從所有可能的起始位置同時(shí)偵測(cè),一旦W0的碼長(zhǎng)L0被偵測(cè)出,就可以從所有已解碼的可能的變長(zhǎng)碼中找出W1,并確定W1的碼長(zhǎng)L1,由此W2的起始位置也就得以確定。依此類推,最多可逐次將Wi(i=0,1,…,M-1)個(gè)變長(zhǎng)碼解出。

每個(gè)Wi的解碼過(guò)程只比Wi-1的解碼過(guò)程多一個(gè)加法操作的延遲,相對(duì)于變長(zhǎng)碼的識(shí)別,加法操作的延遲非常的小。當(dāng)然,如果滑動(dòng)窗口N的取值過(guò)大,每個(gè)Wi之間的加法操作的延遲將累加,這將降低解碼的整體效率。因此對(duì)于滑動(dòng)窗口N的選擇,需要結(jié)合實(shí)際應(yīng)用中可變長(zhǎng)碼編碼的特點(diǎn)來(lái)權(quán)衡。

設(shè)某個(gè)待解碼流為B={110110100011000011001111,…}。這里采用長(zhǎng)度N=12的滑動(dòng)窗口進(jìn)行碼流提取,由于變長(zhǎng)碼的長(zhǎng)度從2~8不等,因此每個(gè)運(yùn)動(dòng)周期至少可以解碼出1個(gè)碼字,最多可解碼出6個(gè)碼字,這6個(gè)變長(zhǎng)碼字可能的起始位置分別為W0:{0};W1:{2,3,4,5,6,7,8};W2:{4,5,6,7,8,9,10};W3:{6,7,8,9,10};W4:{8,9,10};W5:{10}。

綜合起來(lái),可能成為該可變長(zhǎng)碼起始位置的集合為{0,2,3,4,5,6,7,8,9,10},因此在應(yīng)用上共需要10個(gè)可變長(zhǎng)碼檢測(cè)單元并行執(zhí)行。

2 實(shí)現(xiàn)與驗(yàn)證

多碼字并行解碼方法實(shí)現(xiàn)的關(guān)鍵在于解碼過(guò)程的并行性,采用硬件方案實(shí)現(xiàn)起來(lái)并不難。上例中10個(gè)可變長(zhǎng)碼檢測(cè)單元可采用經(jīng)典的位并行解碼方案實(shí)現(xiàn),因?yàn)槲徊⑿薪獯a方案能夠保證不同長(zhǎng)度碼字的輸出時(shí)間基本相同,為其后的操作帶來(lái)便利。在本文中,采用基于查找表的方式來(lái)實(shí)現(xiàn)。

碼字檢測(cè)單元所檢測(cè)到的可變長(zhǎng)碼的碼長(zhǎng)及頁(yè)內(nèi)偏移量(這里采用碼字的最右位作為頁(yè)內(nèi)偏移量),在識(shí)別過(guò)程中可能存在沒(méi)有任何有效碼字的情況。為此,增加了一位有效狀態(tài)位,作為輸出是否有效的標(biāo)志。變長(zhǎng)碼檢測(cè)單元CD的結(jié)構(gòu)框圖如圖1所示。

由于前一個(gè)有效碼字Wi-1的碼長(zhǎng)控制著碼字Wi的選取,而對(duì)應(yīng)Wi-1的檢測(cè)單元Cdi-1輸出了Wi-1的碼長(zhǎng),因此在實(shí)現(xiàn)上可以采用將Cdi-1的輸出作為有效碼字Wi選取的控制位,它通過(guò)控制一個(gè)多路選擇器MUX,從所有對(duì)應(yīng)可能是Wi起始位置的CD輸出中選取有效的輸出作為有效碼字Wi。在有效字Wi被成功識(shí)別后,需要將其碼長(zhǎng)即Cdi的輸出與Cdi-1的輸出相加,作為有效碼字選擇的控制。這些功能通過(guò)一個(gè)復(fù)合的多路復(fù)用器-加法器MA實(shí)現(xiàn),多路復(fù)用器-加法器MA的結(jié)構(gòu)如圖2所示。

采用FPGA器件實(shí)現(xiàn)并行偵測(cè)多路可變長(zhǎng)編碼

在所有有效碼字的起始位置被識(shí)別后,根據(jù)對(duì)應(yīng)CD單元的輸出,即碼長(zhǎng)信息和頁(yè)內(nèi)偏移量,可以通過(guò)查表將對(duì)應(yīng)的碼長(zhǎng)數(shù)據(jù)轉(zhuǎn)換成相應(yīng)的信源符號(hào)或存儲(chǔ)相應(yīng)信源符號(hào)的地址。這些功能由信號(hào)轉(zhuǎn)換單元SYMBOL完成。

根據(jù)上面的討論,設(shè)計(jì)出用于上例的多符號(hào)并行解碼器,其結(jié)構(gòu)圖如圖3所示。

采用FPGA器件實(shí)現(xiàn)并行偵測(cè)多路可變長(zhǎng)編碼

為了驗(yàn)證這種這種結(jié)構(gòu),采用FPGA器件實(shí)現(xiàn)它,選擇的是一片Xilinx xc2s400e-6ft256器件,其規(guī)模為145000門。在這里,采用VHDL語(yǔ)言進(jìn)行RTL級(jí)描述,利用XST進(jìn)行綜合,并在ModelSim5.8中進(jìn)行仿真。結(jié)果驗(yàn)證正確,其仿真結(jié)果如圖4所示。

采用FPGA器件實(shí)現(xiàn)并行偵測(cè)多路可變長(zhǎng)編碼

實(shí)驗(yàn)表明,系統(tǒng)允許最大時(shí)鐘頻率為44.172MHz,占用了197個(gè)Slice(4%),74個(gè)Slice Flip Flops(<1%),347個(gè)四輸入查找表(12%)和1個(gè)全局時(shí)鐘(25%)。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1630

    文章

    21777

    瀏覽量

    604746
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1144

    瀏覽量

    40839
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7113

    瀏覽量

    89303
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    FPGA實(shí)現(xiàn)H 264 AVC視頻編碼標(biāo)準(zhǔn)

    FPGA實(shí)現(xiàn)H 264 AVC視頻編碼標(biāo)準(zhǔn)盡管H.264/AVC承諾將比已有視頻編碼標(biāo)準(zhǔn)具有更高的編碼效率,它仍為系統(tǒng)架構(gòu)師、DSP 工
    發(fā)表于 06-25 11:33

    請(qǐng)問(wèn)有大神可以指點(diǎn)設(shè)計(jì)一個(gè)多路PCM編碼的復(fù)接器

    要求是利用FPGA開發(fā)板,設(shè)計(jì)一個(gè)多路PCM編碼的復(fù)接器,已知8路電話信號(hào)已經(jīng)過(guò)PCM編碼,每路位寬8bit,頻率8KHz,以64比特寬度并行
    發(fā)表于 09-16 21:39

    采用FPGA增量式編碼實(shí)現(xiàn)接口設(shè)計(jì)

    、DSP、ARM等器件直接進(jìn)行并行通訊。實(shí)驗(yàn)結(jié)果驗(yàn)證了設(shè)計(jì)的正確性??梢钥闯觯?b class='flag-5'>FPGA設(shè)計(jì)光電編碼器信號(hào)處理模塊,無(wú)論是設(shè)計(jì)過(guò)程,還是電路結(jié)構(gòu)、都變得更加簡(jiǎn)潔。另外,在應(yīng)用中注意
    發(fā)表于 06-10 05:00

    請(qǐng)問(wèn)怎么采用FPGA和集成器件來(lái)實(shí)現(xiàn)IJF編碼?

    IJF編碼是什么原理?如何實(shí)現(xiàn)IJF編碼?采用FPGA和集成器件來(lái)
    發(fā)表于 04-13 06:56

    如何提高VLD的吞吐量和執(zhí)行效率?

    本文討論一種新型的VLD解碼結(jié)構(gòu),它通過(guò)并行偵測(cè)多路碼字,將Buffer中的多個(gè)可變長(zhǎng)碼一次讀出,這將極大地提高VLD的吞吐量和執(zhí)行效率。然后采用
    發(fā)表于 04-28 06:08

    怎么設(shè)計(jì)c語(yǔ)言的可變長(zhǎng)參數(shù)函數(shù)?

    怎么設(shè)計(jì)c語(yǔ)言的可變長(zhǎng)參數(shù)函數(shù)
    發(fā)表于 10-27 07:10

    基于FPGA并行可變長(zhǎng)解碼器的實(shí)現(xiàn)

    介紹了一種采用并行方式構(gòu)建的多符號(hào)可變長(zhǎng)碼解碼器。該解碼器通過(guò)增加結(jié)構(gòu)的復(fù)雜性和對(duì)硬件資源的占用,換取可變長(zhǎng)碼解碼的高吞吐量。這種結(jié)構(gòu)突破了可變長(zhǎng)
    發(fā)表于 07-17 15:01 ?17次下載

    可變參數(shù)交織編碼器的FPGA實(shí)現(xiàn)

    本文介紹了可變參數(shù)交織編碼FPGA實(shí)現(xiàn)的圖形設(shè)計(jì)過(guò)程,給出了完整的設(shè)計(jì)思路和設(shè)計(jì)電路,并對(duì)設(shè)計(jì)進(jìn)行了仿真實(shí)驗(yàn),從仿真圖中可以清楚的看出不同交織深度下的性能指標(biāo)
    發(fā)表于 07-28 17:59 ?11次下載

    采用可編程邏輯器件器件設(shè)計(jì)可變格式和可變速率的通信數(shù)字信號(hào)源

     摘要:采用Lattice公司的在系統(tǒng)可編程器件pLSI/ispLSI1016,設(shè)計(jì)出一個(gè)具有可變格式、可變長(zhǎng)度和可變
    發(fā)表于 05-26 21:52 ?746次閱讀
    <b class='flag-5'>采用</b>可編程邏輯<b class='flag-5'>器件</b><b class='flag-5'>器件</b>設(shè)計(jì)<b class='flag-5'>可變</b>格式和<b class='flag-5'>可變</b>速率的通信數(shù)字信號(hào)源

    采用可編程邏輯器件器件設(shè)計(jì)可變格式和可變速率的通信數(shù)字信號(hào)源

    摘要:采用Lattice公司的在系統(tǒng)可編程器件pLSI/ispLSI1016,設(shè)計(jì)出一個(gè)具有可變格式、可變長(zhǎng)度和可變速率的通信數(shù)字信號(hào)源,從
    發(fā)表于 06-20 14:00 ?622次閱讀
    <b class='flag-5'>采用</b>可編程邏輯<b class='flag-5'>器件</b><b class='flag-5'>器件</b>設(shè)計(jì)<b class='flag-5'>可變</b>格式和<b class='flag-5'>可變</b>速率的通信數(shù)字信號(hào)源

    基于FPGA可變長(zhǎng)度移位寄存器優(yōu)化設(shè)計(jì)

    本文以最大可變長(zhǎng)度為N、寬度為1bit的移位寄存器為模型,討論如何從結(jié)構(gòu)上優(yōu)化可變長(zhǎng)度移位寄存器和有效的FPGA實(shí)現(xiàn)。至于寬度不為1bit的情況,可以此類推
    發(fā)表于 07-23 10:55 ?5480次閱讀
    基于<b class='flag-5'>FPGA</b>的<b class='flag-5'>可變長(zhǎng)</b>度移位寄存器優(yōu)化設(shè)計(jì)

    基于FPGA仿真結(jié)果的MPEG4可變長(zhǎng)數(shù)據(jù)解碼器設(shè)計(jì)詳細(xì)概述

    本文討論了一種高吞吐量流水方式構(gòu)建的MPEG-4可變長(zhǎng)解碼器的設(shè)計(jì)與仿真結(jié)果。在這種解碼器中,我們采用了基于PLA的并行解碼算法,這種算法能夠實(shí)現(xiàn)每個(gè)時(shí)鐘解碼一個(gè)碼字。同時(shí),為了提高解
    發(fā)表于 04-23 15:09 ?10次下載
    基于<b class='flag-5'>FPGA</b>仿真結(jié)果的MPEG4<b class='flag-5'>可變長(zhǎng)</b>數(shù)據(jù)解碼器設(shè)計(jì)詳細(xì)概述

    基于FPGA實(shí)現(xiàn)高速ADC器件采樣時(shí)序控制與實(shí)時(shí)存儲(chǔ)

    數(shù)據(jù)采集系統(tǒng)的總體架構(gòu)如圖1所示,其中PCI核、DMA控制器與A/D控制器均在FPGA內(nèi)部實(shí)現(xiàn)。為實(shí)現(xiàn)多路并行采樣,可選用多片A/D
    的頭像 發(fā)表于 08-28 10:16 ?1.4w次閱讀
    基于<b class='flag-5'>FPGA</b><b class='flag-5'>實(shí)現(xiàn)</b>高速ADC<b class='flag-5'>器件</b>采樣時(shí)序控制與實(shí)時(shí)存儲(chǔ)

    H.264解碼器中CABAC硬件加速器的實(shí)現(xiàn)

    諸多方面都超越了以往的視頻標(biāo)準(zhǔn)。H.264有兩種熵編碼方案:一種是從可變長(zhǎng)編碼方案發(fā)展而來(lái)的基于上下文的自適應(yīng)可變長(zhǎng)編碼CAVLC;另一種是從算術(shù)編碼發(fā)展而來(lái)的基于上下文的自適應(yīng)二進(jìn)制
    發(fā)表于 11-05 09:55 ?752次閱讀

    如何使用FPGA實(shí)現(xiàn)并行結(jié)構(gòu)FFT

    提出了一種基于FPGA實(shí)現(xiàn)的全并行結(jié)構(gòu)FFT設(shè)計(jì)方法,采用XILINX公司最新器件VirtexII Pro,用硬件描述語(yǔ)言VHDL和圖形輸入
    發(fā)表于 03-31 15:22 ?11次下載
    如何使用<b class='flag-5'>FPGA</b><b class='flag-5'>實(shí)現(xiàn)</b>全<b class='flag-5'>并行</b>結(jié)構(gòu)FFT