?? ?引言
在基于小波變換的圖象壓縮方案中,嵌入式零樹小波 EZW(Embedded Zerotree Wavelets)[1]編碼很好地利用小波系數(shù)的特性使得輸出的碼流具有嵌入特性。近年來,在對EZW改進的基礎上,提出了許多新的性能更好的算法,如多級樹集合分裂算法(SPIHT :Set Partitioning In Hierarchical Trees)[2],集合分裂嵌入塊編碼(SPECK:Set Partitioned Embedded bloCK coder),可逆嵌入小波壓縮算法(CREW:Compression with Reversible Embedded Wavelets)[3] 。本文對這些算法進行了原理分析、性能比較,說明了嵌入式小波圖象編碼的研究方向。
1. 嵌入式零樹小波編碼算法EZW
1. 1算法原理:
內(nèi)嵌編碼[1](embedded coding)就是編碼器將待編碼的比特流按重要性的不同進行排序,根據(jù)目標碼率或失真度大小要求隨時結束編碼;同樣,對于給定碼流解碼器也能夠隨時結束解碼,并可以得到相應碼流截斷處的目標碼率的恢復圖象。內(nèi)嵌編碼中首先傳輸?shù)氖亲钪匾?a target="_blank">信息,也就是幅值最大的變換系數(shù)的位信息。圖1顯示了一個幅度值由大到小排序后的變換系數(shù)的二進制列表。表中每一列代表一個變換系數(shù)的二進制表示,每一行代表一層位平面,最上層為符號位,越高層的位平面的信息權重越大,對于編碼也越重要。內(nèi)嵌編碼的次序是從最重要的位(最高位)到最不重要的位(最低位)逐個發(fā)送,直到達到所需碼率后停止。
由圖1可知內(nèi)嵌編碼的輸出信息主要包括兩部分:排序信息和重要象素的位信息。其中,位信息是編碼必不可少的有效信息,對應于表中箭頭所劃過的比特位;而排序信息則是輔助信息,按其重要性從左到右排列,反映了重要象素在原圖上的空間位置,用于恢復原始的數(shù)據(jù)結構。因此,內(nèi)嵌算法中排序算法的優(yōu)劣和排序信息的處理決定了整個編碼算法的效率。
一副圖象經(jīng)過三級小波分解后形成了十個子帶,如圖2所示。小波系數(shù)的分布特點是越往低頻子帶系數(shù)值越大,包含的圖象信息越多,如圖2中的LL3子帶。而越往高頻子帶系數(shù)值越小,包含的圖象信息越少。就是在數(shù)值相同的情況下,由于低頻子帶反映的是圖象的低頻信息,對視覺比較重要,而高頻子帶反映的是圖象的高頻信息,對視覺來說不太重要。這樣對相同數(shù)值的系數(shù)選擇先傳較低頻的系數(shù)的重要比特,后傳輸較高頻系數(shù)的重要比特。正是由于小波系數(shù)具有的這些特點,它非常適合于嵌入式圖象的編碼算法。在JPEG2000標準中以小波變換作為圖象編碼的變換方法。
EZW算法利用小波系數(shù)的特點較好地實現(xiàn)了圖象編碼的嵌入功能,主要包括以下三個過程:零樹預測,用零樹結構編碼重要圖,逐次逼近量化。
1) 零樹預測
一副經(jīng)過小波變換的圖象按其頻帶從低到高形成一個樹狀結構,樹根是最低頻子帶的結點,它有三個孩子分別位于三個次低頻子帶的相應位置,見圖2左上角,其余子帶(最高頻子帶除外)的結點都有四個孩子位于高一級子帶的相應位置(由于高頻子帶分辨率增加,所以一個低頻子帶結點對應有四個高頻子帶結點,即相鄰的2×2矩陣,見圖2)。這樣圖2所示的三級小波分解就形成了深度為4的樹。
定義一個零樹的數(shù)據(jù)結構:一個小波系數(shù)x,對于一個給定的門限T,如果|x|
2) 用零樹結構編碼重要圖
重要圖包括三種要素:即重要系數(shù)、孤立零和零樹根。其中,對于一個給定的閾值T,如果系數(shù)X本身和它的所有的子孫都小于T,則該點就稱為零樹根;如果系數(shù)本身小于T,但其子孫至少有一個大于或等于T,則該點就稱為孤立零點。在編碼時分別用三種符號與之對應。當編碼到最高分辨率層的系數(shù)時,由于它們沒有子孫,零樹根不再存在,只需其余兩種符號即可。為了有利于內(nèi)嵌編碼,將重要系數(shù)的符號與重要圖一起編碼,這樣就要使用四種符號:零樹根、孤立零、正重要系數(shù)、負重要系數(shù)。
3) 逐次逼近量化(Successive-Approximation Quantization,SAQ)
內(nèi)嵌編碼的核心在于采用了逐次逼近的量化方法(SAQ)。SAQ按順序使用了一系列閾值T0、T1,┄,TN-1來判決重要性,其中Ti=Ti-1/2,初始閾值T0按如下條件選擇,∣Xj∣<2T0,其中Xj表示所有變換系數(shù)。
在編(譯)碼過程中,始終保持著兩個分離的列表:主表和輔表。主表對應于編碼中的不重要的集合或系數(shù),其輸出信息起到了恢復各重要值的空間位置結構的作用,而輔表是編碼的有效信息,輸出為各重要系數(shù)的二進制值。編碼分為主、輔兩個過程:在主過程中,設定閾值為Ti,按上述原理對主表進行掃描編碼,若是重要系數(shù),則將其幅值加入輔表中,然后將該系數(shù)在數(shù)組中置為零,這樣當閾值減小時,該系數(shù)不會影響新零樹的出現(xiàn);在輔過程中,對輔表中的重要系數(shù)進行細化,細化過程類似于比特平面編碼。對閾值Ti來說,重要系數(shù)的所在區(qū)間為[Ti,2Ti],若輔表中的重要系數(shù)位于[Ti,3Ti/2],則用符號“0”表示,否則用符號“1”表示。編碼在兩個過程中交替進行,在每個主過程前將閾值減半。譯碼時系數(shù)的重構值可以位于不確定區(qū)間的任意處,如果采用MMSE準則,則重構值應位于不確定區(qū)間的質(zhì)心處。實際中為簡單起見使用區(qū)間的中心作為重構值。
1. 2算法分析:
研究表明,在圖象的低比特率編碼中,用來表示非零系數(shù)所在位置的開銷遠遠大于用來表示非零系數(shù)值的開銷。零樹結構正是一種描述圖象經(jīng)過小波變換后非零數(shù)值位置的有效方法。EZW的編碼思想是不斷掃描變換后的圖象,生成多棵零樹來對圖象編碼:一棵零樹的形成需要對圖象進行兩次掃描。在生成第一棵零樹時,首先找出變換后圖象的最大絕對值系數(shù),用它對應的T0作初始閾值,對圖象進行第一次掃描。將圖象中絕對值小于閾值系數(shù)都看作零,然后按前面的符號定義形成零樹。在第二次掃描中,對那些絕對值大于閾值的結點(POS和NEG)按其絕對值是否大于閾值的1.5倍附加一個比特1或0來描述其精度。這樣做的目的是減小非零結點系數(shù)值的變化范圍,使其適應下一次閾值減半后的比特附加(具體細節(jié)見文[1])。而后將閾值減半,再經(jīng)兩次掃描生成第二棵零樹,在第一次掃描生成零樹時,以前已經(jīng)大于閾值的結點不再考慮,而第二次掃描附加比特時則要考慮以前數(shù)值較大的結點以保證精度。如此重復下去,不斷生成零樹,直到達到需要的編碼精度為止。
研究發(fā)現(xiàn)EZW算法存在的問題是:
(1).由于編碼時它形成多棵零樹,因而要多次掃描圖象,造成效率很低。而且每一棵樹必須在前一棵樹形成之后才能形成,所以也很難用并行算法優(yōu)化。
(2).對所有的頻域進行等同重要度的編碼,不能充分利用小波變換的特點。改進辦法之一是把最低頻子圖與其它子圖分開處理,對其進行單獨的無失真編碼。
(3).在一棵零樹中包含的元素越多,則越有利于數(shù)據(jù)壓縮。在EZW算法中存在這樣的樹間冗余,在SPIHT算法中則進一步利用了這種樹間冗余。
(4).通過對小波系數(shù)的分析發(fā)現(xiàn),在同一子帶中相鄰元素間有一定的相關性,尤其在高頻子帶存在大量的低值元素,所以可以通過子帶中的集合把大量的這種低值元素組織到一起,達到數(shù)據(jù)壓縮的目的。而EZW算法并沒有充分利用這種相關性。在SPECK算法中利用這種相關性達到了數(shù)據(jù)壓縮的目的。
2. 多級樹集合分裂算法 SPIHT
原理分析:
EZW算法是一種基于零樹的嵌入式圖象編碼算法,雖然在小波變換系數(shù)中,零樹是一個比較有效的表示不重要系數(shù)的數(shù)據(jù)結構,但是,在小波系數(shù)中還存在這樣的樹結構,如圖2,即它的樹根是重要的,除樹根以外的其它結點是不重要的。對這樣的系數(shù)結構零樹就不是一種很有效的表示方法。A.Said和W.A.Pearlman根據(jù)Shapiro零樹編碼算法(EZW)的基本思想,提出了一種新的且性能更優(yōu)的實現(xiàn)方法,即基于分層樹集合分割排序(Set Partitioning in Hierarchical Trees,SPIHT)的編碼算法。它采用了空間方向樹(SOT:spatial orientation tree)、集合D(i,j)和L(i,j)更有效地表示這樣的系數(shù)結構,從而提高了編碼效率。
1)SPIHT算法中用到的概念
算法中的一些符號和概念說明如下:
● H:空間方向樹所有根結點的坐標集合;
● Z(i,j):點(i,j)及其所有的后代的坐標集合,即指空間方向樹;
● D(i,j):點(i,j)的所有后代(子孫)的坐標集合,不包括(i,j)點本身;
● O(i,j):點(i,j)的直接后代(兒子)的坐標集合,在分層塔形結構的最高層H有O(i,j)={(i+LL,j),(i,j+LL),(i+LL,j+LL)},除此之外的結點有O(i,j)={(2i,2j),(2i,2j+1),(2i+1,2j), (2i+1,2j+1)},這里LL為最高層H的尺度。
● L(i,j):點(i,j)除直接后代外所有后代坐標的集合;
評論
查看更多