AVS(Audio Video coding Standard)即數(shù)字音視頻編解碼技術(shù)標準,為中國第二代信源編碼標準,此編碼技術(shù)主要解決數(shù)字音視頻海量數(shù)據(jù)(即初始數(shù)據(jù)、信源)的編碼壓縮問題,故也稱數(shù)字音視頻編解碼技術(shù)。
AVS工作組即數(shù)字音視頻編解碼技術(shù)標準工作組(Audio Video coding Standard Workgroup of China)由國家原信息產(chǎn)業(yè)部科學(xué)技術(shù)司于2002年6月批準成立。工作組的任務(wù)是:面向我國的信息產(chǎn)業(yè)需求,聯(lián)合國內(nèi)企業(yè)和科研機構(gòu),制(修)訂數(shù)字音視頻的壓縮、解壓縮、處理和表示等共性技術(shù)標準,為數(shù)字音視頻設(shè)備與系統(tǒng)提供高效經(jīng)濟的編解碼技術(shù),服務(wù)于高分辨率數(shù)字廣播、高密度激光數(shù)字存儲媒體、無線寬帶多媒體通訊、互聯(lián)網(wǎng)寬帶流媒體等重大信息產(chǎn)業(yè)應(yīng)用。自AVS工作組2002年成立以來,至今,已制定了兩代AVS標準。
AVS標準工作簡況與進展:AVS是我國具備自主知識產(chǎn)權(quán)的第二代信源編碼標準。顧名思義,”信源”是信息的”源頭”,信源編碼技術(shù)解決的重點問題是數(shù)字音視頻海量數(shù)據(jù)(即初始數(shù)據(jù)、信源)的編碼壓縮問題,故也稱數(shù)字音視頻編解碼技術(shù)。顯而易見,它是其后數(shù)字信息傳輸、存儲、播放等環(huán)節(jié)的前提,因此是數(shù)字音視頻產(chǎn)業(yè)的共性基礎(chǔ)標準。
國際上音視頻編解碼標準主要兩大系列:ISO/IEC JTC1制定的MPEG系列標準;ITU針對多媒體通信制定的H.26x系列視頻編碼標準和G.7系列音頻編碼標準。1994年由MPEG和ITU合作制定的MPEG-2是第一代音視頻編解碼標準的代表,也是目前國際上最為通行的音視頻標準。
經(jīng)過十年多演變,音視頻編碼技術(shù)本身和產(chǎn)業(yè)應(yīng)用背景都發(fā)生了明顯變化,后起之秀輩出。目前音視頻產(chǎn)業(yè)可以選擇的信源編碼標準有五個:MPEG-2、MPEG-4、MPEG-4 AVC(簡稱AVC,也稱JVT、H.264)、HEVC、AVS。從制訂者分,前四個標準是由MPEG專家組完成的,第五個是我國自主制定的。從發(fā)展階段分,MPEG-2是第一代信源標準,其余四個為第二代標準。從主要技術(shù)指標----編碼效率比較:MPEG-4是MPEG-2的1.4倍,第一代AVS和AVC相當,都是MPEG-2兩倍以上。第二代AVS2編碼效率比第一代標準提高了一倍以上,壓縮效率超越最新國際標準HEVC(H.265)。
可以推測,由于技術(shù)陳舊需要更新及收費較高等原因,MPEG-2即將退出歷史舞臺。MPEG-4出臺的新專利許可政策被認為過于苛刻令人無法接受,導(dǎo)致被眾多運營商圍攻,陷入無法推廣產(chǎn)業(yè)化的泥沼而無力自拔,前途未卜。而AVS是基于我國創(chuàng)新技術(shù)和部分公開技術(shù)的自主標準,第一代AVS編碼效率比MPEG-2高2-3倍,與AVC相當,技術(shù)方案簡潔,芯片實現(xiàn)復(fù)雜度低,達到了第二代標準的最高水平;而且,AVS通過簡潔的一站式許可政策,解決了AVC專利許可問題死結(jié),是開放式制訂的國家、國際標準,易于推廣;第二代AVS2編碼效率比第一代標準提高了一倍以上,壓縮效率超越最新國際標準HEVC(H.265)。此外,AVC僅是一個視頻編碼標準,而AVS是一套包含系統(tǒng)、視頻、音頻、數(shù)字版權(quán)管理在內(nèi)的完整標準體系,為數(shù)字音視頻產(chǎn)業(yè)提供更全面的解決方案。綜上所述,AVS可稱第二代信源標準的上選。
第一代AVS標準制訂起始于2002年,指系列國家標準《信息技術(shù) 先進音視頻編碼》(簡稱AVS1,國家標準代號GB/T 20090)和廣電系列標準《廣播電視先進音視頻編解碼》(簡稱AVS+)。AVS1包括系統(tǒng)、視頻、音頻、數(shù)字版權(quán)管理等四個主要技術(shù)標準和符合性測試等支撐標準,目前共14個部分。GB/T 20090視頻標準于2006年2月頒布,目前GB/T 20090系列國家標準已頒布9項。針對廣電應(yīng)用制訂的行業(yè)標準《廣播電視先進音視頻編解碼 第1部分:視頻》于2012年7月獲批為行業(yè)標準,行標號為GY/T 257.1----2012,簡稱AVS+。
第二代AVS標準包括系列國家標準《信息技術(shù) 高效多媒體編碼》(簡稱AVS2),AVS2主要面向超高清電視節(jié)目的傳輸,定位在引領(lǐng)未來五到十年數(shù)字媒體產(chǎn)業(yè)的發(fā)展,并爭取為相關(guān)國際標準的制定發(fā)揮關(guān)鍵作用。在第一代AVS推廣應(yīng)用的同時,AVS技術(shù)的持續(xù)演進工作在積極推進,第二代標準AVS2技術(shù)已開發(fā)完成,2016年5月,廣電總局頒布AVS2視頻為行業(yè)標準,2016年12月30日,頒布為國家標準。
經(jīng)國家新聞出版廣電總局、工業(yè)和信息化部測試機構(gòu)測試,第一代AVS的壓縮效率與同期國際標準MPEG-4 AVC/H.264相當,比原視頻編碼國家標準GB/T 17975.2-2000(等同采用ISO/IEC 13818.2-1994,即MPEG-2)提高一倍以上。因而能夠成倍節(jié)省頻譜和帶寬,經(jīng)濟效益突出。根據(jù)國家新聞出版廣電總局廣播電視規(guī)劃院進行的嚴格測試,第二代AVS2編碼效率比第一代標準提高了一倍以上,壓縮效率超越最新國際標準HEVC(H.265),相對于第一代AVS標準,第二代AVS標準可節(jié)省一半的傳輸帶寬,將支撐未來幾年超高清電視在我國的推廣應(yīng)用。
目前,AVS標準除在廣電領(lǐng)域廣泛使用,已進入互聯(lián)網(wǎng)領(lǐng)域,下一步AVS2會進入監(jiān)控應(yīng)用。
2016年初,AVS已啟動VR國際標準和國家標準的制定,AVS VR國際標準已完成立項。2017年1月開始,AVS工作組已啟動《信息技術(shù) 虛擬現(xiàn)實內(nèi)容高效編碼》(簡稱AVS VR標準)系列標準的國家立項申請工作。
2018年初,第二代AVS系統(tǒng)部分《信息技術(shù) 高效多媒體編碼 第1部分:系統(tǒng)》和音頻部分《信息技術(shù) 高效多媒體編碼 第3部分:音頻》進入國標委審批,等待頒布。
2018年6月7日,我國第二代數(shù)字音頻編碼標準《信息技術(shù) 高效多媒體編碼 第3部分:音頻》(簡稱AVS2音頻標準)由國家市場監(jiān)督管理總局和國家標準化管理委員會頒布為國家標準,標準代號GB/T 33475.3-2018,將于2019年1月1日正式實施。AVS2音頻標準立足提供完整的高清三維視聽技術(shù)方案,與第二代AVS視頻編碼(AVS2視頻)配套,是更適合超高清、3D等新一代視聽系統(tǒng)需要的高質(zhì)量、高效率音頻編解碼標準。將應(yīng)用于全景聲電影、超高清電視、互聯(lián)網(wǎng)寬帶音視頻業(yè)務(wù)、數(shù)字音視頻廣播無線寬帶多媒體通信、虛擬現(xiàn)實和增強現(xiàn)實及視頻監(jiān)控等領(lǐng)域。
AVS產(chǎn)業(yè)化的主要產(chǎn)品形態(tài)包括:
(1). 芯片:高清晰度/標準清晰度AVS解碼芯片和編碼芯片。
(2). 軟件:AVS節(jié)目制作與管理系統(tǒng),Linux和Window平臺上基于AVS標準的流媒體播出、點播、回放軟件。
(3). 整機:AVS機頂盒、AVS硬盤播出服務(wù)器、AVS編碼器、AVS高清晰度激光視盤機、AVS高清晰度數(shù)字電視機頂盒和接收機、AVS手機、AVS便攜式數(shù)碼產(chǎn)品等。
MPEG是ISO/IEC JTC1 1988年成立的運動圖像專家組(Moving Picture Expert Group)的簡稱,負責(zé)數(shù)字視頻、音頻和其它媒體的壓縮、解壓縮、處理和表示等國際技術(shù)標準的制定工作。
MPEG-1制定于1992年,它是將視頻數(shù)據(jù)壓縮成1~2Mb/s的標準數(shù)據(jù)流。它主要用于家用VCD,它需要的存儲空間比較大。
MPEG-2制定于1994年,是為高級工業(yè)標準的圖像質(zhì)量以及更高的傳輸率而設(shè)計,它是高質(zhì)量視頻音頻編碼標準。在常規(guī)電視的數(shù)字化、高清晰電視HDTV、視頻點播VOD,交互式電視等各個領(lǐng)域中都是核心的技術(shù)之一。
MPEG-4于1998年11月公布,主要應(yīng)用于視像電話(Video Phone),視像電子郵件(Video Email)和電子新聞(Electronic News)等,其傳輸速率要求較低。它與MPEG-2相比,可節(jié)省90%的儲存空間。MPEG-4標準是面向?qū)ο蟮膲嚎s方式,不是像MPEG-1和MPEG-2簡單地將圖像分為一些像塊,而是根據(jù)圖像內(nèi)容,將其中的對象(物體、人物、背景)分離出來分別進行幀內(nèi)、幀間編碼壓縮,并允許在不同的對象之間靈活分配碼率,對重要的對象分配較多的字節(jié),對次要的對象分配較少的字節(jié),從而大大提高了壓縮比,使其在較低的碼率下獲得較好的效果。
MPEG-7是針對存儲形式(在線、脫機)或流形式(如 Internet上的廣播、推送模型)的應(yīng)用而制定的,并且可以在實時和非實時環(huán)境中操作。它是為互聯(lián)網(wǎng)視頻檢索制定的壓縮標準。MPEG-7標準的正式名稱為”多媒體內(nèi)容描述接口”(Multimedia Content Description Interface), 其目標就是產(chǎn)生一種描述多媒體內(nèi)容數(shù)據(jù)的標準,滿足實時、非實時以及推-拉應(yīng)用的需求,它既不同于基于波形和基于壓縮的表示方式如MPEG-1和MPEG -2,又不同于基于對象的表示方式如MPEG-4,而是將對各種不同類型的多媒體信息進行標準化描述,并將該描述與所描述的內(nèi)容相聯(lián)系,以實現(xiàn)快速有效的搜索。
MPEG-21 Multimedia Framework是致力于在大范圍的網(wǎng)絡(luò)上實現(xiàn)透明的傳輸和對多媒體資源的充分利用。MPEG-21致力于為多媒體傳輸和使用定義一個標準化的開放框架。
WMV(WINDOWS MEDIA VIDEO):是微軟推出的一種流媒體格式,WMV格式的體積非常小,適合在網(wǎng)上播放和傳輸。但由于非開放性標準,時延非常大。
H.261:于1990年完成,實際的編碼算法類似于MPEG算法,但不能與后者兼容。用于電視會議、可視電話。
H.263:于1996年完成,與H.261相比采用了半象素的運動補償,并增加了4種有效的壓縮編碼模式。但是其限制了應(yīng)用的圖像輸入格式,僅允許5種視頻源格式。
H.263+:允許更大范圍的圖像輸入格式,自定義圖像的尺寸,從而拓寬了標準使用的范圍,使之可以處理基于視窗的計算機圖像、更高幀頻的圖像序列及寬屏圖像。
H.263++:在H263+基礎(chǔ)上增加了3個選項,主要是為了增強碼流在惡劣信道上的抗誤碼性能,同時為了提高增強編碼效率。
H.264/MPEG-4 AVC:壓縮能力比H.263更強。高壓縮比、高圖像質(zhì)量、良好的網(wǎng)絡(luò)適應(yīng)性,在較低帶寬上提供高質(zhì)量的圖像傳輸。是為新一代交互視頻通訊制定的標準。該標準也被稱為AVC(Advanced Video Coding)標準,是MPEG-4的第10部分。
H.265:是繼H.264之后所制定的新的視頻編碼標準。H.265標準圍繞著現(xiàn)有的視頻編碼標準H.264,保留原來的某些技術(shù),同時對一些相關(guān)的技術(shù)加以改進。新技術(shù)使用先進的技術(shù)用以改善碼流、編碼質(zhì)量、延時和算法復(fù)雜度之間的關(guān)系,達到最優(yōu)化設(shè)置。H.265旨在在有限帶寬下傳輸更高質(zhì)量的網(wǎng)絡(luò)視頻,僅需原先的一半帶寬即可播放相同質(zhì)量的視頻。這也意味著,我們的智能手機、平板機等移動設(shè)備將能夠直接在線播放1080p的全高清視頻。H.265標準也同時支持4K(4096×2160)和8K(8192×4320)超高清視頻。
IPB幀:視頻中每幀代表一幅靜止的圖像,而在實際壓縮時,會采取各種算法減少數(shù)據(jù)的容量,其中IPB就是最常見的。
I幀是關(guān)鍵幀,屬于幀內(nèi)壓縮(P、B為幀間)。盡可能去除圖像空間冗余信息來壓縮傳輸數(shù)據(jù)量的幀內(nèi)編碼圖像。I幀法是基于離散余弦變換DCT(Discrete Cosine Transform)的壓縮技術(shù),這種算法與JPEG壓縮算法類似。采用I幀壓縮可達到1/6的壓縮比而無明顯的壓縮痕跡。解碼時僅用I幀的數(shù)據(jù)就可重構(gòu)完整圖像。
P幀也叫預(yù)測幀,表示的是這一幀跟之前的一個關(guān)鍵幀(或P幀)的差別,解碼時需要用之前緩存的畫面疊加上本幀定義的差別,生成最終畫面。也就是差別幀,P幀沒有完整畫面數(shù)據(jù),只有與前一幀的畫面差別的數(shù)據(jù)。
B幀也叫雙向預(yù)測幀。既考慮與源圖像序列前面已編碼幀,也顧及源圖像序列后面已編碼幀之間的時間冗余信息來壓縮傳輸數(shù)據(jù)量的編碼圖像。B幀不是參考幀,不會造成解碼錯誤的擴散。
一般地,I幀壓縮效率最低,P幀較高,B幀最高。I、B、P各幀是根據(jù)壓縮算法的需要,是人為定義的,它們都是實實在在的物理幀,至于圖像中的哪一幀是I幀,是隨機的,一旦確定確定了I幀,以后的各幀就嚴格按規(guī)定順序排列。
視頻文件封裝(容器):封裝格式就是將已經(jīng)編碼壓縮好的視頻軌和音頻軌按照一定的格式放到一個文件中,這個文件也就相當于一個容器。采用不同的方式把視頻編碼和音頻編碼打包成一個完整的多媒體文件,也就出現(xiàn)了不同的后綴,常見的封裝格式:
(1). AVI:微軟在90年代初創(chuàng)立的封裝標準,其含義是Audio Video Interactive,就是把視頻和音頻編碼混合在一起儲存。
(2). mov:QuickTime Movie是由蘋果公司開發(fā)的容器。
(3). WMV:是微軟公司開發(fā)的一組數(shù)位視頻編解碼格式的通稱。
(4). mkv: Matroska的簡稱,萬能封裝器,有良好的兼容和跨平臺性、糾錯性,可帶外掛字幕。
(5). flv: 這種封裝方式可以很好的保護原始地址,一些視頻分享網(wǎng)站采用這種封裝方式。
(6). rmvb/rm:Real Video,由RealNetworks開發(fā)的應(yīng)用于rmvb和rm的不同封裝方式。rm是固定碼率,rmvb是動態(tài)碼率(就是靜態(tài)畫面采用用低碼率,動態(tài)采用高碼率)。
(7). MP4:主要應(yīng)用于mpeg4的封裝。
(8). 3GP:主要應(yīng)用于H.263的封裝。
由于不同的播放器支持不同的視頻文件格式,或者計算機中缺少相應(yīng)格式的解碼器,或者一些外部播放裝置(比如手機、MP4等)只能播放固定的格式,因此就會出現(xiàn)視頻無法播放的現(xiàn)象。在這種情況下就要使用格式轉(zhuǎn)換器軟件來彌補這一缺陷。
注:以上全部內(nèi)容均來自網(wǎng)絡(luò),主要參考:
1. http://www.avs.org.cn/
2. https://blog.csdn.net/leixiaohua1020/article/details/12031631
本文轉(zhuǎn)自:https://blog.csdn.net/fengbingchun/article/details/89764388
轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。
審核編輯:何安
-
視頻編解碼
+關(guān)注
關(guān)注
2文章
54瀏覽量
11754
發(fā)布評論請先 登錄
相關(guān)推薦
評論