H.264(MPEG)-4AVC
版權(quán)聲明:本文為博主原創(chuàng)文章,遵循 CC 4.0 BY-SA 版權(quán)協(xié)議,轉(zhuǎn)載請(qǐng)附上原文出處鏈接和本聲明。
本文鏈接:https://blog.csdn.net/Tosonw/article/details/89251677
H.264或MPEG-4第10部分,高級(jí)視頻編碼(MPEG-4 AVC)是一種基于塊的運(yùn)動(dòng)補(bǔ)償視頻壓縮標(biāo)準(zhǔn)。截至2014年,它是錄制,壓縮和分發(fā)視頻內(nèi)容最常用的格式之一。1它支持分辨率高達(dá)8192×4320,包括8K UHD。2
H.264 / AVC項(xiàng)目的目的是創(chuàng)建一種標(biāo)準(zhǔn),能夠以比以前標(biāo)準(zhǔn)低得多的比特率提供良好的視頻質(zhì)量(即,MPEG-2,H.263或MPEG-的比特率的一半或更低)。 4第2部分),沒有增加設(shè)計(jì)的復(fù)雜性,以至于實(shí)施起來(lái)不切實(shí)際或過(guò)于昂貴。另一個(gè)目標(biāo)是提供足夠的靈活性,使標(biāo)準(zhǔn)能夠應(yīng)用于各種網(wǎng)絡(luò)和系統(tǒng)上的各種應(yīng)用,包括低和高比特率,低分辨率和高分辨率視頻,廣播,DVD存儲(chǔ),RTP / IP分組網(wǎng)絡(luò)和ITU-T多媒體電話系統(tǒng)。 H.264標(biāo)準(zhǔn)可以被視為由許多不同的配置文件組成的“標(biāo)準(zhǔn)族”。特定解碼器解碼至少一個(gè)但不一定是所有簡(jiǎn)檔。解碼器規(guī)范描述了可以解碼哪些配置文件。 H.264通常用于有損壓縮,盡管也可以在有損編碼圖像中創(chuàng)建真正的無(wú)損編碼區(qū)域,或者支持整個(gè)編碼無(wú)損的罕見用例。
H.264由ITU-T視頻編碼專家組(VCEG)與ISO / IEC JTC1運(yùn)動(dòng)圖像專家組(MPEG)一起開發(fā)。項(xiàng)目合作伙伴關(guān)系被稱為聯(lián)合視頻小組(JVT)。 ITU-T H.264標(biāo)準(zhǔn)和ISO / IEC MPEG-4 AVC標(biāo)準(zhǔn)(正式地,ISO / IEC 14496-10-MPEG-4 Part 10,高級(jí)視頻編碼)被共同維護(hù),使得它們具有相同的技術(shù)內(nèi)容。關(guān)于第一版標(biāo)準(zhǔn)的最終起草工作于2003年5月完成,其后續(xù)版本中增加了其功能的各種擴(kuò)展。高效視頻編碼(HEVC),即H.265和MPEG-H第2部分是由相同組織開發(fā)的H.264 / MPEG-4 AVC的后繼者,而早期標(biāo)準(zhǔn)仍然普遍使用。
最著名的H.264可能是藍(lán)光光盤的視頻編碼標(biāo)準(zhǔn)之一;所有藍(lán)光光盤播放器必須能夠解碼H.264。它也被流媒體互聯(lián)網(wǎng)資源廣泛使用,例如來(lái)自Vimeo,YouTube和iTunes Store的視頻,諸如Adobe Flash Player和Microsoft Silverlight等網(wǎng)絡(luò)軟件,以及地面上的各種HDTV廣播(ATSC,ISDB-T,DVB) -T或DVB-T2),電纜(DVB-C)和衛(wèi)星(DVB-S和DVB-S2)。
H.264受各方擁有的專利保護(hù)。涵蓋H.264所必需的大多數(shù)(但不是全部)專利的許可由專利池MPEG LA管理。3專利H.264技術(shù)的商業(yè)使用需要向MPEG LA和其他專利所有者支付版稅。 MPEG LA允許免費(fèi)使用H.264技術(shù)為最終用戶免費(fèi)提供流媒體互聯(lián)網(wǎng)視頻,思科系統(tǒng)公司代表其開源H.264編碼器二進(jìn)制文件用戶向MPEG LA支付版稅。
命名
H.264名稱遵循ITU-T命名慣例,其中該標(biāo)準(zhǔn)是H.26x系列VCEG視頻編碼標(biāo)準(zhǔn)的成員; MPEG-4 AVC名稱與ISO / IEC MPEG中的命名約定有關(guān),其中該標(biāo)準(zhǔn)是ISO / IEC 14496的第10部分,ISO / IEC 14496是稱為MPEG-4的標(biāo)準(zhǔn)套件。該標(biāo)準(zhǔn)是在VCEG和MPEG的合作伙伴關(guān)系中共同開發(fā)的,之前在ITU-T開展了一項(xiàng)名為H.26L的VCEG項(xiàng)目。因此,通常使用諸如H.264 / AVC,AVC / H.264,H.264 / MPEG-4AVC或MPEG-4 / H.264 AVC之類的名稱來(lái)引用該標(biāo)準(zhǔn)以強(qiáng)調(diào)共同遺產(chǎn)。有時(shí),它也被稱為“JVT編解碼器”,參考開發(fā)它的聯(lián)合視頻組(JVT)組織。 (這種伙伴關(guān)系和多種命名并不罕見。例如,稱為MPEG-2的視頻壓縮標(biāo)準(zhǔn)也源于MPEG和ITU-T之間的伙伴關(guān)系,其中MPEG-2視頻被ITU-T社區(qū)稱為H .262。4)某些軟件程序(如VLC媒體播放器)在內(nèi)部將此標(biāo)準(zhǔn)標(biāo)識(shí)為AVC1。
歷史
1998年初,視頻編碼專家組(VCEG-ITU-T SG16 Q.6)發(fā)出了關(guān)于一個(gè)名為H.26L的項(xiàng)目的提案征集,其目標(biāo)是將編碼效率提高一倍(這意味著將所需的比特率減半)與用于各種應(yīng)用的任何其他現(xiàn)有視頻編碼標(biāo)準(zhǔn)相比,給定的保真度水平。 VCEG由Gary Sullivan(微軟,前身為美國(guó)PictureTel)擔(dān)任主席。該新標(biāo)準(zhǔn)的初稿設(shè)計(jì)于1999年8月通過(guò)。2000年,Thomas Wiegand(德國(guó)海因里希赫茲研究所)成為VCEG聯(lián)合主席。
2001年12月,VCEG和運(yùn)動(dòng)圖像專家組(MPEG-ISO / IEC JTC 1 / SC 29 / WG 11)組成了一個(gè)聯(lián)合視頻組(JVT),其章程最終確定了視頻編碼標(biāo)準(zhǔn)。[5]該規(guī)范于2003年3月獲得正式批準(zhǔn).JVT由Gary Sullivan,Thomas Wiegand和Ajay Luthra(摩托羅拉,美國(guó):后來(lái)的Arris,美國(guó))擔(dān)任主席。 2004年6月,F(xiàn)idelity范圍擴(kuò)展(FRExt)項(xiàng)目最終確定。從2005年1月到2007年11月,JVT正致力于通過(guò)名為可伸縮視頻編碼(SVC)的附件(G)將H.264 / AVC擴(kuò)展到可擴(kuò)展性。 JVT管理團(tuán)隊(duì)由Jens-Rainer Ohm(德國(guó)亞琛大學(xué))擴(kuò)展。從2006年7月到2009年11月,JVT開展了多視頻視頻編碼(MVC),這是H.264 / AVC向免費(fèi)視點(diǎn)電視和3D電視的擴(kuò)展。這項(xiàng)工作包括開發(fā)兩個(gè)新的標(biāo)準(zhǔn)配置文件:Multiview High Profile和Stereo High Profile。
第一版H.264 / AVC的標(biāo)準(zhǔn)化于2003年5月完成。在第一個(gè)擴(kuò)展原始標(biāo)準(zhǔn)的項(xiàng)目中,JVT隨后開發(fā)了所謂的Fidelity Range Extensions(FRExt)。這些擴(kuò)展通過(guò)支持更高的采樣位深度精度和更高分辨率的顏色信息實(shí)現(xiàn)了更高質(zhì)量的視頻編碼,包括稱為Y’CbCr 4:2:2(= YUV 4:2:2)和Y’CbCr 4:4的采樣結(jié)構(gòu):4。 Fidelity Range Extensions項(xiàng)目中還包括其他一些功能,例如4×4和8×8整數(shù)變換之間的自適應(yīng)切換,編碼器指定的基于感知的量化加權(quán)矩陣,高效的圖片間無(wú)損編碼以及支持附加顏色空間。 Fidelity Range Extensions的設(shè)計(jì)工作于2004年7月完成,其起草工作于2004年9月完成。
最近該標(biāo)準(zhǔn)的進(jìn)一步擴(kuò)展包括添加五個(gè)其他新的配置文件[哪些?]主要用于專業(yè)應(yīng)用,增加擴(kuò)展色域空間支持,定義額外的寬高比指標(biāo),定義另外兩種類型的“補(bǔ)充增強(qiáng)信息”(后過(guò)濾提示和色調(diào)映射),并棄用之前的FRExt配置文件之一(高4:4:4配置文件),行業(yè)反饋[由誰(shuí)?]指示應(yīng)該設(shè)計(jì)不同。
標(biāo)準(zhǔn)中增加的下一個(gè)主要功能是可伸縮視頻編碼(SVC)。在H.264 / AVC的附件G中規(guī)定,SVC允許構(gòu)建包含也符合標(biāo)準(zhǔn)的子比特流的比特流,包括稱為“基本層”的一個(gè)這樣的比特流,其可以由H.264 /解碼不支持SVC的AVC編解碼器。對(duì)于時(shí)間比特流可縮放性(即,存在具有比主比特流更小的時(shí)間采樣率的子比特流),在導(dǎo)出子比特流時(shí)從比特流中移除完整的存取單元。在這種情況下,相應(yīng)地構(gòu)造比特流中的高級(jí)語(yǔ)法和幀間預(yù)測(cè)參考圖片。另一方面,對(duì)于空間和質(zhì)量比特流可伸縮性(即,存在具有比主比特流更低的空間分辨率/質(zhì)量的子比特流),在導(dǎo)出子比特流時(shí)從比特流中去除NAL(網(wǎng)絡(luò)抽象層)。 。在這種情況下,層間預(yù)測(cè)(即,從較低空間分辨率/質(zhì)量信號(hào)的數(shù)據(jù)預(yù)測(cè)較高空間分辨率/質(zhì)量信號(hào))通常用于有效編碼??蓴U(kuò)展視頻編碼擴(kuò)展于2007年11月完成。
標(biāo)準(zhǔn)中添加的下一個(gè)主要功能是多視圖視頻編碼(MVC)。在H.264 / AVC的附錄H中規(guī)定,MVC使得能夠構(gòu)造表示視頻場(chǎng)景的多于一個(gè)視圖的比特流。該功能的一個(gè)重要示例是立體3D視頻編碼。在MVC工作中開發(fā)了兩個(gè)配置文件:Multiview High Profile支持任意數(shù)量的視圖,Stereo High Profile專為兩視圖立體視頻而設(shè)計(jì)。 Multiview視頻編碼擴(kuò)展于2009年11月完成。
應(yīng)用
更多信息:使用H.264 / MPEG-4 AVC的視頻服務(wù)列表:https://en.wikipedia.org/wiki/List_of_video_services_using_H.264/MPEG-4_AVC
H.264視頻格式具有非常廣泛的應(yīng)用范圍,涵蓋從低比特率互聯(lián)網(wǎng)流媒體應(yīng)用到HDTV廣播和幾乎無(wú)損編碼的數(shù)字電影應(yīng)用的所有形式的數(shù)字壓縮視頻。通過(guò)使用H.264,與MPEG-2 Part 2相比,可以節(jié)省50%或更多的比特率。例如,據(jù)報(bào)道,H.264提供的數(shù)字衛(wèi)星電視質(zhì)量與目前的MPEG-2實(shí)現(xiàn)相同,比特率不到一半,目前的MPEG-2實(shí)現(xiàn)速率約為3.5 Mbit / s,H.264僅為1.5 Mbit / s的。[23]索尼聲稱9 Mbit / s AVC錄制模式相當(dāng)于HDV格式的圖像質(zhì)量,其使用大約18-25 Mbit / s。[24]
為了確保H.264 / AVC的兼容性和無(wú)故障采用,許多標(biāo)準(zhǔn)組織已經(jīng)修改或添加到其視頻相關(guān)標(biāo)準(zhǔn)中,以便這些標(biāo)準(zhǔn)的用戶可以使用H.264 / AVC。藍(lán)光光盤格式和現(xiàn)已停產(chǎn)的HD DVD格式都將H.264 / AVC High Profile作為三種強(qiáng)制視頻壓縮格式之一。數(shù)字視頻廣播項(xiàng)目(DVB)于2004年底批準(zhǔn)將H.264 / AVC用于廣播電視。
美國(guó)的高級(jí)電視系統(tǒng)委員會(huì)(ATSC)標(biāo)準(zhǔn)機(jī)構(gòu)于2008年7月批準(zhǔn)了H.264 / AVC用于廣播電視,盡管該標(biāo)準(zhǔn)尚未用于美國(guó)境內(nèi)的固定ATSC廣播。[25] [ 26]它還被批準(zhǔn)用于最新的ATSC-M / H(移動(dòng)/手持)標(biāo)準(zhǔn),使用H.264的AVC和SVC部分。[27]
CCTV(閉路電視)和視頻監(jiān)控市場(chǎng)已將該技術(shù)納入許多產(chǎn)品中。
許多常見的數(shù)碼單反相機(jī)使用包含在QuickTime MOV容器中的H.264視頻作為本機(jī)記錄格式。
派生格式
AVCHD是由Sony和Panasonic設(shè)計(jì)的高清錄制格式,使用H.264(符合H.264,同時(shí)添加其他特定于應(yīng)用程序的功能和約束)。
AVC-Intra是由Panasonic開發(fā)的僅幀內(nèi)壓縮格式。
XAVC是Sony設(shè)計(jì)的錄制格式,使用H.264 / MPEG-4 AVC的5.2級(jí),這是該視頻標(biāo)準(zhǔn)支持的最高級(jí)別。[28] [29] XAVC可支持4K分辨率(4096×2160和3840×2160),速度高達(dá)每秒60幀(fps)。[28] [29]索尼宣布支持XAVC的相機(jī)包括兩款CineAlta相機(jī) - 索尼PMW-F55和索尼PMW-F5。[30]索尼PMW-F55可記錄XAVC,4K分辨率為30 fps,速度為300 Mbit / s,2K分辨率,30 fps,100 Mbit / s。[31] XAVC可以以60 fps的速度記錄4K分辨率,并以600 Mbit / s的速度進(jìn)行4:2:2色度子采樣。[32] [33]
派生格式
AVCHD是由Sony和Panasonic設(shè)計(jì)的高清錄制格式,使用H.264(符合H.264,同時(shí)添加其他特定于應(yīng)用程序的功能和約束)。
AVC-Intra是由Panasonic開發(fā)的僅幀內(nèi)壓縮格式。
XAVC是Sony設(shè)計(jì)的錄制格式,使用H.264 / MPEG-4 AVC的5.2級(jí),這是該視頻標(biāo)準(zhǔn)支持的最高級(jí)別。[28] [29] XAVC可支持4K分辨率(4096×2160和3840×2160),速度高達(dá)每秒60幀(fps)。[28] [29] 索尼宣布支持XAVC的相機(jī)包括兩款CineAlta相機(jī) - 索尼PMW-F55和索尼PMW-F5。[30] 索尼PMW-F55可記錄XAVC,4K分辨率為30 fps,速度為300 Mbit / s,2K分辨率,30 fps,100 Mbit / s。[31] XAVC可以以60 fps的速度記錄4K分辨率,并以600 Mbit / s的速度進(jìn)行4:2:2色度子采樣。[32] [33]
設(shè)計(jì)
本文采用列表格式,可以使用散文更好地呈現(xiàn)。 如果合適,您可以將此文章轉(zhuǎn)換為散文。 編輯幫助可用。 (2016年4月)
特征
H.264的框圖
https://upload.wikimedia.org/wikipedia/commons/8/82/H.264_block_diagram_with_quality_score.jpg
H.264 / AVC / MPEG-4第10部分包含許多新功能,使其能夠比舊標(biāo)準(zhǔn)更有效地壓縮視頻,并為各種網(wǎng)絡(luò)環(huán)境的應(yīng)用提供更大的靈活性。 特別是,一些這樣的關(guān)鍵功能包括:
多畫面畫面間預(yù)測(cè)包括以下特征:
以比以前的標(biāo)準(zhǔn)更靈活的方式使用先前編碼的圖片作為參考,在一些情況下允許使用多達(dá)16個(gè)參考幀(或者在隔行編碼的情況下為32個(gè)參考字段)。在支持非IDR幀的配置文件中,大多數(shù)級(jí)別指定應(yīng)該有足夠的緩沖以允許在最大分辨率下至少4或5個(gè)參考幀。這與現(xiàn)有標(biāo)準(zhǔn)形成對(duì)比,現(xiàn)有標(biāo)準(zhǔn)的限制通常為1;或者,在傳統(tǒng)的“B圖像”(B幀)的情況下,兩個(gè)。這個(gè)特殊功能通常允許在大多數(shù)場(chǎng)景中適度改進(jìn)比特率和質(zhì)量。[引證需要]但在某些類型的場(chǎng)景中,例如具有重復(fù)動(dòng)作或來(lái)回切換場(chǎng)景或未覆蓋背景區(qū)域的場(chǎng)景,它允許顯著在保持清晰度的同時(shí)降低比特率。
可變塊大小運(yùn)動(dòng)補(bǔ)償(VBSMC),塊大小為16×16,小至4×4,可實(shí)現(xiàn)移動(dòng)區(qū)域的精確分割。支持的亮度預(yù)測(cè)塊大小包括16×16,16×8,8×16,8×8,8×4,4×8和4×4,其中許多可以在單個(gè)宏塊中一起使用。根據(jù)使用中的色度子采樣,色度預(yù)測(cè)塊大小相應(yīng)地更小。
在由16個(gè)4×4分區(qū)構(gòu)成的B宏塊的情況下,每個(gè)宏塊使用多個(gè)運(yùn)動(dòng)矢量(每個(gè)分區(qū)一個(gè)或兩個(gè))的能力最大為32。每個(gè)8×8或更大的分區(qū)區(qū)域的運(yùn)動(dòng)矢量可以指向不同的參考圖像。
能夠在B幀中使用任何宏塊類型,包括I-宏塊,從而在使用B幀時(shí)產(chǎn)生更有效的編碼。從MPEG-4 ASP中可以看出這一特性。
用于推導(dǎo)半像素亮度樣本預(yù)測(cè)的六抽頭濾波,用于更清晰的子像素運(yùn)動(dòng)補(bǔ)償。通過(guò)半色值的線性插值導(dǎo)出四分之一像素運(yùn)動(dòng),以節(jié)省處理能力。
用于運(yùn)動(dòng)補(bǔ)償?shù)乃姆种幌袼鼐?,可精確描述移動(dòng)區(qū)域的位移。對(duì)于色度,分辨率通常在垂直和水平方向上減半(見4:2:0),因此色度的運(yùn)動(dòng)補(bǔ)償使用八分之一色度像素網(wǎng)格單元。
加權(quán)預(yù)測(cè),允許編碼器在執(zhí)行運(yùn)動(dòng)補(bǔ)償時(shí)指定縮放和偏移的使用,并在特殊情況下提供性能的顯著優(yōu)勢(shì) - 例如淡入淡出,淡入淡入和淡入淡出過(guò)渡。這包括對(duì)B幀的隱式加權(quán)預(yù)測(cè),以及對(duì)P幀的顯式加權(quán)預(yù)測(cè)。
用于“幀內(nèi)”編碼的相鄰塊邊緣的空間預(yù)測(cè),而不是MPEG-2第2部分中發(fā)現(xiàn)的“DC”預(yù)測(cè)和H.263v2和MPEG-4第2部分中的變換系數(shù)預(yù)測(cè):
這包括亮度預(yù)測(cè)塊大小為16×16,8×8和4×4(其中每個(gè)宏塊中只能使用一種類型)。
無(wú)損宏塊編碼功能包括:
無(wú)損“PCM宏塊”表示模式,其中直接表示視頻數(shù)據(jù)樣本,[34]允許特定區(qū)域的完美表示,并允許對(duì)每個(gè)宏塊的編碼數(shù)據(jù)量進(jìn)行嚴(yán)格限制。
增強(qiáng)的無(wú)損宏塊表示模式允許特定區(qū)域的完美表示,同時(shí)通常使用比PCM模式少得多的比特。
靈活的隔行掃描視頻編碼功能,包括:
宏塊自適應(yīng)幀場(chǎng)(MBAFF)編碼,對(duì)編碼為幀的圖像使用宏塊對(duì)結(jié)構(gòu),允許場(chǎng)模式下的16×16宏塊(與MPEG-2相比,其中場(chǎng)圖模式處理在圖像中被編碼為幀導(dǎo)致處理16×8半宏塊)。
圖像自適應(yīng)幀場(chǎng)編碼(PAFF或PicAFF)允許自由選擇的圖像混合編碼為完整幀,其中兩個(gè)場(chǎng)被組合在一起用于編碼或作為單獨(dú)的單個(gè)場(chǎng)。
新的轉(zhuǎn)換設(shè)計(jì)功能,包括:
精確匹配整數(shù)4×4空間塊變換,允許精確放置殘留信號(hào),幾乎沒有先前編解碼器設(shè)計(jì)中常見的“振鈴”。這種設(shè)計(jì)在概念上類似于眾所周知的離散余弦變換(DCT),由N. Ahmed,T.Natarajan和K.R.Rao于1974年引入,它是離散余弦變換中的引用1。但是,它被簡(jiǎn)化并提供精確指定的解碼。
精確匹配整數(shù)8×8空間塊變換,允許比4×4變換更高效地壓縮高度相關(guān)的區(qū)域。該設(shè)計(jì)在概念上類似于眾所周知的DCT,但是被簡(jiǎn)化并且被提供以提供精確指定的解碼。
用于整數(shù)變換操作的4×4和8×8變換塊大小之間的自適應(yīng)編碼器選擇。
對(duì)應(yīng)用于色度DC系數(shù)(以及在一種特殊情況下也是亮度)的主空間變換的“DC”系數(shù)執(zhí)行二次Hadamard變換,以在平滑區(qū)域中獲得甚至更多的壓縮。
量化設(shè)計(jì)包括:
對(duì)數(shù)步長(zhǎng)控制,通過(guò)編碼器更簡(jiǎn)單的比特率管理和簡(jiǎn)化的逆量化縮放
由編碼器選擇的頻率定制的量化縮放矩陣用于基于感知的量化優(yōu)化
環(huán)路去塊濾波器,有助于防止其他基于DCT的圖像壓縮技術(shù)常見的塊效應(yīng),從而獲得更好的視覺外觀和壓縮效率
熵編碼設(shè)計(jì)包括:
上下文自適應(yīng)二進(jìn)制算術(shù)編碼(CABAC),一種在給定上下文中知道語(yǔ)法元素的概率的無(wú)損壓縮視頻流中的語(yǔ)法元素的算法。 CABAC比CAVLC更有效地壓縮數(shù)據(jù),但需要更多的處理才能解碼。
上下文自適應(yīng)可變長(zhǎng)度編碼(CAVLC),其是用于編碼量化變換系數(shù)值的CABAC的較低復(fù)雜度的替代。雖然復(fù)雜性低于CABAC,但CAVLC比通常用于編碼其他現(xiàn)有設(shè)計(jì)中的系數(shù)的方法更精細(xì)且更有效。
用于許多未由CABAC或CAVLC編碼的語(yǔ)法元素的常見簡(jiǎn)單且高度結(jié)構(gòu)化的可變長(zhǎng)度編碼(VLC)技術(shù),稱為指數(shù)哥倫布編碼(或Exp-Golomb)。
損失恢復(fù)功能包括:
網(wǎng)絡(luò)抽象層(NAL)定義允許在許多網(wǎng)絡(luò)環(huán)境中使用相同的視頻語(yǔ)法。 H.264的一個(gè)非常基本的設(shè)計(jì)概念是生成自包含數(shù)據(jù)包,以刪除標(biāo)題重復(fù),如MPEG-4的標(biāo)頭擴(kuò)展代碼(HEC)。[35]這是通過(guò)從媒體流中解耦與多個(gè)切片相關(guān)的信息來(lái)實(shí)現(xiàn)的。高級(jí)參數(shù)的組合稱為參數(shù)集。[35] H.264規(guī)范包括兩種類型的參數(shù)集:序列參數(shù)集(SPS)和圖片參數(shù)集(PPS)。有效序列參數(shù)集在整個(gè)編碼視頻序列中保持不變,并且有效圖像參數(shù)集在編碼圖像內(nèi)保持不變。序列和圖像參數(shù)集結(jié)構(gòu)包含諸如圖像大小,采用的可選編碼模式和宏塊到切片組映射之類的信息。[35]
靈活宏塊排序(FMO),也稱為切片組,以及任意切片排序(ASO),其是用于重構(gòu)圖片中的基本區(qū)域(宏塊)的表示的排序的技術(shù)。通常被認(rèn)為是錯(cuò)誤/丟失穩(wěn)健性功能,F(xiàn)MO和ASO也可用于其他目的。
數(shù)據(jù)分區(qū)(DP),一種能夠?qū)⒏匾筒惶匾恼Z(yǔ)法元素分成不同數(shù)據(jù)包的功能,可以應(yīng)用不等錯(cuò)誤保護(hù)(UEP)和其他類型的錯(cuò)誤/丟失魯棒性改進(jìn)。
冗余切片(RS),一種錯(cuò)誤/丟失魯棒性特征,它允許編碼器發(fā)送圖像區(qū)域的額外表示(通常以較低保真度),如果主表示被破壞或丟失,則可以使用該表示。
幀編號(hào),允許創(chuàng)建“子序列”的功能,通過(guò)在其他圖片之間可選地包含額外圖片來(lái)實(shí)現(xiàn)時(shí)間可伸縮性,以及檢測(cè)和隱藏整個(gè)圖片的丟失,這可能由于網(wǎng)絡(luò)數(shù)據(jù)包丟失或信道而發(fā)生錯(cuò)誤。
切換片,稱為SP和SI片,允許編碼器指示解碼器跳轉(zhuǎn)到正在進(jìn)行的視頻流,用于諸如視頻流比特率切換和“特技模式”操作之類的目的。當(dāng)解碼器使用SP / SI功能跳轉(zhuǎn)到視頻流的中間時(shí),它可以獲得與視頻流中該位置處的解碼圖像的精確匹配,盡管使用不同的圖片或根本沒有圖片,作為之前的參考。開關(guān)。
一種簡(jiǎn)單的自動(dòng)過(guò)程,用于防止意外模擬起始碼,起始碼是編碼數(shù)據(jù)中的特殊比特序列,允許隨機(jī)訪問比特流并恢復(fù)可能丟失字節(jié)同步的系統(tǒng)中的字節(jié)對(duì)齊。
補(bǔ)充增強(qiáng)信息(SEI)和視頻可用性信息(VUI),它們是可以插入比特流的額外信息,以增強(qiáng)視頻用于各種目的。[需要澄清] SEI FPA(幀封裝安排)包含3D排列的消息:
0:?checkerboard:?pixels?are?alternatively?from?L?and?R. 1:?column?alternation:?L?and?R?are?interlaced?by?column. 2:?row?alternation:?L?and?R?are?interlaced?by?row. 3:?side?by?side:?L?is?on?the?left,?R?on?the?right. 4:?top?bottom:?L?is?on?top,?R?on?bottom. 5:?frame?alternation:?one?view?per?frame.123456
輔助圖片,可用于alpha合成等目的。
支持單色(4:0:0),4:2:0,4:2:2和4:4:4色度子采樣(取決于所選的配置文件)。
支持采樣位深度精度,范圍為每個(gè)采樣8到14位(取決于所選的配置文件)。
能夠?qū)⒏鱾€(gè)顏色平面編碼為具有自己的切片結(jié)構(gòu),宏塊模式,運(yùn)動(dòng)矢量等的不同圖像,從而允許使用簡(jiǎn)單的并行化結(jié)構(gòu)設(shè)計(jì)編碼器(僅支持三個(gè)支持4:4:4的配置文件) 。
圖像順序計(jì)數(shù),用于保持圖像的排序和與定時(shí)信息隔離的解碼圖像中的樣本值的特征,允許系統(tǒng)單獨(dú)地?cái)y帶和控制/改變定時(shí)信息,而不影響解碼圖像內(nèi)容。
這些技術(shù)以及其他幾種技術(shù)有助于H.264在各種應(yīng)用環(huán)境中在各種情況下比任何先前的標(biāo)準(zhǔn)表現(xiàn)得更好。 H.264通??梢员萂PEG-2視頻更好地執(zhí)行 - 通常在比特率的一半或更低的情況下獲得相同的質(zhì)量,特別是在高比特率和高分辨率情況下。[36]
與其他ISO / IEC MPEG視頻標(biāo)準(zhǔn)一樣,H.264 / AVC具有可以免費(fèi)下載的參考軟件實(shí)現(xiàn)。[37]其主要目的是提供H.264 / AVC功能的示例,而不是本身有用的應(yīng)用程序。運(yùn)動(dòng)圖像專家組也在進(jìn)行一些參考硬件設(shè)計(jì)工作。上述是H.264 / AVC的完整特征,涵蓋了H.264的所有配置文件。編解碼器的配置文件是該編解碼器的一組特征,其被識(shí)別以滿足預(yù)期應(yīng)用的某些規(guī)范集。這意味著某些配置文件不支持列出的許多功能。下一節(jié)將討論H.264 / AVC的各種配置文件。
Feature support in particular profiles
級(jí)別
當(dāng)該術(shù)語(yǔ)在標(biāo)準(zhǔn)中使用時(shí),“級(jí)別”是指定的一組約束,其指示簡(jiǎn)檔所需的解碼器性能的程度。 例如,配置文件內(nèi)的支持級(jí)別指定解碼器可以使用的最大圖像分辨率,幀速率和比特率。 符合給定級(jí)別的解碼器必須能夠解碼為該級(jí)別和所有較低級(jí)別編碼的所有比特流。
Levels with maximum property values[22]
High Profile的最大比特率是Constrained Baseline,Baseline,Extended和Main Profiles的1.25倍; Hi10P為3倍,Hi422P / Hi444PP為4倍。
亮度樣本的數(shù)量是宏塊數(shù)量的16×16 = 256倍(并且每秒亮度樣本的數(shù)量是每秒宏塊數(shù)量的256倍)。
解碼圖片緩沖
H.264 / AVC編碼器使用先前編碼的圖片來(lái)提供其他圖片中的樣本值的預(yù)測(cè)。這允許編碼器對(duì)編碼給定圖像的最佳方式做出有效決策。在解碼器處,這些圖片存儲(chǔ)在虛擬解碼圖片緩沖器(DPB)中。 DPB的最大容量,以幀(或字段對(duì))為單位,如上表右欄中的括號(hào)所示,可以按如下方式計(jì)算:
DpbCapacity = min(floor(MaxDpbMbs /(PicWidthInMbs * FrameHeightInMbs)),16)
其中MaxDpbMbs是下表中提供的常量值作為級(jí)別編號(hào)的函數(shù),而PicWidthInMbs和FrameHeightInMbs是編碼視頻數(shù)據(jù)的圖片寬度和幀高度,以宏塊為單位表示(四舍五入為整數(shù)值并計(jì)算裁剪)和宏塊配對(duì)(如適用))。該公式在2017年版標(biāo)準(zhǔn)的A.3.1.h和A.3.2.f節(jié)中規(guī)定。[22]
Hardware
另請(qǐng)參閱:具有板載視頻流編碼和H.264 / MPEG-4 AVC產(chǎn)品和實(shí)現(xiàn)的攝像機(jī)列表
由于H.264編碼和解碼在特定類型的算術(shù)運(yùn)算中需要大量計(jì)算能力,因此在通用CPU上運(yùn)行的軟件實(shí)現(xiàn)通常功耗較低。但是,最新的四核通用x86 CPU具有足夠的計(jì)算能力來(lái)執(zhí)行實(shí)時(shí)SD和HD編碼。壓縮效率取決于視頻算法實(shí)現(xiàn),而不取決于是否使用硬件或軟件實(shí)現(xiàn)。因此,基于硬件和軟件的實(shí)現(xiàn)之間的差異更多地取決于功率效率,靈活性和成本。為了提高功率效率并降低硬件形狀因數(shù),可以采用專用硬件,用于完整的編碼或解碼過(guò)程,或用于CPU控制環(huán)境內(nèi)的加速輔助。
已知基于CPU的解決方案更加靈活,特別是當(dāng)編碼必須以多種格式,多比特率和分辨率(多屏幕視頻)同時(shí)進(jìn)行時(shí),并且可能具有容器格式支持,高級(jí)集成廣告功能等的附加功能?;贑PU的軟件解決方案通??梢愿菀椎卦谕籆PU內(nèi)對(duì)多個(gè)并發(fā)編碼會(huì)話進(jìn)行負(fù)載均衡。
2011年1月CES(消費(fèi)電子展)上推出的第二代英特爾“Sandy Bridge”Core i3 / i5 / i7處理器提供片上硬件全高清H.264編碼器,稱為英特爾快速同步視頻。[54] [ 55]
具有H.264編碼器功能的ASIC編碼器可從許多不同的半導(dǎo)體公司獲得,但ASIC中使用的核心設(shè)計(jì)通常是從Chips&Media,Allegro DVT,On2(以前的Hantro,被Google收購(gòu))等少數(shù)公司中獲得許可, Imagination Technologies,NGCodec。一些公司同時(shí)擁有FPGA和ASIC產(chǎn)品。[56]
德州儀器(TI)生產(chǎn)一系列ARM + DSP內(nèi)核,以30fps的速度執(zhí)行1080p的DSP H.264 BP編碼。[57]這允許編解碼器(其被實(shí)現(xiàn)為高度優(yōu)化的DSP代碼)的靈活性,同時(shí)比通用CPU上的軟件更有效。
許可
另請(qǐng)參閱:Microsoft Corp.訴Motorola Inc.和Qualcomm Inc.訴Broadcom Corp.
在維護(hù)軟件算法專利的國(guó)家,使用H.264 / AVC的產(chǎn)品的供應(yīng)商和商業(yè)用戶預(yù)計(jì)將為其產(chǎn)品使用的專利技術(shù)支付專利許可使用費(fèi)。[58]這也適用于基線概況。[59]
一個(gè)名為MPEG LA的私人組織,與MPEG標(biāo)準(zhǔn)化組織無(wú)任何關(guān)聯(lián),管理適用于該標(biāo)準(zhǔn)的專利許可,以及MPEG-2第1部分系統(tǒng)的專利池,MPEG-2第2部分視頻,MPEG-4第2部分視頻,HEVC,MPEG-DASH和其他技術(shù)。美國(guó)的MPEG LA H.264專利至少持續(xù)到2027年。[60]
2010年8月26日,MPEG LA宣布,對(duì)終端用戶免費(fèi)的H.264編碼互聯(lián)網(wǎng)視頻將永遠(yuǎn)不會(huì)收取版稅。[61]所有其他特許權(quán)使用費(fèi)仍然存在,例如對(duì)H.264視頻進(jìn)行解碼和編碼的產(chǎn)品的版稅以及免費(fèi)電視和訂閱頻道的運(yùn)營(yíng)商。[62]許可條款以5年為塊更新。[63]
法律專利的實(shí)際狀態(tài)在2018年底到期,共有123頁(yè)。 [64]
2005年,美國(guó)專利5,452,104和美國(guó)專利5,576,767的受讓人高通公司在美國(guó)地方法院起訴Broadcom,聲稱Broadcom通過(guò)制造符合H.264視頻壓縮標(biāo)準(zhǔn)的產(chǎn)品侵犯了這兩項(xiàng)專利。[65] 2007年,地區(qū)法院認(rèn)定專利無(wú)法執(zhí)行,因?yàn)楦咄ü驹?003年5月發(fā)布H.264標(biāo)準(zhǔn)之前未能向JVT披露這些專利。[65] 2008年12月,美國(guó)聯(lián)邦巡回上訴法院確認(rèn)了地區(qū)法院關(guān)于專利無(wú)法執(zhí)行的命令,但向地區(qū)法院提出了指示,要求將不可執(zhí)行的范圍限制在符合H.264標(biāo)準(zhǔn)的產(chǎn)品范圍內(nèi)。[65]
External links
ITU-T?publication?page:?H.264:?Advanced?video?coding?for?generic?audiovisual?services MPEG-4?AVC/H.264?Information?Doom9's?Forum H.264/MPEG-4?Part?10?Tutorials?(Richardson) "Part?10:?Advanced?Video?Coding".?ISO?publication?page:?ISO/IEC?14496-10:2010?–?Information?technology?—?Coding?of?audio-visual?objects. "H.264/AVC?JM?Reference?Software".?IP?Homepage.?Retrieved?2007-04-15. "JVT?document?archive?site".?Retrieved?2007-05-06. "Publications".?Thomas?Wiegand.?Retrieved?2007-06-23. "Publications".?Detlev?Marpe.?Retrieved?2007-04-15. "Fourth?Annual?H.264?video?codecs?comparison".?Moscow?State?University.?(dated?December?2007) "Discussion?on?H.264?with?respect?to?IP?cameras?in?use?within?the?security?and?surveillance?industries".?(dated?April?2009) "Sixth?Annual?H.264?video?codecs?comparison".?Moscow?State?University.?(dated?May?2010)1234567891011
原文鏈接:https://en.wikipedia.org/wiki/H.264/MPEG-4_AVC
版權(quán)聲明:本文為博主原創(chuàng)文章,遵循 CC 4.0 BY-SA 版權(quán)協(xié)議,轉(zhuǎn)載請(qǐng)附上原文出處鏈接和本聲明。
本文鏈接:https://blog.csdn.net/Tosonw/article/details/89251677
評(píng)論
查看更多