文章轉(zhuǎn)發(fā)自51CTO【ELT.ZIP】OpenHarmony啃論文俱樂部——《這些小風(fēng)景你不應(yīng)該錯過》
1.圖像壓縮
在如今這個通信高度發(fā)展的時代,圖像壓縮已經(jīng)成為一個要求很高的領(lǐng)域。短視頻、音視頻通話、直播等等,相信這些都是大家每天能都能見到且離不開的東西。多媒體數(shù)據(jù),無論是圖形、音頻還是視頻數(shù)據(jù),解壓時都需要相當大的傳輸帶寬和存儲容量;且圖像、視頻序列和計算機動畫的需求以非常高的速度增長,因此有必要研究和分析圖像壓縮的技術(shù)來壓縮圖像和所有多媒體應(yīng)用程序,以節(jié)省存儲和傳輸時間。
1.1 圖像壓縮的歷史
圖像壓縮的研究起源于20世紀40年代。1948年香農(nóng)的經(jīng)典論文《通信的數(shù)學(xué)原理》中首次提到信息率失真函數(shù)的概念,1959年他又建立了率失真理論,從而奠定了信源編碼的理論基礎(chǔ)。隨后伯杰等人有對其進行了深入的研究,并取得了一定的進步,一些研究人員逐漸開始對聲音、文字和圖像信號的壓縮技術(shù)進行了研究。
80年代中后期,相關(guān)學(xué)科的迅速發(fā)展和新興學(xué)科的不斷涌現(xiàn)為圖像壓縮編碼注入量新的活力。人們對圖像信息需求的劇增也有利地促進了圖像壓縮技術(shù)的進步,許多學(xué)者結(jié)合模式識別、計算機圖形學(xué)、計算機視覺、神經(jīng)網(wǎng)絡(luò)、小波分析和分析幾何等理論,開始探索研究圖像壓縮的新理論和新方法。
1.2 如何壓縮
減少冗余和無關(guān)性一直是壓縮領(lǐng)域兩個重要和基本的部分,在圖像壓縮中也不例外。
其次圖像壓縮最終都是為人服務(wù)的,壓縮到什么程度并在這個程度將圖片壓縮到最優(yōu)的情況是很最重要的。就像很多人總想著買高刷屏打游戲,但是實際上,很多不是經(jīng)常打游戲的人是看不出來用不用高刷屏的區(qū)別的,而這就和我們的人眼視覺系統(tǒng)有關(guān)。
人眼視覺系統(tǒng)(HVS)是世界上最好的圖像處理系統(tǒng),但它遠遠不是完美的。人眼的視覺系統(tǒng)對圖像的認知是非均勻的和非線性的,并不是對圖像中的任何變化都能感知。例如圖像系數(shù)的量化誤差引起的圖像變化在一定范圍內(nèi)是不能為人眼所覺察的。因此,如果編碼方案能利用人眼視覺系統(tǒng)的一些特點,是可以得到高壓縮比的。
對人眼視覺特性的深入研究及由此而建立的各種數(shù)學(xué)模型,一直是各種圖像數(shù)字壓縮算法的基礎(chǔ)。
比如人眼的分辨率:當空間平面上兩個黑點相互靠攏到一定程度時,離開黑點一定距離的觀察者就無法區(qū)分它們,這意味著人眼分辨景物細節(jié)的能力是有限的,這個極限值就是分辨率。研究表明人眼的分辨率有如下一些特點:
-
當光照度太強、太弱或當背景亮度太強時,人眼分辨率降低
-
當視覺目標運動速度加快時,人眼分辨率降低
-
人眼對彩色細節(jié)的分辨率比對亮度細節(jié)的分辨率要差,若黑白分辨率為1,則黑紅為0.4,綠藍為0.19
1.3醫(yī)學(xué)圖像的壓縮
隨著現(xiàn)代醫(yī)療水平的不斷進步和經(jīng)濟實力的增強,更多的醫(yī)療成像設(shè)備投入臨床應(yīng)用,數(shù)字化的醫(yī)學(xué)圖像在醫(yī)學(xué)臨床診斷中發(fā)揮的作用越來越重要,對醫(yī)學(xué)圖像壓縮技術(shù)的研究顯得尤為迫切。
DICOM(Digital Imaging and Communications in Medicine) 即醫(yī)學(xué)數(shù)字成像和通信,是醫(yī)學(xué)圖像和相關(guān)信息的國際標準。它定義了質(zhì)量能滿足臨床需要的可用于數(shù)據(jù)交換的醫(yī)學(xué)圖像格式。
從商業(yè)上來說,DICOM 數(shù)據(jù)壓縮和圖像質(zhì)量是會極大地影響醫(yī)療機構(gòu)企業(yè)成像效率的兩個因素。DICOM 數(shù)據(jù)壓縮有助于有效管理醫(yī)療機構(gòu)的醫(yī)學(xué)圖像工作流程,是設(shè)計企業(yè)成像工作流程時要考慮的關(guān)鍵要素。由于數(shù)據(jù)壓縮和傳輸速度而導(dǎo)致的延遲造成的累計時間損失量會直接影響產(chǎn)生的收入水平。傳輸速度的提高會帶來更高的生產(chǎn)率,從而轉(zhuǎn)化為更多的收入。
但是從個人的生命安全上來說,DICOM 的數(shù)據(jù)壓縮和圖像質(zhì)量關(guān)乎很多人的性命。例如,假設(shè)帶寬在 12 Mbps 左右,則發(fā)送平均為 930.17 MB 的 1542 圖像 CT 研究需要 5 分鐘。未壓縮的研究需要 10 分鐘才能路由,而 JPEG 無損壓縮則需要 6 分鐘,假設(shè)壓縮是在從模態(tài)接收圖像時完成的,其開銷最小,這會導(dǎo)致位延遲(6 分鐘對比 5 分鐘)。在急診室設(shè)置中,周轉(zhuǎn)時間縮短 4 分鐘至關(guān)重要,甚至可以挽救生命。
上圖就是一個支持DICOM圖像壓縮的綜合急診室示例:A:滑動CT掃描儀、B:CT檢查床、C:可移動CT檢查懸臂、D:監(jiān)控屏幕、E:機械呼吸機
2.視頻壓縮
視頻編碼方式是指通過壓縮技術(shù),將原始視頻格式的文件轉(zhuǎn)換成另一種視頻格式文件的方式。視頻流傳輸中最為重要的編解碼標準有國際電聯(lián)的H.261、H.263、H.264。從 1967 年引入 H.120 作為第一個數(shù)字編碼標準的開始,數(shù)字視頻編碼已經(jīng)走了很長一段路。MPEG2 于 1994 年推出,MPEG4 于 1999 年推出,H.264 于 2003 年推出。本文接下來將列舉MPEG2、MPEG4和H.264的特點,并說明它們的區(qū)別。
2.1MPEG2
MPEG2 是用于壓縮數(shù)字廣播視頻和 DVD 的編解碼器。使用 MPEG-2 編解碼器編碼的媒體文件通常具有文件擴展名 .mpg、.mpeg、.m2v、.mp2,或在某些情況下為 .mp3。它也被稱為 H.262,并且仍在數(shù)字電視廣播和 DVD 視頻標準中使用。
MPEG2 于 1994 年創(chuàng)建,以修復(fù)其前身 MPEG1 的缺點,需要與現(xiàn)有硬件和軟件相互兼容。它主要由索尼、湯姆遜和三菱電機開發(fā),之后成為 DVD 和 SD 數(shù)字電視的標準視頻格式。
2.2MPEG4
MPEG4 標準是 1995 年發(fā)起的一種 MPEG4 格式。最初是專門為非常低的比特率而創(chuàng)建的,現(xiàn)在它可以支持高達 4Mbps。MPEG4 包含六個部分:視覺、軟件、系統(tǒng)、交付多媒體集成框架 (DMIF)、一致性測試和音頻。
該視頻編碼標準旨在用于廣播、對話和交互環(huán)境。它還旨在執(zhí)行基于內(nèi)容的可擴展性。由于 MPEG4 的構(gòu)建方式(采用了 MPEG1、MPEG2 和 VRML 的功能),可以在 Web 環(huán)境和電視中使用它,并且可以將來自兩個頻道的內(nèi)容集成到同一個多媒體環(huán)境中。
2.3H.264
H.264 視頻編碼格式,也稱為 H.264/MPEG-4 AVC(高級視頻編碼)是截至今最廣泛用于視頻內(nèi)容的錄制、壓縮和分發(fā)的格式。如果使用過 Netflix 和 YouTube 等互聯(lián)網(wǎng)流媒體資源以及 Adobe Flash Player 等網(wǎng)絡(luò)軟件,那么肯定已經(jīng)知道了 H.264 的作用。地面、有線和衛(wèi)xing上的各種 HDTV 廣播也使用 H.264 視頻編碼格式。
它由 ITU-T 視頻編碼專家組 (VCEG) 和 ISO/IEC JTC1 動態(tài)圖像專家組 (MPEG) 標準化。第一個版本于 2003 年完成。H.264 視頻格式旨在以低于之前的視頻編碼格式的比特率提供良好的視頻質(zhì)量,這樣做的目的是在不增加設(shè)計復(fù)雜性或?qū)崿F(xiàn)成本太高的情況下做到這一點。它還具有靈活性,因此可以應(yīng)用于各種網(wǎng)絡(luò)和系統(tǒng)。
2.4AVS
AVS(Audio Video coding Standard),即數(shù)字音視頻編解碼技術(shù)標準,是中國自主制定的音視頻標準。AVS2為中國第二代信源編碼標準。AVS3標準的制定工作已經(jīng)完成。現(xiàn)在很熱的HDR Vivid(菁彩HDR)(編者注:HDR是High-Dynamic Range 高動態(tài)范圍的英文縮寫)支持的就是AVS2/AVS3的編解碼。HDR Vivid技術(shù)通過智能計算,讓不同的顯示設(shè)備都能呈現(xiàn)最優(yōu)畫面觀看效果,消費者將在畫面里看到前所未見的豐富色彩與細節(jié)。
3. 其他關(guān)鍵技術(shù)
3.1 細胞神經(jīng)網(wǎng)絡(luò)的圖像壓縮技術(shù)
各種細胞神經(jīng) N/w 通用機(CNNUM)算法提出了極快的壓縮靜態(tài)和運動圖像。其關(guān)鍵思想是將圖像分割成空間子帶,只存儲下一子帶的重建圖像和去除空間冗余的原始圖像。該算法在無損壓縮方面表現(xiàn)更好,在壓縮比和速度方面優(yōu)于JPEG 標準。
-
優(yōu)點:快速的壓縮效率
-
應(yīng)用:射線照相,圖像存儲和多媒體應(yīng)用程序
3.2S樹陰影方法
1998年之后,提出了一種新的灰度圖像壓縮方法,圖像的比特率和質(zhì)量表明STC方法比 BTCC 方法可靠。該方法的執(zhí)行周期小于 BTCC 的一半。
-
優(yōu)點:在每個塊中考慮噪聲并增加執(zhí)行時間圖像的質(zhì)量也保持在令人滿意的方式,提出的樹蔭樹方法可以得到非常高的速度改進。
-
應(yīng)用:實時通信和檢索圖像
3.3雙層圖像壓縮算法
適合的無損壓縮集中在分組編碼算法上。對于二進制源符號概率 P0 和 p1算法,它解析其編碼區(qū)間。在 BAC 的基礎(chǔ)上,采用了跨雙級的模板移動方法。為了對概率表模板進行索引,我們構(gòu)造了一個 12 位的上下文表。
-
優(yōu)點:適應(yīng)于每一位圖像信息。
3.4基于模糊算法的壓縮
模糊向量量化算法:在滿足矢量量化問題的同時,提出了一種高效利用模糊聚類優(yōu)勢的算法。
-
優(yōu)點:快速簡捷、概念有吸引力
基于模糊算法的圖像壓縮:系統(tǒng)性能取決于基于小波的子帶和矢量量化分解。
-
優(yōu)點:低計算要求及更好的圖像質(zhì)量
<本文完>
參考文獻
https://sciencedirect.53yu.com/science/article/pii/S0167865501001064https://tarjomefa.com/wp-content/uploads/2017/09/7774-English-TarjomeFa.pdfhttp://www.txxb.com.cn/CN/abstract/abstract1885.shtmlhttps://ezinearticles.com/?Advantages-Of-DICOM-Imaging&id=6945078https://article.sciencepublishinggroup.com/pdf/10.11648.j.ijdsa.20170301.11.pdfhttps://www.docin.com/p-522878503.htmlhttps://huifu.wondershare.cn/repair/10070867.html
- Chung K L, Tseng S Y. New progressive image transmission based on quadtree and shading approach with resolution control[J]. Pattern Recognition Letters, 2001, 22(14): 1545-1555.
- Rehman M, Sharif M, Raza M. Image compression: A survey[J]. Research Journal of Applied Sciences, Engineering and Technology, 2014, 7(4): 656-672.
- 蔣東華, 劉立東, 王興元, 等. 基于細胞神經(jīng)網(wǎng)絡(luò)和并行壓縮感知的 圖像加密算法[J]. 圖學(xué)學(xué)報, 2022, 42(6): 891.
- Advantages Of DICOM Imaging
- Embedded Image Compression:A Review
- 醫(yī)學(xué)圖像壓縮國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢
- 視頻格式MPEG2 、MPEG4和H264有什么區(qū)別
ELT.ZIP是誰?
ELT<=>Elite(精英),.ZIP為壓縮格式,ELT.ZIP即壓縮精英。
成員:
上海工程技術(shù)大學(xué)大二在校生閆旭
合肥師范學(xué)院大二在校生楚一凡
清華大學(xué)大二在校生趙宏博
成都信息工程大學(xué)大一在校生高云帆
黑龍江大學(xué)大一在校生高鴻萱
山東大學(xué)大三在校生張智騰
ELT.ZIP是來自6個地方的同學(xué),在OpenHarmony成長計劃啃論文俱樂部里,與來自華為、軟通動力、潤和軟件、拓維信息、深開鴻等公司的高手一起,學(xué)習(xí)、研究、切磋操作系統(tǒng)技術(shù)...
寫在最后
OpenHarmony 成長計劃—“啃論文俱樂部”(以下簡稱“啃論文俱樂部”)是在 2022年 1 月 11 日的一次日?;顒又姓Q生的。截至 3 月 31 日,啃論文俱樂部已有 87 名師生和企業(yè)導(dǎo)師參與,目前共有十二個技術(shù)方向并行探索,每個方向都有專業(yè)的技術(shù)老師帶領(lǐng)同學(xué)們通過啃綜述論文制定技術(shù)地圖,按“降龍十八掌”的學(xué)習(xí)方法編排技術(shù)開發(fā)內(nèi)容,并通過專業(yè)推廣培養(yǎng)高校開發(fā)者成為軟件技術(shù)學(xué)術(shù)級人才。
啃論文俱樂部的宗旨是希望同學(xué)們在開源活動中得到軟件技術(shù)能力提升、得到技術(shù)寫作能力提升、得到講解技術(shù)能力提升。大學(xué)一年級新生〇門檻參與,已有俱樂部來自多所高校的大一同學(xué)寫出高居榜首的技術(shù)文章。
如今,搜索“啃論文”,人們不禁想到、而且看到的都是我們——OpenHarmony 成長計劃—“啃論文俱樂部”的產(chǎn)出。
-
開源技術(shù)
+關(guān)注
關(guān)注
0文章
389瀏覽量
7956 -
OpenHarmony
+關(guān)注
關(guān)注
25文章
3727瀏覽量
16380
原文標題:關(guān)于圖像和視頻壓縮這些小風(fēng)景你不應(yīng)該錯過
文章出處:【微信號:開源技術(shù)服務(wù)中心,微信公眾號:共熵服務(wù)中心】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論