數(shù)據(jù)冗余:在一個數(shù)據(jù)集合中重復(fù)的數(shù)據(jù)稱為數(shù)據(jù)冗余。
數(shù)據(jù)冗余是指數(shù)據(jù)之間的重復(fù),也可以說是同一數(shù)據(jù)存儲在不同數(shù)據(jù)文件中的現(xiàn)象??梢哉f增加數(shù)據(jù)的獨立性和減少數(shù)據(jù)冗余是企業(yè)范圍信息資源管理和大規(guī)模信息系統(tǒng)獲得成功的前提條件。
數(shù)據(jù)冗余或者信息冗余是生產(chǎn)、生活所必然存在的行為,沒有好與不好的總體傾向。
一般而言圖像、視頻、音頻數(shù)據(jù)中存在的數(shù)據(jù)冗余類型主要有以下一些:
?、倏臻g冗余:圖像數(shù)據(jù)中所經(jīng)常出現(xiàn)的一種冗余。在同一幅圖像中,規(guī)則物體和規(guī)則背景(所謂規(guī)則是指表面是有序的而不是完全雜亂無章的排列)的表面物理特性具有相關(guān)性,數(shù)字化圖像中表現(xiàn)為數(shù)據(jù)冗余。例如一幅靜態(tài)圖像中的一大片藍(lán)天、草地,其中每個像素的數(shù)據(jù)完全相同,如果逐點存儲,就會產(chǎn)生所謂的空間冗余。完全一樣的數(shù)據(jù)當(dāng)然可以壓縮,十分接近的數(shù)據(jù)也可以壓縮,因為被壓縮的數(shù)據(jù)恢復(fù)后人眼也分辨不出與原來的圖片有什么區(qū)別,這種壓縮就是對空間冗余的壓縮。
?、跁r間冗余:這是序列圖像(電視圖像、運動圖像)和語音數(shù)據(jù)中所經(jīng)常包含的冗余。在電視、動畫圖像中,在相鄰幀之間往往包含了相同的背景,只不過運動物體的位置略又變換。因此對于序列圖像中的相鄰兩幀僅記錄它們之間的差異,去掉其中重復(fù)的,稱為時間冗余的那部分信息。同樣,由于人在說話時產(chǎn)生的音頻也是連續(xù)和漸變的,因此聲音信息中也會存在時間冗余。
?、劢Y(jié)構(gòu)冗余:有些圖像從大體上看存在著非常強的紋理結(jié)構(gòu),例如草席圖像,我們稱之為它在結(jié)構(gòu)上存在冗余。
④知識冗余:有許多圖像的理解與某些基礎(chǔ)知識有相當(dāng)大的相關(guān)性。例如:人臉的圖像有固定的結(jié)構(gòu)。比如說嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于臉的中線上等等。這類規(guī)律性的結(jié)構(gòu)可由先驗知識和背景知識得到,稱之為知識冗余。⑤視覺冗余:是由于人體器官的不敏感性造成的。例如在高亮度下,人的視覺靈敏度下降,對灰度值的表示就可以粗糙一些。對于太強太弱的聲音,如果超出了“閾值”,人們聽覺感受也會被掩蔽。利用感官上的這些特性,也可以壓縮掉部分?jǐn)?shù)據(jù)而不被人們感知(覺察)。
⑥信息熵冗余:又可稱為編碼冗余,是指一組數(shù)據(jù)攜帶的平均信息量。正因為多媒體數(shù)據(jù)中存在著上述的各種各樣的冗余,所以多媒體數(shù)據(jù)是可以被壓縮的。針對不同的冗余,人們已經(jīng)提出各種各樣的方法實施對于多媒體數(shù)據(jù)的壓縮。
數(shù)據(jù)冗余的目的:
數(shù)據(jù)的應(yīng)用中為了某種目的采取數(shù)據(jù)冗余方式。
1、重復(fù)存儲或傳輸數(shù)據(jù)以防止數(shù)據(jù)的丟失。
2、對數(shù)據(jù)進(jìn)行冗余性的編碼來防止數(shù)據(jù)的丟失、錯誤,并提供對錯誤數(shù)據(jù)進(jìn)行反變換得到原始數(shù)據(jù)的功能。
3、為簡化流程所造成額數(shù)據(jù)冗余。例如向多個目的發(fā)送同樣的信息、在多個地點存放同樣的信息,而不對數(shù)據(jù)進(jìn)行分析而減少工作量。
4、為加快處理過程而將同一數(shù)據(jù)在不同地點存放。例如并行處理同一信息的不同內(nèi)容,或用不同方法處理同一信息等。
5、為方便處理而是同一信息在不同地點有不同的表現(xiàn)形式。例如一本書的不同語言的版本。
6、大量數(shù)據(jù)的索引,一般在數(shù)據(jù)庫中經(jīng)常使用。其目的類似第4點。
7、方法類的信息冗余:比如每個司機都要記住同一城市的基本交通信息;大量個人電腦都安裝類似的操作系統(tǒng)或軟件。
8、為了完備性而配備的冗余數(shù)據(jù)。例如字典里的字很多,但我們只查詢其中很少的一些字。軟件功能很多,但我們只使用其中一部分。
9、規(guī)則性的冗余。根據(jù)法律、制度、規(guī)則等約束進(jìn)行的。例如合同中大量的模式化的內(nèi)容。
10、為達(dá)到其他目的所進(jìn)行的冗余。例如重復(fù)信息以達(dá)到被重視等等。
數(shù)據(jù)冗余或者信息冗余是生產(chǎn)、生活所必然存在的行為,沒有好與不好的總體傾向。
而對于自然界,則是物質(zhì)存在的一種形式,是客觀存在情況。例如每個人都有與其他人基本相同的基因。
評論
查看更多