自然界中的聲音非常復(fù)雜,波形極其復(fù)雜,通常我們采用脈沖編碼碼調(diào)制編碼,即PCM編碼。PCM編碼通過抽樣、量化、編碼三個(gè)步驟將連續(xù)變化的模擬信號轉(zhuǎn)換為數(shù)字信號
采樣(sample)
數(shù)碼音頻系統(tǒng)是通過將聲波波形轉(zhuǎn)換成一連串的二進(jìn)制數(shù)據(jù)來再現(xiàn)原始聲音的(原始聲音是模擬信號),實(shí)現(xiàn)這個(gè)步驟使用的設(shè)備是模/數(shù)轉(zhuǎn)換器(A/D轉(zhuǎn)換器,或者ADC,或者analog to digital convert)。它以每秒上萬次的速率對聲波進(jìn)行采樣,每一次采樣都記錄下了原始模擬聲波在某一時(shí)刻的狀態(tài),稱之為樣本。將一串的樣本連接起來,就可以描述一段聲波了,把每一秒鐘所采樣的數(shù)目稱為采樣頻率或采率,單位為HZ(赫茲)。采樣頻率越高所能描述的聲波頻率就越高。采樣率決定聲音頻率的范圍(相當(dāng)于音調(diào)),可以用數(shù)字波形表示。以波形表示的頻率范圍通常被稱為帶寬。要正確理解音頻采樣可以分為采樣的位數(shù)和采樣的頻率。
采樣位數(shù)(采樣精度)
電腦中的聲音文件是用數(shù)字0和1來表示的。所以在電腦上錄音的本質(zhì)就是把模擬聲音信號轉(zhuǎn)換成數(shù)字信號。反之,在播放時(shí)則是把數(shù)字信號還原成模擬聲音信號輸出。采樣位數(shù)可以理解為采集卡處理聲音的解析度。這個(gè)數(shù)值越大,解析度就越高,錄制和回放的聲音就越真實(shí)。采集卡的位是指采集卡在采集和播放聲音文件時(shí)所使用數(shù)字聲音信號的二進(jìn)制位數(shù)。采集卡的位客觀地反映了數(shù)字聲音信號對輸入聲音信號描述的準(zhǔn)確程度。8位代表2的8次方--256,16 位則代表2的16次方--64K。
采樣率(sample rate)
單位時(shí)間內(nèi)對媒體對象的采樣次數(shù),單位Hz。采樣頻率是指錄音設(shè)備在一秒鐘內(nèi)對聲音信號的采樣次數(shù),采樣頻率越高聲音的還原就越真實(shí)越自然。在當(dāng)今的主流采集卡上,采樣頻率一般共分為 22.05KHz、44.1KHz(44100Hz)、48KHz三個(gè)等級,22.05 KHz只能達(dá)到FM廣播的聲音品質(zhì),44.1KHz則是理論上的CD音質(zhì)界限,48KHz則更加精確一些。對于高于48KHz的采樣頻率人耳已無法辨別出來了,所以在電腦上沒有多少使用價(jià)值。
5kHz的采樣率僅能達(dá)到人們講話的聲音質(zhì)量。
11kHz的采樣率是播放小段聲音的最低標(biāo)準(zhǔn),是CD音質(zhì)的四分之一。
22kHz采樣率的聲音可以達(dá)到CD音質(zhì)的一半,目前大多數(shù)網(wǎng)站都選用這樣的采樣率。
44kHz的采樣率是標(biāo)準(zhǔn)的CD音質(zhì),可以達(dá)到很好的聽覺效果。
通道數(shù)(channel)
分為單聲道m(xù)ono;立體聲stereo。當(dāng)然還存在更多的通道數(shù)。舉個(gè)列子,聲道多,效果好,兩個(gè)聲道,說明只有左右兩邊有聲音傳過來, 四聲道,說明前后左右都有聲音傳過來
比特率(bitrate)
也叫碼率。針對編碼格式,表示壓縮編碼后每秒的音頻數(shù)據(jù)量大小。計(jì)算公式:比特率 = 采樣率 x 采樣精度 x 聲道數(shù)。單位kbps,這里的k為1000
VBR、ABR、CBR
VBR(Variable Bitrate)動態(tài)比特率。也就是沒有固定的比特率,壓縮軟件在壓縮時(shí)根據(jù)音頻數(shù)據(jù)即時(shí)確定使用什么比特率。這是Xing發(fā)展的算法,他們將一首歌的復(fù)雜部分用高Bitrate編碼,簡單部分用低Bitrate編碼。主意雖然不錯,可惜Xing編碼器的VBR算法很差,音質(zhì)與CBR相去甚遠(yuǎn)。幸運(yùn)的是, Lame完美地優(yōu)化了VBR算法,使之成為MP3的最佳編碼模式。這是以質(zhì)量為前提兼顧文件大小的方式時(shí)推薦的編碼模式。
ABR(Average Bitrate)平均比特率,是VBR的一種插值參數(shù)。Lame針對CBR不佳的文件體積比和VBR生成文件大小不定的特點(diǎn)獨(dú)創(chuàng)了這種編碼模式。ABR也被稱為“Safe VBR”,它是在指定的平均Bitrate內(nèi),以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態(tài)表現(xiàn)時(shí)使用高流量。舉例來說,當(dāng)指定用192kbps ABR對一段wav文件進(jìn)行編碼時(shí),Lame會將該文件的85%用192kbps固定編碼,然后對剩余15%進(jìn)行動態(tài)優(yōu)化:復(fù)雜部分用高于192kbps 來編碼、簡單部分用低于192kbps來編碼。與192kbps CBR相比,192kbps ABR在文件大小上相差不多,音質(zhì)卻提高不少。ABR編碼在速度上是VBR編碼的2到3倍,在128-256kbps范圍內(nèi)質(zhì)量要好于CBR??梢宰鰹?VBR和CBR的一種折衷選擇。
CBR(Constant Bitrate),常數(shù)比特率,指文件從頭到尾都是一種位速率。相對于VBR和ABR來講,它壓縮出來的文件體積很大,但音質(zhì)卻不會有明顯的提高。
有損和無損
根據(jù)采樣和量化的過程可知,音頻編碼最多只能做到無限接近 自然界的信號 ,至少目前的技術(shù)還不可能將其完全一樣。這是因?yàn)樽匀唤绲男盘柺沁B續(xù)的,而音頻編碼后的 值 是離散的。因此,任何數(shù)字音頻編碼方案都是有損的,這也就意味著任何的音頻都不可能完全還原出自然界的聲音。
在計(jì)算機(jī)應(yīng)用中, PCM編碼 能夠達(dá)到最高保真水平。它已經(jīng)被廣泛地應(yīng)用于素材保存及音樂欣賞,包括CD、DVD以及 WAV文件等等。因此,PCM約定俗成了無損編碼,但是這并不意味著PCM就能夠確保信號絕對保真,PCM也只能做到最大程度的無限接近。
我們習(xí)慣性地把MP3列入有損音頻編碼范疇,這是相對PCM編碼的。
強(qiáng)調(diào)編碼的相對性的有損和無損,要做到真正的無損是非常困難,甚至是不可能的。就如同,我們用小數(shù)去表達(dá)圓周率,不管小數(shù)精度有多高,也只能無限地接近,而不是真正等于圓周率的值。
評論
查看更多