語音CODEC,什么是語音CODEC
語音CODEC,什么是語音CODEC
語音編碼器的功能: 語音編碼器的主要功能就是把用戶語音的PCM(脈沖編碼調(diào)制)樣值編碼成少量的比特(幀)。這種方法使得語音在連路產(chǎn)生誤碼、網(wǎng)絡抖動和突發(fā)傳輸時具有健壯性(Robustness)。在接收端,語音幀先被誤碼為PCM語音樣值,然后再轉(zhuǎn)換成語音波形。
語音編碼器的分類: 語音編碼器分為三種類形:(a)波形編器;(b)聲碼器;(c)混合編碼器。波形編碼器會盡可能構(gòu)出包括背景噪單在內(nèi)的模擬波形。由于波形編碼器作用于所有輸入信號,因此會產(chǎn)生高質(zhì)量的樣值。然而,波形編碼器工作在高比特率。例如:ITU-G.711規(guī)范(PCM)用的比特率為64Kbps。 聲碼器(vocoder)不會再生原始波形。這組編碼器會提取一組參數(shù),這組參數(shù)被送到接收端,用來導出語音產(chǎn)生模形。線性預測編碼(LPC)用來獲取一時變數(shù)字濾波器的參數(shù)。這個濾波器用來模擬說話人的聲道輸出[WEST96]。在電話系統(tǒng)中使用聲碼器,語音質(zhì)量不夠好。在VOIP中常用的語音編碼器是混合編碼器,它融入了波形編碼器和聲器的長處,它的另一特點是它工作在非常低的比特率(4-6Kbps)?;旌暇幋a器采用合成分析(AbS)。
為了說明問題,考慮人的聲道產(chǎn)生的一個語音模式:當人說話產(chǎn)生語音信號時就會發(fā)出濁音(如音素pa、da等)和清音(如音素sh、th)。激勵信號就是由輸入的語音信號導出的,其方法是使合成語音與輸入語音的差別非常小。LPC的用法、激勵的產(chǎn)生以及對合成分析(AbS)系統(tǒng)的誤差檢查均如圖4-1所示。 長話質(zhì)量編碼器在比特率高于8Kbps時容易實現(xiàn),如圖4-2所示。長話質(zhì)量的語音平均意見得分(MOS)必須在分或許分以上。傳統(tǒng)的PCN語音在比特率小于32 Kbps,語音質(zhì)量會嚴重惡化,在這里就不討論PCN了?;旌暇幋a和聲碼器在比特率相當?shù)偷腗OS上的得分是可接受的。在現(xiàn)階段,大多數(shù)基于VOIP的編碼器的工作范圍在5.2~8kbps。研究表明,標準的編碼器在比特率為4 Kbps時能提供可接受的NOS得分,一些分用系統(tǒng)在4.8 Kbps的MOS上的得分為3.8。 矢量量化和碼激勵線性預測 一種較好的方法就是用預測存儲的最優(yōu)參數(shù)(碼元矢量)的碼本對輸入語音信號的表示矢量進行編碼,這種技術(shù)稱為矢量量化(VQ,vector quantization)。 將VQ和AbS技術(shù)結(jié)合在一起會進一步提高編碼性能。AbS VQ是技術(shù)構(gòu)成CELP的基礎(chǔ)。VQ和AbS VQ的主要區(qū)別在于進行矢量量化碼簿搜索時采用的量化失真測量定義的不同[WONG96]。
非常好我支持^.^
(2) 13.3%
不好我反對
(13) 86.7%
相關(guān)閱讀:
- [電子說] OTA語音芯片NV040C在智能電動牙刷的應用 2023-10-24
- [電子說] 語音模塊能給落地扇帶來什么? 2023-10-24
- [電子說] 唯創(chuàng)知音WT588F02B-8S語音芯片賦能智能家居:讓清潔工作變得更簡單 2023-10-24
- [電子說] 語音芯片的寬電壓設(shè)計作用 2023-10-23
- [電子說] 語音模塊能給臺式風扇帶來什么? 2023-10-23
- [電子說] 智能離線語音識別全屋智能語音控制方案 2023-10-23
- [電子說] 語音芯片KT142C兩種音頻輸出方式PWM和DAC的區(qū)別 2023-10-21
- [電子說] SOP8封裝 NV400F的語音芯片在電動車充電樁的應用 2023-10-21
( 發(fā)表人:admin )