0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于頻域處理法實(shí)現(xiàn)數(shù)字音頻的變調(diào)功能

電子設(shè)計(jì) ? 來(lái)源:電聲技術(shù) ? 作者:李力利 ? 2021-03-16 14:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1 引言

改變聲音信號(hào)的音調(diào)是許多商用設(shè)備的一種功能,最典型的應(yīng)屬卡拉OK機(jī)了。由于發(fā)音音調(diào)高低因人而異,人們希望伴奏音樂(lè)的音調(diào)適合自己的嗓音,因此卡拉OK機(jī)中設(shè)計(jì)了專(zhuān)門(mén)的硬件來(lái)實(shí)現(xiàn)這一功能。例如雅馬哈公司的用于數(shù)字變調(diào)的大規(guī)摸集成電路 YSS222D和YSS216B,內(nèi)部集成了A/D,D/A和數(shù)字信號(hào)處理器,利用采樣和重放數(shù)據(jù)時(shí)速度的不同來(lái)實(shí)現(xiàn)變調(diào)。功能,重放比采樣速度快則升調(diào),反之則降調(diào)。另外,為了使播放時(shí)間不變,還需對(duì)數(shù)據(jù)段進(jìn)行復(fù)制或刪除。由于商業(yè)保密的需要,具體算法未公開(kāi),據(jù)可詢(xún)資料實(shí)現(xiàn)的系統(tǒng),不能有效解決因復(fù)制或刪除數(shù)據(jù)帶來(lái)的相位不連續(xù)問(wèn)題。

當(dāng)前,聲卡已成為計(jì)算機(jī)的基本配置,但無(wú)變調(diào)功能,為彌補(bǔ)這一缺憾,可以采用件的方法對(duì)聲音文件重新編碼,使聲卡回放時(shí)音調(diào)改變。另外,數(shù)字音頻工作站也需要軟件實(shí)現(xiàn)變調(diào)功能。因此討論了3種軟件實(shí)現(xiàn)算法,圍繞著如何變調(diào)而不變時(shí)間,以及如何解決相位不連接問(wèn)題,從變調(diào)原理著手,討論了時(shí)域?qū)崿F(xiàn)的理論依據(jù),最后找到了一種有效的變調(diào)方法-- 頻域處理法,實(shí)驗(yàn)證實(shí)效果良好。

2 變調(diào)的樂(lè)理基礎(chǔ)

聲音是由物體振動(dòng)產(chǎn)生的,聲音的基本要素有:音調(diào)、音強(qiáng)和音色。樂(lè)音體系根據(jù)振動(dòng)頻率即音調(diào)的不同,將樂(lè)音分成音級(jí),基本音級(jí)廣泛采用CDEFGAB這8個(gè)字母命名,某音級(jí)與往上數(shù)8個(gè)音級(jí)之間的距離稱(chēng)為“純八度”,世界上普遍采用的12平均律將一個(gè)純八度分成12個(gè)均等的半音,相鄰兩個(gè)半音間的物理振動(dòng)頻率相差21/12倍,也就是說(shuō)各半音間的振動(dòng)頻率成等比關(guān)系,一個(gè)純八度頻率相差2倍。

如果將信號(hào)中的所有頻率成分升高或降低21/12倍,就能使音調(diào)升高或降低一個(gè)半音。假設(shè)原信號(hào)頻率為f,變調(diào)后頻率為f,二者的關(guān)系應(yīng)該滿(mǎn)足

f=fx2d/12, d=±1 ,±2,±3 (1)

當(dāng)d》0時(shí),升調(diào),反之,降調(diào);d每變化1,音調(diào)升高或降低一個(gè)半音。

3 時(shí)域?qū)崿F(xiàn)的依據(jù)及存在的問(wèn)題

一種實(shí)現(xiàn)變調(diào)的作法,是采用硬件實(shí)現(xiàn)相似的辦法,即改變WAV文件頭中有關(guān)采樣率的信息。如果采樣率提高,則聲卡回放速度加快,產(chǎn)生升調(diào)的效果,同時(shí)回放時(shí)間變短;反之,產(chǎn)生降調(diào)的效果,回放時(shí)間變長(zhǎng)。為保持時(shí)間不變,以幀為單位,利用信號(hào)的短時(shí)周期性,升調(diào)時(shí)將幀內(nèi)后部數(shù)據(jù)段復(fù)制,降調(diào)時(shí)將幀內(nèi)后部數(shù)據(jù)段刪除,圖1畫(huà)出了一幀的數(shù)據(jù)處理情況??梢钥吹?,若是升調(diào),幀間數(shù)據(jù)是連續(xù)的,但由于數(shù)據(jù)段的復(fù)制,幀內(nèi)數(shù)據(jù)段間相位不連續(xù);若是降調(diào),幀內(nèi)數(shù)據(jù)連續(xù),但幀間數(shù)據(jù)相位不連續(xù),因此聲音質(zhì)量必然受到影響,產(chǎn)生喀嚓聲。

另一種方法是,采用時(shí)域抽選和內(nèi)插[4]。下面分析抽選和內(nèi)插的頻譜,看如何實(shí)現(xiàn)變調(diào)。抽選表示成下式

Xd[n]=[nM] (2)

表示每M個(gè)采樣值選1個(gè),其余M-1個(gè)舍棄,則信號(hào)長(zhǎng)度縮短為1/M。抽選后信號(hào)頻譜和原信號(hào)頻譜間的關(guān)系為

1 M-1

Xd(ejω)=-Σ X[ej(ω/M-2πi/M (3)

M i=0

圖2所示粗線(xiàn)為M=2的抽選信號(hào)頻譜,粗實(shí)線(xiàn)為M=2的抽選信號(hào)頻譜,可以看出,抽選后信號(hào)的頻率成分均為原來(lái)的2倍,所以能實(shí)現(xiàn)升調(diào)。為防止抽選后頻譜混疊,抽選前必須作抗混疊數(shù)字低通濾波,截止頻率為π/M。

再看看內(nèi)插的頻譜變化。內(nèi)插時(shí)域表示成

Xi[n]={x[n/L,n=O,±L,+2L,+3L, 。.. (4)

0, 其它

表示每?jī)蓚€(gè)采樣值中插入L-1個(gè)零,整個(gè)信號(hào)長(zhǎng)度增加為L(zhǎng)倍。內(nèi)插后信號(hào)頻譜和原信號(hào)頻譜間的關(guān)系為

Xi(ejω)=X(ejLω) (5)

圖2虛線(xiàn)所示為L(zhǎng)=2的內(nèi)插信號(hào)頻譜,可以看出,所有頻率成分均為原信號(hào)的1/2,所以能實(shí)現(xiàn)降調(diào)。為不產(chǎn)生鏡像頻率成分,內(nèi)插后必須作反鏡像數(shù)字低通濾波,截止頻率π/L,也可用線(xiàn)性?xún)?nèi)插取代插零,而無(wú)須反鏡像濾波。

抽選和內(nèi)插后的數(shù)據(jù)量同樣會(huì)變短或變長(zhǎng),下面來(lái)推導(dǎo)保持?jǐn)?shù)據(jù)量不變的具體實(shí)現(xiàn)方法。根據(jù)上述抽選和內(nèi)插的頻譜變化情況,反推時(shí)域變化過(guò)程:若將信號(hào)作快速離散傅里葉變換(FFT),將譜線(xiàn)沿頻率軸擴(kuò)張或收縮,再作反變換(IFFT),得到的信號(hào)應(yīng)該是被升調(diào)或降調(diào),并且數(shù)據(jù)量保持不變。

非整數(shù)倍的變調(diào)可由抽選和內(nèi)插結(jié)合實(shí)現(xiàn),同樣可以采用數(shù)據(jù)段的復(fù)制或刪除的辦法保持?jǐn)?shù)據(jù)量即回放時(shí)間不變,其系統(tǒng)結(jié)構(gòu)如圖3所示。但對(duì)于復(fù)制或刪除數(shù)據(jù)后段間相位的不連續(xù)性問(wèn)題,有些資料[3]提出找出信號(hào)的基音周期,以基音周期為復(fù)制或刪除單位,并幀間重疊處理,也不能從根本上解決相位問(wèn)題。

4 頻域?qū)崿F(xiàn)的算法研究

現(xiàn)在考慮采用頻域?qū)崿F(xiàn)來(lái)解決相位問(wèn)題。

首先采用頻譜伸展的辦法得到升調(diào)的信號(hào),如圖4所示,(a)為原始信號(hào)波形及FFT的幅度和相位圖,(b)為將原始信號(hào)的FFT譜線(xiàn)向高頻伸展一倍,中間內(nèi)插零,再I(mǎi)FFT得到信號(hào)波形及FFT幅度和相位圖,情況和時(shí)域抽選一樣。然后考慮將頻譜伸展過(guò)程中的譜線(xiàn)內(nèi)插零改成線(xiàn)性?xún)?nèi)插,如(c)所示,可見(jiàn)信號(hào)波形段間能很好地吻合,但波形失真較大。最終發(fā)現(xiàn)結(jié)合插零和線(xiàn)性?xún)?nèi)插,低頻插零,高頻線(xiàn)性?xún)?nèi)插,既能保證波形失真較小又能在兩段相連處較好地過(guò)濾,如(d)所示。

對(duì)于降調(diào),圖5(a)是2幀原始信號(hào)波形及后一幀的FFT幅度圖,圖5(b)采用FFT譜線(xiàn)向低頻收縮,再I(mǎi)FFI,得到的波形和時(shí)域內(nèi)插法一樣,改進(jìn)措施見(jiàn)圖5(c),被處理的連續(xù)兩幀信號(hào)間有一部分重疊,得到的兩幀信號(hào)波形便能很好地過(guò)渡。

因此,要實(shí)現(xiàn)式(1)任意倍頻率的變調(diào),令α=2d/A2,采用以下公式。為簡(jiǎn)單起見(jiàn),低頻高頻均線(xiàn)性?xún)?nèi)插:

X[K]=FFT[x(n)], k=0,1,。..N-1 (6)

y[n]=IFFT[Y(K)],n=0,1,。..N-1 (8)

其中N是幀長(zhǎng),int()表示取整,min()表示取較小值。注意,僅僅對(duì)于降調(diào)a

另外幀長(zhǎng),即被處理的數(shù)據(jù)長(zhǎng)度也必須適當(dāng),如果太短,會(huì)造成數(shù)據(jù)的復(fù)制和刪除太過(guò)頻繁;過(guò)長(zhǎng),又不符合短時(shí)周期性,明顯地感到聲音的多次重復(fù)或被打斷。經(jīng)過(guò)實(shí)驗(yàn)表明,幀長(zhǎng)取4000點(diǎn)左右比較合適,對(duì)于采樣率44.1 kHz的音頻信號(hào)是0.1 s的數(shù)據(jù)量,4 000點(diǎn)的FFT使頻譜取樣間隔為10Hz左右。

5 結(jié)束語(yǔ)

實(shí)現(xiàn)變調(diào)的基本原理是改變信號(hào)的頻率成分,可以通過(guò)時(shí)域抽選或內(nèi)插實(shí)現(xiàn),但為保持時(shí)間不變,每幀要復(fù)制或刪除部分?jǐn)?shù)據(jù)段,由此帶來(lái)相位不連續(xù)從而影響聲音質(zhì)量。文中提出的頻域法,根據(jù)變調(diào)的原理,將FFT譜線(xiàn)向高頻或低頻搬移,再作IFFT得到時(shí)域信號(hào),若升調(diào)譜線(xiàn)搬移過(guò)程中采用線(xiàn)性?xún)?nèi)插,降調(diào)采用時(shí)域幀間重疊,能消除數(shù)據(jù)段的不連續(xù)問(wèn)題,改善變調(diào)后的聲音質(zhì)量。頻域?qū)崿F(xiàn)無(wú)須低通抗混疊濾波或低通反鏡像濾波,且FFT是快速算法,假設(shè)采用如ADSP2181或TMS320C54X,乘法運(yùn)算占用單指令周期的DSP芯片,運(yùn)算量小于1 MIps,實(shí)時(shí)運(yùn)算不成問(wèn)題??梢?jiàn),頻域法是一種有效可行的辦法。

責(zé)任編輯:gt

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19874

    瀏覽量

    234734
  • 集成電路
    +關(guān)注

    關(guān)注

    5422

    文章

    12028

    瀏覽量

    368141
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7654

    瀏覽量

    90644
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    數(shù)字音頻輸入接口電路

     數(shù)字音頻輸入接口電路 AES/EBU解碼器和解復(fù)用器AES/EBU解碼器將雙相標(biāo)志碼串行AES/EBU數(shù)字音頻信號(hào)轉(zhuǎn)換為信號(hào)數(shù)據(jù)流,再將兩聲道的音頻數(shù)據(jù)信號(hào)分開(kāi),產(chǎn)生兩路并行比特
    發(fā)表于 08-01 08:21

    數(shù)字音頻接口的優(yōu)勢(shì)是什么

    數(shù)字音頻接口的優(yōu)勢(shì)模擬耳機(jī)插孔的其他選擇使用USB的數(shù)字音頻
    發(fā)表于 03-09 07:35

    面向高清電視的全數(shù)字音頻系統(tǒng)的設(shè)計(jì)

    隨著數(shù)字錄音和傳輸?shù)某霈F(xiàn),將數(shù)字信號(hào)源與數(shù)字處理直接結(jié)合起來(lái)提供端到端數(shù)字音頻系統(tǒng)的想法看起來(lái)即將實(shí)現(xiàn)。端到端
    發(fā)表于 12-02 16:35 ?23次下載

    數(shù)字音頻編碼技術(shù)

    內(nèi)容• 數(shù)字音頻編碼技術(shù)基礎(chǔ)• 數(shù)字音頻編碼技術(shù)標(biāo)準(zhǔn)• DRA音頻編碼技術(shù)及應(yīng)用• 數(shù)字音頻編碼技術(shù)最新進(jìn)展
    發(fā)表于 08-31 17:25 ?27次下載

    一種基于SOLA的數(shù)字音頻變調(diào)算法及其在TMS320C671

    摘要:數(shù)字變調(diào)數(shù)字音處理的一種重要應(yīng)用。描述了一種基于時(shí)域的內(nèi)插和抽取技術(shù)實(shí)現(xiàn)音頻
    發(fā)表于 09-01 20:28 ?45次下載

    數(shù)字音頻編輯技術(shù)

        能夠根據(jù)教學(xué)需要錄制數(shù)字音頻     能夠利用軟件編輯數(shù)字音頻     能夠根據(jù)需要輸出相應(yīng)格式的
    發(fā)表于 09-13 16:01 ?31次下載

    數(shù)字音頻監(jiān)視器

    泰克764數(shù)字音頻監(jiān)視器是現(xiàn)代數(shù)字音頻應(yīng)用系統(tǒng)中的先進(jìn)監(jiān)視儀器。它可用于數(shù)字音頻的節(jié)目制作和質(zhì)量檢驗(yàn)。764綜合了相位表和電平表的特點(diǎn),并將這一特點(diǎn)用于數(shù)字音頻數(shù)據(jù)監(jiān)
    發(fā)表于 12-19 23:56 ?41次下載

    什么是DAB/數(shù)字音頻廣播

    什么是DAB/數(shù)字音頻廣播     DAB是數(shù)字音頻廣播(Digital Audio Broadcasting)的英文縮寫(xiě)。DAB是繼調(diào)幅(AM)、調(diào)頻(FM)廣播
    發(fā)表于 01-28 16:47 ?2414次閱讀

    什么是數(shù)字音頻

    什么是數(shù)字音頻 大家知道,無(wú)論現(xiàn)在的多媒體電腦功能如何強(qiáng)大,其內(nèi)部也只能處理數(shù)字信息。而我們聽(tīng)到的聲音都是模擬信號(hào),怎
    發(fā)表于 02-02 11:50 ?4324次閱讀

    什么是數(shù)字音頻會(huì)議系統(tǒng)?

    什么是數(shù)字音頻會(huì)議系統(tǒng)?   數(shù)字音頻會(huì)議系統(tǒng)是針對(duì)模擬音頻會(huì)議系統(tǒng)而產(chǎn)生的。   數(shù)字音頻會(huì)議
    發(fā)表于 02-21 11:03 ?1101次閱讀

    面向高清電視的全數(shù)字音頻系統(tǒng)

    隨著數(shù)字錄音和傳輸?shù)某霈F(xiàn),將數(shù)字信號(hào)源與數(shù)字處理直接結(jié)合起來(lái)提供端到端數(shù)字音頻系統(tǒng)的想法看起來(lái)即將實(shí)現(xiàn)。端到端
    發(fā)表于 07-16 09:28 ?1650次閱讀
    面向高清電視的全<b class='flag-5'>數(shù)字音頻</b>系統(tǒng)

    數(shù)字音頻應(yīng)用解析

    數(shù)字音頻是一種利用數(shù)字化手段對(duì)聲音進(jìn)行錄制、存放、編輯、壓縮或播放的技術(shù),它是隨著數(shù)字數(shù)字音頻號(hào)處理技術(shù)、計(jì)算機(jī)技術(shù)、多媒體技術(shù)的發(fā)展而形
    發(fā)表于 11-01 15:53 ?7277次閱讀

    數(shù)字音頻技術(shù)的應(yīng)用與發(fā)展

    (ADC)轉(zhuǎn)換為數(shù)字信號(hào),再通過(guò)數(shù)字信號(hào)處理技術(shù)進(jìn)行處理和存儲(chǔ)的一種音頻技術(shù)。數(shù)字音頻具有高保真
    的頭像 發(fā)表于 07-13 10:14 ?4993次閱讀

    電視數(shù)字音頻輸出是什么接口

    。 1. 數(shù)字音頻輸出的基本原理 數(shù)字音頻輸出利用數(shù)字信號(hào)處理技術(shù),將音頻信號(hào)轉(zhuǎn)換為數(shù)字數(shù)據(jù)流。
    的頭像 發(fā)表于 09-24 10:40 ?5932次閱讀

    藍(lán)牙音頻模組中模擬音頻數(shù)字音頻如何選擇?

    藍(lán)牙模塊中我們常說(shuō)的模擬音頻數(shù)字音頻,是指兩種不同的信號(hào)處理技術(shù),它們都可以實(shí)現(xiàn)聲音的錄制、存儲(chǔ)、編輯、壓縮或播放,但也有一些區(qū)別和特點(diǎn)。本文將為您深入解析藍(lán)牙
    的頭像 發(fā)表于 04-17 15:55 ?290次閱讀
    藍(lán)牙<b class='flag-5'>音頻</b>模組中模擬<b class='flag-5'>音頻</b>和<b class='flag-5'>數(shù)字音頻</b>如何選擇?

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品