1 麥克風陣列
? ?? ???麥克風陣列,是一組位于空間不同位置的全向麥克風按一定的形狀規(guī)則布置形成的陣列,是對空間傳播聲音信號進行空間采樣的一種裝置,采集到的信號包含了其空間位置信息。根據(jù)聲源和麥克風陣列之間距離的遠近,可將陣列分為近場模型和遠場模型。根據(jù)麥克風陣列的拓撲結構,則可分為線性陣列、平面陣列、體陣列等。
(1) 近場模型和遠場模型
? ?? ???聲波是縱波,即媒質中質點沿傳播方向運動的波。聲波是一種振動波,聲源發(fā)聲振動后,聲源四周的媒質跟著振動,聲波隨著媒質向四周擴散,所以是球面波。
? ?? ???根據(jù)聲源和麥克風陣列距離的遠近,可將聲場模型分為兩種:近場模型和遠場模型。近場模型將聲波看成球面波,它考慮麥克風陣元接收信號間的幅度差;遠場模型則將聲波看成平面波,它忽略各陣元接收信號間的幅度差,近似認為各接收信號之間是簡單的時延關系。顯然遠場模型是對實際模型的簡化,極大地簡化了處理難度。一般語音增強方法就是基于遠場模型。
? ?? ???近場模型和遠場模型的劃分沒有絕對的標準,一般認為聲源離麥克風陣列中心參考點的距離遠大于信號波長時為遠場;反之,則為近場。設均勻線性陣列相鄰陣元之間的距離(又稱陣列孔徑)為d,聲源最高頻率語音的波長(即聲源的最小波長)為λmin,如果聲源到陣列中心的距離大于2d2/λmin,則為遠場模型,否則為近場模型,如圖1所示。
圖1??近場模型和遠場模型
(2) 麥克風陣列拓撲結構
? ?? ???按麥克風陣列的維數(shù),可分為一維、二維和三維麥克風陣列。這里只討論有一定形狀規(guī)則的麥克風陣列。
? ?? ???一維麥克風陣列,即線性麥克風陣列,其陣元中心位于同一條直線上。根據(jù)相鄰陣元間距是否相同,又可分為均勻線性陣列(UnIForm Linear Array,ULA)和嵌套線性陣列,如圖2所示。均勻線性陣列是最簡單的陣列拓撲結構,其陣元之間距離相等、相位及靈敏度一直。嵌套線性陣列則可看成幾組均勻線性陣列的疊加,是一類特殊的非均勻陣。線性陣列只能得到信號的水平方向角信息。
圖2??線性陣列拓撲結構
? ?? ???二維麥克風陣列,即平面麥克風陣列,其陣元中心分布在一個平面上。根據(jù)陣列的幾何形狀可分為等邊三角形陣、T型陣、均勻圓陣、均勻方陣、同軸圓陣、圓形或矩形面陣等,如圖3所示。平面陣列可以得到信號的水平方位角和垂直方位角信息。
圖3??平面陣列拓撲結構
? ?? ???三維麥克風陣列,即立體麥克風陣列,其陣元中心分布在立體空間中。根據(jù)陣列的立體形狀可分為四面體陣、正方體陣、長方體陣、球型陣等,如圖4所示。立體陣列可以得到信號的水平方位角、垂直方位角和聲源與麥克風陣列參考點距離這三維信息。
圖4??立體陣列拓撲結構
2??波束形成
? ?? ???波束形成,是對各陣元的輸出進行時延或相位補償、幅度加權處理,以形成指向特定方向的波束。
? ?? ???在遠場模型中,假設輸入是一個平面波。設傳播方向為θ,時域頻率(弧度)為ω,聲音在介質中的傳播速度為c,對于在一個局部均勻的介質里傳播的平面波,定義波束k為
k = ωsinθ/c = 2sinθ/λ,其中λ是對應于頻率ω的波長。由于信號到達不同的傳感器的時間不同,則陣列接收到的信號可表示為
? ?? ???f(t)=[f(t-τ0) f(t-τ1)…f(t-τN-1)]T=[exp(jω(t-kτ0)) exp(jω(t-kτ1))…exp(jω(t-kτN-1))]T
其中τn為第n個陣元接收到的信號相對于參考點的時延,N為陣元個數(shù),T表示轉置。
? ?? ???定義v(k) = [e-jωkτ0 e-jωkτ1 …e-jωkτN-1]T
矢量v包含了陣列的空間特征,稱為陣列流行矢量。則f(t)可表示為f(t) = ejωtv(k)。
? ?? ???陣列處理器對一個平面波的響應為y(t,k) =HT(ω)?v(k)ejωt
其中H(ω)是濾波器系數(shù)向量的傅里葉變換。符號y(t,k)強調了輸出和輸入波數(shù)k的關系。時域上的相關性體現(xiàn)在輸出是一個復指數(shù),和輸入平面波有相同的頻率。在頻域上式可表示為Y(ω,k) =HT(ω)?v(k)。
注意此處ω對應單一的輸入頻率,所以是窄帶的。陣列的空時處理關系完全可以由上式的右端描述,稱為陣列的頻率-波數(shù)響應函數(shù)。它描述了一個陣列對于時域頻率為ω,波數(shù)為k的輸入平面波的復增益。
? ?? ???陣列的波束方向圖反映了平面波在一個局部均勻的介質中傳播情況,它是用入射方向表示的頻率-波數(shù)響應函數(shù),可以寫成B(ω:θ) = Y(ω,k)|k=sinθ。
陣列的波束方向圖是確定陣列性能的關鍵要素,其主要參數(shù)有3dB帶寬,到第一零點的距離,第一旁瓣高度,旁瓣衰減速度等。其幅度的平方定義為功率方向圖,是常用的一種陣列性能度量。
3 時延補償
? ?? ???由于麥克風陣元空間位置的差異,各陣元接收到的信號存在時延,在對信號處理之前進行時延補償,保證各陣元待處理數(shù)據(jù)的一致性,使陣列指向期望方向。
? ?? ???考慮最簡單的均勻線性麥克風陣列,如圖5所示。
圖5??ULA時延
? ?? ???設麥克風陣列共用M個陣元,中心為參考點,陣元間距為d,信號入射角為θ,聲音傳播速度為c,則根據(jù)幾何知識,第m(0≤m≤M-1)個陣元的時延為τm = (d/c) sinθ(m-(K-1)/2)。
? ?? ???麥克風采集的是數(shù)字信號,設采樣周期為T,則對時域離散的信號來說,時延為D = τ/T。
? ?? ???通常D不是一個整數(shù),而對離散信號來說,整數(shù)時延才有意義。對于非整數(shù)D,可以分解為整數(shù)部分和分數(shù)部分D = ?D? + d,式中,?D?為D的向下取整,0≤d<1。對于非零的分數(shù)部分d,此時信號實際值介于兩個相鄰采樣點之間,即分數(shù)延遲。在實際處理中,可對d四舍五入取整,然后加上?D?,得到近似整數(shù)時延,但這種方法處理的結果不夠精確。
? ?? ???為了得到較為精確的處理結果,就必須設計分數(shù)時延濾波器,對采樣信號進行精確的時延補償。理想的分數(shù)時延濾波器的沖激響應可表示為hid(m) = sinc(m-D)。
? ?? ???由數(shù)字信號處理知識可知,上式是無限長、非因果不穩(wěn)定的,在物理上不可實現(xiàn)。為了解決這一問題,在實際操作中,通常會對上式進行加窗,加窗后濾波器的沖激響應為
h(m)=(W(m-D)sinc(m-D), 0≤m≤M-1。加窗后的分數(shù)時延濾波器的時延精確程度與理想分數(shù)時延濾波器非常接近
? ?? ???麥克風陣列,是一組位于空間不同位置的全向麥克風按一定的形狀規(guī)則布置形成的陣列,是對空間傳播聲音信號進行空間采樣的一種裝置,采集到的信號包含了其空間位置信息。根據(jù)聲源和麥克風陣列之間距離的遠近,可將陣列分為近場模型和遠場模型。根據(jù)麥克風陣列的拓撲結構,則可分為線性陣列、平面陣列、體陣列等。
(1) 近場模型和遠場模型
? ?? ???聲波是縱波,即媒質中質點沿傳播方向運動的波。聲波是一種振動波,聲源發(fā)聲振動后,聲源四周的媒質跟著振動,聲波隨著媒質向四周擴散,所以是球面波。
? ?? ???根據(jù)聲源和麥克風陣列距離的遠近,可將聲場模型分為兩種:近場模型和遠場模型。近場模型將聲波看成球面波,它考慮麥克風陣元接收信號間的幅度差;遠場模型則將聲波看成平面波,它忽略各陣元接收信號間的幅度差,近似認為各接收信號之間是簡單的時延關系。顯然遠場模型是對實際模型的簡化,極大地簡化了處理難度。一般語音增強方法就是基于遠場模型。
? ?? ???近場模型和遠場模型的劃分沒有絕對的標準,一般認為聲源離麥克風陣列中心參考點的距離遠大于信號波長時為遠場;反之,則為近場。設均勻線性陣列相鄰陣元之間的距離(又稱陣列孔徑)為d,聲源最高頻率語音的波長(即聲源的最小波長)為λmin,如果聲源到陣列中心的距離大于2d2/λmin,則為遠場模型,否則為近場模型,如圖1所示。
圖1??近場模型和遠場模型
(2) 麥克風陣列拓撲結構
? ?? ???按麥克風陣列的維數(shù),可分為一維、二維和三維麥克風陣列。這里只討論有一定形狀規(guī)則的麥克風陣列。
? ?? ???一維麥克風陣列,即線性麥克風陣列,其陣元中心位于同一條直線上。根據(jù)相鄰陣元間距是否相同,又可分為均勻線性陣列(UnIForm Linear Array,ULA)和嵌套線性陣列,如圖2所示。均勻線性陣列是最簡單的陣列拓撲結構,其陣元之間距離相等、相位及靈敏度一直。嵌套線性陣列則可看成幾組均勻線性陣列的疊加,是一類特殊的非均勻陣。線性陣列只能得到信號的水平方向角信息。
圖2??線性陣列拓撲結構
? ?? ???二維麥克風陣列,即平面麥克風陣列,其陣元中心分布在一個平面上。根據(jù)陣列的幾何形狀可分為等邊三角形陣、T型陣、均勻圓陣、均勻方陣、同軸圓陣、圓形或矩形面陣等,如圖3所示。平面陣列可以得到信號的水平方位角和垂直方位角信息。
圖3??平面陣列拓撲結構
? ?? ???三維麥克風陣列,即立體麥克風陣列,其陣元中心分布在立體空間中。根據(jù)陣列的立體形狀可分為四面體陣、正方體陣、長方體陣、球型陣等,如圖4所示。立體陣列可以得到信號的水平方位角、垂直方位角和聲源與麥克風陣列參考點距離這三維信息。
圖4??立體陣列拓撲結構
2??波束形成
? ?? ???波束形成,是對各陣元的輸出進行時延或相位補償、幅度加權處理,以形成指向特定方向的波束。
? ?? ???在遠場模型中,假設輸入是一個平面波。設傳播方向為θ,時域頻率(弧度)為ω,聲音在介質中的傳播速度為c,對于在一個局部均勻的介質里傳播的平面波,定義波束k為
k = ωsinθ/c = 2sinθ/λ,其中λ是對應于頻率ω的波長。由于信號到達不同的傳感器的時間不同,則陣列接收到的信號可表示為
? ?? ???f(t)=[f(t-τ0) f(t-τ1)…f(t-τN-1)]T=[exp(jω(t-kτ0)) exp(jω(t-kτ1))…exp(jω(t-kτN-1))]T
其中τn為第n個陣元接收到的信號相對于參考點的時延,N為陣元個數(shù),T表示轉置。
? ?? ???定義v(k) = [e-jωkτ0 e-jωkτ1 …e-jωkτN-1]T
矢量v包含了陣列的空間特征,稱為陣列流行矢量。則f(t)可表示為f(t) = ejωtv(k)。
? ?? ???陣列處理器對一個平面波的響應為y(t,k) =HT(ω)?v(k)ejωt
其中H(ω)是濾波器系數(shù)向量的傅里葉變換。符號y(t,k)強調了輸出和輸入波數(shù)k的關系。時域上的相關性體現(xiàn)在輸出是一個復指數(shù),和輸入平面波有相同的頻率。在頻域上式可表示為Y(ω,k) =HT(ω)?v(k)。
注意此處ω對應單一的輸入頻率,所以是窄帶的。陣列的空時處理關系完全可以由上式的右端描述,稱為陣列的頻率-波數(shù)響應函數(shù)。它描述了一個陣列對于時域頻率為ω,波數(shù)為k的輸入平面波的復增益。
? ?? ???陣列的波束方向圖反映了平面波在一個局部均勻的介質中傳播情況,它是用入射方向表示的頻率-波數(shù)響應函數(shù),可以寫成B(ω:θ) = Y(ω,k)|k=sinθ。
陣列的波束方向圖是確定陣列性能的關鍵要素,其主要參數(shù)有3dB帶寬,到第一零點的距離,第一旁瓣高度,旁瓣衰減速度等。其幅度的平方定義為功率方向圖,是常用的一種陣列性能度量。
3 時延補償
? ?? ???由于麥克風陣元空間位置的差異,各陣元接收到的信號存在時延,在對信號處理之前進行時延補償,保證各陣元待處理數(shù)據(jù)的一致性,使陣列指向期望方向。
? ?? ???考慮最簡單的均勻線性麥克風陣列,如圖5所示。
圖5??ULA時延
? ?? ???設麥克風陣列共用M個陣元,中心為參考點,陣元間距為d,信號入射角為θ,聲音傳播速度為c,則根據(jù)幾何知識,第m(0≤m≤M-1)個陣元的時延為τm = (d/c) sinθ(m-(K-1)/2)。
? ?? ???麥克風采集的是數(shù)字信號,設采樣周期為T,則對時域離散的信號來說,時延為D = τ/T。
? ?? ???通常D不是一個整數(shù),而對離散信號來說,整數(shù)時延才有意義。對于非整數(shù)D,可以分解為整數(shù)部分和分數(shù)部分D = ?D? + d,式中,?D?為D的向下取整,0≤d<1。對于非零的分數(shù)部分d,此時信號實際值介于兩個相鄰采樣點之間,即分數(shù)延遲。在實際處理中,可對d四舍五入取整,然后加上?D?,得到近似整數(shù)時延,但這種方法處理的結果不夠精確。
? ?? ???為了得到較為精確的處理結果,就必須設計分數(shù)時延濾波器,對采樣信號進行精確的時延補償。理想的分數(shù)時延濾波器的沖激響應可表示為hid(m) = sinc(m-D)。
? ?? ???由數(shù)字信號處理知識可知,上式是無限長、非因果不穩(wěn)定的,在物理上不可實現(xiàn)。為了解決這一問題,在實際操作中,通常會對上式進行加窗,加窗后濾波器的沖激響應為
h(m)=(W(m-D)sinc(m-D), 0≤m≤M-1。加窗后的分數(shù)時延濾波器的時延精確程度與理想分數(shù)時延濾波器非常接近
評論
查看更多