鄭毅豪, 鞏朋成,2, 杜幫華, 張正文
(1 湖北工業大學電氣與電子工程學院, 湖北 武漢 430068; 2 電子科技大學信息與通信工程學院, 四川 成都 611731)
麥克風陣列波束形成源于雷達陣列波束形成的思想,是多通道語音增強研究中的重要方法,在人機語音交互系統、助聽器、車載免提語音通信、遠程電視會議系統及機器人聽覺等領域具有廣泛應用[1]。波束形成器是一種空間濾波器,其主要功能是對特定方向的有用信號形成波束,同時抑制其他方向的干擾信號和噪聲[2]。
傳統的波束形成技術包括延遲—求和波束形成((Delay and Sum Beamforming, DSB),最小方差無失真響應(Minimum Variance Distortionless Response, MVDR)波束形成,廣義旁瓣抵消(Generalized Sidelobe Canceller, GSC)算法等[3]。DSB算法首先對信號到達各個麥克風間的時間延遲進行估計[3-4],然后對不同通道信號進行時延補償,使得各通道在目標語音方向上達到同步,最后對各通道進行加權平均得到系統的輸出。MVDR算法在保證目標方向語音信號不變的前提下,使得陣列的輸出總功率達到最小。文獻[5]提出了用于噪聲環境中自動語音識別的魯棒性MVDR波束形成算法,利用基于混合高斯模型的語音幅度譜求得的方向向量進而構建MVDR波束形成器。GSC算法由固定波束形成器、阻塞矩陣和自適應噪聲消除模塊三大部分組成:固定波束形成器用于帶噪聲的語音信號的初步增強;阻塞矩陣用來產生噪聲參考信號;自適應噪聲消除器利用阻塞矩陣產生的參考噪聲信號來消除波束形成器輸出信號中的殘留噪聲[6-7]。文獻[8]提出了基于傳遞函數的廣義旁瓣抵消算法(TF-GSC),該算法通過估計聲學傳遞函數的相對比值來構建波束形成器和阻塞矩陣,在方向性噪聲場景下可以取得不錯的效果,但在非方向性噪聲如擴散噪聲場下算法性能會下降。在麥克風陣列中實現上述算法功能需要較多的陣元,但在一些諸如手機、助聽器之類的小型設備中不能使用大量的麥克風。
差分陣列(Differential Microphone Arrays,DMA)是利用相鄰陣元的聲壓差實現波束形成,因此并不需要大量的陣元,且DMA具有頻率不變特性、在相同的陣元數下可以獲得最大的指向性和方向性,靈活多變的特點受到了廣泛的關注。1995年G. W. Elko與A. T. N. Pong提出了一階差分麥克分陣列技術(First-order Differential Microphone Arrays),利用兩個小間距麥克風在噪聲方向形成波束零點[9]。傳統的差分陣列設計方法雖然簡便,但是針對不同波束模式的構建缺乏靈活性。對此,Benesty等人提出了在短時傅里葉變換域設計差分陣列的新方法[11]。2002年Luo等人在一階差分陣列的基礎上,提出了自適應零限(Adaptive Null-Forming)波束形成技術[12],使得系統輸出的波束零點自適應對準噪聲方向。DMA常常因為空間白噪聲而引起信噪比(SNR)異常,在DMA中把這種現象叫做白噪增益(WNG),用它反映DMA處理噪聲的能力,通過改變WNG的值,進而改善系統的穩定性。
傳統的差分麥克風陣列是由多級級聯方式實現的,每一級是通過取相鄰陣元采集信號的時間差異性而得到相應的波束,這樣設計的差分麥克風陣列結構復雜,而導致陣列的魯棒性降低[10]。文獻[13]提出了一種線性DMA的設計方法,將麥克風陣列信號轉換為短時傅里葉變換(STFT)域,然后將DMA波束形成設計轉化為簡單的線性系統求解,該方法有較靈活的獲得指定方向上的方向圖,但是發現DMA的低階輸出模式在低頻信號時有WNG的異常問題。文獻[14]設計一種基于均方誤差(MSN)準則的非對稱的n階DMA模型,該方法可降低白噪聲對陣列波束圖的影響。文獻[15]提出了一種平面約束的魯棒超定向波束形成器,將整個波束形成器分成兩個子波束形成器,并將兩個子波束形成器進行卷積設計出一種較低的指向性的波束圖。
本文提出一種基于圓形差分陣列的二階段波束形成器的設計,以解決DMA在二階輸出后白噪異常問題。該方案的特點是第一階段與傳統的差分麥克風陣列一階響應相同,第二階段通過引入白噪系數,獲得最大的WNG方法構造的波束形成器,該方法不僅能夠保持傳統差分陣列頻率不變的特性,而且解決了低頻信號WNG異常導致陣列性能降低的問題,同時提高了差分麥克風陣列的陣增益。
本文考慮遠場條件下的均勻圓形麥克風陣列模型。假設均勻圓形麥克風陣列的中心位于坐標系統的中心處,第1個陣元位于x軸上(圖1)。

圖 1 遠場均勻圓形麥克風陣列模型
根據圖1,假設遠場信號到陣列的方位角為θr,則在遠場條件下,信號到達第m個陣元與陣列中心之間的時間差為

Ym(ω)=Xm(ω)+Vm(ω)=
ejωcos(θr-θm)X(ω)+Vm(ω),
m=1,…,M
(1)

根據式(1),M個麥克風陣列采集到的信號表示成向量形式為:
y(ω)=[Y1(ω),Y2(ω),…,YM(ω)]T=
d(ω,cosθr)X(ω)+V(ω)
其中,(·)T表示轉置,d(ω,cosθ)表示信號到達陣列的方向導向矢量,在遠場條件下,其值為:

(2)
本文考慮在麥克風陣列中通過設計濾波器系數h(ω)以提高信噪比(SNR),達到降低噪聲的目的。假設M個陣列接收到的信號經過濾波器為:
h(ω)=[H1(ω),H2(ω),…,HM(ω)]T
(3)
其中,Hm(ω)為第m個陣元的濾波器系數。因此,在期望方向θ處的波束方向圖可表示為:

(4)
本文考慮利用陣列的輸入信噪比(iSNR)和輸出信噪比(oSNR)的比值表示SNR。iSNR和oSNR可分別定義為
(5)

(6)


(7)
由式(4)可知,通過設計濾波器可以提高陣列的SNR,抑制噪聲信號,增強輸出的語音信號,因此,要求式(4)的值應該遠大于1;若式(4)的值小于1,表明輸出信噪比小于輸入信噪比時,表明系統的噪聲系數大,需要對其進行抑制。本文考慮引入白噪增益指標來判定陣列的SNR能力。
根據文獻[13],如果噪聲在時間域和空間域上都是白噪聲,則Γv=IM,其中IM為單位矩陣。此時,SNR增益稱為白噪增益,其定義為:
(8)
本文考慮在研究均勻圓形麥克風陣列的基礎上,提出一種基于二階差分圓形麥克風陣列進行白噪增益最大化的設計方法,該方法首先引入二階差分麥克風陣列到均勻圓形麥克風陣列中,接著通過設計濾波器系數,使得白噪增益最大化。
L階輸出的DMA陣列如圖2所示,陣列以級聯的方式輸出,第一階輸出為兩個相鄰陣元相減得到,第二階輸出為兩個相鄰的第一階輸出相減得到,同理得到第L階輸出是由兩個相鄰的第L-1階輸出相減得到。在DMA中,陣元數決定了陣列的輸出階數,故M個陣元可以得到L=M-1階輸出。

圖 2 DMA輸出框圖
根據圖2,結合式(2),假設DMA中各級級聯的濾波器系數為hDMA(ω):
hDMA(ω)= [H1(1)(ω),H2(2)(ω),…,HM(L)(ω)]
(9)
結合式(3)與式(6),可得DMA陣列在期望方向θ處的波束方向圖可表示為:

(10)
為了得到DMA在期望方向θ上L階的頻率不變的方向圖輸出,可以把式(7)改寫為:
(11)
其中,αL,l,l=1,2,…,L表示DMA的第L階輸出模式上加入空值的個數 ,αL,l的取值不同DMA會產生不同的輸出波束模式如:心形、超心形和超指向性心形等。根據文獻[10],DMA期望方向θ上的值為
BL(θ)=cosθ

根據式(8),L階DMA在任何模式下的期望方向上至多具有L個空值,由于cosθ是一個偶函數,因此在極坐標系下波束圖是關于x軸對稱,可以只考慮期望角度θ∈[0,1800]。因此把圓形陣列的白噪增益引入到DMA中,根據式(5)可以得到DMA經過L階級聯后,陣列的白噪增益可表示為:
(12)
由式(9)可知,DMA中陣列白噪增益受信號頻率的影響,當陣列接收的信號頻率較低時,系統的WNG也隨之降低。為了使差分陣列獲得最大的白噪增益,從而提高陣列輸出SNR,研究了以下兩種設計方法:
首先,本文考慮DMA指向期望方向θ,且最大化WNG的L階DMA波束圖設計,其數學上可表示為:

(13)
其中,α=[cosθ,αL,l,…,αL,L]和D(ω,α)表示DMA陣列的方向導向向量矩陣,其可表示為:
(14)
根據文獻[17],采取最小范數求解式(10)得到的權值函數hMWNG:
hMWNG=DH(ω,α)[D(ω,α)DH(ω,α)]-1α
(15)
當DMA高階輸出(即L>3)時,加入的空值比較多,即使DMA接收的信號頻信號較低,波束方向圖的效果仍然較好。但當L≤2時,DMA輸入的空值比較少,此時如果DMA接收到低頻信號時,則波束方向圖的效果很不理想。

hMWNG1(ω)=h′DMA(ω)h″MWNG(ω)
(16)
假設DMA陣列始終在無失真的條件下,因此滿足如下的關系:
dH(ω,cosθ)h′DMA(ω)h″MWNG(ω)=1
(17)


(18)
于是,在最大化WNG時,且使期望方向θ在無失真條件下的優化模型可表示為:

(19)

由式(19)求解出DMA的二階段濾波器的第二階輸出的權值函數為:

(20)
聯合式(18)與式(20),基于最大化白噪增益的二階段濾波器的波束響應為:

(21)

選取半徑分別為r=1 cm和r=4 cm,陣元為M=4的均勻圓形DMA,期望方向θ=00,DMA二階輸出在該方向上加入2個空值。比較采用最小范數的方法求解的DMA權值向量hMWNG和基于最大白噪增益在兩階濾波的方法求解的DMA權值向量hMWNG1。在仿真中,DMA和MWNG分別表示DMA的權值向量函數為hMWNG和hMWNG1的波束形成器。分別比較兩種不同的方法獲得DMA的權值向量的WNG和期望波束方向圖。
圖3給出了陣元為M=4的均勻圓形DMA半徑r=1 cm和r=4 cm在不同信號頻率下的陣列的白噪增益結果圖。
由圖3可知,權值向量函數hMWNG的DMA在f=1.4 kHz是陣列白噪聲增益異常,而本文設計的最大白噪增益異常點在f=0.3 kHz。通過比較,本方法設計的波束形成器可以提高陣列在處理低頻信號的能力,增大了陣列在低頻信號處理的穩健性。且本文設計的波束形成器在其他采樣頻率上的白噪增益遠大于權值向量函數hMWNG的DMA,因此本文設計的波束形成在白噪增益上性能更好。

圖 3 陣列白噪增益
圖4、圖6、圖8和圖10半徑r=1 cm 信號頻率分別為:0.8 kHz、2 kHz、4 kHz和7 kHz下的期望方向均在0°方向上波束方向圖。
圖5、圖7、圖9和圖11半徑r=3 cm信號頻率分別為:0.8 kHz、2 kHz、4 kHz和7 kHz下的期望方向均在0°方向上波束方向圖。

圖 4 r=1 cm,f=0.8 kHz的波束圖

圖 5 r=4 cm,f=0.8 kHz的波束

圖 6 r=1 cm,f=2 kHz的波束圖

圖 7 r=4 cm,f=2 kHz的波束圖

圖 8 r=1 cm,f=4 kHz的波束圖

圖 9 r=4 cm,f=4 kHz的波束圖

圖10 r=1 cm, f=6 kHz的波束圖

圖11 r=4 cm,f=6 kHz的波束圖
由仿真圖可以看出,本文MWNG波束形成器在采樣頻率低時依舊有效,而DMA波束形成器在采樣頻率低時隨著白噪增益的異常而波束方向圖失真,在仿真圖可以看出,采用DMA波束形成的方法得到的波束圖不能夠保證頻率不變的特性,波束圖在各個采樣頻率上有少許變化,而采用MWNG的方法的波束形成器得到的波束方向圖保持了頻率不變的特性,MWNG的波束形成的主瓣遠比DMA波束形成大,因此陣列的信噪比增益遠大于DMA波束形成器。仿真圖表明在陣元間距變大時,波束形成器處理信號的能力都會變差,通過比較最大白噪增益的波束形成器的適應能力遠大于傳統DMA波束形成器。
在差分麥克風陣列中,常常會因為信號采樣頻率低,而造成陣列的白噪增益異常的問題,進而影響陣列性能的現象,本文提出了一種基于最大白噪增益的波束形成器,通過仿真結果,得到如下結論:
1)通過本文的方法可以較好改變白噪增益在信號采樣頻率低異常的問題,提高了陣列的工作頻率范圍,同時增大了陣列的信噪比。
2)本文方法實現了頻率不變的方向圖輸出,本文的頻率不變方向圖的范圍提高了約1 kHz。
3)相較于采用最小范數求解權值向量的方法的DMA,本文方法提高了陣列波束圖的主瓣級,降低了旁瓣區域,從而提高了陣列的性能,增加了陣列處理信號的能力。本文方法僅改變陣列輸出模式,并沒有從結構上改變差分麥克風陣列,此方法設計波束形成器容易實現,具有較好的經濟利用價值。