董曉紅 康平



摘?要:聲源定位技術是當今人們研究的熱門問題,廣泛應用于醫療、交通、雷達、遠程會議、航天、機器人等先進領域。其原理是通過麥克風來獲取語音信號,分析并處理數字信號,來確定聲源的位置。本文用麥克風樹時延估計聲源定位法確定聲源的位置。先介紹麥克風樹的原理,按照麥克風樹離聲源的遠近,將模型分類。
關鍵詞:麥克風樹;近場模型;遠場模型
1 問題分析
語音信號通過麥克風拾取,然后通過數字信號處理技術把拾取出的語言信號進行處理和分析,來確定聲源的位置。通常使用單個麥克風來識取,但其拾音范圍很有限,拾取信號的效果不是很好,如果我們把若干(≥1)只同樣型號的麥克風固定安裝在一個剛性的枝形架子上(可水平移動),組成一個麥克風樹,不同的麥克風所處位置的不同,錄制到的聲音也有細微的不同,進而通過對數個麥克風識取的聲音進行對比分析,得到許多有關聲源的信息,就可以確定聲源的位置。
2 問題的求解
2.1 麥克風樹語音信號處理模型概述
將一組不同位置的聲學傳感器(麥克風),按一定規則或形狀,排成一個陣列,采集聲音的空間特性叫做麥克風樹。
用來采集聲音信號,來獲取聲源的位置信息。按照麥克風樹離聲源的遠近,將模型分類,通常分為進場和遠場。
聲波由發聲體(聲源)產生振動,借助空氣等各種介質向四面八方傳播,是一種縱波。也屬于是球面波。
根據麥克風樹距聲源的不同,將聲場模型分為兩類:近場和遠場。近場模型將聲波歸類為球面波,因此需要考慮不同陣元間的相位差;而另一種遠場模型,則是把聲波發出的近似為平面波,相反的是不考慮麥克風不同陣元間接收信號時產生的相位差,而把不同陣元接收信號看成時延關系。因此遠場模型可看做被簡化的實際模型,這樣就可以最大限度的簡化處理不同信號的難度,一些語音增強法就是在此基礎上產生的。
一般來說遠場模型,即麥克風樹距聲源較遠,聲源傳導至麥克風樹各不同陣元件的幅度差較小,可以不做考慮,看做平面波模型;近場模型,即麥克風樹距聲源的較近,不同陣元間接收信號時產生的幅度差無法忽略,此時看作球面波模型。
遠場模式和遠場近場通常使用下面這個公式對近場遠場進行區別:
r是參考陣元與聲源距離,λ為聲波波長,L為陣列長度。在現實運用時,式中的r與參考陣元與聲源距離r0相比,確定近遠場:若r0
2.2 近場模型的實際運用
假設本次模型試驗對象處于近場位,和遠場位有所不同的是,近場位模型需要考慮到聲音發出的位置與每個麥克風之間的相位差,聲音發出位置和各個麥克風的距離不再是等距,定位的空間從原來的一維拓展的二維。聲音發出位置到每個麥克風的聲波幅度減弱也相當重要,不可被忽略。根據聲波傳播特性可以知道:聲波隨著傳播距離的增高,聲波的聲壓也會隨之降低,故聲波傳播距離與其幅度的變化成反比。
圖2引入了任意一個發聲源Si(t)和各個麥克風的距離的參數rji,以陣列中心為參照點,Si(t)到參照點的距離為ri其他的參照數與圖2一樣,只要將rji求出,便可以得到型號傳輸方向矢量A,因此得出一個結構關系式圖1:
近場的均勻線陣接收到的信號可以如圖2:
在這條假設中使用的近場均勻線陣模型用時延估計法是無法研究,所以這條近場均勻線陣模型不在繼續進行研究。
2.3 求解遠場模型
若聲源處于遠場,則麥克風樹成直線排列,且每個麥克風間隔為半個信號波長。通常來講,語言信號的頻率往往在101~3401HZ間,在空氣中傳播的波長一般都在100~340cm,由此可得,每個麥克風的距離一般在6~15cm之間。
因為遠場模型中麥克風收集到的聲波為平面波,所以每個麥克風接受到的信號相對相位相同。聲源s(θ,r),麥克風接受到的信號與信號的入射角和信號的頻率都有關系,因此遠場模型還能表示為均勻線陣:
在該式中,ω為角頻率,公式中的τji是第i個信號傳導第j個麥克風,與第i個信號傳導第1個麥克風達的延時參數。τji可表示為:
假設知道在該模型中聲音在空氣中的傳播速度為v,時延TDOA為s,因此l=s*v,根據這些從而求出θ2=arcsin*l/2d,θ1=π/2-θ2。可確定該模型中發聲源人的位置,并用廣義互相關時延估計算法算出。
該方法的陣列由兩個麥克風構成,并接收信號,可列函數為:
2.4 麥克風聲源定位的研究與設計
流程設計。本文算法簡易,計算量小,應用廣泛。廣義互相關函數的原理是:首先是求出x1(w)和x2(w)之間的互功率譜函數,通過一些考慮權重的計算,然后經傅里葉反變換法,變換到時域,這樣我們就能求出x1(w)和x2(w)的互相關函數,求出極大值,然后兩個極大值相減后的絕對值,求出兩組信號的時延。
廣義互相關時延的估計法相對其他時延估計法簡單很多,該方法方法先估計時延,再通過一簡單運算就即可確定聲源位置。本文的麥克風聲源定位是遠場定位在二維平面上實現的,只需要把聲源與麥克風樹的角度求出即可,然而這個角度需要測出兩個時延估計值,三維空間要求測出三個時延估計值,這里不做過多講解。本文研究二維只需要測量兩個獨立的時間延遲估計值。每個時間延遲估計值對應于一二個方程,把這些方程求出來就可以求出時延估計,所以進行麥克風樹聲源定位只需要求出時延估計,再進行一些數學計算,就可以確定聲源的位置。根據上面的描述,基于時延估的計算法的運算量比較小,在實際應用中很廣泛。
3 結論
本文研究的方法“遠場定位法”,以及“廣義互相關時延估計法”來確定聲源的位置。“遠場定位法”,只需測出聲音信號到達各個麥克風的時延(TDOA),然后完成簡單的數學公式推導即可。該方法計算量小,易于實現,實際應用性強。
參考文獻:
[1]吳俁.基于麥克風陣列的聲源定位技術的研究.百度文庫,2008-5-1.
[2]王君培.基于麥克風陣列的進場聲源定位與跟蹤.百度文庫,2014-6.
[3]孫韶杰,孫紹俊,李國輝,李紅梅.一種改進的聲測定位時延估計算法[J].計算機應用,2006,(11).
基金項目:內蒙古自治區教育科學“十三五規劃課題”數學建模推進高職院校數學課程教學改革的研究NZJGH2019159
作者簡介:董曉紅(1983—),女,內蒙古包頭人,理學碩士,講師,主要從事高等數學的教學與研究工作。