艾炎

語音是人類進行交流溝通最主要的方式之一,他能方便快捷的承載這巨大的信息。隨著社會的迅速發展,進入了高度信息化,語音也室作為重要的信息載體之一,語音數據處理的整個過程可以分為兩個部分:A/D轉換,即把原始聲音的模擬輸入轉化為數字化信息;D/A轉換,即把數字信息轉化為模擬數據。他的傳送、存儲、識別、合成和增強室現代信息數字化中非常重要、基礎的組成部分之一。而現在人工智能技術的發展,尤其是自然語言處理技術的高速發展,語音處理已經成為現在智能家居、交通、辦公、通信等新興領域中的核心技術之一。尤其像現在線上教育、云會議等方式的流行,語音信號處理是一個非常具有價值及必要的研究技術。
麥克風陣列(Microphone Array),從字面上,指的是麥克風的排列。也就是說由一定數目的聲學傳感器(一般是麥克風)組成,用來對聲場的空間特性進行采樣并處理的系統。麥克風按照指定要求排列后,加上相應的算法(排列+算法)就可以解決很多房間聲學問題,比如聲源定位、去混響、語音增強、盲源分離等。語音增強是指當語音信號被各種各樣的噪聲(包括語音)干擾甚至淹沒后,從含噪聲的語音信號中提取出純凈語音的過程。聲源定位技術是指使用麥克風陣列來計算目標說話人的角度和距離,從而實現對目標說話人的跟蹤以及后續的語音定向拾取,是人機交互、音視頻會議等領域非常重要的前處理技術。去混響技術能很好的對房間的混響情況進行自適應的估計,從而很好的進行純凈信號的還原,顯著的提升了語音聽感和識別效果。聲源信號的提取就是從多個聲音信號中提取出目標信號,聲源信號分離技術則是將需要將多個混合聲音全部提取出來。
近場模型和遠場模型
根據聲源和麥克風陣列距離的遠近,可將聲場模型分為兩種:近場模型和遠場模型。近場模型將聲波看成球面波,它考慮麥克風陣元接收信號間的幅度差;遠場模型則將聲波看成平面波,它忽略各陣元接收信號間的幅度差,近似認為各接收信號之間是簡單的時延關系。顯然遠場模型是對實際模型的簡化,極大地簡化了處理難度。一般語音增強方法就是基于遠場模型。
近場模型和遠場模型的劃分沒有絕對的標準,一般認為聲源離麥克風陣列中心參考點的距離遠大于信號波長時為遠場;反之,則為近場。設均勻線性陣列相鄰陣元之間的距離(又稱陣列孔徑)為d,聲源最高頻率語音的波長(即聲源的最小波長)為λmin,如果聲源到陣列中心的距離大于2d2/λmin,為遠場模型,否則為近場模型,示意圖如下圖1所示。
麥克風陣列的拓撲結構
麥克風陣列的拓撲結構可以分為線性拓撲、平面拓撲,還有三維拓撲,如下圖2麥克風的三種拓撲結構,其中線性陣列的結構簡單、容易分析、算法復雜度相對較低,但是他的估計有效性估計是一維的,只能定位信號源的方向角度。平面陣列中常見的是均勻圓陣,如下圖3京東公司推出的叮咚mini的就是4顆麥克風均勻按圓形排列。
圖3京東叮咚mini的麥克風均勻圓陣
定位原理
TDOA定位是一種利用時間差進行定位的方法。通過測量信號到達監測站的時間,可以確定信號源的距離。利用信號源到各個監測站的距離(以監測站為中心,距離為半徑作圓),就能確定信號的位置。但是絕對時間一般比較難測量,通過比較信號到達各個監測站的絕對時間差,就能作出以監測站為焦點,距離差為長軸的雙曲線,雙曲線的交點就是信號的位置。
假設測得聲源到第n個麥克風接收到聲源所發出的聲音信號的時刻分別為ti(i=1,2,3,4...n),且假設標簽到第n個基站的距離為ri(i=1,2,3,4...n)如下圖4聲源到麥克風的傳輸示意圖。
.
在基站之間完全同步的情況下,得出定位標簽相對于四組定位基站(假設1#、2#為第一組,2#、3#為第二組,3#、4#為第三組,4#、1#為第四組)的距離差di12~di14為:
假設空間布有N個基站,同時利用多個TDOA 測量值可以構成關于標簽位置的雙曲線方程組,求解此方程組即可得到標簽坐標。
TDOA估值進行聲源定位,三顆麥克風陣列可以確定空間聲源位置,增加麥克風會增高數據精度。定位的方法有MLE最大似然估計,最小方差,球形差值和線性相交等,TDOA相對來講應用廣泛,定位精度高,且計算量最小,實時性好,可用于實時跟蹤,在目前大部分的智能定位產品中均采用TDOA技術作為定位技術。
廣州大學華軟軟件學院省級“創新強校工程”科研項目《基于人工智能的自然語言交互設備研究》(2017KQNCX274)
參考文獻:
[1]張芳.基于STM32的麥克風陣列聲源定位系統研究[D].河北:燕山大學,2014.
[2]鄧承韻.基于麥克風陣列的語音分離算法研究[D].北京:北京郵電大學,2019.
[3]高健; 陸陽; 李慶巧; 衛星.采用三次通信的TOF與TDOA聯合定位算法[D].安徽:電子測量與儀器學報,2020.
[4]郝張紅; 段羽浩; 韓彬彬.基于TDOA的聲源定位算法研究及實現[D].安徽:信息系統工程,2020.
[5]高健;陸陽;李慶巧;衛星.基于UWB技術的無人機室內飛行測試平臺設計[D].湖南:傳感器與微系統,2019.