林彬
【摘要】科技的發展日新月異,4G、5G技術的日漸成熟催生了相關行業領域的科技創新發展,對于麥克風信號領域通信傳輸的要求也在增加,人們對高品質高穩定的通信陣列信號處理需求也更加強烈,對語音信號處理需求也增大。本文通過介紹基于單片機的麥克風陣列時延估計系統,細致分析了單片機設計方案及麥克風選型及陣列設計,了解到單片機能夠非實時地計算出實驗中的陣列系統時延,幫助復雜的麥克風陣列時延估計實時性的研究,可實現對麥克風陣列聲源定位等理論知識研究應用分析。
【關鍵詞】麥克風;陣列;時延;單片機;語音信號
中圖分類號:G212? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? DOI:10.12246/j.issn.1673-0348.2023.09.067
1. 麥克風陣列
麥克風陣列是由一定數目的聲學傳感器(麥克風)按照一定規則排列的多麥克風系統。而聲源定位,是指運用麥克風拾取聲音信號,再通過對麥克風陣列信號的分析與處理,得到一個或者多個聲源的位置信息定位聲源位置。麥克風陣列系統的聲源定位技術研究意義在于:當輸入的信息只有兩個方向,難以確定聲源的位置。人類的聽覺系統是個兩個傳感器的拾音系統,原則上,任意兩個傳感器的拾音定位系統只能定位在一個平面上聲源的位置距離,但無法知道聲音是從前面還是后面任何相同距離的聲源傳來的。人耳取決于頭和外耳氣壓差聲波實現聲源定位。一個傳感器定位系統對三維空間里某個聲源進行定位,需要最少三個傳感器來定義聲源在三維空間中的坐標。麥克風的數量越多,所接收到的信息量也越多,聲源的精確定位也變成可能。
麥克風陣列的聲源定位技術首先是對聲音信號進行采樣,再通過麥克風陣列對信號進行處理,得到聲源到達陣列的波達方向,從而定位聲源的位置信息。隨著技術創新與發展,基于麥克風陣列的聲源定位技術已經形成了比較成熟的理論基礎。但對于其聲源定位方法可以分為基于到達時延估計算法、基于最大輸出功率的可控波束形成算法和高分辨率譜估計算法三種計算方法。但人們常用的聲源定位信號處理方法是基于時延的定位算法,因為這種算法定位精度高,所以被廣泛使用。
2. 關于聲源定位
目前基于麥克風陣列的聲源定位方法主要有三種:基于最大輸出功率的可控波束成形和基于高分辨譜估計以及基于到達時延差估計的定位方法。首先波束形成法的原理是將麥克風接收到的信號進行濾波加權求和來形成波束,再按照特定的規律對聲源位置進行搜索定位,最終得到麥克風最大輸出功率時,即為真實的聲源方位。而基于高分辨率譜估計的定位方法適合多個聲源的情況下,是通過分解協方差矩陣估計聲源方位,突破了物理限制,模糊了聲源的分辨率與陣列尺寸之間的關系。優點是在特定條件下可以實現任意程度的聲源定位,并且不受采樣頻率限制。但是計算系統比較復雜,抗噪和抗混響性能較差,因此該方法對環境要求比較高。基于到達時延差估計的定位方法可以拓展到寬帶處理模式,但是對數據誤差十分敏感,通常適合遠場模型,且矩陣的運算量巨大,必須運用麥克風陣列克服,充分利用每個麥克風信號之間的數據相關性,加以融合來實現聲源定位。
對于語音信號處理的發生過程,先是增強單個麥克風信號的語音信號,提高信噪比。然后,為了應對聲學環境的復雜性特點,人們接著實現了多麥克風按照一定的空間位置排列的麥克風陣列信號處理。同時需要對麥克風陣列進行處理,去掉干擾信號,減少雜音的影響,從而增強語音信號。
麥克風陣列處理技術為麥克風系統提供了更好的穩定性,是語音信號增強及處理的重要部分。陣列處理方法通常包括固定波速形成算法和自適應波速形成算法兩種。波速形成對空間噪聲有更好的抑制效果,逐漸成為陣列信號處理的主流,其中自適應波速形成算法中的時延估計成為陣列處理中的重要一環。雖然時延估計的算法很多,但是能夠實際應用的卻很少,這就歸結于研究人員的研究方向和實際使用效果。除去波速形成算法外,對于麥克風處理技術還有多種關鍵技術,比如:混響消除是為了降低聲波的多次反射和吸收,提高聲音的真實效果;回聲消除是為了更真實地保留外界聲響,消除設備本身反射聲響;陣列增益為了解決拾音距離問題,抑制噪音增強設備聲響。
3. 單片機麥克風
單片機(Single-Chip Microcomputer)是一種集成電路芯片,它采用超大規模集成電路技術把各種電子電路集成到一起,其中包括具有數據處理能力的中央處理器CPU、隨機存儲器RAM、只讀存儲器ROM、多種I/O口和中斷系統、定時器/計數器等功能(可能還包括顯示驅動電路、脈寬調制電路、模擬多路轉換器、A/D轉換器等電路)等,最終集成到一塊硅片上,從而構成的一個小而完善的微型計算機系統,并在工業控制、電子電器等領域中廣泛應用。從最早的4位、8位單片機,經過長期的發展直到現在的高速單片機,后續也許還會有集成更高、性能更高的單片機出現。
單片機采集麥克風的信號一般來說是不能直接采集的,要加一個外圍芯片,麥克風出來的信號一般來說是頻率信號,外圍芯片的作用就是把頻率信號轉換為電壓信號,再通過單片機的A/D口采集。還有另外一種方案是直接采集頻率信號,只能通過通信的方式,設置單片機的一個定時器時鐘為外部時鐘,麥克風的頻率信號連接這個時鐘引腳用自帶的晶振再設置一個定時器,通過定時器來判斷外部時鐘來了多少個周期來計算頻率,如果麥克風聲音頻率過高會造成信號失真,所以一般不采取這個方案。
4. 單片機設計方案
基于DS聲源定位和AT89C52單片機設計的麥克風陣列語音增強系統基于延遲疊加聲源定位的原理,提出了一個四通道語音增強的設計方案,這里將介紹硬件和軟件設計的原理,硬件設計包括單片機、數模轉換和模數轉換器、電路連接等等。設計采用了軟件和硬件相結合的方法循環緩沖區,為軟件實時運行提供可能性。
麥克風陣列廣泛應用于語言通信應用程序的時空過濾,比如汽車環境等的有效的語音處理。因此,麥克風陣列語音增強的技術已經成為語音增強處理的重點。空間濾波是一種基于麥克風陣列的信號采集的基本特征,在應用程序中扮演了一個重要的角色,比如語音增強和語音識別。有的專家設計了一個便宜的麥克風陣列實現了一個特定的語音增強技術,首先,介紹了聲源定位延遲疊加原理用于語音增強。其次,提出了語音增強系統的設計方案,包括硬件和軟件設計。硬件設計使用AT89C52單片機,ADS8515模數轉換器和DAC8820數模轉換器等。
波束形成是根據所需信號的位置,從噪聲和干擾區分空間濾波的方法。波束形成技術是DS聲源定位實現定向陣列系統的最簡單和最古老的技術。由于有帶寬,因此大部分麥克風陣列語音采集的實現為DS聲源定位。DS聲源定位已經廣泛的應用于測量,聲源定位,DOA估計,免提語音應用程序等等。DS聲源定位是通過適當補償信號延遲到每個麥克風之前結合使用一個加法運算,這延遲信號求和的結果是一個加強版的期望信號從不同的渠道減少噪音。
5. 麥克風選型與陣列設計
對于聲源定位系統來講,麥克風陣列是最前端設備,麥克風陣列的性能優劣直接影響聲源定位的精準度。因此對麥克風的選型及陣列的設計非常重要,關系著整體系統的最終效果,在對聲源定位系統設計之前必須作好麥克風陣列性能的設計預判,選擇合適的麥克風類型。
麥克風的種類繁多,可以根據結構造型分為動圈式、電容式、壓電式等;還可以根據適用方式分為有線和無線;根據接受聲波方向分為定向麥克風和全向麥克風。對于聲源定位系統中常用的麥克風就是動圈式和電容式兩種。
動圈式麥克風常應用于演出現場、音視頻娛樂場所等,而電容式麥克風則應用于消費電子領域。但在聲源定位系統中,人們綜合考慮常用電容式麥克風作為首選。
電容式麥克風主要包括駐極體麥克風和微型機電系統麥克風,而微型機電系統麥克風有相對的優勢就是功耗低、成本低、穩定性好。因此常用來構成麥克風陣列系統。而對于聲源定位系統來講,還需要對麥克風性能參數做出具體的要求,選定合適型號的麥克風,具體要求為:
⑴為了適應環境的需求需要接收到各個方位的聲音,并去除單向麥克風帶來的聲學問題,定位系統一般選取全指向性麥克風;
⑵為了對不同信號更好地接收,對麥克風的靈敏度的選擇居中為宜,過高或者過低的靈敏度都會影響聲音信號的接收;
⑶為了對頻率響應范圍的最大化接受,應該根據環境和接受聲音的頻響范圍做設定,選擇合適的頻響功率,比如人聲頻率響應范圍應該在200Hz~10kHz左右;
⑷對于麥克風輸出阻抗的選擇也應該適中,過高過低都會影響,或者阻抗噪聲能力差,或者麥克風靈敏度偏低。
同時聲源定位技術在助聽器行業、軍事國防領域、智能機器人等系統也有廣泛的應用。但隨著社會發展的需求,電子設備向多樣化、小型化發展,對于聲源定位技術來說,如何構建結構簡單、低成本、高精度的小型定位系統,是今后需要重點關注的方向。由于基于到達時延估計的雙步定位法的特殊算法問題,在大型聲源定位系統中已經廣泛應用,但是對于小型聲源定位系統來說,這種算法就相對復雜化了,限制了其推廣應用。因此還需要尋找多種算法對應不同的環境需求。對于各種條件下的麥克風陣列聲源定位系統的研究,就需要相關人員更多的努力。目前對于麥克風陣列聲源定位系統,部分專家已經能夠使其在8位單片機中實現。
關于算法的研究中,有的研究人員首先針對基于時延估計的聲源定位,介紹了時延估計算法的基本原理,給出了各個算法本身的優缺點。其次,通過GCC方法利用頻域加權函數對信號進行濾波,但是如果再運用8位單片機實現時,會受到容量限制,難以實現理想效果。因此可以針對特定音頻信號的時延估計,可以設計一種結合匹配濾波與互相關的時延估計方法。再根據8位單片機的硬件條件限制要求,對時延估計進行了優化設計,合理匹配存儲量和計算量的實際需求。再次,以單片機作為硬件平臺基礎,基于8位單片機的硬件要求,設計一種聲音識別與測向功能的控制器,用于麥克風陣列接收聲音信號的控制單元,通過8位單片機來對聲音進行檢測、前后識別、模式識別,以及測向系統的時延估計,最終設計成為結合匹配濾波與互相關的時延估計算法。最后,根據實際環境需求對控制器進行測試調試,得出實驗結果。明確顯示該設計系統算法具有更高的實時性和抗噪聲性能,并且簡單化、運算量小,可以運用到實時定位系統中。
6. 結束語
本文通過對聲源定位系統的介紹以及單片機硬件的設計的分析,解釋了一部分關于聲源定位系統的時延算法,在單片機內直接把兩路語音信號的時延差非實時的求出。有的專家在一定程度上已經設計出無論是從需求還是運算量或者速度上都可以完美呈現效果的聲源定位系統,這就為后續的實時時延算法的設計提供了參考,也更方便完善復雜的陣列信號處理。隨著互聯網技術的發展與實際行業的融合,陣列信號定位系統正在向多樣化、多媒體化以及多業務融合方向發展。單片機正從以傳統單片機向多位單片機發展,同時多媒體信息業務也趨向轉變,增值業務種類增加。網絡架構呈分層趨勢,規范的能力層接口使越來越多的業務開發者無須深刻了解這種技術便能從事聲源系統的開發,所有這些變化都將導致單片機的類型和數量呈幾何級數增長。把麥克風利用到單片機上正是在此背景下提出的,同時概念性運行環境也是一種顛覆傳統業務平臺的建設模式,屬于完全不同的創新性建設模式。通過對麥克風的關鍵影響因素進行研究分析,為麥克風在單片機上的應用找到理論依據和技術創新方式,提高麥克風陣列系統工作效率,簡化聲源定位系統維護管理工作,實現聲源定位系統的廣泛應用,為國家新時代建設提供技術支持。
參考文獻:
[1]李樹德,黃頌,劉彩霞,柳佳.基于TC264單片機的智能無人小車設計[J].桂林航天工業學院學報,2021,26(04):435-440.
[2]郭龍霞.一種基于互相關算法的二維聲源定位系統[J].中國科技信息,2021(12):98-99.
[3]吉愛國,劉偉平,劉志強,劉棟,宋傳旺.麥克風陣列近場聲源定位與跟蹤系統[J].信息記錄材料,2019,20(07):149-152.
[4]王宇威,雍洋,孫新.基于麥克風陣列的聲源跟蹤系統[J].電子產品世界,2018,25(12):48-51.
[5]支艷利,張云偉.基于環形麥克風陣列的遠場語音識別系統[J].微型電腦應用,2017,33(04):62-64,73.