王威,安騰飛,歐建平
?
無人機被動音頻探測和識別技術研究
王威1,安騰飛1,歐建平2
(1. 長沙理工大學計算機與通信工程學院綜合交通運輸大數據智能處理湖南省重點實驗室,湖南長沙 410114; 2.國防科技大學電子科學與工程學院,湖南長沙 410073)
為解決近場空域低、慢、小旋翼無人機的安全威脅,提出基于音頻信號分析的無人機探測識別方法。該方法采用改進流程和參數的梅爾頻率倒譜系數(Mel-Frequency Cepstral Coeffi-cients, MFCC)和其一階差分作為無人機音頻的特征參數,結合提出的多距離分段采集法,通過訓練高斯混合模型(Gaussian Mixture Model, GMM),建立多特征的無人機音頻“指紋庫”,最后用特征匹配算法實現無人機的探測和識別。實驗結果表明,所提出的方法在典型郊區環境中可實現150 m距離內無人機的探測和識別,識別率達到84.4%。
無人機;探測和識別;梅爾頻率倒譜系數;高斯混合模型
2016年被稱為消費級無人機元年,無人機在各行業廣泛應用的同時也帶了很大的負面影響。近年來,國內外常報道無人機用于走私、恐怖襲擊、侵占航線、侵犯隱私等非法用途。湖北日報微信號2017年06月21日報道:據民航部分公布的數據,2015年,全國發生無人機干擾民航飛行事件4起,2016年則發生23起,2017年僅僅上半年已經發生超過40起。對于無人機的探測和監管已迫在眉睫,因此,對無人機的探測和識別也顯得尤為重要。
國內對于消費級無人機探測的研究較少,日本、法國、美國、俄羅斯等國家則已經相繼推出了無人機探測和反制系統。目前已有基于紅外、圖像、無線信號、音頻等技術來探測無人機的方法[1-4]。József Mezei等[5]利用互相關法證明了音頻探測無人機的可行性,文獻[6]在音頻信號處理方面,使用了基于距離的思想實現近距離無人機探測和識別。文獻[7-9]使用傳聲器陣列技術,基于波束形成及到達時間差 (Time Difference of Arrival,TDOA) 探測無人機,但只做到了大致的定向。
隨著語音識別方法的逐漸成熟,考慮到語音和無人機音頻的一些共性,很多專家和學者也嘗試著將一些語音識別的方法應用于無人機探測。C Asensio等[10]使用MFCC來分辨無人機聲音以及非無人機聲音,在近距離和信噪比較高的情況下,具有很好的識別率,但沒有考慮不同距離情況下無人機信號所表現的差異性。Louise Hauzenberger等[11]使用了線性預測系數(Linear Predictive Coefficient, LPC)結合短時過零率和短時能量的方法,可以在消音室環境下實現類型識別。Sungho Jeon等[12]針對特定條件下使用MFCC特征作為神經網絡輸入參數,達到了較好的識別率,但需要大量的環境模擬數據,訓練樣本是無人機信號和環境信號的人工混合信號,并要求無人機信號比環境峰值高出5%,雖然增加了訓練樣本量,但不能完全反映無人機飛行的真實環境狀況。
目前常用的音頻特征識別有隱馬爾科夫模型(Hidden Markov Model,HMM)、支持向量機模型(Support Vector Machine,SVM)以及高斯混合模型。本文結合無人機飛行特點和傳聲器實際響應距離,提出訓練數據采集法,改進流程,優化MFCC參數,最后使用GMM模型來實現對無人機音頻信號的檢測和識別。
以某型無人機為例進行特征分析。通過實際采集的時域信號可知,信號幅度隨著無人機的接近逐漸增大,隨著無人機的遠離而逐漸減小,如圖1(a)所示。
如圖1(b)所示,無人機時頻圖音頻信號主要集中在低頻部分,當無人機經過錄音設備正上方時其高頻成分明顯加強。隨著無人機相對距離的變化,其頻率呈現出一定的多普勒效應。
從圖1(c)可以看出,其頻率信號具有一定的倍頻關系。
通過分析多種類型的無人機音頻信號(無人機音頻噪聲)得知,無人機的音頻噪聲主要為氣動噪聲和機械噪聲。氣動噪聲主要來源于旋翼切割空氣及機體與空氣摩擦,該部分噪聲主要分布于聲音信號的低頻部分,在空氣中衰減慢,傳播距離較遠;機械噪聲則主要由電機以及傳動部件造成,該部分噪聲主要分布在信號的高頻部分,在空氣中衰減較快。
對于大多消費級無人機,高頻部分噪聲在距離地面50~80 m之后衰減很大,幾乎可以忽略不計,為了探測更遠距離的無人機音頻信號,本文重點研究無人機音頻信號低頻部分的探測和識別方法。
不同于武裝直升機的氣動噪聲頻率范圍(30~400 Hz)[13],本文通過大量數據分析得知,無人機的氣動噪聲頻率范圍主要在130~2 000 Hz之間。頻率范圍與無人機電機類型(有刷電機和無刷電機)、外形結構、旋翼個數、旋翼大小和長度、電機轉速等有關。

使用單傳聲器采集信號的情況下,遠距離飛行的無人機的多普勒效應和諧波現象不太明顯,旋翼個數對頻率的變化影響不大,這一特點對構建無人機音頻“指紋庫”具有一定的指導意義。
另外,不同飛行狀態下的無人機特點表現有所不同,而大多數文獻中分析的是懸停狀態下的無人機音頻信號,故在實際應用中效果并不理想。
本文提出的音頻信號探測和識別系統框圖如圖2所示。

圖2 無人機音頻探測和識別系統框圖
具體步驟如下:
(1) 預處理:對訓練數據和測試數據進行預處理,包括降噪、帶通濾波、分幀和加窗;
(2) 特征提取:提取無人機音頻的靜態特征和動態特征;
(3) 模型訓練:訓練數據的GMM模型,構建無人機音頻模板庫;
(4) 特征匹配:提取測試數據特征,通過特征匹配算法和無人機音頻模板庫進行匹配,得出識別結果。
在實際生活環境中,噪聲分布范圍較廣,對無人機的音頻信號具有全頻帶覆蓋的影響,由于無人機的音頻信號的低頻部分主要分布于130~2 000 Hz,因此,識別過程中先使用sym8小波對其進行三層分解,再選取200~1 800 Hz范圍的帶通濾波,濾除絕大部分高頻噪聲,最后對無人機音頻信號分幀,幀長為60 ms,幀移為30 ms,并選用漢寧窗減少頻譜泄漏。
Mel頻率能夠反映人耳對于不同頻率語音的感知能力,而Mel頻率倒譜系數(MFCC)利用了人耳聽覺原理和倒譜的相關特性,被廣泛應用于音頻相關的識別任務中。因此實驗采用MFCC作為無人機音頻信號的基本特征參數。
為了更好地體現無人機音頻信號特點,本文在傳統求取MFCC基礎上對流程進行改進,使用幅度譜代替能量譜,具體流程如圖3所示。

圖3 改進的求解MFCC特征流程圖


根據得出的無人機音頻信號特征,基于無人機飛行特點和傳聲器實際響應距離,本文提出多距離分段采集法。
在采集過程中,按照傳聲器實際響應距離采集無人機訓練數據,每種型號的無人機至少在三種距離條件下分別采集懸停狀態和飛行狀態的音頻數據,每個樣本的數據長度范圍30~50 s。三種距離分別是:
(1) 近距離樣本,采樣距離范圍為20~30 m;
(2) 半距離樣本,即按照傳聲器實際響應距離的一半采集;
(3) 2/3距離樣本。
訓練各種類型無人機的GMM模型參數的過程,也就是建立無人機音頻模板庫的過程。本文使用GMM模型來擬合無人機音頻特征數據。通過期望最大化(Expectation-Maximization,EM)[14]迭代算法迭代計算GMM模型中混合權重、每個高斯模型的均值和方差。如果高斯混合模型中高斯模型的個數過多則會出現“過擬合”現象,因此需選用合適的高斯模型個數。


將參數帶入后可得:

實驗軟件環境基于MATLAB8.0平臺實現,采用i7雙核2.5 GHz CPU、4 GB內存的普通筆記本電腦。所使用的音頻數據均采用DC-900拾音器配備音頻采集卡進行采集,采集地點在湖南省長沙市岳麓區,實驗數據來自于DJI2、DJI3、DJI4、MavicPro、FPV250、ProMark P70、DJIS1000和某型植保無人機共8種大小結構不同、型號各異、旋翼個數有所差別的市面上常用的消費級無人機。
訓練數據在樓頂相對安靜的條件下按照2.3節的設定要求進行采集,測試數據在公園環境下采集(在采集部分測試樣本期間有戰斗機轟鳴聲和強烈鳥鳴聲),以驗證系統對無人機的識別性能。每種類型無人機測試數據保存規則如表1所示。

表1 測試數據保存規則
測試數據的采集規則如表2所示,根據無人機型號和限制飛行高度的實際情況按照規則進行采集,為了更貼近實際情況,使實驗更具有代表性,具體的高度信息和飛行狀態均是大概估計。
測試數據采用不同環境條件下不同距離段和不同飛行狀態的無人機音頻數據,共采集到115個測試文件,總時間長度為65 min。為得出最小探測時間,本文把測試文件按照時間長度進行切分,再對切分后的文件進行識別。圖4為不同時間長度、不同高斯模型個數時系統的識別率。

表2 測試數據采集規則

圖4 不同時間長度和高斯模型個數條件下的識別率
由圖4可以看出,不同的時間長度下,當高斯模型個數為3時,識別率最高。系統取高斯模型個數為3,再測定不同時間長度下的識別率,識別結果如表3所示。

表3 不同時間長度的測試樣本識別率(M=3)
從表3中可以看出,在樣本時間長度為2 s時,識別率為84.37%。
通過綜合分析可以看出,高斯模型個數為3,測試樣本時間長度大于1.5 s時,系統識別率可以達到80%以上;當測試樣本長度達到2.5 s以上時,系統識別率超過85%。系統用時相對合理,達到了接近實時探測和識別的效果,可以在郊區環境中探測和識別無人機,也為以后無人機探測和識別提供了新思路。
本文提出了基于音頻特征的無人機探測和識別方法,通過對數據的測試和分析,表明該方法易于實現,準確性高,能夠滿足150 m距離內對市面上常用無人機探測和類型識別的要求。在實際應用中,可以進一步通過調整傳聲器高度及朝向來減少大部分來自地面的噪音干擾,提升系統的整體性能。今后的研究重點是使用波束形成技術實現無人機的定位、定向和更遠距離的探測。
[1] POPOVIC V, OTT B, WELLIG P, et al. Near-infrared high-resolution real-time omnidirectional imaging platform for drone detection[C]//SPIE Security+ Defence. International Society for Optics and Photonics, 2016: 999706-999706-7.
[2] VASQUEZ J R, TARPLEE K M, RIGLING B D. Multisensor 3D tracking for counter small unmanned air vehicles (CSUAV)[J]. Proceedings of SPIE-The International Society for Optical Engineering, 2008(6971): 11.
[3] BUSSET J, PERRODIN F, WELLIG P, et al. Detection and tracking of drones using advanced acoustic cameras[C]//SPIE Security +Defence. International Society for Optics and Photonics, 2015: 96470F-96470F-8.
[4] SHI W, BISHOP B, ARABADJIS G, et al. Detecting, tracking, and identifying airborne threats with netted sensor fence[M]. London: INTECH Open Access Publisher, 2011.
[5] MEZEI J, MOLNáR A. Drone sound detection by correlation[C]//2016 IEEE 11th International Symposium on Applied Computational Intelligence and Informatics(SACI), Timisoara, 2016: 509-518.
[6] HEARING B, FRANKLIN J. Drone detection and classification methods and apparatus: U.S. 9275645[P]. 2016-3-1.
[7] BENYAMIN M, GOLDMAN G H. Acoustic detection and tracking of a class I UAS with a small tetrahedral microphone array[R]. Army Research Lab Adelphi Md, 2014.
[8] GENESCà M, ROMEU J, PàMIES T, et al. Real time aircraft fly-over noise discrimination[J]. Journal of Sound and Vibration, 2009, 323(1): 112-129.
[9] CASE E E, ZELNIO A M, RIGLING B D. Low-cost acoustic array for small UAV detection and tracking[C]//Aerospace and Electronics Conference, 2008. NAECON 2008. IEEE National. IEEE, 2008: 110-113.
[10] ASENSIO C, RUIZ M, RECUERO M. Real-time aircraft noise likeness detector[J]. Applied Acoustics, 2010, 71(6): 539-545.
[11] HAUZENBERGER L, HOLMBERG Ohlsson E. Drone detection using audio analysis[J]. Geostandards & Geoanalytical Research, 2011, 35(3): 369-385.
[12] JEON S, SHIN J W, LEE Y J, et al. Empirical study of drone sound detection in real-life environment with deep neural networks[J]. arXiv preprint arXiv: 1701.05779, 2017.
[13] 葛欣宏. 飛行器被動音頻探測與識別技術研究[D]. 長春: 長春理工大學, 2006.
[14] DEMPSTER A P, LAIRD N M, RUBIN D B. Maximum likelihood from incomplete data via the EM algorithm[J]. Journal of the Royal Statistical Society. Series B (methodological), 1977, 39(1): 1-38.
Research on audio detection and recognition of UAV
WANG Wei1, AN Teng-fei1, OU Jian-ping2
(1. Hu’nan Provincial Key Laboratory of Intelligent Processing of Big Data on Transportation, School of Computer & Communication Engineering, Changsha University of Science & Technology, Changsha 410114, Hu’nan, China;2. School of Electronic Science and Engineering, National University of Defense Technology, Changsha 410073, Hu’nan, China)
In order to solve the security threat from low, slow and small rotor UAV (unmanned aerial vehicle) in the near field airspace, a method of analyzing the UAV audio signal is proposed. In this method, the Mel-Frequency Cepstral Coefficients (MFCC) and its first-order difference with improved solving flowchart and optimized parameters are used as the characteristic parameters of the UAV audio signal. The multi-distance segmentation method is used to train Gaussian mixture model (GMM) for the establishment of multi-feature “fingerprint library” of UAV audio signals, and finally the UAV detection and identification is achieved with the feature matching algorithm. The experimental results show that the proposed method can realize the UAV detection and recognition within 150m distance in typical suburban environment with an accuracy rate of 84.4%.
unmanned aerial vehicle (UAV); detection and identification; mel-frequency cepstral coefficients (MFCC); Gaussian mixture model (GMM)
TB53
A
1000-3630(2018)-01-0089-05
10.16300/j.cnki.1000-3630.2018.01.016
2017-05-20;
2017-07-26
國防973基金贊助項目(613XXX0301)
王威(1974-), 男, 山東青島人, 教授, 研究方向為智能信息處理。
安騰飛, E-mail: anyuanjing@stu.csust.edu.cn