吳晏辰, 王英民
基于Gammatone頻率倒譜系數的艦船輻射噪聲分析
吳晏辰, 王英民
(西北工業大學 航海學院, 陜西 西安, 710072)
艦船輻射噪聲的聲學特征提取對目標訓練和識別有著重要影響。文中提出一種基于Gammatone頻率倒譜系數(GFCC)的特征分析方法: 以目標特征提取方法——Mel頻率倒譜系數(MFCC)算法作為比照組, 針對小型低速船只、小型高速船只及大型船只三大類目標, 在2種不同水聲環境中提取的5122個樣本進行了分類識別比對試驗。試驗結果表明, 2種算法的目標識別率均大于80%, 且GFCC在海洋復雜聲環境中的識別率顯著高于MFCC, 并對高頻目標更敏感。說明GFCC算法與標準的MFCC算法相比, 在海洋等強干擾環境下具有更好的抗噪性和更高的快速目標識別率。
水下目標識別; 艦船輻射噪聲; 特征提取; Gammatone頻率倒譜系數; Mel頻率倒譜系數
水下目標識別是水聲工程領域的一個重要分支。按照信號生成方式劃分, 水下目標識別通常被分為被動目標輻射噪聲識別和主動目標回波識別[1]。與主動聲吶相比, 被動聲吶具有隱蔽性強的優點。由于輻射噪聲的組成主要由艦船機械噪聲、螺旋槳噪聲和水動力噪聲組成, 因此可以借由分析艦船輻射噪聲, 利用聲源的固有屬性來識別噪聲。但是, 由于水聲目標復雜的發聲機理、水下復雜的聲信道環境等諸多因素, 基于被動聲吶的艦船輻射噪聲識別技術一直是聲吶領域中的研究重點與難點[2]。
隨著神經網絡的不斷發展, 人工智能在水下目標識別中的應用越來越多。作為目標識別主要組成部分之一的特征提取, 不但對傳統目標識別結果起著關鍵作用, 也顯著影響著神經網絡在水下目標識別系統中的準確性[3]。文中利用文獻檢索平臺, 以“水下目標識別(underwater acoustic ta- rget recognition, UATR)”為關鍵詞, 統計了2015~ 2020年所有公開發表的中英文文獻, 并將所有文獻關鍵詞制作成詞云[4], 如圖1所示。比對2014~ 2018年的數據表明, 自2018年以來, 國內學者由多數采用支持向量機(support vector machine, SVM)轉向對神經網絡的深入發掘, 且大部分文獻的研究方向是以特征提取為基礎的, 其中較常見的是利用模擬人耳聽覺效應, 獲得諸如聽音感知特征和聲學參數特征等[5], 如梅爾頻率倒譜系數(Mel frequency cepstrum coefficient, MFCC)。

圖1 文獻關鍵詞詞云
作為目標應用最廣泛的特征, MFCC在針對無干擾環境下的目標識別中具有很好的應用效果, 但隨著環境噪聲提高, 識別效果急劇下降。而Gammatone濾波器組可以通過模擬人耳的頻譜分析與頻率選擇特性, 獲得很強的抗噪性, 在強干擾環境下也能保持較好的識別效果[6-8]。基于此, 文中提出基于Gammatone頻率倒譜系數(Ga- mmatone frequency cepstrum coefficient, GFCC)的目標特征提取分析方法, 利用GFCC代替MFCC, 使用K近鄰(K-nearest neighbor, KNN) 算法作為分類器, 提取目標的40階GFCC特征, 并以同一目標的40階MFCC特征作為對照組, 對小型低速船只、小型高速船只及大型船只三類目標在低噪聲的水庫樣本及高噪聲的近海樣本進行分類[9]。結果表明, GFCC特征較MFCC特征在高噪聲環境下具有更好的抗干擾能力。
由于輻射噪聲的時變特性, 需要對信號作短時分析[10], 因此需要利用分幀來提取信號的幀特征參數, 同時, 為了保證每一幀之間的信號連續性, 利用幀移使每幀互有交疊, 并在最后將若干幀合并組成樣本的特征向量。每幀長度取30 ms, 幀移50%幀間長度。
利用快速傅里葉變換(fast Fourier transform, FFT)對幀信號進行處理, 得到信號能量譜






式(4)~式(6)共同構成幀特征向量

圖2為MFCC特征提取的主要流程。

圖2 MFCC特征提取流程

式中,為信號采樣點數。
由于Gammatone濾波器組具有無限長單位脈沖響應特性, 因此Gammatone濾波系數

從水聲信號中提取特征時, 將人耳聽覺特征的臨界值作為每個濾波器的帶寬, 可表示為


將式(8)~(9)聯立取對數得信號的Gammatone能量譜

利用DCT, 得到Gammatone系數

求式(13)的最大值、最小值、中值、平均值及標準差等5種統計參數, 可得GFCC特征向量。 GFCC特征提取的主要流程圖見圖3。
表1給出了目標在水庫和近海試驗所得的艦船輻射噪聲音頻信息。將樣本分為3類: 甲種小型低速船只、乙種小型高速船只以及大型船只。所有樣本均由西北工業大學航海學院聲學工程與檢測技術國家專業實驗室收集制作, 圖4為水庫試驗照片。

表1 艦船輻射噪聲樣本信息
文中采用KNN算法[11]作為樣本分類器, 具體步驟如下: 1) 將樣本目標得分初始化為0, 對訓練用樣本與未知樣本間的距離進行計算; 2) 對所有計算所得樣本進行排序, 得到個最小距離; 3) 統計所有樣本, 對距離訓練樣本小于最小距離的待測樣本所在的類別分值加1; 4) 統計每類目標得分, 將得分最大類作為未知樣本類。

圖4 水庫試驗現場照片
將采集的樣本目標分別采用MFCC特征和GFCC特征進行訓練, 并使用KNN進行目標分類, 分類結果見表2和表3。

表2 MFCC特征提取后樣本識別統計結果

表3 GFCC特征提取后樣本識別統計結果
對于水庫測試的樣本, 無論使用MFCC或是GFCC, 識別率都達到了較高的水平, 但是對于海洋測試樣本, 其識別率產生了一定的差距, 圖5給出了3類目標40階MFCC (藍色)與GFCC(紅色)特征值均值比較, 試驗結果表明: 1) 復雜聲環境對于基于特征提取的水下目標識別系統具有顯著影響; 2) 與MFCC特征提取相比, 在復雜聲環境下, GFCC特征提取可有效提高水下目標識別系統的識別能力, 其抗噪能力更好; 3) 對于海洋樣本測得的3類船只, MFCC幅值普遍低于GFCC幅值。

圖5 海洋艦船輻射噪聲樣本目標MFCC與GFCC特征值比較
可以看到, 隨著濾波器階數的提高, 在3類船只目標1~40階范圍內, GFCC都顯示出明顯的優勢。由于民用船只通常是高速航行狀態, 其高頻輻射噪聲中有很大一部分由螺旋槳的空化噪聲組成, GFCC在高頻區域對于快速船只的幅值收斂速度明顯小于MFCC, 因此更適合用來排查小型艦艇。
文中分別采集了3類艦船目標在低噪聲水庫中和復雜海洋環境下的輻射噪聲, 結合對大數據平臺關于水下目標識別的中英文文獻的數據分析, 分別采用MFCC和GFCC 2種方法對目標進行了特征提取, 再利用KNN對采集的3類艦船輻射噪聲進行了分類識別與比較。結果表明: 在水下復雜聲場環境中, GFCC較MFCC具有更優良的抗噪能力, 對快速目標的識別能力也更強。后續, 將利用卷積神經網絡替代KNN進行更加深入的研究。
[1] 徐及, 黃兆瓊, 李琛, 等.深度學習在水下目標被動識別中的應用進展[J].信號處理, 2019, 35(9): 1460-1475.
Xu Ji, Huang Zhao-qiong, Li Chen, et al. Advances in Underwater Target Passive Recognition Using Deep Learning[J]. Journal of Signal Processing, 2019, 35(9): 1460-1475.
[2] 方世良, 杜栓平, 羅昕煒, 等. 水聲目標特征分析與識別技術[J]. 中國科學院院刊, 2019, 34(3): 297-305.
Fang Shi-liang, Du Shuan-ping, Luo Xin-wei, et al. Development of Underwater Acoustic Target Feature Analysis and Recognition Technology[J]. Bulletin of the Chinese Academy of Sciences, 2019, 34(3): 297-305.
[3] 杜雪, 廖泓舟, 張勛. 基于深度卷積特征的水下目標智能識別方法[J]. 水下無人系統學報, 2019, 27(3): 260-265.
Du Xue, Liao Hong-zhou, Zhang Xun. Underwater Target Recognition Method Based on Deep Convolution Feature[J]. Journal of Unmanned Undersea Systems, 2019, 27(3): 260- 265.

[5] 程錦盛, 杜選民, 周勝增, 等. 基于目標MFCC特征的監督學習方法在被動聲吶目標識別中的應用研究[J]. 艦船科學技術, 2018, 40(9): 116-121.
Cheng Jin-sheng, Du Xuan-min, Zhou Sheng-zeng, et al. Application of the MFCC Feature Based Supervised Le- arning Method in Passive Sonar Target Recognition[J]. Ship Science and Technology, 2018, 40(9): 116-121.
[6] 吳姚振, 楊益新, 田豐, 等.基于Gammatone頻率離散小波系數的水下目標魯棒識別[J].西北工業大學學報, 2014, 32(6): 906-911.
Wu Yao-zhen, Yang Yi-xin, Tian Feng, et al. Robust Underwater Target Recognition Based on Gammatone Frequency Discrete Wavelet Coefficients(GFDWC)[J]. Journal of Northwestern Polytechnical University, 2014, 32(6): 906-911.
[7] 周萍, 沈昊, 鄭凱鵬.基于MFCC與GFCC混合特征參數的說話人識別[J]. 應用科學學報, 2019, 37(1): 24-32.
Zhou Ping, Shen Hao, Zheng Kai-peng. Speaker Recognition Based on Combination of MFCC and GFCC Feature Parameters[J]. Journal of Applied Sciences, 2019, 37(1): 24-32.
[8] 劉雨柔, 張雪英, 陳桂軍, 等. VMD改進GFCC的情感語音特征提取[J]. 計算機工程與設計, 2020, 41(8): 2265-2270.
Liu Yu-rou, Zhang Xue-ying, Chen Gui-jun, et al. Feature Extraction of Emotional Speech Based on Improved GFCC with VMD[J]. Computer Engineering and Design, 2020, 41(8): 2265-2270.
[9] Jiang J, Shi T, Huang M, et al. Multi-Scale Spectral Feature Extraction for Underwater Acoustic Target Recognition[J]. Measurement, 2020, 166: 108227.
[10] 張少康, 田德艷. 水下聲目標的梅爾倒譜系數智能分類方法[J]. 應用聲學, 2019, 38(2): 267-272.
Zhang Shao-kang, Tian De-yan. Intelligent Classification Method of Mel Frequency Cepstrum Coefficient for Underwater Acoustic Targets[J]. Applied Acoustics, 2019, 38(2): 267-272.
[11] 曾向陽. 水下智能目標識別[M]. 北京: 國防工業出版社, 2016: 8-15.
Ship-Radiated Noise Analysis Based on the Gammatone Frequency Cepstrum Coefficient
WU Yan-chen, WANG Ying-min
(School of Marine Science and Technology, Northwestern Polytechnical University, Xi’ an 710072, China)
Acoustic feature extraction of ship-radiated noise has a major effect on target training and recognition. This research proposes a feature analysis method based on the gammatone frequency cepstrum coefficient(GFCC). The method uses the typical target feature extraction method——Mel frequency cepstrum coefficient(MFCC) algorithm for comparison and uses 5 122 samples with three types of targets, namely, small low-speed, small high-speed, and large vessels. The samples are extracted in two different underwater acoustic environments to generate a classification identification comparison test. Results show that the recognition rate of the two algorithms is greater than 80%. However, the recognition rate of GFCC in an ocean complex acoustic environment is found to be significantly higher than that of MFCC and is more sensitive to high-frequency targets. These results show that the GFCC algorithm has better noise resistance and a higher recognition rate for fast targets in oceanic and other strong interference environments as compared with the standard MFCC algorithm.
underwater target identification; ship-radiated noise; feature extraction; gammatone frequency cepstrum coefficient(GFCC); Mel frequency cepstrum coefficient
TJ630.34; TB53
A
2096-3920(2021)01-0060-05
10.11993/j.issn.2096-3920.2021.01.009
吳晏辰, 王英民. 基于Gammatone頻率倒譜系數的艦船輻射噪聲分析[J]. 水下無人系統學報, 2021, 29(1): 60-64.
2020-10-15;
2020-11-30.
吳晏辰(1989-), 男, 在讀博士, 主要研究方向為神經網絡和水下聲信號.
(責任編輯: 楊力軍)