田禹 田文峰 蘇宇辰 于新偉 王云飛
(天津工業大學電子與信息工程學院 天津 300387)
水下目標的分類識別是利用聲學或光學手段,對水下物體進行分類或識別,對國防建設和海洋資源開發有重要意義。艦艇輻射噪聲是水下目標分類識別的主要信息來源[1],其包括多種噪聲源,由寬帶連續譜和一系列線譜構成。如何從輻射噪聲中獲取目標特征信息并進行分類識別,是水下目標分類識別領域的主要研究方向。
傳統的水下目標分類識別是由人的聽覺完成的,存在很大的局限性,不適應現代信息化的水下作業場景。深度學習(Deep Learning)在計算機視覺、語音識別、自然語言處理等領域取得巨大成功,在很多方面接近或超過了人的智能水平。在這種技術浪潮下,聲吶研究人員也將深度學習技術引入水下目標識別領域,取得了豐富的研究成果。
葛召華等人利用Wigner 高階譜方法提取水下信號的譜特征,用最小二乘支持向量機進行目標識別[2]。王升貴等人通過短時傅里葉變換得到LOFAR譜圖,使用深度卷積神經網絡進行分類識別[3]。付同強等人使用遷移學習方法進行水下目標識別[4]。李琛等人利用多通道級聯特征的深度神經網絡解決低信噪比條件下的水下目標識別問題[5]。張牧行等人提出一種水下目標識別的最大信息系數特征選擇方法,可以使用更少的特征,提升分類正確率[6]。此外,吳晏辰等人基于MFCC 和GFCC 特征構建卷積神經網絡和殘差神經網絡,建立小樣本下的水下目標識別系統[7]。陳凱峰等人設計了基于FPGA和CNN的水下目標識別系統[8]。
本文在前人研究基礎上,對水下目標輻射噪聲進行建模,生成虛擬樣本,輔助真實樣本對網絡進行訓練。分析了水下目標輻射噪聲DEMON 譜特征提取方法,生成DEMON 譜樣本。設計了深度神經網絡對水下目標DEMON 譜進行分類識別,實驗數據表明該網絡模型能較好地對水下目標進行分類識別,達到預期設計目標。
對水下目標進行分類識別時,由于水下目標樣本采集代價大,造成數量和種類稀缺,不滿足深度神經網絡訓練需求。通常情況下,需要對水下目標輻射噪聲建模,生成不同種類和參數的樣本,輔助真實的樣本,對網絡模型進行訓練和測試。
本文根據水下目標輻射噪聲譜的特征,設計的仿真模型如圖1所示。
水下目標輻射噪聲的建模過程可以表示為
式(1)中:s(t)為目標輻射噪聲;vc(t)為空化噪聲信號;va(t)為海洋環境噪聲信號;ωs為輻射噪聲基頻;mi為基頻的i次諧波分量的調制幅度;θs(t)為i次諧波分量的調制相位;K為諧波次數。
根據該模型,生成5類目標,用于深度神經網絡的訓練、評估和測試。不同目標的本質區別在于輻射噪聲基頻ωs是不同的,特征譜線的數量即諧波次數K是不同的。每個諧波的調制幅度mi在0.5~1之間隨機分布。通過調整海洋環境噪聲va(t)的強度,來改變水下目標輻射噪聲的信噪比。
水下目標輻射噪聲經過遠距離傳播,到達聲吶接收端時功率非常微弱,完全淹沒在環境噪聲中。目前,有多種方法可以從環境噪聲中提取水下目標輻射噪聲特征,如LOFAR譜、DEMON譜、梅爾倒譜系數、高階統計量等。本文使用DEMON 譜進行水下目標的分類識別,DEMON譜可以提取水下目標輻射噪聲的低頻線譜和連續譜,包含了艦船螺旋槳的軸頻和葉頻信息,廣泛用于水下目標檢測、分類和識別。
水下目標輻射噪聲DEMON 譜的提取過程如圖2所示。艦船輻射噪聲經過多個不同頻帶的帶通濾波器,多通道數據分別進行絕對值檢波、低通濾波和降采樣處理后,進行傅里葉變換,得到的譜圖為多通道的DEMON譜。為了降低深度神經網絡的計算量,多通道DEMON譜取最大值,保留一個通道作為最終目標識別的樣本。

圖2 DEMON譜的提取過程
本文傅里葉變換的長度為4 096,取前一半譜線作為DEMON譜的樣本,即每個樣本的維度為1×2 048。
深度神經網絡是一種利用非線性映射函數的方式建立的數學模型,廣泛用于機器學習領域。神經網絡由大量的神經元構成,解決不同問題時,需要專門進行網絡設計和訓練,確定各神經元之間的連接關系和權重值。通過大規模的數據訓練,實現網絡模型的自主學習。
本文設計深度神經網絡,并進行訓練,實現對5個不同種類的水下目標進行識別,并可對深度神經網絡的Dense層的層數、各Dense層的神經單元數等網絡結構進行精細篩選調優。網絡模型訓練時,采用Glorot初始化方式、調整訓練批次Batch 大小,損失函數選擇交叉熵損失,優化器選用Adam。為了防止神經網絡出現過擬合現象,在隱蔽層之間設計Dropout 層,丟棄率設置為0.2,隨機減小隱蔽層之間連接。
本文經過優化設計額深度神經網絡的結構如圖3所示。網絡模型除了輸入層和輸出層外,包含3 個Dense層和一個Dropout層。

圖3 網絡模型結構
網絡模型參數如表1所示。

表1 深度神經網絡的結構和參數
根據式(1)所述的模型,生成不同種類的目標輻射噪聲,按照圖2 所示的DEMON 譜處理過程,生成目標的樣本,任取4個樣本,圖形如圖4所示。

圖4 典型目標樣本
由圖4 中可以看出,不同種類目標的特征譜線有明顯差異。
深度神經網絡的設計,需要對多個參數進行篩選優化。本文以Dense層數為例,說明網絡優化過程。
深度神經網絡對水下目標識別的性能容易受到水下目標運動狀態和工作狀態影響,如多普勒頻偏。評估網絡模型性能時,需要重點考察多普勒頻偏對網絡模型性能的影響。
進行網絡模型設計時,研究不同的Dense 層數量時,水下目標輻射噪聲多普勒頻偏對網絡模型性能的影響,結果見圖5。圖中,橫坐標為相對多普勒頻偏,縱軸為識別精度,不同的曲線表示不同的Dense層時,識別精度隨多普勒頻偏的變換。從圖5 中可以看出,相對多普勒頻偏增大時,識別精度均有不同程度的下降,但是Dense 層為3 層時,識別精度隨多普勒頻偏增大時下降得最慢。由此可知,Dense 層為3 時,網絡模型對水下目標多普勒頻偏具有更好的包容性。

圖5 多普勒頻偏對網絡性能的影響
按照類似的研究方法,本文對網絡模型的各個參數進行優化,得到表1所示的優化后的網絡模型。
測試數據集包含5 類不同種類的目標樣本,標記為A~E,每類目標樣本數為500,樣本的多普勒頻偏是隨機生成的。使用測試數據集對本文提出的深度神經網絡進行性能測試,分類識別結果的混淆矩陣如圖6所示。

圖6 混淆矩陣
由圖6 可知,5 類目標最低識別率為90.0%,最高識別率為93.2%,平均識別率為91.6%,達到了預期的研究目標。
本文對水下目標輻射噪聲建模,生成虛擬目標樣本,輔助真實數據,實現對神經網絡的訓練和測試,并對輻射噪聲進行DEMON 譜處理,提取目標特征。設計深度神經網絡,給出網絡結構和參數,用于水下目標分類識別。實驗數據表明:提出的網絡模型能夠準確地對目標進行分類識別,達到預期效果。研究下一步工作是完善數據集,補充更多的目標樣本,對網絡模型進行改進,進一步提升分類識別性能。