
















摘 要:水下高速航行器作為海洋中唯一可高速航行的精確導引裝備,其目標識別性能決定著任務最終完成效果。由于復雜的海洋壞境和不斷升級的新型對抗器材,水下高速航行器目前面臨著識別能力不足問題,急需尋找一種新型特征提取目標識別途徑。本文基于深度卷積網絡良好的特征挖掘能力,結合回波信號的特點,提出了一種深度學習水下目標識別模型,并利用試驗場采集的數據進行了模型驗證實驗。同時,針對訓練數據不足問題,建立了生成對抗網絡進行數據集擴充,實驗結果表明,本文提出的深度學習模型可有效地對水下目標進行識別,并且生成對抗網絡的數據集擴充提高了模型識別準確率,為水下高速航行器智能化發展提供了新的思路。
關鍵詞:水下高速航行器;目標識別;深度學習;生成對抗網絡
中圖分類號:U674;TP18 文獻標志碼:A DOI:10.3969/j.issn.1673-3819.2025.02.011
Research on an underwater high-speed vehicle target
recognition method based on deep learning
WU Yajun LIU Liwen
(1. Navy Armament Department, Xian 710077, China;2. The 705 Research Institute,
China Shipbuilding Industry Corporation, Xian 710077, China)
Abstract:As the only high-speed navigation equipment in the ocean, the target recognition performance of the underwater high-speed vehicle determines the final completion effect of the mission. Due to the complexity of marine environment and the constantly upgrading of new countermeasure equipment, underwater high-speed vehicles are currently faced with the problem of insufficient recognition ability in complex marine environment, and it is urgent to find a new way of feature extraction and target recognition. Based on the good feature mining ability of deep convolutional networks and the characteristics of echo signals, a deep learning underwater target recognition model is proposed in this paper, and the model verification experiment is carried out by using test site data. At the same time, to solve the problem of insufficient training data, a generative adversarial networks is established to expand the data set. The experimental results show that the deep learning model proposed in this paper can effectively identify underwater targets, and the model recognition accuracy is improved by generating adversarial network data set expansion, which provides a new idea for the intelligent development of underwater high-speed vehicles.
Key words:underwater high-speed vehicle; target recognition; deep learning; generative adversarial networks
水下高速航行器是水下主動搜索和跟蹤水下目標最有效的裝備[1]。隨著現代水聲、電子技術和人工智能技術的不斷發展,現代水下戰場通常在同一海區可能同時存在水下誘餌、電聲對抗裝置、電子干擾器材以及其他各類武器系統等[2-3]。因此,在激烈的水聲對抗環境下,水下高速航行器主動識別系統工作扇面內會同時出現的多個目標或誘餌,這種情況下,水下高速航行器必須在極短時間內有效識別和正確判斷出各個目標的真假,保證不被假目標欺騙而導致任務失敗或浪費航程,其次,水下高速航行器必須優先選擇威脅最大、能力最強的核心目標,并智能化精確打擊體目標,最大程度發揮裝備效能[4]。因此,為了適應現代水下目標眾多、情況復雜等作戰環境,水下高速航行器必須具有遠距離探測、智能化識別和精確制導能力。
目前,隨著水聲對抗技術的不斷發展,水聲對抗器材已經由最初僅可以模擬體目標特性的聲誘餌,發展到了近年出現的新型誘餌,甚至二維平面陣誘餌等[5],這些新型水聲對抗器材不僅可以模擬目標的運動特性,而且可以模擬目標一維或二維的尺度特征。當前我國水下高速航行器的目標識別方法在充滿新型對抗器材的水下環境中顯得力不從心,亟須尋求新型特征提取與目標識別的途徑。只有具備遠距離探測、高水下目標識別率的水下高速航行器裝備才能發揮足夠的能力。
深度學習良好的學習和預測性能,已被眾多研究人員關注和研究,并被廣泛應用于語音識別、圖像分類和自然語言處理等領域,將其應用在水下高速航行器目標識別系統中來提高其目標探測識別能力已成為一種發展趨勢[6-11],通過對歷史目標數據進行數值特征挖掘和分類,可自動實現水聲目標檢測和識別功能。與傳統特征提取方法相比,其能夠實現對冗余數據深層次抽象信息計算,提取的特征可分性更好,識別結果泛化能力強。同時,其能力的提升來自于對歷史數據的不斷自主學習,具備自主進化能力,在聲吶目標探測識別方面具有良好的應用前景。因此,對深度學習模型進行優選和改進,將通過深度神經網絡隱藏層學習得到的特征替代使用現有方法人工提取的特征,有望獲得使用現有方法無法提取的水下目標本征特征,從而提高水下高速航行器的目標探測和識別能力[12-14]。
本文基于水下航行器目標識別系統提出了深度學習水下目標主動識別方法,該方法可同時對水下點、線、體目標進行主動識別,并針對訓練數據集不足的問題建立生成對抗網絡模型進行數據集擴充,提升了模型訓練效果,并利用試驗場采集數據進行目標識別仿真實驗驗證了該方法識別效果。
1 數據預處理
水下高速航行器在執行目標識別任務時面臨多重具體約束,其中航行速度是關鍵因素之一。高速度使得傳統的聲學傳感器難以獲得清晰的目標圖像,會導致信號處理中的多普勒效應加劇,從而引起頻譜展寬和相位失真。此外,水介質特性也帶來了挑戰,如吸收和散射引起的信號衰減,這進一步限制了有效探測距離和分辨率??紤]到水下高速航行器的自主性,它需要能夠在沒有實時外部通信支持的情況下做出決策,這就增加了算法的復雜性和計算資源的需求。
此外,水下高速航行器獲取的回波數據與其他平臺(如固定式或低速移動平臺)的數據存在顯著差異。高速運動產生的動態背景噪聲增加,使得有用信號與噪聲分離更加困難。同時,由于多普勒頻移的影響,目標反射的頻率特征會發生變化,不同于靜態或慢速場景下的情況。而且,高速度還可能引發非線性效應,例如湍流和空化現象,這些都會引入額外的干擾成分,使回波數據更加復雜。這些不同點直接影響到后續識別網絡的設計。
為了適應上述特點,在識別網絡設計中,需要特別關注模型架構、數據預處理以及訓練策略等方面。模型架構應選擇能夠處理時變特性的深度學習模型,比如卷積神經網絡(CNN)來提取空間特征;實施有效的降噪技術和自適應濾波策略,確保輸入識別網絡的數據的質量。這包括但不限于去趨勢處理、頻域濾波等手段;利用模擬環境生成大量標注樣本進行預訓練,然后用真實世界中收集的數據微調模型參數,提升泛化能力。綜上所述,本文充分考慮了水下高速航行器所特有的工作環境和技術難點,并據此調整了目標識別網絡的設計思路。
本文所應用的訓練數據為水下高速航行器試驗場采集的數據。由于原始回波信號的目標特征微弱,導致深度學習識別模型訓練難度增大,不易收斂,并且原始信號樣本維度較高,導致網絡訓練參數激增,計算量龐大,易產生維度災難,因此,筆者對水下高速航行器主動識別系統接收到目標反射的回波波束信號進行處理之后作為訓練樣本輸入[15],如數據標準化、數據截取和副本相關的處理工作,可降低原始數據的維度并增強目標本征特征,數據處理流程如圖1所示。
本研究首先對數據進行標準化。由于實驗條件不盡相同,各個樣本之間的分布范圍都有差異,所以需要對數據進行標準化處理。本文采用Z-score標準化方法實現數據標準化[16],先對數據去均值,再除以標準差,將數據變換為相同尺度,如下式所示:
式中:μ為該特征的平均值,σ為標準差,則標準化后的樣本數據均值為0,方差為1,且無量綱。接著進行數據截取。由于水下高速航行器主動聲探測系統的一個周期內接收的回波數據長達數萬或數十萬個點,而且由于各個探測周期下目標距離不斷發生改變,各周期接收信號長度也會發生變化,回波數據一般長短不一。因此,要對原始回波進行信號截取,重點分析目標回波中能量聚集區的數據,以降低輸入數據維度,提高模型的訓練效率。
最后,對數據進行副本相關處理。由于截取數據樣本受背景干擾影響較大,特征不夠突出,且各類樣本之間差別較小,因此需要對數據進行副本相關處理。副本相關主要由互相關接收器實現,該方法可以有效提高回波數據的信噪比,使目標特征更加明顯,其原理如圖2所示。
其中,x(t)為聲吶接收信號,s(t)為參考信號,一般取聲吶發射信號副本,τ為信號延遲時間,輸出Rxs(τ)
為互相關函數。當信號延遲時間τ等于目標回波的時間延遲時,互相關函數可以取得最大值,即副本相關峰值。
本文根據實際工程經驗對歸一化后的原始數據進行數據截取和副本相關處理,得到長度為1 024個數據點的樣本,并隨機選取某個段回波信號,對比其數據處理前后的時域波形,如圖3所示。對比可知,相比于原始回波信號而言,處理后的回波信號數據維度大幅降低,信混比大幅度提高,數據質量有明顯的提升。經過處理后,本文的數據集包含288個樣本,每個樣本的長度都為1 024個數據點。
2 深度學習模型建立
本文的網絡架構基于通用的卷積神經網絡(CNN),卷積神經網絡(convolutional neural network, CNN)作為最重要的深度模型之一,具有良好的特征提取能力和泛化能力,在圖像處理、目標跟蹤與識別、自然語言處理、場景分類、人臉識別、音頻檢索、醫療診斷諸多領域獲得了巨大成功。但為了適應水下高速航行器環境下的目標識別任務,我們進行了若干定制化調整。在輸入層,筆者考慮到水下環境中回波數據的特點,對歸一化后的原始數據進行數據截取和副本相關處理,得到長度為1 024個數據點的樣本,這有助于提高模型對不同噪聲條件的魯棒性。特征提取層通過對比不同卷積核對識別結果的影響,采用了多通道輸入模式優選最佳的卷積核。分類層通過全連接層和softmax函數實現最終的目標分類。此外,還引入了dropout技術來防止過擬合,保證模型的泛化性能。
卷積神經網絡模型必須考慮卷積核、池化窗口的大小以及步長等參數的影響,不斷對各種數據進行調節,最終確定適用于水下目標回波的網格結構。
在建模過程中,本文使用了卷積、池化相互交替的經典結構,其中池化層結構相對簡單,主要工作為如何確定卷積結構。本文根據以下幾個卷積核特點確定卷積核結構:
(1)降維/升維
由于N×1卷積核中N代表通道數,一個最直觀的結果就是可以將原本的通道數進行增加或者減少。
(2)增加非線性
對于1*1卷積核,可以在保持feature尺度不變,即不損失分辨率的前提下利用后接的非線性激活函數大幅增加非線性特性,加深網絡層次。
(3)跨通道信息交互
使用1×1卷積核,實現降維和升維的操作其實就是通道間信息的線性組合變化,3×3,64通道的卷積核后面添加一個1×1,28通道的卷積核,就變成了3×3,28個通道的卷積核,原來的64個通道就可以理解為跨通道線性組合變成了28個通道。
結合常見的卷積核形式以及使用的樣本長度,本文在以下幾種卷積核之間進行了反復的實驗對比,綜合結果如表1所示(此時使用最大值池化)。
對比以上結果可知,卷積核大小為12×1時的網絡模型可取得最佳的目標識別比例。利用此種形式的卷積核對樣本進行特征提取后,還需要進行池化運算來降低數據維度,同時賦予已學習到的特征位移不變的特性。在實驗中將池化區域設定為4×1,類似于二維卷積神經網絡中常用的2×2池化,步長設置為4,不進行重復池化。本文中共使用了兩層池化層,根據使用的池化策略不同,得到了如表2所示的試驗結果。
如表中所示,當兩層都采用平均值池化時,模型可取得78.3%的目標識別率,高于其他幾種方式。最后,為對應文中選擇的代價函數,以softmax分類器作為輸出層,輸出層節點為3。經過多次的實驗對比后,卷積神經網絡模型最終的詳細網格參數如表3所示,結構圖如圖4所示。
卷積神經網絡中的全連接層一般由大小為1×1的卷積核實現,表3中的特征圖數量類似于多層感知器網絡中的神經元數量,該模型中的非線性激勵函數同樣使用ReLU函數。相比于sigmoid和tanh而言,該函數在降低模型運算量以及抑制“梯度消失”等方面具備更優秀的表現。
3 生成對抗模型建立
生成對抗網絡(generative adversarial network, GAN)是一種基于博弈論的生成模型[17]。該模型通過對訓練樣本的概率分布進行學習,生成與訓練樣本概率分布相似的新樣本,從而達到數據生成的目的,該方法在很多研究領域中已經取得了不錯的效果。
生成對抗網絡的基本結構如圖5所示,其主要由兩個深度網絡組成,這兩個網絡分別稱為生成網絡和判別網絡。生成網絡的主要作用是生成符合一定分布的且與真實數據極為相似的生成數據;判別網絡的主要作用是在同時收到真實數據和生成器生成的數據時,準確地將兩者區分開。
生成對抗網絡的學習過程,就是判別網絡和生成網絡通過相互對抗,不斷地更新迭代各自的參數,相互促進相互提升。最終使得生成網絡能夠生成與真實數據服從相同分布的生成數據,同時判別網絡也通過不斷的對抗以具有更強的分辨能力,進一步提高生成數據的質量。
不同于傳統的圖像生成任務(訓練樣本為二維矩陣),水下高速航行器回波信號生成任務的樣本為一維向量。相應地,其生成對抗網絡的基本單元應該選取全連接層或者一維卷積層。卷積結構具有局部感受野、權值共享等特點,能夠在降低網絡模型參數和復雜度的同時還確保高度的縮放、平移不變性,具備廣泛的實用性,因此本文選擇了一維卷積結構作為生成對抗網絡的主要運算單元。生成對抗網絡由生成網絡模塊和判別網絡模塊組成。生成網絡的詳細結構如圖6所示,其中,deconv表示反卷積層,stride表示步長,filters表示卷積核的通道數,Batch Norm表示批量歸一化處理(batch normalization),activation表示激活函數。生成網絡主要由輸入層、輸出層和5個反卷積單元組成。具體地,前4個反卷積單元的激活函數選取leaky relu函數,以避免梯度消失;第5個反卷積單元的激活函數選取tanh函數,使得輸出介于-1~+1。為了提高收斂速率以及防止過擬合,筆者在前4個反卷積單元中加入了batch normalization批量歸一化處理[18]。
判別網絡的詳細結構如圖7所示,其中,conv表示卷積層,fully connected表示全連接層。判別網絡主要由輸入層、輸出層、3個卷積單元和一個全連接層組成。同樣地,3個卷積單元和全連接層的激活函數選取leaky relu函數,以避免梯度消失;為了提高收斂速率以及防止過擬合,筆者在3個卷積單元中加入了batch normalization批量歸一化處理[18]。
首先將整個生成對抗網絡長度為100個數據點的隨機噪聲輸入生成網絡中, 經過5個反卷積單元的運算,輸出長度為1 024個數據點的生成信號。然后,將生成信號和真實信號分別輸入判別網絡中,經過3個卷積單元和1個神經元個數為128的全連接層,最終輸出信號的真假信息。
4 實驗驗證與結果分析
4.1 卷積神經網絡實驗驗證
為了加快模型的收斂速度,
本文針對一維時間序列的CNN模型的主要框架(如表3所示),在每個卷積層之后加入了BN層,此外為保證模型的泛化能力,在分類層之前使用了dropout策略對其進行正則化處理,概率系數設定為0.4。網絡同樣使用Adam算法進行參數更新,初始學習率設置為0.001,每15代衰減為原先的一半,經過75代后停止訓練過程。本文所應用的驗證數據均為水下高速航行器試驗場采集的高速航行數據,CNN模型的識別準確率見表4,收斂曲線見圖8。
從表4可以看出,副本相關樣本下模型平均識別準確率可以達到80%左右,其在副本相關樣本下目標識別的具體結果見表5。
此時,目標的平均識別準確率為80.5%。從表5中可以看出,線、體兩類目標的識別準確率遙遙領先,均在85%以上。但是點目標識別情況不理想,識別準確率遠低于以上兩種目標。
4.2 生成對抗網絡實驗驗證
為了驗證基于生成對抗網絡的目標回波信號生成模型的有效性,本文利用處理后的目標回波副本相關信號作為真實信號進行回波信號生成實驗。生成模型訓練時所使用的超參數如表6所示。
本文的網絡模型訓練時選用的優化器為深度學習中收斂速度較快的Adam函數。為了防止網絡出現擬合,在網絡中加入了L2正則化,正則化的系數為0.001。由于訓練集數據量較小,本課題選擇小批次訓練,批次大小設為4,進而每回合網絡參數更新次數為72次。
網絡訓練的回合數會影響生成信號的質量,回合數太少會導致欠擬合,使得生成信號和真實信號差異較大;回合數太多會導致過擬合,使得生成信號和真實信號完全一樣,喪失了生成信號的意義。訓練250代時的生成信號及其幅度概率分布對比如圖9所示。
從信號波形層面看,生成信號的亮點等間隔分布與真實信號基本一致,且亮點個數與真實信號基本一致都在3~6;從信號幅度概率密度分布來看,生成信號與真實信號的幅度概率密度分布走勢基本一致。生成器G生成的圖片已經很逼近真實圖,但同時融合了一些其他真實數據的特征,因此又不與原圖片完全相同。
本文基于GAN生成了大量的合成數據,并人為地對其進行挑選。在合成數據對原回波圖像數據集進行擴充時,需要依靠一定的原則對其數量進行擴充。根據生成器和判別器的損失可以看出,在選擇生成數據構成數據集時,應當盡可能地選擇損失值小的迭代區間所產生的生成數據圖,從而使合成數據集特征更貼近于真實數據集,如表7所示。
本文將生成對抗網絡所增強的數據集加入已有原始數據庫中,組成新水下目標回波數據集,應用到已構建的MLP和CNN模型進行訓練,訓練結果見表8。
從表8中可知,利用數據增強方法可以在一定程度上提升目標的識別準確率。該結果說明,基于深度學習的目標識別方法準確率強依賴于整體樣本質量與數量,本文所提出的深度學習模型結合生成對抗網絡對副本相關樣本的擴充方法并不會破壞目標特征。
5 結束語
本文針對水下高速航行器在復雜水下戰場環境中面對新型對抗器材識別率不高的問題,提出了一種基于深度學習技術的水下目標識別方法,結合主動回波信號特點,設計并搭建了基于卷積核的深度學習識別模型,并針對水下目標回波數據匱乏的問題,建立生成了對抗網絡模型對有限數據集進行數據擴充。實驗結果表明,本文提出的深度學習水下目標識別方法可有效地對點、線、體目標進行識別,平均識別正確率可達87.8%。經過生成對抗網絡進行數據集擴充后,重新對深度學習模型訓練,識別準確率提升至92.2%。因此,本文提出的深度學習識別模型以及生成對抗網絡的小樣本識別方案可有效對水下目標進行識別,為下一步在水下高速航行器平臺上部署
奠定了技術基礎。
參考文獻:
[1] 李志舜. 魚雷自導信號與信息處理[M]. 西安: 西北工業大學出版社, 2004.
LI Z S. Torpedo homing signal and information processing[M]. Xi’an: Northwestern Polytechnical University Press, 2004.
[2] 陳春玉, 王嵐. 反魚雷技術[M]. 北京: 國防工業出版社, 2006.
CHEN Y C, WANG L. Anti-torpedo technology[M]. Beijing: National Defense Industry Press, 2006.
[3] 何心怡, 高賀, 陳菁, 等. 魚雷真假目標識別技術現狀與展望[J]. 魚雷技術, 2016, 24(1):23-27.
HE X Y, GAO H, CHEN J, et al. Current situation and prospect on torpedo’s true/1 target identification technologies[J]. Torpedo Technology, 2016, 24(1):23-27.
[4] 宋波. 水下目標識別技術的發展分析[J]. 艦船電子工程, 2014, 34(4): 168-173.
SONG B. Development analysis of the underwater target recognition technology[J]. Ship Electronic Engineering, 2014, 34(4): 168-173.
[5] 唐波, 孟荻, 范文濤. 國外水聲對抗器材發展現狀與啟示——潛用器材[J]. 水下無人系統學報, 2022, 30(1): 15-22.
TANG B, MENG D, FAN W T. Current situation and enlightenment of foreign underwater acoustic countermeasure equipment for submarine[J]. Journal of Unmanned Undersea Systems, 2022, 30(1): 15-22.
[6] DING S, SU C. Application of optimizing BP neural networks algorithm based on Genetic Algorithm[C]. Proceedings of the 29th Chinese Control Conference, Beijing, 2010, New York: IEEE. 2010: 2 425-2 428.
[7] Sainath T N, Vinyals O, Senior A, et al. Convolutional, long short-term memory, fully connected deep neural networks[C]. Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on IEEE, 2015: 4 580-4 584.
[8] HINTON G E, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786): 504-507.
[9] 何媛媛, 胡淼, 彭祖權, 等. 語音識別對抗攻擊方法綜述[J]. 華中科技大學學報(自然科學版), 2023, 51(2): 10-18.
HE Y Y, HU M, PENG Z Q, et al. Survey of adversarial attacks on speech recognition[J]. Journal of Huazhong University of Science and Technology(Natural Science Edition), 2023, 51(2): 10-18.
[10]Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks[J]. Communications of the Acm, 2012, 60(2): 36-46.
[11]HE K, ZHANG X, REN S, et al. Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification[J]. 2015: 1 026-1 034.
[12]JIANG X D, YANG D S, SHI S G, et al. The research on high speed underwater target recognition based on fuzzy logic inference[J]. Journal of Marine Science and Application, 2006, 5(2): 19-23.
[13]JIANG J J, WU Z N, LU J N, et al. Interpretable features for underwater acoustic target recognition[J]. Measurement, 2021, 173: 108 586.
[14]LIU J, GONG S, GUAN W, et al. Tracking and localization based on multi-angle vision for underwater target[J]. Electronics, 2020, 9(11): 1 871.
[15]劉伯勝, 黃益旺, 陳文劍, 等. 水聲學原理[M]. 3版. 北京: 科學出版社, 2019.
LIU B S, HUANG Y W, CHEN W J, et al. Principles of underwater acoustics[M]. 3rd ed. Beijing: Science Press, 2019.
[16](美) 鄧力, (美) 俞棟, 謝磊. 深度學習: 方法及應用[M]. 北京: 機械工業出版社, 2016.
DENG L,YU D, XIE L. Deep learning: methods and applications[M]. Beijing: China Machine Press, 2016.
[17]Kataoka Y, Matsubara T, Uehara K. Image generation using generative adversarial networks and attention mechanism[C]//IEEE/ACIS International Conference on Computer & Information Science. IEEE, 2016.
[18]王晨宇, 劉禮文, 劉罡, 等. 基于小樣本條件下水下回波生成方法研究[J]. 水下無人系統學報, 2022, 10: 612-620.
WANG C Y, LIU L W, LIU G, et al. Research on Underwater Echo Generation Method Based on Small Sample[J]. Journal of Unmanned Undersea Systems, 2022, 10: 612-620.
[19]趙璐, 馬野, 李曉芳. 基于多層感知器和運動軌跡的海上目標類型識別[J]. 艦船電子工程, 2020, 40(3): 36-39.
ZHAO L, MA Y, LI X F. Marine target type recognition based on MLP and motion trajectory[J]. Ship Electronic Engineering, 2020, 40(3): 36-39.
(責任編輯:李楠)