孟 磊,曲 衛,蔡 凱,張 婧
(1.航天工程大學 研究生院, 北京 101416; 2.航天工程大學 電子與光學工程系, 北京 101416;3.北京市遙感信息研究所, 北京 100192; 4.北京航天飛行控制中心, 北京 100094)
雷達輻射源識別(Radar Emitter Identification,REI)是通過分析處理截獲的敵方雷達信號,獲取敵方雷達的工作參數和信號特征參數,通過與已知雷達數據庫進行對比,判斷雷達的型號、工作模式、位置,進而掌握其作戰平臺、工作狀態、威脅等級等信息,為戰場態勢感知、威脅告警、作戰計劃制定等提供情報支持[1],是影響復雜戰場環境下電子戰勝負的重要因素。
早期的雷達輻射源識別方法有參數匹配法、專家系統法等。參數匹配法是直接利用測量獲得的信號特征參數與已知的雷達數據庫進行匹配,識別雷達輻射源的屬性信息[2],該方法具有識別速度快,易于實現等優點,但該方法過于依賴先驗知識,缺乏推理能力。專家系統法根據專家提供的雷達屬性知識,構建雷達信號識別的推理規則,對雷達輻射源數據進行推理和識別,具有一定的學習和推理能力[3],但該方法的實現依賴于海量的雷達信號參數實例及雷達屬性知識,算法的識別效率較低,識別速度較慢。
隨著相控陣等新體制雷達的快速發展和廣泛軍事應用,戰場輻射源數量急劇增加,信號密度呈指數級增長,信號形式日趨復雜。傳統雷達輻射源識別方法不能有效應對日益復雜的戰場電磁環境。機器學習是一種智能的數據分析工具,在數據挖掘、人臉識別、計算機視覺、搜索引擎等領域得到廣泛應用。電子戰研究人員也嘗試利用機器學習方法進行雷達輻射源識別研究,較傳統方法具有智能化程度高、魯棒性好以及泛化能力強的優點,更能適應日益復雜的電磁環境和復雜多變的電磁信號。
機器學習算法在輻射源識別研究中的優勢促使越來越多的研究人員將最新的機器學習成果應用到雷達輻射源識別的研究中。本文全面回顧和介紹了當前基于機器學習的雷達輻射源識別研究與發展現狀,對比各方法的優缺點,提出基于深度學習的雷達輻射源識別方法將成為發展確趨勢,并探討了該方法存在的不足及相應解決方案和研究方向。
基于機器學習的雷達輻射源識別方法,是利用機器學習算法對已知雷達輻射源數據進行學習,構建識別模型,使用該模型對新數據進行預測即可獲取雷達輻射源屬性。其原理如圖1所示。

圖1 基于機器學習的雷達輻射源識別原理框圖
圖2展示了近年來應用于雷達輻射源識別研究的主要的機器學習算法。

圖2 基于機器學習的雷達輻射源識別方法框圖
基于神經網絡的雷達輻射源識別,是將雷達輻射源特征參數和輻射源信息(雷達型號、工作模式等)作為神經網絡的輸入和輸出,通過調整內部神經元權重及連接方式等信息構建神經網絡模型,使損失函數達到最小。利用構建的模型對實例進行預測即可獲得輻射源的屬性。
該方法中常用的神經網絡包括誤差逆向傳播(Back Propagation,BP)神經網絡、徑向基函數(Radial Basis Function,RBF)神經網絡、向量神經網絡等。文獻[4]利用BP神經網絡對雷達輻射源進行識別,選擇載頻(Radio Frequency,RF)、脈寬(Pulse Wide,PW)、脈沖重復間隔(Pulse Repetition Interval,PRI)3個參數作為模型的輸入特征,利用構建的模型獲得了較高的輻射源識別精度。文獻[5]提出基于粗糙集理論和RBF神經網絡的雷達輻射源識別方法,首先基于粗糙集對雷達輻射源信號進行屬性約簡,提取決策規則;然后采用粗糙k均值聚類方法對RBF神經網絡的聚類中心進行增益,利用信息表提取的決策規則構建RBF神經網絡。文獻[6]為了解決雷達輻射源區間輸入數據的問題,提出一種向量神經網絡并將其用于雷達輻射源識別,該網絡輸入特征為RF、PW、PRI的區間值矢量數據,該方法利用BP算法優化網絡權值,可對多個雷達輻射源進行分類。
人工神經網絡具有良好的模式識別分類和泛函逼近能力,魯棒性和容錯性較強,在模式分類中得到廣泛的應用。但是該方法在處理雷達輻射識別問題中,存在局部極值和過(欠)學習的問題,在網絡模型的優化、雷達輻射源特征屬性的選擇等方面還有較大的改進空間。
統計學習是從數據中抽象出概率統計模型,利用模型對新的數據進行分析和預測的理論。基于統計學習的雷達輻射源識別方法使用的機器學習算法主要包括k近鄰法(k-Nearest Neighbor,KNN)、決策樹、支持向量機(Support Vector Machines,SVM)等。
KNN是在訓練數據集基礎上,計算與新輸入的實例距離最近的k個訓練實例,k中數量最多的那一類則為預測結果[7]。文獻[8]利用雷達信號的累積量作為個體識別的特征,使用KNN分類器對3部相同型號機載雷達的實測數據進行分類識別,取得良好的分類效果。文獻[9]將雷達信號轉化為符號序列,提取多尺度信息熵作為識別特征,利用KNN進行分類識別,具有良好的抗噪性。
決策樹是基于特征對實例進行分類的樹形結構模型,可以表示為if-then規則的集合[10]。文獻[11]提出一種改進的決策樹算法并將其用于雷達輻射源識別,通過對雷達輻射源信號進行粗造集處理,提取信號的相對信息量以確定重要性,建立了簡化的決策樹結構,該方法具有較好的識別率和抗噪性。
SVM是通過核函數將輸入樣本特征向量映射到高維特征空間,在高維空間進行線性分類,找到最優分離超平面,使訓練樣本最大可分[12]。文獻[13]首次提出將SVM引入雷達輻射源識別中,并取得了較好的識別效果,證明了SVM適用于雷達輻射源識別研究。核函數的選擇對于SVM的分類效果有很大影響,文獻[14]構建了基于5類核函數的SVM分類器,并通過仿真實驗,從抗噪性、正確率和識別速度比較不同核函數SVM分類器的性能,給出了不同應用條件下SVM核函數的選擇標準。文獻[15]針對SVM處理大樣本數據速度慢的問題,提出基于AP聚類的SVM雷達輻射源識別方法。首先利用AP聚類算法對數據集進行優化,得到一個高質量、小樣本的訓練集,再通過SVM分類器進行識別分類,獲得了更高的分類精度。文獻[16]提出一種基于粗糙k均值分類器和SVM的雷達輻射源識別方法。首先利用粗糙k均值分類器對訓練樣本進行聚類,之后利用粗糙邊界內的樣本訓練SVM,再用SVM對不確定區域內的樣本進行識別,從而提高了分類精度,并且時間復雜度更低。此外,研究人員提取雷達信號時頻圖像紋理特征[17]、小波矩特征[18]、雙譜特征[19]、位置和尺度特征[20]等脈內調制特征,用SVM進行分類識別,在信噪比小于-2 dB的條件下取得了平均90%以上的識別率。
KNN算法簡單、易于理解,但需要占用大量空間儲存已知實例,且要將待分類實例與所有已知實例進行比較,從而導致時間復雜度較高,隨著雷達輻射源數據庫不斷增加,會影響雷達輻射源識別效率。決策樹算法結構直觀,分類速度快,對小規模數據集有效,但是在雷達輻射源存在缺失值及特征變量較多的情況下,識別正確率會明顯下降。SVM算法非常適合解決小樣本、非線性、高維度的識別問題,具有較強的泛化能力,不但能夠處理雷達型號識別,還可應用于雷達個體識別,目前仍被廣泛使用。但該方法存在核函數選擇和參數確定問題,在處理多分類任務時還需進一步改進,當雷達輻射源種類和數量較多時,該方法存在一定的局限性,識別速度和正確率都將受到影響。
集成學習是通過構建并結合多個“個體學習器”來完成學習任務,獲得比每個個體學習器更好的泛化能力和穩定性。集成學習方法根據個體學習器的生成方式一般分為2類:個體學習器間有強依賴關系、必須串行生成的序列化方法,代表算法是Boosting;個體學習器間無強依賴關系、可同時生成的并行化方法,代表算法是Bagging[21]。
文獻[22]提出了基于AdaBoost和決策樹的雷達輻射源識別方法,該方法在高密度信號環境下具有較高的輻射源識別率和較快的識別速度。文獻[23]針對數據集識別難度分布不均勻,提出了基于粗糙K-means和AdaBoost的雷達輻射源識別算法。首先提出一種改進粗糙K-means算法,將數據特征空間分割為確定區域、粗糙區域和不確定區域,對數據集進行篩選和識別;然后基于粗糙區域已知數據訓練AdaBoost分類器識別不確定區域未知數據,提升識別速度和精度。文獻[24]提出一種基于加權xgboost模型的復雜體制雷達信號分類方法,該方法通過引入平滑權函數解決數據偏差問題,使用不同屬性組成的大型數據集對模型進行訓練,取得良好的輻射源識別效果。
隨機森林是以決策樹為基學習器構建Bagging集成模型,是Bagging的擴展變體。文獻[25]針對雷達信號脈內調制識別準確率低的問題,提出利用隨機森林進行雷達信號脈內調制類型識別,選取雷達信號時頻圖像的形狀、紋理作為融合特征,由100棵決策樹組成的隨機森林作為分類器,實現信號的分類識別;通過仿真對8種調制信號類型進行識別,在信噪比為-2 dB時得到90%以上的識別率。文獻[26]提出一種基于隨機森林的不完整數據集的多功能雷達(Multi-Function Radar,MFR)輻射源識別方法,該方法將先驗知識集按照MFR輻射源波形單元進行多重劃分為多個子集,利用隨機森林算法對各個子集構建弱分類器,根據子集識別貢獻率設定權值,得到最終的識別模型。仿真表明該方法能在少量先驗知識條件下提高波形單元識別準確率和魯棒性,降低計算成本。文獻[27]提出一種基于深度學習和集成學習的輻射源識別框架,利用棧式降噪自編碼模型學習雷達信號時頻圖像特征,構造集成不同SVM的模型對雷達信號進行識別,提高了輻射源識別的正確率。
集成學習具有良好的學習效果,近年來受到研究人員的關注。AdaBoost算法不用做特征篩選,也不用擔心過度擬合等問題,但計算復雜度較高,訓練時間較長,弱分類器的選擇對識別結果影響較大,針對不同類型的雷達輻射源需要選擇合理的弱分類器。隨機森林結構簡單,計算開銷小,容易訓練,在雷達輻射源識別任務中具有獨特優勢。
近年來,深度學習在計算機視覺、語音識別、自然語言處理等領域取得了令人矚目的成果,是當前最熱門的研究方向,已經形成十幾種不同算法,典型的深度學習算法有深度置信網絡(Deep Belief Network,DBN)、卷積神經網絡(Convolutional Neural Network,CNN)、稀疏自編碼器(Sparse Automatic Encoder,SAE)、循環神經網絡(Recurrent Neural Network,RNN)、長短期記憶網絡(Long Short Term Memory,LSTM)、生成式對抗網絡(Generative Adversarial Networks,GAN)等[28]。將深度學習用于雷達輻射源識別是國內外研究者的最新課題,通過構建深度神經網絡,可以將復雜的底層信號特征,通過神經網絡傳遞,實現非線性的函數逼近,從而完成對雷達輻射源的分類識別,目前主要從兩個方向開展研究。
第1個研究方向是通過有監督學習提取輻射源信號的特征進行分類識別,典型深度學習模型是CNN。利用CNN在解決計算機視覺任務上的強大性能,對雷達輻射源信號進行一定的變換,提取其二維圖像特征(較為常用的是時頻分布特征)作為樣本訓練CNN模型,然后進行分類識別。文獻[29]對雷達輻射源信號進行短時傅里葉變換(Short Time Fourier Transform,STFT)得到調制信號的時頻分布,用CNN進行分類識別,針對低信噪比條件下模型區分BPSK和普通信號效果差的問題,設置STFT最大時間累積量閾值,實現對上述2類信號的有效識別。文獻[30]針對低截獲概率雷達波形識別問題,提出利用深度卷積網絡遷移學習的識別方法,首先利用Choi-Williams分布將信號轉化為二維時頻圖像并進行預處理,預處理后輸入到CNN預訓練模型進行特征提取,CNN網絡選擇Inception-v3或ResNet-152,最后用SVM分類器進行識別,在信噪比為-2 dB條件下,對9類調制信號平均識別率可達97%。文獻[31]提取輻射源信號的雙譜特征并進行降維,利用壓縮雙譜特征訓練CNN,進行輻射源個體識別(Specific Emitter Identification,SEI)。文獻[32]提取輻射源的相位/正交(inphase/quadrature,IQ)不平衡參數,以該參數作為輸入訓練CNN從而實現SEI,該方法還可應用于輻射源目標跟蹤。文獻[33]提出一種雷達輻射源信號精確識別系統,可以有效分離多個信號分量,并準確識別BPSK、LFM等9類調制信號。文獻[34]比較了CNN、RNN、LSTM三種深度神經網絡模型,并以雷達輻射源信號包絡前沿為識別特征,將模型應用于雷達輻射源個體識別。文獻[35]將CNN與強化學習相結合,利用CNN自動提取雷達輻射源信號包絡前沿特征,并擬合當前狀態動作時的Q值,通過3種強化學習模型完成輻射源個體識別,實測數據實驗表明深度強化學習網絡對輻射源的正確識別率高達98%。
第2個研究方向是通過無監督學習提取輻射源信號的特征進行訓練,再利用BP算法對模型參數進行有監督微調,最后通過分類器進行識別。典型深度學習模型是DBN和SAE。文獻[36]針對雷達工作模式識別問題,提出了一種基于DBN和邏輯回歸的深度學習架構,通過DBN學習雷達輻射源特征,利用邏輯回歸識別特定類型的輻射源,該方法在不同噪聲和脈沖丟失條件下具有良好的魯棒性和較高的識別率。文獻[37]提出一種基于STFT能量累積量和強化深度信念網絡(Reinforced Deep Belief Network,RDBN)的雷達輻射源識別方法,該方法首先對STFT的時頻分布進行基頻降噪處理,通過計算不同時間采樣下各頻率采樣值的累積量,得到STFT的能量累積量作為輸入特征。將強化學習與DBN結合構建RDBN模型,利用輸入特征訓練模型,實現對雷達輻射源的識別分類,該方法在低信噪比下具有較強的魯棒性和廣泛的適用性。文獻[38]以輻射源時域波形數據作為訓練樣本,利用訓練樣本對使用RBM和DBN相結合的模型進行訓練,采用KNN、隨機森林、SVM三類分類器進行識別,并通過大量實測雷達數據進行了實驗驗證,取得良好效果。文獻[39]通過STFT將時域雷達信號轉換為時頻圖像并降維處理,利用SAE自動提取特征并進行訓練,使用Softmax函數進行分類識別,并仿真驗證了算法的有效性。文獻[40]利用SAE提取輻射源信號模糊函數主脊包含的調制特征并訓練網絡,用Softmax分類器進行分類識別。選取6種調制類型信號進行仿真實驗,分析了SAE參數和結構、輸入信號特征、特征提取方法、深度學習算法、信號調制樣式對實驗結果產生的影響,并使用實測雷達數據驗證了該方法的有效性。文獻[41]提取雷達信號的雙譜特征,采用分層極限學習機(hierarchical extreme learning machine,H-ELM)中的SAE進行特征學習,通過仿真驗證了方法的有效性。
深度學習是更深層的人工神經網絡,它將特征工程自動化,自動學習數據中全面的關鍵信息,提取數據更本質的特征。在訓練樣本充足的前提下,能夠獲得非常好的識別率和魯棒性,在解決大數據量、高復雜度、高維特征參數方面有很好的效果。其代價是模型太大,超參數過多,訓練時間較長,依賴大規模帶標簽數據,而實際中獲取大量的非合作雷達輻射源數據存在一定的困難。
現代戰場電磁環境下,雷達信號空前密集,信號調制樣式愈加復雜,雷達功能愈加多樣化。雷達輻射源識別的任務需求,由早期有限數量的簡單雷達信號識別,發展為復雜電磁環境條件下對多目標多種工作模式的高效準確識別,給雷達輻射源識別帶來極大困難。
利用機器學習實現雷達輻射源識別智能化是解決上述問題的有效途徑。綜前所述,基于神經網絡的雷達輻射源識別方法存在局部極值和過學習的風險,難以達到模型最優。基于統計學習的雷達輻射源識別方法處理大樣本、多分類問題時反應速度較慢,抗干擾能力有限。基于集成學習的雷達輻射源識別方法隨著個體學習器數量的增加,存儲空間需求增大,預測速度受到影響。基于深度學習的雷達輻射源識別方法將特征選擇和分類器結合到一個框架中,省去了人工設計特征的繁瑣,極大簡化了工作流程,深層神經網絡結構適用于大樣本、多分類任務,具有良好的識別效果和魯棒性,通過預先訓練得到網絡模型,就可利用模型進行快速預測,易于工程實現,是未來的發展趨勢和主要研究方向。目前,基于深度學習的雷達輻射源識別存在以下幾個問題。
1) 樣本數量不足。足夠數量的樣本數據是開展機器學習的基礎和前提條件,相較于其他方法,深度學習對樣本數量的要求更高。而實際應用中,由于電磁環境復雜性以及研究目標的非合作性質,往往面臨樣本數量不足的問題。可以從兩方面開展研究:一是利用生成式對抗網絡(GAN)進行數據增強,GAN廣泛應用于圖像生成,當提取雷達信號的二維圖像特征后,使用GAN擴充樣本庫,再對CNN、DBN、SAE等模型進行訓練;二是深度神經網絡與SVM結合,利用SVM適合解決小樣本識別問題的優勢,由深度神經網絡自動提取識別特征,之后用SVM進行分類識別。
2) 訓練速度較慢。深度神經網絡具有較深的網絡層次、大量的超參數,加之訓練樣本規模較大,導致模型訓練速度很慢。為了提升模型訓練速度,可以從兩個方面開展研究:一是改進訓練算法,通過降低算法的計算復雜度,提高運算速度;二是優化訓練流程,研究并行化訓練模式,將訓練中的前向、后向計算流程劃分為多個可并行模塊,通過并行處理提高運算效率。
3) 雷達工作模式識別研究較少。目前基于深度學習的雷達輻射源識別研究主要通過提取雷達信號二維圖像特征,對雷達脈內調制方式進行識別;對雷達工作模式識別的研究相對較少,而雷達工作模式識別對于分析目標行為和意圖預測具有重要意義。雷達各種工作模式是由不同變化方式的雷達脈沖列實現,一種識別方法是研究提取合適的識別特征,將不同工作模式的脈沖序列轉換為二維圖像,利用CNN模型在圖像識別上的優秀性能進行識別。另一種方法是針對雷達脈沖列的時間序列屬性,利用循環神經網絡在處理時序數據的良好性能,開展基于RNN模型的雷達工作模式識別方法研究,該方法直接以脈沖序列作為輸入,不必提取信號特征,實現雷達工作模式的“端對端”識別,在流程結構上更具優勢。
雷達輻射源識別技術是電子對抗技術的重要組成部分,隨著科技進步,雷達輻射源識別智能化是未來的主要發展方向。機器學習是人工智能的核心技術,將機器學習與雷達輻射源識別結合是很好的解決方案。本文綜述了基于機器學習的雷達輻射源識別方法,指出基于深度學習的雷達輻射源識別方法作為將來該領域的研究方向,提出了亟需解決的問題及研究方向,對下步研究具有一定的參考意義。