侯思堯 ,李 偉,李永光,凌 杰,黃黔川
(電子信息控制重點實驗室,成都 610036)
輻射源信號個體識別首先利用表征個體指紋特征的屬性,如包絡上升沿、下降沿、頂部起伏等,通過傅里葉變換等手段完成指紋特征的提取,再采用相應的個體識別方法實現對同類輻射源的不同個體的識別。
目前利用機器學習的個體識別方法方面主要包括深度學習和集成學習兩類,均需要根據個體樣本開展識別模型訓練,然后根據訓練后的模型完成未知個體的識別。其中,深度學習方法首先提取輻射源個體特征,然后構建多層網絡,將提取的特征作為輸入開展個體識別訓練,訓練期間利用多層網絡組合低層特征形成更加抽象的高層表示屬性類別或特征,以發現數據的分布式特征表示,提升識別準確率。典型深度學習方法包括卷積神經網絡[1-4]、深度置信網絡[5]等,通過二維分布圖或多維的描述作為輸入,通常由于網絡層級較大,導致計算量大,不利于工程應用。
集成學習首先組成一組個體學習器,再用某種策略將它們結合在一起,使其具有較好的分類效果和泛化性能,典型方法有隨機森林[6]、Adaboost[7]、GBDT[8]等。隨機森林具有高維特征處理、數據適應性強和較好的抗噪能力,但在噪聲較大的分類或回歸問題上容易出現過擬合;Adaboost方法在數據不平衡的情況下容易導致分類精度下降,訓練耗時長且易受噪聲干擾;GBDT方法的多個弱學習器之間存在依賴關系,難以并行訓練數據。
本文采用優勢互補的方式,將卷積神經網絡和隨機森林方法進行綜合,同時,從工程化應用角度考慮,減少卷積神經網絡層數,最終形成針對不同輻射源的綜合識別模型。通過仿真驗證,本文提出的識別方法具有運算時間短、識別概率高的特點。
本文提出的輻射源個體識別流程如圖1所示。

圖1 輻射源個體識別流程
Step1 將所有輻射源信號進行預處理并建立標簽,生成數據集M,隨機抽取其中的80%作為訓練集T,剩余的20%作為測試集C,其中,抽取的輻射源信號滿足數據標簽均勻分布,對于數據量少的個體通過同標簽數據隨機填補,以保證不同個體的訓練樣本數量基本一致。
Step2 依次提取訓練集T中各輻射源信號的指紋特征,生成輻射源特征矩陣A,用于下一步的訓練與實際分類處理。
Step3 構建基于卷積神經網絡的深度學習模型,考慮工程化應用,采用3個卷積層、3個池化層、3個激活層以及輸入層和輸出層。將Step 2生成的輻射源特征矩陣作為輸入進行訓練,生成個體識別模型。
Step4 構建基于隨機森林的集成學習模型,將Step 2生成的輻射源特征矩陣作為輸入進行訓練,生成個體識別模型。
Step5 將Step 2中的輻射源特征矩陣作為輸入,分別利用Step 3、Step 4的個體識別模型進行個體識別,并基于兩種模型的識別結果,采用識別概率統計的方法生成不同輻射源個體的綜合權重向量,即卷積神經網絡和隨機森林的權重值,最后根據綜合權重向量形成針對不同輻射源個體的綜合識別模型。
為了適應實際應用中電磁環境的變化,將新獲取的數據Madd添加到輻射源信號數據集M中形成新的數據集Mnew,定期執行Step 1~5,對訓練模型進行更新。
Step6 依次提取測試集中各輻射源信號的指紋特征,生成輻射源特征矩陣,利用Step 5生成的綜合識別模型進行個體識別驗證。
構建卷積神經網絡,訓練基于深度學習的個體識別模型。卷積層的卷積核為一維向量,激活層為ReLU函數,輸出層由一層全連接網絡和Softmax分類器組成。其中,卷積層1的卷積核為1×25,步長為2,卷積核個數為70;卷積層2的卷積核為1×16,步長為2,卷積核個數為140;卷積層3的卷積核為1×8,步長為2,卷積核個數為280。池化層1、2、3均采用最大池化,池化大小為1×4,步長為2,如圖2所示。將特征矩陣A作為輸入,生成基于卷積神經網絡的輻射源個體識別模型Mdpl。

圖2 卷積神經網絡結構
構建隨機森林網絡,訓練基于集成學習的個體識別模型。通過K個決策樹和信息增益構建隨機森林網絡,其中K為輻射源個體數的20倍,用于分割節點的特征子集合個數為特征集合個數的均方根。將特征矩陣A作為輸入,生成基于隨機森林網絡的輻射源個體識別模型Meml。
將特征矩陣A作為輸入,分別利用識別模型Mdpl和Meml進行個體識別,并基于識別結果的概率統計確定個體識別模型Mdpl的權重向量wdpl以及個體識別模型Meml的權重向量weml,并保存模型參數。權重向量算法如下:
根據給定的閾值Ftrust以及輻射源個體集合D={a1,a2,a3,…,az},得到識別結果為輻射源個體am的準確率Fam為
(1)
式中:Sam是訓練集中輻射源個體am的信號數量;fam表示某一信號識別為am的概率值;Bool(fam≥Ftrust)表示當fam≥Ftrust時值為1,否則值為0。

通過上述方式可得到長度為z的綜合權重向量wdpl和weml。
根據兩個識別模型及其對應的權重向量生成不同個體的綜合識別模型,利用綜合識別模型計算某一信號識別為個體am的綜合概率如下:
(2)

本文在仿真環境下利用某型號雷達9個不同個體實際數據進行仿真驗證,數據集中每個個體的脈沖數為7 000~12 000,其中80%作為訓練使用,剩余20%作為測試使用,如表1所示。置信度閾值Ftrust=0.6,訓練用計算機的CPU為Intel Xeon Silver 4110,內存32 GB,顯存16 GB。

表1 輻射源脈沖數統計表
利用卷積神經網絡算法的識別結果如圖3所示,利用隨機森林算法的識別結果如圖4所示,利用本文所述算法的識別結果如圖5所示。

圖3 卷積神經網絡算法得到的識別結果

圖4 隨機森林算法得到的識別結果

圖5 結合卷積神經網絡與隨機森林算法得到的識別結果
通過圖3~5的對比分析可知,本文所提方法的平均識別準確率為94.6%,卷積神經網絡算法平均識別準確率為88.4%,隨機森林算法平均識別準確率為90.6%,因此本文方法能夠提升整體識別準確率。針對單一算法識別準確率較低的個體,如卷積神經網絡對輻射源個體A44識別準確率為38%,隨機森林對輻射源個體A46識別準確率為49%,而本文所提方法對輻射源個體A44識別準確率為92%,對輻射源個體A46識別準確率為98%,識別正確率均高于單一算法,因此本文所提算法對于不同輻射源個體均有較好的適用性。
本文提出的輻射源個體識別算法選取了深度學習中的典型算法——卷積神經網絡和集成學習中的典型算法隨機森林,目的在于提供一種思路,即如何將深度學習算法與集成學習算法相結合,通過減少深度學習網絡層數,達到減少運算時間的目的,從而提升工程化應用能力。應用分析結果顯示,本文所提方法具有良好的識別結果。
此外,應用分析中用到的雷達數據不含多徑效應以及噪聲干擾等情況,因此在工程應用中,所述方法缺少對數據的預處理環節,這也是本文的不足之處,后續應該進一步探索在復雜電磁環境下的輻射源個體識別問題,以滿足實際需求。