丁辰偉,孫閩紅,官友廉
(1 杭州電子科技大學通信工程學院,杭州 310000;2 75798部隊,北京 100089)
特定輻射源識別(special emitter identification, SEI)是通過分析從輻射源發送的信號中提取與輻射源設備相關聯的特征參數(個體細微特征)來自動識別輻射源的技術。近年來,人工智能技術迅速發展,深度學習算法被廣泛應用于輻射源個體識別。文獻[1]提出了一種利用CNN識別7種脈沖重復間隔調制類型的全自動方法,不僅提高了系統的性能,而且對具有丟失和偽脈沖的環境具有魯棒性;文獻[2]構建了一個深度殘差網絡來學習信號的希爾伯特譜圖,有效解決了退化問題,提高了效率和通用性;文獻[3]采用卷積神經網絡對特定輻射源信號進行壓縮雙譜識別,提高了識別性能;文獻[4]提出了一種基于稀疏自編碼器(SAE)的電磁信號分類算法。但是,上述算法都忽略了特征間的內在聯系。在圖像識別中往往會采用圖像增強技術[5-6]對圖像進行處理提高識別性能。但是,不論是傳統方法還是深度學習方法,算法性能都受到樣本數目的約束,在小樣本的情況下算法很難達到較好的識別性能。文獻[7]提出了一種多模態Weibull虛擬樣本創建算法,使用一個數據集來檢查所提出的方法的性能,并且通過預測均方根誤差進行比較,驗證了算法的有效性;文獻[8]提出了一種分段隨機抽樣方法對加速測試數據進行重采樣,有效擴展測試樣本大小,并通過仿真驗證了生成樣本的可靠性;文獻[9]提出了類似于原始圖像的多個虛擬樣本生成算法,提高了小樣本下的識別率;文獻[10]提出了一種基于增強條件對抗生成網絡(SCGAN)和CNN的低分辨雷達目標識別算法,提高了小樣本條件下算法的識別性能。
文中采用圖像增強算法對SAE提取的特征進行特征增強,使得特征間的差異更加明顯,然后利用SCGAN和CNN網絡對增強后的特征進行訓練識別,有效提高了小樣本條件下雷達輻射源個體識別的識別率。
如圖1所示,算法流程為:

圖1 算法運行框圖
1)數據預處理。首先對接收到的雷達脈沖信號s(t)進行短時傅里葉變換(STFT)得到它的時頻圖矩陣S(t,f);然后將時頻圖矩陣S(t,f)進行灰度處理得到灰度矩陣W;最后將灰度矩陣W進行向量化操作,得到一個N維向量v作為輸入樣本。將采集到的多個雷達輻射源下M個脈沖信號進行上述操作,得到一個大小為M×N的灰度矩陣V。
2)特征提取。將灰度矩陣V輸入到SAE中進行特征提取,通過調節網絡參數,使得網絡輸出維度為M×n的特征矩陣HM×n,此處n< 3)特征增強。通過直方圖修正法、灰度變換法、圖像濾波法等圖像增強的方法將輸出的特征矩陣H進行特征增強,最后輸出得到增強特征矩陣KM×n。 4)樣本擴充。將增強特征向量KM×n輸入到SCGAN中進行訓練,訓練完畢后提取SCGAN中的生成網絡模型Model_G,通過Model_G得到M1個生成特征樣本,將生成特征樣本與增強特征樣本混合,得到新的增強特征矩陣K(M+M1)×n。 5)分類識別。將增強特征矩陣K(M+M1)×n輸入到CNN中進行訓練,最后通過SoftMax分類器進行識別,輸出識別概率。 以線性調頻(LFM)信號s(t)為例,對其加漢明窗進行STFT,得到S(t,f),如圖2所示。然后對時頻圖中有信號的部分進行截取,通過邊緣檢測技術提取時頻圖輪廓,然后找到時頻圖輪廓重心,以重心為中心點提取300×300的像素點,如圖3所示。 圖2 LFM信號時頻圖 圖3 LFM信號截取后時頻圖 最后將圖像轉化為灰度圖像,并進行下采樣和向量化操作,得到長度為60×60的時頻圖灰度向量v。 對預處理后得到的時頻圖灰度向量v通過SAE進行特征提取,SAE網絡的輸入大小設置為3 600,第一層輸出大小設置為196,第二層輸出大小設置為100。 圖4和圖5給出了在2臺輻射源各100個信號樣本經過2層SAE特征提取后第一層和第二層的隱含層特征,發現100個信號樣本第一層的隱含層特征基本重疊,說明特征穩定,而100個信號樣本第二層的隱含層特征在幅度上存在一定的差異,說明第二層的特征存在一定的不穩定性,因此可以認為,輻射源個體信號時頻圖經過SAE特征提取后的第一層隱含層特征比第二層穩定。 圖4 兩臺不同輻射源信號經過SAE特征提取后第一層隱含層特征 圖5 兩臺不同輻射源信號經過SAE特征提取后第二層隱含層特征 常用的圖像增強算法主要有灰度變換增強[11](拉普拉斯算子銳化、Gamma校正等)和直方圖增強[12]算法。以直方圖增強算法為例:首先將信號SAE第一層的輸出轉化為圖像形式,然后將這幅特征圖像轉化為灰度圖,利用直方圖變換技術對特征信息進行增強。 圖6(a)是特征圖的原始圖像,可以看出整個特征圖像素點之間的差異不是很明顯,無法輕松辨別其細節特征。圖6(b)給出了原始特征圖像的256級直方圖,可以看出,特征圖像的灰度級主要集中在[0,30]之間,為了更好的增強特征圖像信息,可以選取[0,30]的灰度級進行處理并均衡化。 圖6 原始特征圖像及其256級直方圖 從圖7可知,調整后的直方圖在亮調細節方面比原始圖像有了顯著提高,動態范圍明顯增加。經過均衡化后圖像質量得到進一步改善,特征圖像亮度分布均勻,階調變得更加柔和,直方圖由原來的亮調集中變為分布基本均衡,達到了特征增強的目的。 圖7 均衡化30級灰度圖及其直方圖 SCGAN在條件生成對抗網絡(CGAN)的基礎上改變了條件信息y,并在判決網絡的損失函數中添加混疊懲戒項,將錯誤標簽與真實樣本相結合輸入到判決網絡。SCGAN的基本結構如圖8所示,條件信息y定義為輻射源個體的標簽值。 圖8 增強條件生成對抗網絡模型 GAN網絡中的生成網絡和判決網絡均采用3層全連接層,將100維噪聲與1維標簽連接成101維數據輸入到生成網絡中,通過3層全連接層和3層BN層后將維度轉為784維生成樣本,再將784維生成樣本與真實標簽結合成785維數據輸入到對抗網絡中,同時將真實樣本與真實標簽結合成785維數據輸入到對抗網絡中,此外對抗網絡還將輸入錯誤標簽與真實樣本的結合數據。生成網絡與判決網絡中第一層和第二層的激活函數均為LeakyReLU函數,最后一層的激活函數采用Sigmoid函數,其中加入Dropout層和BN層防止模型過擬合。 實驗中的生成網絡與判決網絡中的優化器均采用Adam優化器,其學習率設置為0.002,動量為0.5,每個批次32個樣本,每一批樣本在生成網絡和對抗網絡中交替訓練各一次,訓練批次設置為2 000,損失函數均為交叉熵。 通過3臺同廠家同型號的軟件無線電外設(software defined radio,SDR)USRP N210進行實測信號的采集和接收。將其中2臺N210作為發射機,先后發射相同的信號,另1臺作為接收機,發射位置和接收位置保持一致。在實驗室環境下,發射機和接收機的距離為1 m,此時可以忽略信道噪聲帶來的影響。兩臺發射機均發射正弦脈沖信號,載波頻率設為0.8 MHz,采樣頻率設為10 MHz。將接收到一段時間內的脈沖信號進行截取,通過MATLAB程序對脈沖進行檢測并截取,截取長度為250(其中脈沖部分長度為150,噪聲部分長度為100)。 忽略小樣本條件,將特征增強前后的特征直接輸入到CNN中進行識別。卷積神經網絡的訓練輪次設置為10,批大小設置為64,損失函數選擇為交叉熵函數,學習率為0.01。CNN中輸入總樣本數為6 000,每臺輻射源各2 000組樣本,將其打亂后進行訓練和測試,其中訓練集占總樣本的70%,測試集占30%。每個信噪比下各進行500次蒙特卡洛實驗。為了比較不同特征增強算法的性能,同時考慮了3種特征增強方法:直方圖均衡化、拉普拉斯算子銳化以及Gamma校正。最后得到識別率如圖9所示。 圖9 特征增強前和增強后的真實信號識別率 圖9給出了不同信噪比下的識別率曲線,其中采用特征增強方法的識別性能比未采用特征增強方法有明顯提高。如未采用特征增強時,CNN在-9 dB時已經無法識別出輻射源個體,而經過特征增強后,CNN的識別性能均有所提高。3種特征增強方法中,直方圖增強法的識別性能最優,平均提高9 dB;其次是Gamma校正增強方法,平均提高7 dB;最后是拉普拉斯算子增強方法,識別性能平均提高3 dB。 針對不同算法,分別在不同信噪比下進行實驗。每臺輻射源的樣本個數設置為400,將2臺輻射源的各2 000個真實樣本作為測試數據。算法一將每臺輻射源信號樣本進行數據預處理得到時頻灰度矩陣,對時頻灰度矩陣直接進行SAE特征提取以及直方圖均衡化后輸入到CNN網絡中進行識別。算法二將每臺輻射源信號樣本進行數據預處理得到時頻灰度矩陣,通過SCGAN生成每臺輻射源各1 600個樣本,將生成樣本與原始樣本融合得到每臺輻射源各2 000數量的時頻灰度矩陣,對時頻灰度矩陣進行SAE特征提取以及直方圖均衡化后輸入到CNN網絡中進行識別。算法三將每臺輻射源信號樣本進行數據預處理得到時頻灰度矩陣,對時頻灰度矩陣進行SAE特征提取以及直方圖均衡化,然后通過SCGAN生成每臺輻射源各1 600個樣本,將生成樣本與原始樣本融合得到每臺輻射源各2 000數量的增強特征矩陣,輸入到CNN網絡中進行識別。最后得到識別率如圖10所示。 圖10 不同信噪比下的識別率 圖10給出了3種算法在不同信噪比下的識別率曲線,可以看到,通過SCGAN擴充特征樣本可以大大提高算法的識別性能,說明SCGAN可以很好地擬合增強后的特征分布,從而有效擴充樣本,提高識別性能。但是通過SCGAN擴充時頻灰度向量卻對提高識別性能沒有幫助,說明SCGAN在擴充時頻灰度向量時,很難對其進行較好的擬合,原因是由于真實信號生成的時頻圖數據維度過高。此外,在相同識別率條件下,算法三識別性能較算法一和算法二均提高了15 dB,說明了文中算法的有效性。 針對小樣本實驗中的算法一和三,分別在不同訓練樣本數下進行實驗。樣本的信噪比設置為-3 dB,每臺輻射源的樣本數范圍設置為50~300,間隔設置為50,每臺輻射源的真實訓練樣本數目設置為400,每臺輻射源的生成特征樣本個數為2 000個。采用不包含訓練樣本的每臺輻射源各1 000個真實樣本進行測試。 圖11給出了不同訓練樣本數下,算法在加入SCGAN前后的識別率變化情況。當識別率同時達到98%時,采用文中算法僅需每臺輻射源各100的訓練樣本,而未加入GAN的算法需要每臺輻射源各400的訓練樣本,在達到同樣識別率情況下,需要的樣本數量僅為改進前算法的25%。 圖11 不同訓練樣本數下的識別率 提出了一種基于小樣本條件的雷達輻射源個體識別算法,算法首先提取雷達脈沖信號的時頻圖,然后將得到的灰度圖進行SAE特征提取,利用圖像增強算法處理實現特征增強,然后輸入到GAN中進行樣本擴充,最后輸入到CNN網絡中進行識別。實驗結果表明:采用特征增強方法的識別性能比未采用特征增強方法有明顯提高,識別性能的改進程度高低依次為直方圖增強法、Gamma校正增強法和拉普拉斯算子增強法;加入SCGAN后大大提高了算法在小樣本條件下的識別性能,在相同識別率下,算法識別性能平均提高15 dB,所需訓練樣本數量與改進前相比減少了75%。1.2 圖像預處理


1.3 SAE特征提取


1.4 特征增強


1.5 SCGAN生成特征

2 實驗結果與分析
2.1 特征增強性能分析

2.2 小樣本下算法性能分析


3 總結