姚 瑤,王戰紅
(1.鄭州工程技術學院信息工程學院,河南 鄭州 450044;2.鐵道警察學院圖像與網絡偵查系,河南 鄭州 450033)
在電子情報(Electronic Intelligence, ELINT)分析中,對雷達信號的識別是電子戰系統的關鍵技術之一[1-2]。隨著雷達技術的飛速發展,脈間參數提供的信息可能越來越少,更多的信息被掩藏在脈內調制方式中,而其信號內部的調制方式可以在提高雷達信號的參數估計精度、推測雷達工作模式,進而判斷雷達威脅程度等方面發揮重要作用[3]。因此,在信號脈內調制越來越復雜的背景下,對信號調制方式的正確識別受到眾多學者的關注,同時也成為現代電子戰中亟需有效解決的問題。
時頻分析是處理非平穩信號的重要工具之一,它相對于傅里葉變換等時域分析方法來說,將時間與頻率結合起來,有效地檢測到信號頻率與時間的變化規律,清楚地描述出在不同時間內頻率的能量密度或強度[4-5],因此在雷達信號處理中,可以更好地反映信號調制方式的內部結構。國內外許多學者在利用時頻變換得到的數據進行相關的特征提取,文獻[3]在利用CWD(Choi-Williams Distribution)變換的基礎上提取時頻圖像的奇異譜熵特征,再結合分形特征,使用8類雷達信號,在信噪比大于4 dB時,識別正確率都達到了100%。文獻[6]利用CWD時頻圖像,并從圖像中提取相關特征,在信噪比為-2 dB下識別率能達到94.7%。文獻[7]提出了多尺度小波熵以及特征權重選擇法,獲得了較高的識別效果。從上述文獻可知,在時頻變換的基礎上利用其他特征提取方法,可以得到各種各樣的識別方法,但是這些方法并沒有從時頻變換得到的圖像本身出發,而是通過人工設計大量的特征組合在一起。對于人工選取特征這一類的方法,一方面是需要大量專業知識與經驗,是相對困難的;另一方面,選取的特征在不同環境或者狀態下,其識別率也不穩定,并且它們通常都屬于淺層特征[8]。
隨著人工智能的發展,深度學習的方法逐漸被引入雷達信號處理中[9-10],其能減少特征的選取過程以及能夠對特征進行深度提取,在識別中具有強大的優勢。其中,卷積神經網絡(Convolutional Neural Network, CNN)相對于其他網絡能夠對圖像進行自動學習結構化特征,可以自動學習到圖像數據中的結構[11]。文獻[8]提出了利用棧式稀疏自編碼器作為提取特征和分類的工具,識別效果較為明顯,然而在預處理過程中容易保留不住信號特征,導致識別率提高不上去。
針對在預處理過程中時頻圖像的特征性可能會降低且人工選擇特征的復雜度較高的問題,提出了一種時頻預處理下卷積網絡的雷達信號識別算法,較好地在預處理過程中保留住時頻圖像的特征,為卷積網絡深層次提取具有判別性的特征提供保障,實現了在低信噪比下的信號識別。
SPWVD時頻分布是由WVD分布中加入兩個實的偶函數g(u)和h(τ)得來的,相對于WVD,SPWVD可以更好地削弱相干項的影響,能量和時頻聚集性更強,更容易看出信號的時頻關系。
對于截獲到的雷達信號x(t),可計算WVD分布:

(1)
進而加入兩個實偶窗函數,其中g(u)為時域平滑窗和h(τ)為頻域平滑窗,得到SPWVD分布:

(2)
為直觀展現SPWVD與WVD在表達雷達信號時頻圖像上的差異,圖1為在信噪比為10 dB下,本文使用的8種典型雷達信號調制類型時頻變換上的圖像表達,包括常規信號、線性調頻、非線性調頻、二相編碼、四相編碼、頻率編碼、調頻連續波、COSTAS碼。
可以看出,SPWVD的時頻聚集性強于WVD,能量表達更為凸顯,且成像更為干凈,說明SPWVD受噪聲的影響也比WVD小。另外,從頻率編碼和COSTAS信號可以發現,WVD在變換過程中會產生多余的分量,掩蓋了原信號的時頻特征。因此通過SPWVD更容易獲取信號的時頻特征,不受其他多余分量的干擾。
考慮到網絡的計算性能,對圖像的預處理目的在于進一步減少數據量,但在此基礎上一定要盡可能地保留圖像內容的完整性以及特征的明顯性,避免在處理過程中使能夠判別類別的特征被削弱或被丟失。因此在本文對雷達信號的時頻圖像預處理中,首先需要進行對稱映射,增加特征信息;然后對信號的時頻曲線進行主能量脊提取,并二值化,提高抗噪性,突出特征信息的同時減少數據數值;最后對時頻圖像進行重置,減少數據量。

圖1 8種雷達信號SPWVD與WVD時頻圖Fig.1 The time-frequency images of SPWVD and WVD among 8 sorts of radar signal
從圖1可以看出,NS、LFM、BPSK、NLFM、QPSK五種調制方式以及FSK、COSTAS兩種調制方式,在時頻圖像表達上有一定的相似度,尤其在信噪比較低的情況下,噪聲的干擾可能會削弱調制方式之間的不同特征,會對分類器的學習、訓練、識別造成一定的影響。因此本文首先采取對稱映射的方式,增加不同調制信號間本身的特征信息,如圖2所示。
時頻圖像反映了信號在時域和頻域的能量分布,而能量的分布正是表征不同信號種類的特征。為了突出能量的分布狀態,降低噪聲的干擾,在每一采樣點上可以獲得最大能量值Emax,文獻[12]則是連接每一采樣時刻的幅度峰值點,形成了一條特定的曲線,然而信號時頻能量的分布并不能僅僅用一條曲線來表示,更應該用輪廓來表示,比如BPSK、QPSK信號,如果按照文獻[12]處理,則會得到幾乎一樣的直線,在識別中誤差會加大;另一方面,當信噪比較低時,噪聲能量可能比信號能量還要高,那么峰值點將會出現在噪聲處,這樣得到的曲線將已不是原來信號的模樣。
因此,本文對主能量脊提取方法為:在采樣點上獲得最大能量值后,降低判定為主能量脊的閾值,選擇E=Emax·σ,σ∈[0.5, 1)作為判斷依據,即在采樣時刻大于E的點都可作為主能量脊,其中σ表示值在區間[0.5, 1)內選擇,當噪聲逐漸增大時,區間的取值也逐漸增大,用以消除噪聲的影響。

圖2 對稱映射后的時頻圖Fig.2 The time-frequency images after symmetrical mapping
當對信號時頻圖像進行主能量脊提取后,則可以獲取時頻能量的分布狀態,在隨后本文的算法中CNN學習不再關注能量的大小,而是關注能量的分布形狀,因此將圖像二值化可以在保留信號的完整特征信息的基礎上,進一步減少噪聲的干擾,也可以降低訓練中數據數值的計算,簡化識別部分的運算。
二值化處理的方法有很多,其中牛津法能夠自適應確定分割閾值,也叫最大類間誤差法,其特點在于:能夠將圖像分為目標和背景兩個部分,目標和背景之間的類間差越大,說明構成圖像的兩部分的差別也就越大。通過第二步主能量脊的提取,目標和背景已經能夠在很大程度上區分,因此適合用最大類間誤差法進行二值化。
在CNN處理圖像時需要考慮到計算性能與識別效率,若圖像數據量大、維數大則會導致訓練的參數將成倍增加,在訓練學習中非常耗時,同時也影響識別效果。而在圖像重置中提供了許多不同的插值方法,其中雙3次插值在精度上能夠更好地插補圖像,對重置的效果最好。因此本文采用雙3次插值的方法進行時頻圖像的調整,并考慮到若重置太小,將模糊了信號的一些重要特征信息,最后將圖像調整為64×64。
經過四步預處理,可以得到需要的信號時頻圖像,也是CNN的輸入數據。圖3(a),(b),(c)為在信噪比0 dB、-5 dB、-10 dB下LFM信號預處理后的圖像,可以看出,隨著信噪比的降低,時頻圖像開始出現其他的噪聲點,但是在低信噪比下依然能夠清楚看到信號調制方式樣式,極大地保持了原調試方式的特征,說明預處理對噪聲的抗干擾性較強。圖3(d),(e),(f)為LFM信號在信噪比為-10 dB下,σ=0.7,0.8,0.9時的情況,可以看出當σ逐漸增大時,噪聲點逐漸減少,說明了當信噪比較低時,適當提高σ值可以在一定程度上抑制噪聲點的干擾。
有著大量待學習參數的卷積神經網絡,若采用隨機初始化的方法,可能導致卷積核初始化欠優,產生權值和網絡參數的學習難度增大、網絡收斂時間長等問題,訓練的效果可能并不理想。若要達到較好的效果,則需要大量的標注的樣本,通過大量的迭代使網絡得到收斂。

圖3 預處理后的LFM圖像Fig.3 LFM image after preprocessing
而對于電子戰系統的截獲接收機來說,雖然復雜電子環境中有百萬級數量的電磁信號,實際上能夠截獲到攜帶輻射源信息的、能夠判定威脅程度的完整信號并不多,即在情報分析中能夠提供的信號樣本較少,因此很難通過上述所講的大量樣本來訓練網絡。從文獻[11—13]可知,使用一個在其他訓練集上訓練好的CNN模型,對另一個待學習的CNN模型進行訓練,能夠較快地使參數得到最優化,網絡得到收斂,且不需要巨量的樣本數據。而文獻[14]又提到,使用大數據進行預訓練的方法,要在選用的數據集和目標數據之間差異較小的情況下才可能達到效果,同時也需要進行大規模的訓練才能遷移到目標數據集上。
鑒于MNIST手寫數據庫[15]中的手寫圖像是灰度的,且在分布形態上與本文處理后的信號時頻圖像都有著直觀上的相似度,因此本文使用MNIST手寫數據庫作為CNN模型的預訓練數據集,并通過預訓練將得到的卷積核對本文CNN模型的卷積層進行逐層初始化。
經過網絡大小、計算性能、識別效果的綜合考慮,本文設計的CNN模型最終采用3個卷積層,3個池化層和1個全連接層。其中卷積層的卷積核大小分別為5,5,2,卷積核滑動都為1,卷積核的個數分別為16,32,64;池化層中均采用2×2最大池化(Max Pooling),滑動步長為2,分別緊接在前三個卷積層后,最后一個池化層緊接在全連接網絡前;所有中間層的激活函數均使用ReLU(Rectified Linear Unit)函數。具體結構參數如表1所示。

表1 CNN結構參數
最后,本文提出的雷達信號的識別算法如圖4所示,通過對截獲到的雷達信號進行時頻圖像預處理,得到保留信號調制方式特征的二值化圖像,輸入到經過預訓練后初始化模型的CNN中進行學習、識別。
實驗測試平臺為:Win7、32位操作系統,處理器Inter(R) Core(TM) i5-3210M,內存4 GB,CPU主頻2.50 GHz。實驗仿真依然采用第2章提到的8種典型雷達信號,參數設置參考文獻[16],其中所有信號的采樣頻率為60 MHz,在載波頻率在7~13 MHz范圍內均勻變化,其他參數具體如表2所示。

表2 信號主要參數范圍

圖4 本文信號識別算法Fig.4 Signal recognition algorithm
實際上對于截獲到的信號往往會有噪聲污染,因此在仿真實驗中,對每種信號添加高斯白噪聲,信噪比從10~-10 dB,以5 dB為步進間隔,且每種信號在不同信噪比下隨機產生1 000組訓練樣本,150組測試樣本。同時在同一信噪比下,將不同種類信號隨機排列形成混淆矩陣,測試時重復10次,識別結果取平均。
為了展示本文對時頻圖像預處理方法的優勢,采取與文獻[8]使用的方法進行對比,使用本文產生的信號數據集,將同一信噪比下的每種信號樣本數量從200逐漸增加到1 000,以200為步進間隔,比較了信噪比為10 dB、0 dB、-10 dB下的識別正確率,如圖5所示。

圖5 在不同信噪比下預處理方法對比Fig.5 The comparison of preprocessing methods at different SNRs
從圖5可以看出,隨著訓練樣本數量的增加,識別正確率持續提高,說明網絡還是依賴于訓練規模的大小,但可以看出每種信號在樣本數量為800時,識別率將逐漸趨于平穩。在10 dB和0 dB下,兩種方法得到的信號識別準確率基本上相差不大,但在信噪比為-10 dB時,本文方法較文獻[8]識別率平均提高了2.2%,一方面文獻[8]使用的CWD在時頻聚集性上相比于SPWVD較差;另一方面文獻[8]通過圖像的剪切獲取了具有信號特征的局部部分,而隨后的重置將圖像的分辨率進一步降低,而在低信噪比下噪點逐漸增加,若剪切重置后的圖像中有噪點,則該噪點被放大從而極大地干擾信號特征,本文則依然使用全局圖像,噪點的干擾相對來說影響要小。
為驗證預訓練CNN模型的效果,在此比較了直接使用新模型和使用預訓練后模型的訓練時間和識別正確率,為盡量避免偶然性的出現,在信噪比為10 dB下,進行對比實驗并重復10次,最后結果取平均值,如表3所示。在訓練過程中,未進行預訓練的CNN識別率最低出現過96.4%的結果,而進過預訓練的CNN模型在這10次實驗中都是100%;另外預訓練后的CNN在訓練時間上減少了近三分之一,因此說明通過MNIST數據集訓練后的CNN,其得到的參數能夠較好地遷移到本文信號識別目標上來。

表3 有無預訓練過程的對比
為驗證本文識別算法的優勢,與文獻[3]的SVEFD-CSVM算法、文獻[17]的CWD-ENN網絡(Elman Neural Network)分類系統在不同信噪比下進行識別正確率的對比,結果如圖6所示;其中利用文獻[3]提出的SVEFD方法處理本文信號數據集,然后輸入到CSVM中進行訓練、識別;利用文獻[17]基于CWD時頻圖像進行提取的方法處理本文信號數據集,然后輸入到ENN中進行訓練、識別。

圖6 算法對比Fig.6 Algorithm comparison
從圖6可以看出,本文算法的識別效果優于另外兩種算法,尤其在低信噪比下優勢明顯,識別正確率比文獻[3]平均提高了13.0%,比文獻[17]平均提高了9.2%。這是因為文獻[3]和文獻[17]都采用人工提取特征的方法,且使用的分類器屬于淺層分類器,當信噪比逐漸降低時,特征之間的區分度也隨之下降,分類器也不能進行有效分類;同時也說明了本文算法采用卷積神經網絡相比于人工特征提取方法,在深度提取特征方面,能夠更好地把握信號圖像的內部結構,從而在信噪比低的情況下,仍有較好地識別率。
本文提出了時頻預處理下卷積網絡的雷達信號識別算法。該算法通過將信號的SPWVD時頻圖像與CNN相結合,利用對稱映射、主能量脊提取、二值化以及重置的預處理過程,在極大地保留信號圖像特征的基礎上,降低數據量,減小噪聲干擾。最后利用預訓練后的CNN對圖像進行自動地深層特征提取,免去了人工特征提取的困難。
仿真結果表明,預處理方法在低信噪比下有著更好的保留特征的優勢;提出的算法相比于兩種人工提取特征的方法,在低信噪比下識別率分別提高了13%,9.2%,較好地實現了在低信噪比下得到較高的識別率,為電子戰的情報分析提供了一種可行的方法。