徐晉凱,謝 鈞,俞 璐
(1.中國人民解放軍陸軍工程大學 指揮控制工程學院,江蘇 南京 210007;2.中國人民解放軍陸軍工程大學 通信工程學院,江蘇 南京 210007)
輻射源個體識別通過偵收輻射源(各種通信電臺或雷達等)的發射信號,利用信號處理、機器學習等技術,從中提取能夠區分不同輻射源個體的“指紋”特征,并在此基礎上使用分類或聚類方法實現輻射源的個體識別。為獲得良好的識別效果,指紋特征應具有普遍性、唯一性、穩定性、獨立性和可檢測性,然而細微的通信輻射源指紋特征通常淹沒在包含噪聲和不同傳輸數據的發射信號中,提取難度很大。因此在輻射源個體識別的研究中,如何有效提取具有高區分性的輻射源指紋特征一直是關注的焦點。
通信輻射源個體特征主要是由發射機硬件工作產生。文獻[1]歸納了發射機硬件產生的主要特征有時鐘符號率誤差、同向正交(In-phase/Quadrature,I/Q)調制器的調制誤差、振蕩器的頻率偏差和相位噪聲、混頻器和功率放大器的噪聲、等效濾波器失真等。常見的指紋提取方式分為人工提取與深度學習提取兩種。人工指紋特征提取的研究主要從信號的時域、頻域、時頻域、調制域和高階譜等角度進行。文獻[2]對射頻功率放大器帶記憶非線性行為進行建模,通過擬合發射信號的這些非線性變化提取模型參數作為輻射源的指紋特征。文獻[3]使用時間序列置換熵作為輻射源的個體特征。文獻[4]提出了信號總能量、暫態信號持續時間和最大能量點持續時間3 種全局特征和信號希爾伯特變換時頻圖的頻率軸能量分布、時間軸能量分布和時頻平面能量分布3 種時頻指紋特征。星座圖誤差指紋特征又稱為調制域誤差指紋特征,是由Brik 等人[5]于2008年提出的一種穩態指紋特征。文獻[5]對比了星座圖的分布差別,使用相位誤差、幅度誤差和I/Q 偏移等作為識別特征,取得了不錯的識別效果。文獻[6]提到只要滿足時間反向不變性,信號就會具有對稱頻譜,因此通過測量頻譜圖的分布特征,以及測量距離與互相關性作為指紋特征,實現信號的識別。文獻[7]提出信號雙頻譜圖兩個頻率軸之間存在非線性相位耦合,因此雙譜可以作為特征向量進行分類識別。文獻[8]使用小波變換方法提取指紋特征實現高準確度識別。
雖然目前已有不少人工特征提取的研究成果被提出,但是人工特征提取存在著對領域知識要求高和特征普適性差的問題,限制了人工特征輻射源個體識別方法的發展。由于在計算機視覺和自然語言處理等領域取得了巨大成功,深度學習近年來在輻射源個體識別領域也受到廣泛關注。典型的深度網絡如卷積神經網絡(Convolutional Neural Networks,CNN)、長短期記憶網絡(Long Short-Term Memory,LSTM)等在輻射源個體識別中都有成功的應用。文獻[9]基于深度學習提出了多采樣神經網絡,由神經網絡完成指紋提取與分類識別工作。文獻[10]研究了深度神經網絡、卷積神經網絡和循環神經網絡3 種網絡模型對無線設備的特征提取識別效果。文獻[11]比較了支持向量機(Support Vector Machine,SVM)、深度神經網絡和卷積神經網絡等不同類型機器學習技術在輻射源個體識別中的應用。文獻[12]使用長短時記憶神經網絡自動識別特定硬件的特征,并進行發射器分類。文獻[13]采用CNN 和循環神經網絡(Recurrent Neural Network,RNN)對各種信噪比范圍內的物聯網(Internet of Things,IoT)設備進行分類。文獻[14]利用深度學習研究動態信道對射頻指紋的影響。文獻[15]使用生成對抗網絡識別非法輻射源。文獻[16]設計了一個卷積神經網絡,對信號的差分星座跟蹤圖(Differential Constellation Trace Figure,DCTF)進行學習來識別物聯網終端個體。
通信輻射源個體指紋信息是信號發射元器件在發射信號時,附加在數據信號上的細微“噪聲”信號。這些對傳輸信息無益的“噪聲”信號,正是識別輻射源個體至關重要的“指紋”,而攜帶不同通信信息的數據信號卻是嚴重影響輻射源個體識別性能的無益“噪聲”。由于指紋信號相對于數據信號非常微弱,因此采用端對端深度學習的方法需要大量訓練樣本才能把這些微弱的指紋特征提取出來。如果能夠把輻射源發射的原始信號中的數據信號過濾掉,而僅留下指紋信號,則可以大大提升分類器的性能,同時降低所需的標記樣本個數?;谝陨戏治?,本文提出了將發射信號中的數據部分過濾而保留指紋噪聲的研究思路。本文采用變分模態分解(Variational Mode Decomposition,VMD)方法提取指紋信號,并使用CNN 進行特征提取和分類識別。在公開數據集ORACLE[17]以及自建數據集上的實驗結果均表明,該方法可顯著提高輻射源個體識別的性能,特別是在小樣本條件下具有明顯優勢。
現有研究表明,通信輻射源個體特征主要來源于發射機硬件工作產生的各種噪聲,主要包括時鐘符號率誤差、I/Q 調制器的調制誤差、振蕩器的頻率偏差和相位噪聲、混頻器和功率放大器的噪聲、從數字模塊到天線過程中等效濾波器的失真等[1]。這些發射機硬件工作產生的特有噪聲會在發射信號中引入一些微弱的高頻分量,而這些微弱的噪聲信號正是通信輻射源個體識別的關鍵,但與攜帶通信信息的數據信號混雜在一起?,F有通信輻射源個體識別研究都是對包含數據和噪聲的接收信號直接進行特征提取,特別是基于深度學習的端到端特征提取方法。由于占據主要成分的數據信號隨數據不斷變化,會對學習過程產生嚴重干擾,而網絡模型通常需要大量的標記樣本才能學習到通信輻射源的個體特征。雖然指紋信號與數據信號不是簡單的線性疊加,但數據信號會更多地存在于發射信號的低頻部分。如果能將包含更多個體特征的高頻噪聲信號與包含更多數據信號的低頻分量分離,再送入網絡模型進行學習,將會大大提高模型的學習效率,這正是本文提出的研究思路。
將復雜信號分解為有限個頻率分量的常用方法主要有,經驗模態分解(Empirical Mode Decomposition,EMD)、集合經驗模態分解(Ensemble Empirical Mode Decomposition,EEMD)、互補集合經驗模態分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)以及VMD。EMD 方法受噪聲干擾較大,有較嚴重的端點效應和模態混疊效應。雖然EEMD 方法在一定程度上抑制了EMD 方法分解過程中產生的模態混疊現象,但因其在分解過程中添加了白噪聲,導致分解不具有完備性。CEEMD 方法因為添加了成對符號相反的白噪聲,重構誤差大大減小,但計算量過于龐大,并且仍然存在過多的偽分量。VMD 方法能夠自適應地實現信號的頻域剖分及各頻率分量的有效分離,解決了EMD 方法的模態混疊問題,具有更好的噪聲魯棒性,但缺點是需要利用先驗知識確定信號分解的模態數。由于通信輻射源指紋特征主要存在于原始信號的高頻分量中,本文選用VMD 方法對原始信號進行2 模態分解,將特征信號(高頻分量)與數據信號(低頻分量)進行分離,然后將分解后的特征信號送入CNN 網絡進行分類識別,如圖1 所示。

圖1 VMD-CNN 通信輻射源個體識別方法
通信信號可以看作是由多個頻率分量疊加的復雜信號。VMD[18]可以自適應地將復合信號分解為指定數量的各頻率分量。VMD 認為信號是由不同頻率占優的子信號疊加而成,并假設信號所有分量都是集中在各自中心頻率附近的窄帶信號。VMD 通過構建頻域變分優化問題,對變分模型進行迭代搜尋,每次迭代求解低頻部分中心頻率的信號分量,即本征模態函數(Intrinsic Mode Function,IMF),高頻部分留待進一步分解。與EMD 不同,IMF 在VMD 中被定義為一個調幅-調頻信號,而不局限于窄帶信號,其第k個IMF 的表示形式為:

式中:uk(t)為第k個本征模態函數;Ak(t)為隨時間變化的幅值函數;Φk(t)為相位函數。
對接收信號進行3 步處理:第一步,Hilbert 變換求解析信號;第二步,將信號平移到基帶;第三步,使用H1 Gaussian smoothness 估計信號的帶寬。其表達式如下:

式 中:{uk}={u1,u2,…,uK},{ωk}={ω1,ω2,…,ωk};K為分解的模態數;uk和ωk為分解后第k個模態分量和中心頻率;δ(t)為狄拉克函數;*為卷積運算符;f為輸入信號f(t)。對式(2)添加2 次懲罰項與拉格朗日乘子λ(t),使用交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)進行求解,其迭代求解式為:

用VMD 方法進行信號分解的示例如圖2 所示。圖2(a)是由頻率分別為圖2(b)80 Hz、圖2(c)200 Hz、圖2(d)800 Hz 和圖2(e)1 600 Hz 的余弦信號疊加而成的復合信號,其中80 Hz 的信號振幅最大。將圖2(a)中的復合信號進行VMD 分解,不斷迭代分離出信號中的低頻部分。當分解模態數K=4 時,其分解的第一、第二、第三和第四本征模態函數結果為圖2(f)、圖2(g)、圖2(h)和圖2(i)。當分解模態數K=2 時,其分解的第一、第二本征模態函數結果為圖2(j)和圖2(k),可以看出,分解出來的第一本征模態函數與復合信號的主分量基本一致。

圖2 VMD 方法信號分解示例
本文設計的完整的VMD-CNN 網絡如圖3 所示,對輸入信號先進行VMD 處理,將處理后的數據輸入后續的深度網絡中。深度網絡由3 個卷積層、2個全連接層與1 個softmax 層構成。第一卷積層由50 個1×9 的卷積核構成,提取粗粒度的指紋特征。第二卷積層由50 個1×5 的卷積核構成,提取細粒度的指紋特征。前兩層分別學習I 路和Q 路時間序列變化。第三卷積層由50 個2×5 的卷積核構成,使用2×5 的卷積核提取I 路信號與Q 路信號組合特征的指紋信息,3 個卷積層都采用ReLU 激活函數。第一層全連接層設定256 個神經元,第二層全連接層設定80 個神經元,并且在兩層全連接層加入Dropout 與l2正則化參數,正則化參數λ=0.000 1,網絡的優化器為Adam,學習率為0.000 1。由softmax層輸出概率向量,確定產生信號的輻射源個體。

圖3 VMD-CNN 網絡模型
由于目前公開的通信輻射源實采數據集非常少,很多通信輻射源識別論文基于仿真數據進行實驗驗證,說服力不強。2019 年,美國東北大學公開了通信輻射源實采數據集ORACLE[17],為驗證輻射源個體識別方法提供了便利。ORACLE 使用一臺通用軟件無線電外設(Universal Software Radio Peripheral,USRP) B210 作為接收端,16 臺USRP X310 作為發送端。發送的數據是由MATLAB 工具包產生的符合IEEE 802.11a 的數據幀,數據幀包含隨機生成的數據并具有相同的地址字段。接收端放置在開放反射少的區域實現信號采集,其中心頻率為2.45 GHz,采樣頻率為5 MHz(每秒采集500 萬個采樣點),分別對I 路Q 路信號進行采樣。
本文為了說明方法的有效性,自建了通信輻射源實采數據集。使用1 臺USRP N210 作為接收端,對5 臺USRP N210 進行信號采集。接收距離為10 m,環境封閉無遮擋。信號的中心頻率為1.00 GHz,以5 MHz 的采樣頻率對I 路Q 路信號進行采樣。
本文將采集的每個輻射源信號序列的前80%用于產生訓練樣本,后20%用于產生測試樣本。使用長度為128,步長為1 的滑動窗,在IQ 信號序列上提取2×128 維的樣本??紤]到神經網絡訓練過程中的隨機性,本文采用10 次實驗的平均值作為實驗結果。
為了驗證VMD 方法提取指紋信號的有效性,本文使用文獻[17]中ORACLE 的CNN 網絡作為分類器,并在ORACLE 數據集上進行實驗驗證。從ORACLE 數據集中僅隨機選取長度為1 萬個采樣點(在少量標簽樣本情況)的5類信號序列用于實驗。使用VMD 方法對接收信號進行2 模態分解,得到第1 本征模態函數信號(低頻分量)和第2 本征模態函數信號(高頻分量)。分別以原始接收信號、VMD 第1 本征模態函數信號和VMD 第2 本征模態函數信號作為輸入,用ORACLE 的CNN 網絡進行訓練與測試。實驗結果如表1 所示。從5 分類的平均識別率可以看出,輸入為VMD 第2 本征模態函數信號的識別率可以達到99.03%,明顯高于輸入為原始接收信號的識別率,而輸入為VMD 第1 本征模態函數信號的識別率最低,僅有82.51%。實驗結果表明,輻射源指紋信息主要存在于VMD 第2 本征模態函數信號(高頻分量)中,而數據信息主要存在于VMD 第1 本征模態函數信號(低頻分量)中。對原始接收信號進行VMD 2 模態分解,并過濾掉第1 本征模態函數信號,可以顯著降低數據信號對于指紋特征的干擾。

表1 不同輸入信號的平均識別率 %
為了驗證本文CNN 和VMD-CNN 的有效性,在ORACLE 公開數據集上,針對5 分類、10 分類和16 分類,對ORACLE 算法、本文CNN 和VMDCNN 的識別率進行比較。每種類別的信號序列長度為1 萬個采樣點。實驗結果如表2 所示。無論是5分類、10 分類還是16 分類,本文CNN 識別率略高于ORACLE 方法,而VMD-CNN 的識別率明顯高于ORACLE 方法??傮w上隨著類別數的增加,識別率有所下降。

表2 不同類別數的平均識別率 %
為了分析不同訓練樣本數對實驗結果的影響,本文從訓練集中隨機抽取了5 000、10 000、20 000 和40 000 個不同數量的訓練樣本對分類器進行訓練,類別數為16。3種方法的識別率如表3所示。圖4 顯示了各方法識別率隨訓練樣本數增大的變化曲線。可以看出,在小樣本條件下,VMD-CNN 方法具有更加顯著的優勢,其優勢隨著訓練樣本數的增加而縮小。

表3 不同訓練樣本數的平均識別率 %

圖4 不同訓練樣本數識別率變化
本文在自建數據集上,進行了5 分類實驗。使用5 個USRP N210 設備作為輻射源,每個輻射源采集的信號序列長度為1 萬個采樣點。實驗結果如表4 所示。VMD-CNN 的識別率依然最高,可達99.91%,明顯高于ORACEL 和本文CNN 方法。

表4 自建數據集上的平均識別率 %
本文提出了將發射信號中的數據部分過濾而保留指紋噪聲的研究思路,在此基礎上,設計了基于變分模態分解的通信輻射源個體識別方法。該方法能夠顯著降低數據信號的變化對網絡模型學習過程的干擾,提高網絡模型學習性能并可明顯減少標記樣本個數的需求。該方法利用變分模態分解方法將主要傳輸信息的數據信號與主要包含輻射源個體特征的指紋信號進行有效分離,并使用深度網絡模型對時間序列信號進行特征提取和分類識別。本文方法在公開數據集和自建數據集上均獲得了很高的識別準確率,在小樣本條件下其優勢尤為明顯。本文的研究為通信輻射源個體識別提供了新的研究思路。