王 檢,張邦寧,魏國峰,郭道省
(中國人民解放軍陸軍工程大學 通信工程學院,南京 210007)
隨著無線通信技術和物聯網技術的飛速發展,智能無線終端和物聯網設備為人們帶來了豐富的生活體驗,同時也為非法用戶的入侵提供了可乘之機。非法用戶和網絡攻擊通常利用截獲的身份信息,如密碼和MAC地址等來進行設備欺騙,從而造成嚴重的安全隱患。射頻指紋(Radio Frequency Fingerprint,RFF)[1]是輻射源設備發射電磁波所形成的獨特特征,無法被截獲和模仿。因此,基于射頻指紋的輻射源個體識別技術應運而生。
輻射源個體識別研究中,射頻指紋的提取方法主要有基于基本參數信息[2]、調制域信息[3-4]、變換域信息、基于信號特征圖像信息[5]、神經網絡提取[6]等,射頻信號的選擇通常為輻射源工作功率恒定時的穩態信號。近年來,變換域信息常被作為射頻指紋特征在輻射源識別領域的應用較為廣泛,與其他提取特征的方法相比,此類方法保留了信號在變換域內的全部特征,而不是提取某個單一特征,不存在因關鍵特征選擇不佳而影響識別性能的問題,同時此類方法不需知曉調制方式等一些先驗信息,應用范圍更加廣泛。變換域信息主要包括時頻分析[7]、高階譜[8]、循環譜等[9-10],但是此類方法中,時頻譜分析受制于分析工具性能,自適應性能較差;高階譜分析往往維度較高,帶來的運算壓力較大,往往采取切片的手段進行降維處理;循環譜同樣維度較高,且十分依賴信號本身的完整性,在信號完整性差或信噪比低時,識別效果不佳。信號的功率譜也是一種變換域特征,它描述了信號功率隨著頻率變化的情況。相比于其他變換域特征,功率譜具有提取難度小、維度較低且在低信噪比下方差性能良好的優勢。
近幾年,深度學習理論快速發展,卷積神經網絡在圖像識別領域取得了令人矚目的成果。鑒于卷積神經網絡在細微特征提取的卓越性能,許多研究也將卷積神經網絡應用到輻射源感知[11]和識別[12]的場景中,取得了同樣不錯的分類性能。Wong等人[13]基于I/Q不平衡理論,直接將原始I/Q數據作為輻射源的指紋特征送入神經網絡進行分類識別。對與未經挖掘或人為提取特征的原始I/Q數據而言,數據中包含著輻射源的全部微特征信息,結合卷積神經網絡對輻射源進行了有效的分類。然而I/Q數據在低信噪比情況下,其包含的細微特征往往會被噪聲湮沒,致使卷積神經網絡很難提取特征影響分類結果,在全頻段功率信噪比為0 dB條件下對10組輻射源設備的識別率僅為64%[12]。
為解決在低信噪比條件下輻射源個體識別率低的問題,本文選用信號的功率譜作為指紋特征,它不僅包含了頻域內的所有特征,且比頻譜在低信噪比下有更好的方差性能。Welch功率譜算法是一種改進的功率譜算法,相較其他功率譜算法性能更優,結合卷積神經網絡可在低信噪比下對輻射源進行有效的分類。本文構建了由20個ZigBee協議的CC2530物聯網設備組成的測試平臺,CC2530也是目前常用物聯網設備。為了避免因調制信息不同帶來的影響,截取了信號前同步碼(preamble)部分的信號用于特征提取,將輻射源前同步碼部分的Welch功率譜數據送入卷積神經網絡,在瑞利信道全頻段功率信噪比為25 dB信噪比條件下對20個CC2530設備的識別率達到了98.88%,信噪比為0 dB時識別率為92.78%。經過實驗對比,本文方法在低信噪比條件下的識別效果明顯優于其他方法。
本文設計了基于Welch功率譜和卷積神經網絡特征提取的通用模型,共分為5個部分,如圖1所示。

圖1 基于Welch功率譜和卷積神經網絡特征提取模型
在實際場景中,非法用戶或網絡攻擊往往會采用和主用戶來自同一廠家相同型號的設備,因此在輻射源識別過程中,易獲得輻射源的中心頻率、碼率、通信協議等部分先驗知識。基于上文所述的先驗知識,可對輻射源信號進行良好的采集、保存,并將輻射源數據進預處理,去除冗余保留輻射源關鍵部分信息。將Welch功率譜算法得到的信號功率譜數據作為輻射源的指紋特征,送入卷積神經網絡訓練,最后將測試數據集送入網絡得到最終分類結果。
當下廣泛采用的智能終端和物聯網設備,其通信協議多基于IEEE 802框架,因此本文選用基于ZigBee協議的20個CC2530發射器作為輻射源驗證模型性能,信號采集設備為Signal-Hound BB60C實時頻譜分析儀,采集的輻射源信號保存在PC端,并利用相關軟件進行數據處理。
本文研究的輻射源設備是來自同一廠家相同型號不同序列號的20個ZigBee CC2530設備。ZigBee協議使用IEEE 802.15.4規范作為物理層標準,其物理層協議數據單元包括同步頭、物理層報頭和載荷,如圖2所示。

4 B1 B1 B可變長度前同步碼(preamble)幀定界符(SFD)幀長度(7 b)保留(1 b)物理層數據(PSDU)同步頭(SHR)物理層報頭(PHR)物理層載荷(PHY payload)
圖2ZigBee物理層協議數據單元
圖3展示了整個采集系統,包括20個CC2530發射器、采集設備和存儲設備。信號的采集都是基于Signal-Hound BB60C實時頻譜分析儀完成的。由于ZigBee設備的I/Q信道碼片速率為1 Mb/s,我們以40 Msample/s的采樣率通過有線的方式對每個ZigBee設備的1 000次數據傳輸進行采集,采集的信號經過BB60C下變頻至基帶,最終以復數I/Q數據的方式儲存至PC,如圖4(a)所示。

圖3 數據采集系統

(a)一次完整通信的I/Q數據

(b)前同步碼的標準化I/Q數據
2.2.1 數據截取
基于IEEE 802相同協議規范的前同步碼(preamble)中包含的數據成分相同,因此將信號前同步碼部分的信號特征作為輻射源的指紋特征,能夠避免調制信息不同帶來的影響,且相較其他特征更加穩健,十分適用于無線網絡設備的識別。在先前的研究中,無線信號前同步碼的射頻特性已被證明能夠可靠地區分IEEE 802.11a無線電[14]。鑒于前同步碼的射頻特性,本文截取ZigBee信號前同步碼部分,將其射頻特征作為指紋特征用于輻射源識別,同時可以避免數據量龐大帶來的運算壓力。IEEE 802.15.4協議根據輻射源的頻帶和調制方案,要求使用基于30~40位的前同步碼,本文選用中心頻率為2.405 GHz的CC2530發射器,其前同步碼長度為4 B共128 μs。因此我們截取每次傳輸數據前128 μs的前同步碼I/Q數據,共計5 120個樣本點用于特征提取,并將信號數據進行標準化處理。標準化處理數據不僅利于神經網絡的訓練和分類,還可以避免信號幅度值不同引入的非指紋特征,如圖4(b)所示。
2.2.2 數據去噪
在低信噪比情況下,輻射源的細微特征往往會被噪聲湮沒,導致特征提取難度加大,進而影響對輻射源的識別。因此,本文設計了低通濾波器對保存的I/Q信號進行去噪處理。Toeplitz矩陣類似于隨機矩,大概率地滿足了受限等距性質(Restricted Isometry Property,RIP),被廣泛用作度量核[15-16]。采取窗函數的方法設計數字低通濾波器,利用Toeplitz矩陣的循環特性實現接收信號與低通濾波器系數的卷積。假設濾波器階數為K,并且數字濾波器系數由FC表示,則Toeplitz濾波器矩陣為

(1)
式中:Ki=「K/2?,「·?表示四舍五入,且K< (2) 式中:r表示接收到的信號。因此,濾波后的信號可以矩陣乘法的形式表示為 Sfilter(nrow)=Tr=T(s+n)。 (3) 顯然,Sfilter是一個N階向量。測量值由下式給出: y=XSfilter=XT(s+n)=φ(s+n)。 (4) 式中:X表示信號序列。濾噪核表示為 φM×N=XM×NTN×N。 (5) Toeplitz矩陣去噪能夠較好地減小噪聲對輻射源射頻特征的影響,為提升低信噪比下輻射源識別性能起到了關鍵作用。 Welch功率譜算法是一種改進的周期圖法,在Bartlett法的基礎上進行了兩方面改進。首先,當信號序列分段時,該算法可將相鄰兩段重疊以提高方差性能,同時使用非矩形窗函數提升譜估計的分辨率,達到進一步減小方差的目的。Welch功率譜算法如下: xi(n)=x[n+(i-1)k],0≤n≤M-1,1≤i≤L。 (6) 式中:0 圖5 Welch算法分段方法 第i段信號的功率譜為 (7) 式中:U為歸一化因子,w(n)為非矩形窗函數。則信號的Welch功率譜定義為 (8) Welch功率譜估計在信號含有高噪聲的情況下方差性能依然良好,Welch法定義的譜估計方差為 (9) 如果含有噪聲x(n)的信號是平穩隨機過程,則式(4)的協方差僅取決于r=i-j。公式(4)可以寫成簡單的求和表達式,即 (10) (11) 根據公式(11),Welch功率譜的方差減少到每段方差的1/L。然而,這些分段實際上是相關的,因此Welch功率譜的真方差大于公式(11)。在下文的結果驗證中,也能夠得出Welch功率譜對噪聲的敏感度較低。這是因為頻譜是直接對信號進行傅里葉變換,而Welch功率譜對信號序列進行每段的傅里葉變換,分割后再計算均值。 我們利用Welch功率譜算法得到了前同步碼的功率譜,并用歸一化幅度表示相對功率的大小。將功率譜與采用相同點數快速傅里葉變換(Fast Fourier Transform,FFT)的頻譜進行對比(全頻段功率信噪比0 dB時),如圖6所示。對比結果表明分割信號序列可以明顯改善方差性能,證明了公式(11)的結論,因此Welch功率譜相較頻譜在低信噪比環境下能更夠更好地提取信號特征。 (a)0 dB信噪比前同步碼功率譜 (b)0 dB信噪比前同步碼頻譜 由于本文的特征數據為一維功率譜數據,因此我們構建一維卷積神經網絡(1-Dimensional Convolutional Neural Network,1-DCNN)用于輻射源的個體識別。典型的卷積神經網絡由卷積層、池化層、全連接層和輸出層組成,1-DCNN與CNN的區別在于其特征的維度是一維,因此1-DCNN由一維卷積層、一維池化層、全連接層和輸出層構成。本文所使用的網絡結構如圖7所示。 圖7 1-DCNN網絡架構 設S是由輻射源功率譜數據組成輸入,Sl是第l層卷積層的輸出,卷積計算方法為 (12) 在池化層中我們選用最大池化算法,對經過卷積層的數據進行降采樣操作,從而降低運算的復雜度,提升學習效率。 全連接層的目的是將經過卷積層和池化層提取的特征重新組成一組,并輸出為 δi=f(wipi+bi),i=1,2,…,k。 (13) 式中:δi表示第i個輸出(共k個輸出),pi為上一層的輸出,wi和bi分別是第i個神經元的權重及閾值,f(x)為激活函數ReLU。 在神經網絡的訓練過程中,過擬合的問題不容忽視。為了抑制過擬合,本文在全連接層采用Dropout,有效抑制了過擬合的現象。 輸出層利用Softmax分類器可以直接完成每一組輸出的分類任務,每一個設備的識別概率為 (14) 式中:N為輻射源設備的總數,且所有概率之和為1。 卷積神將網絡的損失函數通過Softmax的輸出向量與實際的標簽做交叉熵計算而來,損失函數的公式為 (15) 式中:yi′表示實際標簽中的第i個值,yi為Softmax輸出向量中的第i個值。 在網絡反向傳播過程中,使用Adam算法進行參數優化,利用參數的一階矩估計和二階矩估計動態調整每個參數的學習率,從而更新權值求得最優解[17]。 本文構建的卷積神經網絡超參數如表1所示,其中輸入為Welch功率譜數據(5 120×1),輸出為分數向量(維度20×1)。 表1 神經網絡超參數 為驗證本文提出的模型在實際場景下的識別性能,我們將采集的有線I/Q數據按照文獻[18]的處理方法,仿真出在典型城區瑞利衰落下傳播的信號,并在信號中添加高斯白噪聲。通過仿真,最終得到在瑞利信道條件下,全頻段功率信噪比為-30~25 dB(信噪比以5 dB為間隔)、信號帶寬與噪聲帶寬比值為1∶5時的標準化I/Q數據,如圖8所示(以0 dB為例)。 圖8 瑞利信道下0 dB信噪比前同步碼I/Q數據 在Welch功率譜算法中,FFT運算點數對功率譜的分辨率有較大的影響。我們通過Welch算法得到基于5 120、10 240、20 480、40 960點FFT的功率譜數據(如圖9所示),將其送入卷積神經網絡訓練并分析不同FFT點數Welch功率譜數據對識別效果的影響。 (a)5 120點FFT功率譜 (b)10 240點FFT功率譜 (c)20 480點FFT功率譜 (d)40 960點FFT功率譜圖9 不同FFT點數Welch功率譜 神經網絡的數據集為20個CC2530ZigBee發射器的1 000次傳輸的前同步碼Welch功率譜數據,共20 000組。網絡的訓練數據集和驗證數據集按5∶1劃分。訓練參數:batch-size為128,Dropout比率為0.5,學習率0.001,epoch為100輪。在不同FFT點數下的Welch功率譜數據對輻射源個體的識別率如圖10所示。 圖10 不同FFT點數Welch功率譜識別率 由實驗結果分析可知,在信噪比高于0 dB時,不同FFT運算點數對輻射源識別率影響較小,在25 dB信噪比條件下,10 240點FFT的Welch功率譜對20個輻射源的識別率達到了98.88%,高于其他點數FFT運算Welch功率譜對輻射源的識別概率;當信噪比低于0 dB時,5 120點FFT的Welch功率譜數據對輻射源的識別性能明顯下降,識別率低于其他對照組。 為了對比驗證本文算法的識別效果,本文實驗還采用了近年來熱門的5種基于變換域的識別方式,即基于I/Q數據和卷積神經網絡、基于頻譜和卷積神經網絡、基于短時傅里葉變換和卷積神經網絡、基于積分雙譜切片、循環譜切片的方法進行實驗對比,分析不同算法的性能。瑞利信道下不同信噪比的各種輻射源識別方法的性能如圖11所示。 圖11 輻射源識別方法性能比較 由圖11可知,在瑞利衰落條件下,當全頻段功率信噪比大于20 dB時,不同算法對20個輻射源的識別能力相近,但是當信噪比較低時,各種算法的識別性能有明顯的降低。本文所提出的基于Welch功率譜和卷積神經網絡的輻射源識別算法在全頻段功率信噪比為0 dB條件下仍有92.78%的識別率,在低信噪比條件下識別性能明顯優于其他算法,證明了本文算法的優越性。 基于深度學習的通信輻射源識別逐漸模糊了輻射源特征提取和分類識別的界限,大大減小了之前憑借提取專家特征進行識別的束縛,能夠提取更全面、本質的細微特征。本文通過分析常用通信協議的幀格式,利用Welch功率譜算法得到前同步碼的功率譜并將其作為輻射源的特征,在保留輻射源所有的細微特征的同時避免了不同調制信息帶來的干擾。因此,本文方法可推廣到通信協議已知的各種輻射源識別場景中,具有良好的適用性。在先前的輻射源識別的研究中,信道和信噪比對識別效果的影響常常被忽略,而本文實驗場景全部基于典型的瑞利衰落和不同信噪比模型,且經驗證,本文方法在低信噪比的條件下識別效果明顯優于其他算法,具有很好的魯棒性。3 基于Welch算法的信號功率譜特征提取
3.1 Welch法估計信號功率譜

3.2 Welch功率譜在低信噪比下性能分析



4 卷積神經網絡



5 實驗分析

5.1 不同FFT點數Welch功率譜識別率





5.2 不同算法的識別效果

6 結 論