王安義,李立
(西安科技大學通信與信息工程學院,西安 710054)
為適應復雜多樣的信道環境,無線通信中出現了各種各樣的調制方式[1]。因此在非協作通信系統中如何準確自適應的識別出接收到信號的調制類型,將對后續的解調譯碼起到重要前提作用[2]。當前調制識別技術研究主要有:傳統的人工特征構造方法和基于深度神經網絡的自適應學習特征方法。傳統的特征構造方法有基于信號瞬時特征、變換域特征、循環平穩特性和高階統計特征[3-5]等。以這些特征作為對信號辨別分類的依據,具有易于分析和實現的優點,因此得到了廣泛應用[6]。但是該方法對于信號的信噪比要求較高,識別性能受信號特征的影響較大。因此無法滿足復雜環境下的調制識別任務[7]。
基于深度學習的調制識別方法避免了人為構造特征的缺陷,由海量的數據驅動內部隱藏層神經網絡自適應學習信號特征,并將學習到的特征映射到易于區分的特征空間,最后由網絡的輸出層進行分類。O’Shea等[8]將通信接收端原始信號的同相正交(in-phase quadrature,IQ)數據作為深度神經網絡模型的輸入數據,輸出就是對應的信號種類標識,該方法采用密集神經網絡(dense neural network,DenseNet)對24種調制信號進行分類,當信噪比為10 dB時,正確識別率可達95.6%。自此,基于ResNet的卷積結構模型備受青睞。文獻[9]提出了一種改進的ResNet框架對9種雷達時域IQ信號進行識別,在2 dB時,綜合識別率達到了90%以上。文獻[10]將信號處理為星座圖,采用ResNet-50和ResNet V2對高斯白噪聲下的振幅鍵控(amplitude shift keying,ASK)、相位鍵控(phase shift keying,PSK)、正交振幅調制(quadrature amplitude modulation,QAM)不同階數的調制信號進行識別。文獻[11]針對深度神經網絡規模大的問題,提出了輕量級的卷積神經網絡降低了模型參數。文獻[12]采用信號的幅度和相位二維圖像作為神經網絡的輸入,采用卷積神經網絡(convolutional neural networks,CNN)對8種調制方式進行識別研究,結果表明在信噪比為0以上時,比基于IQ數據的識別準確率高2%,這源于信號的幅度和相位信息得到了更直接的表達。除了基于卷積結構基礎的調制識別研究外,文獻[13]提出卷積和長短期記憶(long short-term memory,LSTM)的組合改進模型,當信噪比為8 dB時,對24種調制信號平均正確識別率超過95%。文獻[14]采用卷積結構和雙向循環神經網絡(bidirectional recurrent neural network,BRNN)結構組合,文獻[15]采用卷積結構和基于LSTM的改進門控單元(gate recurrent unit,GRU)組合對公共數據集RML2016.10a進行測試,實驗結果分析表明:訓練時間過長且在低信噪比下效果較差。
從以上研究工作中可以看出,算法模型的復雜度逐漸變高。以時域IQ信號或二維圖像為數據源,存在一定的特征提取受限。而平臺則是以軟件仿真為主以及選用高斯白噪聲信道背景下進行調制識別研究,未考慮真實的無線信號傳輸環境。針對此問題,現通過GNU Radio 軟件無線電開發平臺生成仿真數據集,利用兩臺軟件無線電硬件外設HackRF完成實際電磁環境下的通信數據發送接收過程,構建實測數據集進行研究。對于深層神經網絡梯度容易消失且模型訓練復雜等問題,采用殘差塊和DenseNet結構對信號特征進行自主學習,進而實現無線調制信號的自動識別分類。此外,還通過數據預處理構建新的IQ數據維數以提高識別精度,達到對通信中常見的調制信號識別的目的。
在實際的無線通信系統中,會根據對無線信道預測的結果動態調整調制編碼方案。這些系統所使用到的調制方式有GMSK、BPSK、QPSK、8PSK、16QPSK、16QAM、64QAM、256QAM、4PAM。以上調制信號的數學表達式這里不在此給出,只考慮基帶調制信號的時域復包絡信息數據。
對于IQ信號數據而言就是數據分為兩路,用相互正交的載波分別進行調制(調制原理見圖1),然后進行疊加得到輸出信號,表達式為

圖1 I/Q信號調制原理圖Fig.1 Schematic diagram of I/Q signal modulation
s(t)=rI(n)+jrQ(n)=acosω0t-bsinω0t
(1)
式(1)中:rI(n)和rQ(n)分別代表采樣點n的同相分量和正交分量;a和b為兩路信號數據;cosω0t和sinω0t分別為兩路載波。在調制識別的研究中通常將基帶數據的IQ向量作為神經網絡的輸入。
設n0為采樣起點,采樣點數為N,則IQ數據向量組可記為式(2),如圖2所示為QPSK信號的星座圖。

圖2 QPSK調制星座圖Fig.2 QPSK modulation constellation
(2)
通過對比文獻[8-15]的仿真結果,可以看出單一且未經處理的IQ數據對QAM調制方式的類內調制識別效果較差。這是因為高階的QAM調制其IQ數據所對應的星座圖中也包含有低階的QAM調制信息特征[10]。此外IQ數據雖然有著豐富的頻域和時域信息且所包含信息量最大,但是IQ沒能直接表示出信號的幅度以及相位信息(amplitude/phase,A/θ)。然而基帶IQ信號星座圖中的A/θ卻是信號調制的重要特征之一。因此將IQ數與其計算出的A/θ數據聯立組成4×N的向量數據,讓神經網絡自主學習信號向量數據信息從中獲得更加完備的高層特征進行識別。因此選擇將IQ與其幅度相位聯合作為深度神經網絡的輸入,其向量矩陣可以表示為
(3)
在自然環境中存在遮擋物、電磁干擾會導致無線通信信號傳輸損耗嚴重。雖然可以通過增大天線發射功率,提高接收靈敏度以及天線的增益來緩解此問題,但是較大的發射功率是不允許的。此外各類無線發射設備較多,在這無疑是增加了信號檢測識別的難度。
無線信道可分為大尺度衰落和小尺度衰落。大尺度衰落對信號傳輸質量影響較小,并且在一定程度上可以消除。而小尺度衰落在時域上容易導致碼間串擾,嚴重影響信號傳輸質量。主要針對小尺度衰落信道為基礎,研究原始基帶信號s(t)經過帶有高斯白噪聲的多徑衰落信道后由接收機捕獲,最后通過下變頻處理得到基帶x(t)可表示為
x(t)=s(t)*h(t)+z(t)
(4)
式(4)中:s(t)為原始基帶信號;*為卷積運算;h(t)為復雜信道下的多徑響應函數;z(t)加性高斯白噪聲。x(t)可更具體地表達為

h(t-τ+εT)dt+zadd(t)
(5)
式(5)中:a為信號幅度;f0和θ分別為中心頻率偏移和相位偏移;p(·)為脈沖整形;τ為信道響應時間;h(·)為信道相應;εT為符號定時誤差;zadd(t)為加性噪聲。
實際的通信鏈路主要由發端和收端組成,發端過程可簡化概括為信源編碼、信道編碼、載波調制、最后射頻發送,接收端是其逆過程。相比傳統無線通信系統,當前軟件無線電(software defined radio,SDR)技術被業界廣泛用來做通信研究,SDR的核心思想是構造一個開放化、標準化、模塊化的通用平臺,盡可能地將模數轉換和數模轉換模塊靠近射頻天線,通過軟件程序實現無線信號收發處理功能,SDR通信系統的基本結構如圖3所示。

圖3 SDR通信系統基本結構Fig.3 Basic structure of SDR communication system
SDR通信系統主要由RF射頻前端、中頻處理部分以及基帶處理部分組成。其中RF射頻前端連接空口天線,可完成濾波和功率放大等操作,還能實現射頻信號和中頻信號的轉換。A/D、D/A模塊是SDR的重要組成部分,用于完成高頻段信號的數字與模擬之間的轉換;高速數字處理器(digital signal processor,DSP)或專用可編程門陣列(field programmable gate array,FPGA)通過數字上/下變頻完成中頻信號和低速基帶數據流的轉換。基帶信號由PC端根據不同任務進行處理,主要完成編碼調制等操作。
考慮到本文所研究的通信信號調制識別問題僅需要基本的收發功能即可完成 I/Q 信號的空口數據采集,因此選用HackRF作為軟件無線電硬件外設。HackRF承擔高頻、中頻信號的處理工作,而基帶信號的調制解調、編解碼等操作均由PC端實現,一定程度上降低了開發成本。
基于深度學習的調制識別研究過程中,深度學習作為實現分類任務目標的算法基礎。主要思想就是利用多層感知機網絡完成非線性映射,具體通過多層的感知機網絡自主的找到訓練數據與其標簽數據的映射關系。這一過程也可以稱之為特征學習或特征表達過程。和傳統的機器學習以及決策算法相比減少了人為設計特征的過程。文獻[9-15]大多都是利用深度學習里面的算法模型對普通加性高斯白噪聲環境下的無線調制信號進行識別研究。因此本章主要研究如何改進模型結構提升真實多徑無線信道環境下的調制信號識別率。
基于信號IQ數據的調制識別方法中,大多研究者將卷積層作為網絡模型的基本結構單元[6-15]。這主要源于卷積層能夠較好地提取數據的局部特征并且權重共享,尤其是對無線信號而言卷積層處理對應的是頻域特征。
當IQ數據維數為2×5,對其進行卷積(2×2)、池化(1×2)過程結果如圖4所示。最大池化過程將最大的特征值保留下來其他的舍棄掉,因此可以有效的給數據降維,減少模型參數。常用于調制識別的典型CNN結構模型為殘差神經網絡(ResNet)[8-10]。殘差塊的結構如圖5所示。

圖4 信號的卷積和池化操作Fig.4 Convolution and pooling operations on signals
ResNet 結構在訓練過程中主要學習殘差映射F(x),這種獨特的快捷連接方式并不會給網絡模型帶來額外參數和計算復雜度。在實際應用中,常串聯多個類似圖5的殘差單元構成深層殘差網絡,其第l層網絡的梯度表示為

圖5 ResNet結構Fig.5 ResNet structure
(6)
式(6)中ResNet的梯度比單一的CNN多了一個常數1。有了這個恒等映射可理解為無論何時ResNet都不會發生梯度消失的現象,有效提高了網絡模型訓練的穩定性。
在圖像識別領域中ResNet網絡模型的層數最高達到了152層。本文中選50層的殘差網絡作為對比網絡模型,基本結構類型可參考文獻[9-10]。
ResNet增加一個恒等映射,跳過本層或多層運算,解決了傳統的網絡會出現信息丟失、梯度消失、梯度爆炸等問題。但是ResNet增加的恒等映射的增加只是使得加深網絡深度不會造成梯度消失,不會降低網絡性能,但是一味地增加網絡深度帶來的訓練時間開銷是難以避免的。因此基于ResNet 以快捷連接實現特征傳遞的思想,設計一種密集前后連接的結構來保證各層特征的最大流通。
密集連接塊是一個3層的復合卷積結構,也可以將密集連接塊理解為一個復合的函數集合,由批量歸一化(batch normalization,BN)、激活函數、卷積運算組成。其密集連接塊結構如圖6所示。

圖6 DenseNet密集連接塊Fig.6 DenseNet connected blocks
由圖6可知,假設輸入為x0,經過l層的神經網絡,DensNet第l層的輸出可記作
xl=Hl(x0,x1,…,xl-1)
(7)
根據式(7),對于DensNet而言,l層的輸出是之前所有層的輸出集合。相比ResNet結構l層的輸出是l-1層的輸出加上對l-1層輸出的非線性變換。由此可見Dense Block每個中間層的輸入都是之前各層輸出向量的通道維合并特征,每一層的輸出協同前層的輸出一起傳遞給后層,促進特征向量的傳遞。這種獨特的特征重用方式不僅使網絡能夠學習到更豐富的淺層特征信息,同時避免了網絡訓練時產生的冗余特征,進一步緩解了梯度消失問題。
一般基于深度學習的調制識別過程主要由信號數據預處理、自適應學習特征提取、特征融合和特征分類等過程。本文設計DenseNet模型,參考了基于圖像處理的密集塊網絡結構和ResNet模型的優點。并增加調制信號IQ的數據的維度。將基帶的IQ數據制作為4×N的向量矩陣,經數據預處理過后制作做成為數據集。以4×N的維度作為網絡模型的輸入維度,網絡模型經損失函數每輪次的計算和反向調整得到最優的模型權重參數,最終達到調制識別泛化的性能要求。
本文DenseNet模型設計了含有3個密集塊的DenseNet結構。初始卷積層設計為1×3步幅為1卷積,如圖7所示。

圖7 DenseNet網絡結構模型Fig.7 DenseNet network structure model
(1)信號預處理。主要對接收到的射頻信號進行基帶處理,按1.1節將IQ數據再增加幅度和相位角信息。
(2)特征學習提取模塊。將經過信號預處理數據輸入網絡模型,由第一層卷積對數據維度進行降維處理減小規模,后續依次進入密集連接塊和卷積池化層,密集連接塊主要對信號的數據特征空間進行學習,將大量的學習特征集合通過卷積池化進行降維處理以及進行融合,以此得到最關鍵的特征信息。
(3)全連接層分類。將特征向量映射至輸出空間。最后使用Softmax激活函數實現不同調制樣式的分類。
基帶數據處理由GNU Radio完成,產生動態衰落信道模塊包含萊斯多徑衰落和加性高斯白噪聲。具體的數據集參數如表1所示。

表1 數據集參數設置Table 1 Dataset parameter settings
按照表1中生成數據,硬件配置為兩臺HackRF 外設用于數據收發,兩臺計算機,用于數據處理。如8所示。

圖8 實際數據采集場景Fig.8 Actual data collection scenario
首先在發射端通過 GNU Radio完成調制信號基帶數據處理,再將信號通過USB接口傳送至HackRF進行數字上變頻得到中頻信號。中頻信號經D/A轉變為模擬信號,完成信號的功率放大和濾波,送入射頻電路將高頻電波通過天線發出。接收端完成發射端的逆過程,得到數字基帶信號。將接收端所處理的基帶信號的IQ信號的實部和虛部將IQ數據轉化A/θ數據并聯立組成4D-IQ數據。
本節實驗仿真平臺:計算機配置(CPU為i9-9900k,GPU為雙RTX2080Ti,內存為32 G),采用TensorFlow2.0和Keras作為深度學習軟件仿真平臺完成訓練并測試,最終將測試結果數據由MATLAB2020a進行數據結果可視化展示。
3.2.1 基于2D-IQ傳統神經網絡模型的對比
如圖9所示,在對比實驗中:CNN模型的框架設計源于文獻[11-12]的輕量級卷積模型結構。LSTM模型根據參考文獻[13]的兩層LSTM結構。CLDNN網絡模型根據文獻[14-15]的卷積結構和LSTM的變體結構復合模型設計出的串行3種結構模型(CNN、LSTM、DNN)。由圖9基于2D-IQ的傳統模型識別效果對比可知,LSTM模型的識別率比CNN模型的識別率高,這源于LSTM模型適合更適合處理含有時間序列相關和延遲相對較長的通信信號數據。將CNN模型和LSTM模型結合出的CLDNN模型,有著比兩者更好的識別效果,這里采用的LSTM與文獻[15]里面門控循環單元(GRU)相比更適合處理海量的通信IQ數據。圖9反映了傳統深度學習網絡與組合神經網絡結構的調制識別性能。通常除了改變算法模型的方法來提高識別率,還可以對輸入數據預處理達到同樣目的。本文通過增加IQ數據的維度提高識別率,對比實驗如圖10所示。

圖9 傳統神經網絡模型的對比Fig.9 Comparison of traditional neural network models
3.2.2 2D-IQ和4D-IQ實驗對比
如圖10所示,根據4D-IQ和2D-IQ識別效果對比可知,在引入A/θ信息后ResNet和DenseNet模型的識別率在整個信噪比區間都有提升,使用4D-IQ數據的模型識別率提升了10%。在5 dB時,本文中設計的DenseNet對9種調制信號的平均識別率可以達到90%以上。進一步結合本文輸入數據維度設計文獻[9-15]中的深度學習調制識別模型,其中文獻[10]是以信號的星座圖像作為神經網絡的輸入,文獻[12]是以幅-相域的二維圖像作為輸入,這兩個文獻中的模型無法直接作為本文的數據的實驗對象,因此通過改變模型輸入層配置參數,進而完成文獻中的模型與本文所提模型的對比。表2~表4分別為3種信噪比下的對比結果。

圖10 4D-IQ和2D-IQ識別效果對比Fig.10 4D-IQ and 2D-IQ recognition effect comparison
由表2~表4可知在同一模型下4D-IQ數據的識別效果要好于2D-IQ的識別效果。在同一數據集下本文所提出的DenseNet模型識別效果最優。進一步對比算法模型的時間開銷,統計模型的參數數量P和迭代一次的時間t,如表5所示。

表2 信噪比為-10 dB下的識別率Table 2 Recognition rate when the signal-to-noise ratio is -10 dB

表3 信噪比為0時的識別率Table 3 Recognition rate when the signal-to-noise ratio is 0

表4 信噪比為10 dB下的識別率Table 4 Recognition rate when the signal-to-noise ratio is 10 dB

表5 模型性能參數表Table 5 Model performance parameter table
根據表5可以看出ResNet模型參數最多,達到了23萬,迭代一次的訓練時間為951 s,通過結合對比各類模型的識別效果,本文所提出的DenseNet模型具有一定優勢。
3.2.3 基于4D-IQ的模型性能實驗對比
根據圖11可知,采用改進的4D-IQ作為訓練數據,本文所提的DenseNet算法模型對多徑信道下的九種調制信號整體平均識別率要遠高于ResNet、CLDNN和CNN模型。在-10 dB到0的信噪比下DenseNet網絡模型的識別性能整體效果要比CNN和CLDNN模型的識別率高10%左右。尤其在-10 dB到0低信噪比下DenseNet模型的識別率有較大的提升。

圖11 基于改進IQ算法不同深度學習網絡模型性能Fig.11 Improved algorithm recognition rate
基于軟件無線電硬件平臺HackRF和GNU Radio對所設計的DenseNet調制識別模型進行了分析,得到如下結論。
(1)基于4D-IQ數據下的CNN、ResNet、CLDNN和DenseNet調制識別模型對多徑信道低信噪比下的九種調制信號平均正確識別率都比2D-IQ數據下的識別率高。
(2)改進后的DenseNet模型進一步提高了對通信IQ數據特征提取的能力,能夠從多徑無線信道低信噪比下的噪聲中學習到信號特征,從而提高了在低信噪比下的識別率。