孫思燕,張偉雄,唐 娉,鄭 柯,張 正*
(1.中國科學院空天信息創新研究院,北京 100094;2.中國科學院大學 電子電氣與通信工程學院,北京 100049)
通信傳輸信息的調制樣式對于接收端來說是未知的,需要先對信號的調制方式進行識別,再進行下一步分析與處理[1]。早期的調制識別主要依靠人工,效率低下、可持續性差。隨著技術發展和頻率感知需求的增長,自動調制識別(Automatic Modulation Recognition,AMR)技術開始被研究[2]。目前,大量AMR算法及其改進算法被提出,促進了通信領域的進步。
在20世紀80年代,為解決AMR問題,出現了基于決策理論的假設檢驗調制識別方法[3]。該方法利用待識別信號的統計特征構建最大似然函數,計算似然比后再與判決信號的門限值作比較,得到調制識別結果。根據建立模型方式的不同,又可分為平均似然比檢驗、廣義似然比檢驗及混合似然比檢驗[4-6]?;跊Q策理論的假設檢驗方法具有理論性完備等特點,但計算復雜,目前主流的AMR技術是基于特征的統計模式識別方法[7-8]?;谔卣鞯慕y計模式識別方法無需依靠先驗知識,利用信號本身來構造特征,再通過設計好的分類器對目標信號進行識別。在特征設計階段,除了直接從信號的瞬時或統計參數構造專家特征外,也可將時域信號變換到其他特征空間,例如星座圖[9]、時頻圖[10]等。星座圖在對特定幾種信號的調制識別中發揮著巨大作用,但由于部分信號如調頻信號等,其特征無法通過星座圖反映,因此,基于時頻圖的調制識別算法受到了廣泛關注。常見的由一維信號生成時頻圖的時頻轉換方法有短時傅里葉變換(Short Time Fourier Transform,STFT)、小波變換、魏格納-維爾分布(Wigner-Ville Distrbution,WVD)和Cohen類時頻分布等[11],皆滿足信號的測不準原理,即時域信號經過時頻轉換后,時寬和頻寬不可能同時任意的窄。隨著深度學習技術在各個領域的廣泛應用,通信領域的研究人員也開始利用卷積神經網絡(Convolutional Neural Network,CNN)識別信號。在目前的AMR研究中,針對不同的信號數據源,將時頻圖與深度學習結合對信號調制樣式進行識別,成為新的研究熱點。2019年,Zhang等[12]創建了不同調制方式下復雜信號的STFT時頻圖的圖像數據集,并研究了不同信噪比下,CNN使用不同激活函數和優化函數對調制識別準確率的影響。2020年,Daldal等[13]研究基于STFT和CNN結合的AMR模型,對比了5種常見的CNN的調制識別準確率。2020年,李紅光等[14]采用STFT&WVD組合時頻變換方法,對跳頻信號進行時頻變換得到二維時頻圖,并經過一系列的處理后,輸入CNN中訓練學習,進行識別。
為了降低噪聲干擾,提高時頻圖質量,取得更好的識別效果,本文提出一種基于小波閾值去噪與時頻圖像檢測的信號調制識別技術,并對7種常見的數字調制信號進行了訓練識別。通過與沒有去噪步驟的識別方法,以及其他調制識別方法對比后發現,所提方法對于低信噪比下7類調制信號的識別效果較優。
信道中傳輸的信號s(t)通常由噪聲和信號兩部分組成,公式如下:
s(t)=x(t)+n(t),
(1)
式中:x(t)為發送的調制信號,n(t)為噪聲,本文中考慮的是高斯白噪聲(Additive White Gaussian Noise,AWGN)。x(t)的一般表達式為:
(2)
式中:Am為信號x(t)的調制幅度序列,an為取值0或1的符號序列,g(t)為符號周期內形成的波形脈沖,Ts為信號x(t)的符號周期,fc為信號x(t)的載波頻率,fm為信號x(t)的調制頻率,φ0為信號x(t)的初始相位,φm為信號x(t)的調制相位[15]。通過對調制參數的控制,得到不同調制樣式的信號,常見的有幅移鍵控(Amplitude-Shift Keying,ASK)調制、頻移鍵控(Frequency-Shift Keying,FSK)調制、相移鍵控(Phase-Shift Keying,PSK)調制以及正交振幅調制(Quadrature Amplitude Modulation,QAM)。
針對低信噪比下信號表達模糊導致調制困難的問題,本文提出了一種基于小波閾值去噪和時頻圖像檢測的調制識別方法,該方法的核心思想是將信號調制識別問題轉化為圖像處理問題。該方法主要分為兩部分:第一部分是數據處理,包括利用希爾伯特變換將實信號變為解析信號、利用小波閾值去噪技術對一維信號進行去噪以及通過時頻轉換方法生成時頻圖3個步驟。為了讓生成的時頻圖能夠更好地反映信號特征,將時頻重排技術作為本文的時頻轉換方法。作為一種后處理技術,時頻重排重新分配了信號在時頻圖上的權重,具有比較好的抗噪聲性能。本文選擇VGG網絡作為調制識別網絡,對生成的時頻圖進行學習訓練,得到對應信號的調制樣式。具體流程如圖1所示。

圖1 本文提出的調制識別方法框架Fig.1 Framework of the proposed modulation recognition method

(3)

z(t)=f(t)+jH(f(t))。
(4)
任何一個實函數都可以通過希爾伯特變換得到一個解析信號,這個解析信號也可以唯一分解為其實部和虛部。經過希爾伯特變換后得到的解析信號,其相位譜完全繼承了實信號的相位信息。
2.2.1 小波閾值去噪原理
由Donoho[16]提出的小波閾值去噪法具有良好的局域性和多分辨率特性,能有效地區分信號和噪聲,是一種被廣泛使用的信號去噪方式。原始信號中,信號部分和噪聲部分在頻譜上的分布不同,信號部分通常體現在低頻處,噪聲則主要出現在高頻處。小波閾值法的本質是利用小波變換分離出信號的小波系數,再選擇一個適當的閾值過濾掉信號的異常頻率部分,最后對信號進行小波重構,達到去除噪聲的目的。整體流程如圖2所示。

圖2 小波閾值去噪流程Fig.2 Wavelet threshold denoising process
其中,信號小波分解的公式如下:
(5)
式中:c0(k)和dj(k)分別為尺度函數和小波函數的系數,第一項為信號f(t)的零階近似,前兩項為一階近似,前三項為二階近似……以此類推。信號小波分解過程如圖3所示,原信號被依次分解為ca3、cd3、cd2、cd1,其中ca表示低頻信息,cd則表示高頻信息。

圖3 信號3級小波分解示意Fig.3 Schematic diagram of signal in three-level wavelet decomposition
2.2.2 小波閾值去噪參數確定
影響小波閾值去噪效果的因素有很多,在不同的情況下,需要選擇合適的閾值、閾值函數以及小波分解級數(Level,Lev)。結合本文中信號的實際情況,進行了以下分析:
① 小波閾值去噪中常用的閾值函數有2種:硬閾值函數和軟閾值函數。
硬閾值函數:
(6)
軟閾值函數:
(7)
式中:wj,k為原始小波系數,λ為閾值。從式中可以看出,硬閾值函數有一個明顯的閾值點,如果信號的幅度小于該閾值,就會被設置為0,這對信號的主要成分可能會產生較大的影響,從而導致失真。相比于硬閾值函數,軟閾值函數具有較為平滑的轉折點,因此對信號的較小幅度的噪聲成分進行閾值處理時,可以產生連續的減小效應,不會出現明顯的失真。基于以上分析,本文方法中選擇的是硬閾值函數。
② 閾值的選擇
小波中閾值即閾值函數中的λ,常用的有RigSure閾值、Sqtwolog閾值、Heursure閾值和Min-max閾值。一般來說,Min-max閾值和RigSure閾值偏保守,適合噪聲較低情況。而用Sqtwolog閾值去噪比較徹底,但是也容易把有用的信號誤認為噪聲去掉。Heursure閾值則是RigSure閾值和Sqtwolog閾值的綜合,比較適合高噪聲情況,因此選擇Heursure閾值作為本文小波去噪的閾值。Heursure閾值的公式如下:
(8)
式中:n為信號長度,N為小波分解的最大層數,σ為信號標準差。
(9)
③ 小波分解級數的選擇
小波分解級數由處理信號本身的特性決定,面對不同的情況時有不同的選擇。為對比小波閾值法在不同層的去噪方法性能,選擇適合本研究中信號的分解級數,引入信噪比和均方根誤差這2個評價指標,對去噪后的信號進行評估。公式如下:
(10)
(11)


表1 2FSK在不同級小波分解下的去噪表現Tab.1 Denoising performance of 2FSK under different levels of wavelet decomposition
從表中可以看出,在RSN≤0 dB,且其他條件相同的情況下,Lev=1時的小波閾值去噪表現在信噪比和均方根誤差指標上均不如另外2個分解級數,這說明1級小波分解不能滿足本研究中的信號去噪需要。當RSN≤-6 dB時,相比起在其他小波分解級數,Lev=2的小波分解去噪效果是最好的;而當RSN>-6 dB時,3級小波分解的去噪效果趕超了 2級小波分解的效果。因此,對于本文調制識別模型乃至小波去噪算法,以RSN=-6 dB為界,當不低于這個信噪比時,令Lev=2;當小于這個信噪比時,令Lev=3。
大豆窄行種植技術原則上就是縮短大豆之間的行距,增加種植密度,提高大豆作物的陽光面積,使大豆高產。目前,根據我國大豆品種的地理條件和生長規律,大豆窄行密植栽培技術大致可分為平作、大壟、窄行小壟、窄行密植三種。在土壤質量差的偏遠地區,窄行密植也能提高大豆產量,而在土壤肥力好、農業資源設備高、碳素好的地區,大壟窄行密植效果較好。生存與管理。因此,在種植時,應選擇適宜的技術模式。
作為最具代表性的雙線性時頻轉換方法,WVD可以看作是STFT的擴展,表達式如下:

(12)
相比于STFT,WVD在時頻域上更為準確地描述了信號的特性。但其缺點也很明顯,WVD易受到邊界效應和噪聲干擾的影響,導致分辨率不夠高或產生假分量等。研究人員在此基礎上提出推廣的信號時頻譜圖,以減少交叉項的干擾。信號譜圖的一般形式可表示為信號的WVD和短時窗的WVD的二維卷積形式,公式如下:
(13)

(14)
(15)
此時,時頻重排的表達式如下:
式中:δ(·)為狄拉克函數。STFT、WVD等常用的時頻分析方法符合測不準原理,但時頻重排相當于一種后處理技術,可以通過重新排布生成的時頻面上的能量分布,同時改善信號的時頻分辨率。圖4為2FSK信號的譜圖與重排后的譜圖對比,可以看出,對于相同的信號,通過時頻重排生成的譜圖,相較于信號譜圖具有更好的時間和頻率分辨率[17]。

(a)譜圖

(b)時頻重排譜圖
直接對信號進行時頻轉換得到的時頻圖不一定符合網絡的輸入尺寸,且生成的時頻圖過大,有可能會影響運算速率。出于統一輸入時頻圖尺寸與提高效率的考慮,本方法對時頻圖進行了縮放處理。為了能盡量保留原圖像中的特征信息,使用了雙線性插值圖像縮放技術。
(17)
(18)
記原始時頻圖上的元素坐標為(xold,yold),縮放后時頻圖中的元素坐標為(xnew,ynew),可使用反向映射的方法計算在原始時頻圖中的位置,即:

(19)

(20)
接下來利用雙線性插值對時頻圖上的每一點進行縮放操作。對于新時頻圖中某一位于(Idist,Jdist)位置的點,可以利用其在原始時頻圖中位置為(i+v,j+u)的點來進行雙線性插值,如圖5所示。雙線性插值的基本思想是通過舊元素周圍4個最近鄰的元素加權平均,來計算新元素值的方法??梢钥醋髟?個方向分別進行一次線性插值對于坐標(i+v,j+u)附近的4個元素,設它們的元素值分別為a、b、c、d,則新元素值的計算公式如下:

圖5 雙線性插值縮放示意Fig.5 Schematic diagram of bilinear interpolation scaling
vnew=a(1-u)(1-v)+bu(1-v)+c(1-u)v+duv,
(21)
式中:u和v是坐標(xold,yold)與最近鄰元素之間的距離比例。
本節對本文中使用的調制識別網絡模型進行了詳細介紹。由于VGG(Visual Geometry Group)網絡模型在圖像分類任務中的良好表現[18-20],常被用作調制信號識別網絡。在傳統VGG16模型的基礎上進行了修改,作為本文調制識別使用的訓練網絡,網絡一共有5個卷積-最大池化(Conv-Maxpool)塊, 每個塊包括2個卷積層(Convolutional Layer,Conv)和一個最大池化層(Maximum Pooling Layer,Max Pooling),每次卷積后,都會經過一次歸一化層(Batch Normalization,BN)和激活函數層,激活函數為ReLU。最后是一個具有3個全連接層和一個softmax層的線性模塊,結構如圖6所示。VGG CNN通過組合與堆疊多個卷積核,提取輸入鄰域內的特征。實現多個小尺寸卷積核的組合的非線性特征優于單個大的卷積核的目的,提升網絡的識別精度,同時大幅減少由于深度增加所帶來的參數量。VGG通過最大池化進行圖像降維,提取主要特征,全連接層降低參數量并與分類器softmax配合完成分類識別。

圖6 本文調制識別方法中VGG網絡結構Fig.6 VGG network structure in the proposed modulation recognition method
為探究本文調制識別方法的性能,仿真7種常見的數字調制信號,分別為2ASK、4ASK、2FSK、4FSK、2PSK、4PSK、16QAM。采樣點數為800,信號的采樣頻率統一為40 kHz,載波頻率集為{4 kHz, 9 kHz,14 kHz,19 kHz}。每類數字調制信號均生成800個樣本,共5 600個無噪聲信號。然后對這些信號添加噪聲,得到的信號樣本的信噪比為-14~ 0 dB,間隔為2 dB。無噪聲情況下,7類信號通過時頻重排生成的時頻圖如圖7所示。


圖7 7類調制信號通過時頻重排生成的時頻圖Fig.7 Time-frequency map generated by time-frequency rearrangement of seven types of modulated signals
本實驗的數據處理部分在Matlab(2020b)上完成,網絡框架使用PyTorch搭建。實驗電腦的CPU型號為Intel(R) Xeon(R) W-2135 CPU @ 3.70 GHz,GPU為NVDIA GeForce RTX 2080Ti。對不同信噪比下生成的時頻圖樣本集,每類調制樣式隨機挑選600個信號時頻圖樣本用于訓練,100個樣本用于測試,100個樣本用于驗證。網絡訓練的歷元數(Epochs)設置為100,樣本批量大小(Batch Size)為10,選擇Adam優化器,學習率(Learning Rate)設置為0.000 9。
一般認為當RSN<0 dB時為低信噪比,本文研究信號的信噪比為[-14,0]dB,信噪比較低,噪聲對信號的影響較大,嚴重影響了生成時頻圖的質量,降低了調制識別效果。因此在將含噪聲信號通過時頻重排方法轉換成時頻圖之前,先對一維含噪信號進行小波去噪處理。由2.2.2小節的分析,Matlab中小波閾值去噪函數參數選擇如表2所示。

表2 Matlab中小波去噪函數的參數選擇Tab.2 Parameter selections for the wavelet denoising function in Matlab
圖8展示了當信噪比分別為0、-8 dB時,生成16QAM信號時頻圖的去噪效果。當RSN=0 dB時,小波的分解級數取2,其他參數設置見表2??梢钥闯?RSN=0 dB的情況下,噪聲對時頻的影響不是很大,仍然能從時頻圖上分辨出信號分量。當RSN= -8 dB時,噪聲分量掩蓋了信號分量,信號在時頻圖上的信息受到了很嚴重的干擾。經過小波閾值去噪后, 時頻圖上的噪聲有所抑制。因為添加高斯白噪聲的程度不同,RSN=-8 dB時去噪前后的時頻圖比RSN=0 dB時的時頻圖更加明顯。但噪聲越高,信號分量與噪聲的區分度也越低,因此,部分信號信息也在去噪過程中被去除。

(a)RSN=0 dB,16QAM,去噪前

(d)RSN=-8 dB,16QAM,去噪后
為了驗證小波閾值去噪確實提高了調制識別效果,同樣通過時頻重排對沒有經過小波閾值去噪的信號進行了時頻轉換,生成的時頻圖同樣輸入VGG網絡中,并與本文的模型進行了比較。使用信號的整體識別準確率做為評價指標,即正確識別樣本數量與樣本總數量的比值,得到的結果如圖9所示??梢钥闯?經過小波閾值去噪的識別效果會優于沒有經過小波閾值去噪的調制識別模型。信噪比為 -12~-4 dB時,小波閾值去噪帶來的識別準確率提升明顯。當信噪比為-8 dB時,去噪后的方法的識別準確率是89.14%,而沒有經過小波閾值去噪的識別準確率為87.71%。當RSN≤-12 dB以及RSN≥-2 dB時,小波閾值去噪對模型調制的優化效果并不明顯,這是因為當信噪比較高時,噪聲對信號信息的影響有限,這時去噪上步驟的意義不大。而當信噪比過低時,噪聲嚴重影響了信號本身的信息,去噪效果并不理想,因此識別準確率沒有較大的提高。

圖9 調制模型在有無小波閾值去噪的整體識別準確率Fig.9 Overall recognition accuracy of modulation models with and without wavelet threshold denoising
為了探究本文提出的調制識別模型的性能,將本文的仿真數據,輸入文獻[16,21]提出的調制識別模型進行訓練識別,并與本文方法進行了對比,如圖10所示。整體來看,3種模型的識別準確率與信噪比成正相關。當信噪比大于-2 dB時,本文提出的調制識別模型效果與其他2個模型的性能接近。而當信噪比小于-6 dB時,本文提出的方法與其他 2種方法的識別準確率差距逐漸增加,這說明本文提出的識別模型對低信噪比下7種信號的識別表現優異。當信噪比取-10 dB時,本文提出方法的識別準確率為81.71%,文獻[21]的識別準確率為 80.28%,文獻[15]的識別準確率為76.51%。

圖10 本文模型與其他調制識別模型的識別準確率Fig.10 Recognition accuracy of the proposed model and other modulation recognition models
為了探究在低信噪比下3種方法具體對每類信號的識別表現,圖11展示了3種方法在RSN= -12 dB情況下的混淆矩陣。整體來看,本文提出的方法具有較好的一致性。從每類信號的識別準確率中可以看出,即便是在信噪比為-12 dB的情況下, 3種方法對2ASK、2FSK信號的識別準確率都要高于對應的4ASK、4FSK信號,3種方法對2ASK、2FSK的識別準確率都達到了90%以上。這能夠說明二進制的調幅與調頻信號對比相應的多進制信號來說,具有更好的抗噪能力。而2PSK信號在低信噪比的情況下,最容易被錯分為4PSK信號,本文方法的錯分率分別達到了15.58%,文獻[15]方法的錯分率為25.86%,文獻[21]方法更是將34%的2PSK樣本錯分成了4PSK。4PSK信號則容易被錯分為2PSK信號和4ASK信號。造成調相信號識別準確率低的原因是,時頻圖對于相位特征的反應不如時域和頻域特性敏感,因此在低信噪比的情況下,模型很容易對信號產生誤判。類似的,16QAM信號也是因為相位信息被模糊,本文方法得到的混淆矩陣顯示,有39%的樣本被錯分為4ASK信號,而在文獻[21]和文獻[15]得到的混淆矩陣中,也分別有65%、39%的樣本被錯分成4ASK信號。

(a)RSN=-12 dB,本文方法

(c)RSN=-12 dB,文獻[15]
從混淆矩陣中不難發現,3種方法各有優劣。本文方法對2PSK信號的識別準確率達到了77%,比文獻[21]方法的35%、文獻[15]方法的58%要高得多。而文獻[21]對4ASK信號的識別準確率則達到了70%,也要明顯優于其他2種方法。但從圖8展示的不同信噪比下的整體識別準確率變化來看,本文方法對這7種信號的識別整體表現最優。
本文提出了一種基于小波閾值去噪與時頻圖像檢測的信號調制識別方法,該方法的核心思想是將一維信號轉換成二維時頻圖像進行處理。而在信號轉換成時頻圖之前,先利用小波閾值去噪方法對信號進行去噪,以降低干擾,提高時頻圖質量。本文使用時頻重排技術的生成時頻圖,相較于其他時頻轉換方法,時頻重排通過重新分配信號能量,能有效提高時頻圖的時間和頻率分辨率。由于VGG在圖像領域的識別優越性,本文使用修改的VGG網絡作為時頻圖的訓練網絡。由于生成的時頻圖不一定符合網絡尺寸,本文使用了雙線性插值對時頻圖進行縮放處理,保證輸入網絡的時頻圖大小為256×256。通過對7種數字調制信號,即2ASK、4ASK、2FSK、4FSK、2PSK、4PSK、16QAM進行調制識別,發現本文方法在低信噪比下的表現較好。盡管在低信噪比下的整體識別準確率較高,但對于某幾類調制信號,如PSK和QAM,本方法的識別表現還有待提高。因此,如何進一步提高這2類信號的識別準確率,是接下來的研究方向。