陳雙雙,顧師嘉,李娜娜,吳玉泉*
(1.中國海洋大學(xué) 電子工程學(xué)院,山東 青島 266100;2.中國科學(xué)院軟件研究所,北京 100190)
非合作通信下的信號調(diào)制模式識別作為水聲對抗領(lǐng)域的重要組成部分,逐漸成為研究熱點。水聲信道具有多途、頻散、環(huán)境噪聲高、信道帶寬窄和多普勒頻移大[1]等特點。特別是海洋中存在各種時間和空間尺度的海洋動力過程,引起了水體的非均勻性,加之海面的隨機波動性和海底的不平整性等因素,均會對水中的聲波傳播造成影響,因此水聲信道存在顯著的空間差異和時間起伏,這些特性均對水聲通信信號識別帶來巨大挑戰(zhàn)。
水聲信號調(diào)制識別分類引起了人們的廣泛關(guān)注和研究,一般調(diào)制識別分類方法分為2種:基于似然(LB)的方法和基于特征(FB)的方法。LB通過比較不同調(diào)制信號的似然函數(shù)來獲得最佳結(jié)果,但是存在更多的調(diào)制信號類型時,LB方法的計算復(fù)雜度會很高。相比之下,FB可以在較低的計算復(fù)雜度下,分類更多類型的調(diào)制信號模式。FB分類系統(tǒng)包括2個主要部分:特征提取和識別子系統(tǒng)。在特征提取方面,傳統(tǒng)方法需要提取大量特征,例如吳姚振等[2]結(jié)合了伽馬通倒譜系數(shù)(GT)與DEMON的特征向量譜分析有效提高了目標(biāo)分類的準確性和穩(wěn)定性。陳蕙心等[3]基于高階累積量和熵值聯(lián)合特征的調(diào)制識別算法,提出了改進粒子群(PSO)算法,構(gòu)造出改進粒子群優(yōu)化支持向量機分類器(PSO-SVM)。楊柳等[4]利用雙譜計算(頻域)信號的雙譜矩陣的算法,將最大內(nèi)積值對應(yīng)的調(diào)制方式作為待識別信號的調(diào)制方式,在高信噪比(Signal to Noise Ratio,SNR)條件下能達到90%以上的識別率。羅昕煒等[5]針對非平穩(wěn)調(diào)制特點,利用希爾伯特-黃變換(HHT)時頻特征數(shù)據(jù)自適應(yīng)特性和高分辨率的時頻分析能力以及數(shù)學(xué)形態(tài)濾波器(MMF)對信號的降噪性能,提出了一種利用希爾伯特-黃變換提取寬帶幅度調(diào)制信號的調(diào)制特征方法(MH_ DEMON)方法。信號分類識別系統(tǒng)可使用如隱馬爾可夫模型的手動提取特征方法,或者深度學(xué)習(xí)這種自動提取特征的方法。深度學(xué)習(xí)是近幾年研究的熱點,例如陸揚等[6]從偵收信號的維格納-維爾分布(WVD)中提取特征向量,利用人工神經(jīng)網(wǎng)絡(luò)對特征向量進行分類,但在SNR較低的情況下識別正確率較低,Jiang等[7]提出了一種卷積神經(jīng)網(wǎng)絡(luò)雙向長短時記憶具有對稱結(jié)構(gòu)依次提取信號的頻域特征和時序特征,與經(jīng)典的機器學(xué)習(xí)方法相比該算法在低SNR下具有較高的識別精度,所提出的調(diào)制識別方法在非合作通信中是有效的系統(tǒng),但該網(wǎng)絡(luò)的感受野較小會丟失信息,且模型復(fù)雜度高。姚曉輝等[8]采用卷積神經(jīng)網(wǎng)絡(luò)進行水聲信號識別,仿真結(jié)果調(diào)制識別正確率可以達到85%,但該網(wǎng)絡(luò)在計算卷積時后來的時序,會導(dǎo)致信號特征泄露從而影響正確率。
針對上述提到的傳統(tǒng)方法需要特征較多和人工神經(jīng)網(wǎng)絡(luò)等模型特征丟失、模型復(fù)雜度高的問題,本文提出采用殘差時序卷積網(wǎng)絡(luò)(Residual Temporal Convolutional Network,ResTCN)模型進行水聲信號識別分類。分別對雙頻移鍵控信號(2fsk)、雙相移鍵控信號(2psk)、四頻移鍵控信號(4fsk)、四相移鍵控信號(4psk)、連續(xù)波(cw)、直接序列擴頻譜(dsss)、跳頻擴頻譜(fhss)、線性調(diào)頻(lfm)和正交頻分復(fù)用(ofdm)九類信號預(yù)處理后輸入至ResTCN模型訓(xùn)練,實現(xiàn)在不同功率SNR情況下的水聲通信信號分類識別。SNR在-10~10 dB的仿真測試集上,其識別準確率可達到95%,在海上試驗數(shù)據(jù)上可達到93.5%。
水聲信號調(diào)制模式識別主要分為三部分,分別為水聲信道以及通信模型的建立、特征參數(shù)的提取和信號調(diào)制模式分類識別,其流程如圖1所示。

圖1 調(diào)制模式識別流程Fig.1 Modulation mode identification flowchart
仿真信號采用Matlab仿真出不同的信號,并在BELHOP射線理論的基礎(chǔ)上[9]建立瑞利衰落多徑的水聲信道模型,將通信模型與水聲信道進行卷積加噪聲得到接收端仿真信號。實驗數(shù)據(jù)需要在發(fā)射端建立信號,然后進行試驗,最后將接收端的數(shù)據(jù)進行截取,篩選有用信號。得到仿真信號或試驗有用信號后,通過短時傅里葉變換(Short-Term Fourier Transform,STFT)對仿真信號進行預(yù)處理[10],最后將信號預(yù)處理的頻域特征作為輸入送至分類模型進行訓(xùn)練。
采用STFT進行信號的預(yù)處理,STFT是一個分析非平穩(wěn)信號的工具,它表示信號的時率能量分布。
傅里葉變換一般用來分析分布參數(shù)不隨時間發(fā)生變化的平穩(wěn)信號。由于非平穩(wěn)信號在短時間內(nèi)可以看作是平穩(wěn)信號,STFT正是利用這種逐段分析的思想,對信號先加一個窗函數(shù),然后再對窗里的部分進行傅里葉變換,窗口隨著時間進行移動,相當(dāng)于把信號分段,最終把每個窗內(nèi)的結(jié)果整體聯(lián)系起來進行觀察,從而得到非平穩(wěn)信號的時頻特征。根據(jù)此理論可得到連續(xù)信號x(t)的STFT公式[11]:

式中:g(t)表示窗函數(shù),不同的窗函數(shù)可以得出不同的結(jié)果。
STFT原理簡單、計算速度較快,非常適合分析信號頻譜分量隨時間變化比較慢的非平穩(wěn)信號。由于窗函數(shù)的存在,不能同時滿足時域和頻域高精度要求。隨著選取滑窗時間的變長,時域分辨率會逐漸降低;隨著選取滑窗時間的變短,頻域分辨率會逐漸降低。因此,當(dāng)信號頻譜隨時間變化非常快時,應(yīng)該選擇時間窗口較小的窗函數(shù),從而可以獲得較高的時間分辨率;當(dāng)信號頻譜隨時間變化相對平緩時,可以選擇時間窗口較大的窗函數(shù),從而獲得較高的頻譜分辨率[12]。
ResTCN[13]由基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)[14]和全卷積網(wǎng)絡(luò)(FCN)衍生的新網(wǎng)絡(luò)模型TCN的基礎(chǔ)上添加殘差網(wǎng)絡(luò)(ResNET)得到,可以看作是幾個殘差塊的組合,模型結(jié)構(gòu)如圖2所示。加減模型層數(shù)較為簡單,可以只改動參數(shù),因此該模型是一個簡單且容易理解的結(jié)構(gòu),它具有并行性、感受野靈活、梯度穩(wěn)定和內(nèi)存占有率低等優(yōu)點,具體表現(xiàn)在:①它可以并行執(zhí)行卷積,減少水聲信號識別的時間;②可以通過層數(shù)、擴張因子和過濾器大小來調(diào)整感受野大小,感受野大抓取的特征信息更多;③TCN不像循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)在不同時間段共享參數(shù),梯度更穩(wěn)定;④內(nèi)存需求低于長短時記憶網(wǎng)絡(luò)(LSTM)和門控循環(huán)單元(GRU),其卷積內(nèi)核在一個層中共享,內(nèi)存使用低。ResTCN模型的殘差模塊中包含了TCN模型的主要結(jié)構(gòu),此結(jié)構(gòu)分為一維全卷積、因果卷積和膨脹卷積。

圖2 殘差時序卷積網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure ResTCN
(1)一維全卷積
TCN引用一維FCN的結(jié)構(gòu)[15],每一個隱藏層的輸入輸出的時間長度都相同,且用零進行填充來保證輸入輸出的長度一致,維持相同的時間步,因此每個時間的輸入都有對應(yīng)的輸出,其結(jié)構(gòu)如圖3所示。

圖3 一維全卷積結(jié)構(gòu)Fig.3 1-D fully convolutional structure
引用一維FCN來預(yù)測序列的元素量級。卷積運算的層數(shù)越高,其感受野就越大,對特征的變化就會更加敏感。使用一維卷積代替全連接有助于構(gòu)建網(wǎng)絡(luò)的長期記憶。
(2) 因果卷積
為了保證未來的信息“泄露”至當(dāng)前時刻,TCN采取因果卷積網(wǎng)絡(luò)[16]。給定一個時間序列x0,x1,…,xt,…,xn,預(yù)測對應(yīng)時刻的輸出y0,y1,…,yt…,yn,在“t”時刻的輸出yt只和“t”時刻以及"t”時刻之前的輸入x0,x1,…,xt相關(guān),與“未來”的xt+1,xt+2,…,xn無關(guān)。
因果卷積的操作如圖4所示,每一層的時間步長“t”的輸出只計算不晚于前一層時間步長“t”的區(qū)域。對于圖4而言,卷積核大小k=3,可以看出對于一個2層網(wǎng)絡(luò)而言,其感受野大小RF=5;對于圖5而言,卷積核大小k=2,其感受野大小RF=5。

圖4 普通卷積結(jié)構(gòu)Fig.4 Common convolutional structure

圖5 因果卷積結(jié)構(gòu)Fig.5 Causal convolutional structure
(3)膨脹卷積
膨脹卷積又稱為空洞卷積[17]。在不堆積更多層和更大卷積核的前提下,抓取更長的依賴關(guān)系。膨脹卷積是從距離t的d步處獲得輸入:xt-(k-1)d,xt-(k-2)d,…,xt-2d,xt-d,xt,其中k是卷積核大小。膨脹因子d會隨著網(wǎng)絡(luò)層數(shù)的增加,以2的指數(shù)增長,如圖6所示,d分別為1、2、4。這樣卷積網(wǎng)絡(luò)就可以在比較少的層,獲得很大的感受野。將因果卷積和膨脹卷積相結(jié)合,就可以得到如圖6所示的膨脹因果卷積網(wǎng)絡(luò)結(jié)構(gòu)。

圖6 膨脹因果卷積結(jié)構(gòu)Fig.6 Dilated causal convolutional structure
圖6為4層神經(jīng)網(wǎng)絡(luò),其卷積核k=3,第一層是輸入層,第二層的d為1,是常規(guī)的一維因果卷積,后面d隨著層數(shù)翻倍,即添加了“空洞”,最上層的最后一個神經(jīng)元共15個輸入數(shù)據(jù),可以觀測到輸入數(shù)據(jù)的全部特征。
TCN的穩(wěn)定依賴于網(wǎng)絡(luò)層數(shù)g、卷積核大小k和膨脹因子d,所以越深越大的網(wǎng)絡(luò)感受野越大,TCN越穩(wěn)定,膨脹卷積在網(wǎng)絡(luò)層數(shù)一定的情況上增大了感受野,當(dāng)需要追溯久遠的信息時,網(wǎng)絡(luò)層數(shù)不得不增加,隨著網(wǎng)絡(luò)深度的增加,會導(dǎo)致訓(xùn)練深層網(wǎng)絡(luò)出現(xiàn)的問題,例如梯度爆炸、梯度彌散和網(wǎng)絡(luò)退化。因此本模型加入了殘差網(wǎng)絡(luò)來杜絕此類問題的出現(xiàn)。
(4)殘差模塊
在輸入是高維的情況下,此模型采用殘差模塊來增加卷積網(wǎng)絡(luò)層數(shù),避免網(wǎng)絡(luò)出現(xiàn)訓(xùn)練深層的網(wǎng)絡(luò)退化問題。解決網(wǎng)絡(luò)退化實際上就是解決網(wǎng)絡(luò)冗余層產(chǎn)生恒等映射問題,一般情況下,讓網(wǎng)絡(luò)的某層去學(xué)習(xí)恒等映射函數(shù)Y(x)=x較為困難,如果網(wǎng)絡(luò)為Y(x)=F(x)+x,就可以用網(wǎng)絡(luò)學(xué)習(xí)殘差問題F(x)=Y(x)-x代替學(xué)習(xí)恒等映射問題,只要使F(x)=0,就可以構(gòu)成Y(x)=x的恒等映射。一般在參數(shù)初始化時,權(quán)重參數(shù)較小,比較適合學(xué)習(xí)F(x)=0,所以擬合殘差問題較為容易[16],其數(shù)學(xué)表達式為Y(x)=F(x)+x。
為了避免模型成為表達力不夠的線性模型,在網(wǎng)絡(luò)中加入了ReLU激活函數(shù)來添加非線性因素。此模型通過在每一個卷積層加入權(quán)重參數(shù)初始化來規(guī)范隱含層的輸入解決梯度問題。通過在每個卷積層之后引入dropout正則化來防止模型出現(xiàn)過擬合問題。因此在每個殘差塊包含2層的膨脹因果卷積、權(quán)重歸一化、ReLU激活和dropout正則化,其結(jié)構(gòu)如圖7所示。

圖7 殘差塊結(jié)構(gòu)Fig.7 Residual block structure
根據(jù)水聲信道的特點采用BELLHOP模型進行水聲信道仿真。仿真參數(shù):海水深度為50 m,聲源深度為10 m,接收器水平范圍為5 km,海底粗糙度為0,海綿粗糙度為2,用來計算聲速以及聲速沿聲線的導(dǎo)數(shù)的插值方法為C-線性插值,海表面以上為真空,水體之下介質(zhì)類型為聲學(xué)半空間。結(jié)合多種應(yīng)用場合情況,信道可以被看作是緩慢時變的相干多途信道,即信道的介質(zhì)和邊界條件時不變,聲源和接收器位置固定。若觀察處理時間不是特別長,可以用時不變的濾波器來表示。它的信道沖激響應(yīng)如圖8所示,根據(jù)上述參數(shù)產(chǎn)生14條本征聲線,且每條聲線的幅度都產(chǎn)生了不同程度的降低,到達時間產(chǎn)生了不同程度的延遲,體現(xiàn)了水聲信道的多途效應(yīng)、時變效應(yīng)和信號衰減等特點。

圖8 BELLHOP淺海信道的沖激響應(yīng)Fig.8 Impulse response of BELLHOP shallow sea channel
將仿真的發(fā)射端信號通過建立的水聲信道模型,得到接收端信號,圖9、圖10以2psk、2fsk為例,2psk信號使用相位變化來體現(xiàn)碼元變化,振幅和頻率保持不變;2fsk信號有疏有密,其中疏的波形代表載波頻率較低的,密的波形代表載波頻率較高的。2種信號經(jīng)過水聲信道后波形包絡(luò)無明顯特點,波形疏密及相位變化都不明顯,可以看出經(jīng)過水聲信道會隱藏信號原本的特征。提取信號的STFT,如圖11、圖12所示為在SNR為0 dB情況下信號2fsk、2psk的STFT波形,2fsk信號有2種載波頻率可以明顯地體現(xiàn),2psk信號只有一種頻率,可以將其2種信號區(qū)分,識別模型在此基礎(chǔ)上提取圖片特征進行識別,減輕了模型識別的困難。

(a)2psk信號時域波形

(a)2fsk信號時域波形

圖11 2fsk信號的STFT波形Fig.11 STFT waveform of 2fsk signal

圖12 2psk信號的STFT波形Fig.12 STFT waveform of 2psk signal
將9類信號數(shù)據(jù)集打好標(biāo)簽,每類1 000條按照7∶3的比例劃分為訓(xùn)練集和測試集,在基于STFT和殘差的情況下進行水聲信號的調(diào)制識別。訓(xùn)練模型應(yīng)用循環(huán)選取參數(shù),最后畫出loss圖,選擇收斂較好且正確率較高的模型,減少調(diào)參用時。圖13~圖16所示為信號分別在SNR為0、2、-3、-10 dB時模型訓(xùn)練的loss收斂和正確率的圖像。本模型的參數(shù)設(shè)置分別為:初始學(xué)習(xí)率lr=0.001,一次訓(xùn)練所選取的樣本數(shù)batch_size=512,訓(xùn)練次數(shù)100,隱藏層的層數(shù)17,卷積和的數(shù)量2 023,卷積核尺寸2。

圖13 SNR=0 dB時的loss和正確率Fig.13 Loss and accuracy at SNR=0 dB

圖15 SNR=-3 dB時的loss和正確率Fig.15 Loss and accuracy at SNR=-3 dB

圖16 SNR=-10 dB時的loss和正確率Fig.16 Loss and accuracy at SNR=-10 dB
以SNR為2 dB時為例,不同卷積和的數(shù)量情況下的正確率如圖17所示,可以看出在卷積和的數(shù)量為2 023時的識別效果最好。保持卷積和的數(shù)量一定,不同隱藏層層數(shù)情況下的正確率如圖18所示,將其對比可以看出在隱藏層層數(shù)為17時的信號識別分類正確率最高。

圖17 不同卷積和數(shù)量的正確率Fig.17 Accuracy for different convolutions and numbers

圖18 不同隱藏層層數(shù)的正確率Fig.18 Accuracy for different numbers of hidden layers
SNR在-10~10 dB下9種信號每類信號3 900條進行測試,得到信號的混淆矩陣如圖19所示,可以看出信號4psk被錯誤識別為2psk信號的情況較多,在低SNR的情況下,fhss信號會被識別為dsss信號,其他7種信號識別效果良好。

圖19 ResTCN模型仿真信號的混淆矩陣Fig.19 Confusion matrix of ResTCN model simulation signal
綜上所述,可以看出ResTCN模型選定適合的卷積和數(shù)量與隱藏層層數(shù)后,在仿真的測試集數(shù)據(jù)上識別正確率可以達到95%,在模型訓(xùn)練完后識別正確率比較穩(wěn)定。
CNN[18]是包含卷積層和降采樣層的深度神經(jīng)網(wǎng)絡(luò)模型,基本組成部分為卷積層和池化層,池化層與卷積層交替設(shè)置。神經(jīng)網(wǎng)絡(luò)的層與層之間利用局部空間相關(guān)性將相鄰的每一層的神經(jīng)元點與它相近的上層神經(jīng)元點連接,卷積層的每一個卷積濾波器重復(fù)作用于整個輸入層。為防止過擬合,采用的是池化層對數(shù)據(jù)進行降維。將水聲通信信號的時頻圖輸入至CNN,網(wǎng)絡(luò)一次訓(xùn)練所取樣本數(shù)batch_size為512,初始學(xué)習(xí)率lr設(shè)置為0.000 1,卷積核尺寸為5,訓(xùn)練次數(shù)epoch為1 000。以2 dB為例,可得到如圖20和圖21所示的收斂loss和正確率acc圖。

圖20 CNN模型在SNR=2 dB時的loss

圖21 CNN模型在SNR=2 dB時的acc
SNR在-10~10 dB下將9種信號每類信號3 900條輸入至CNN模型進行測試,得到信號的混淆矩陣如圖22所示,2psk信號和4psk信號互相識別錯誤較多,dsss信號被錯誤識別為4psk和2psk信號。總體信號識別正確率約為89.8%,因此在仿真數(shù)據(jù)上,識別效果不如TCN模型,并且CNN模型需要較多的訓(xùn)練次數(shù)。

圖22 CNN模型仿真信號的混淆矩陣Fig.22 Confusion matrix of CNN model simulation signal
本模塊使用海上試驗數(shù)據(jù)進行訓(xùn)練和測試,本次海上試驗數(shù)據(jù)來源于南海海域進行的海洋試驗,試驗當(dāng)天海況較好。圖23為海上試驗示意。發(fā)射端與接收端船只處于動態(tài)漂浮,平均距離大約為2 n mile,海平面到換能器距離為15 m,水下接收陣列距離海平面5 m。

圖23 海上試驗示意Fig.23 Sea test
實驗過程:將各種信號按照一定的格式串聯(lián),將其在發(fā)射端用換能器發(fā)送,在接收端采用水下接收陣列。將收集到的數(shù)據(jù)進行低通濾波、頻域變換等預(yù)處理得到其STFT,圖24~圖27為海上試驗數(shù)據(jù)的STFT,fhss信號跳變頻率有多個,在STFT圖上可以明顯看出。2psk信號只有一個頻率,二者的STFT從圖上看有差距。與上述仿真的2psk信號相比,海上試驗噪聲的影響明顯。信號2psk、4psk和cw頻率都只有一個,這更加體現(xiàn)了識別模型的識別能力。

圖24 2psk信號STFT

圖25 fhss信號STFT

圖26 cw信號STFT

圖27 4psk信號STFT
將試驗數(shù)據(jù)集每類各1 000條按照7∶3劃分訓(xùn)練集和測試集,將測試集分別輸入至訓(xùn)練好的ResTCN模型和CNN模型進行測試,得到其混淆矩陣如圖28和圖29所示。

圖28 ResTCN模型試驗信號的混淆矩陣Fig.28 Confusion matrix of ResTCN model test signal

圖29 CNN模型試驗信號的混淆矩陣Fig.29 Confusion matrix of CNN model test signal
綜上結(jié)果,ResTCN模型對未進行降噪處理的試驗數(shù)據(jù)的識別正確率為93.5%。在噪聲的干擾下,fhss與dsss信號相似度較高,信號fhss會被錯誤識別為dsss,其他7種信號識別正確率較好。如上圖CNN模型海上試驗信號的混淆矩陣所示,對未進行降噪處理的試驗數(shù)據(jù)的識別正確率為89.6%,信號4psk較多被錯誤識別為2psk,部分dsss信號和fhss信號被錯誤區(qū)分。相比較2種模型,本文所提的ResTCN在海上試驗信號分類效果明顯優(yōu)于CNN模型。
提出的ResTCN模型,通過仿真實驗和海上試驗驗證,模型在水聲信號模式識別方面具有一定實用價值。由于海上試驗平臺噪聲不穩(wěn)定,所以識別結(jié)果與仿真結(jié)果存在一些差異。尤其是仿真實驗低信噪比情況下信號2psk和4psk的分類,未進行降噪處理的海上試驗情況下信號fhss與dsss的分類。由于在水聲通信領(lǐng)域的數(shù)據(jù)集數(shù)量較小,需要對不同海域進行數(shù)據(jù)測試來訓(xùn)練分類器進行學(xué)習(xí)。