基于深度學(xué)習的Wi-Fi信號編碼參數(shù)盲識別

2021-12-02 11:24:48崔勇強王曉磊李永輝

科學(xué)技術(shù)與工程 2021年33期

關(guān)鍵詞：深度模型

白迪，崔勇強*，王曉磊，李永輝

(1.中南民族大學(xué)電子信息工程學(xué)院，武漢 430074；2.武漢大學(xué)電子信息學(xué)院，武漢 430072)

近幾年來，無人機“黑飛”事件[1-2]呈高發(fā)態(tài)勢,而無線(局域)網(wǎng)/無線保真(wireless fidelity，Wi-Fi)是目前使用最為廣泛的互聯(lián)無線通信協(xié)議標準，眾多無人機采用Wi-Fi作為其通信數(shù)據(jù)鏈，故研究Wi-Fi的鏈路層特征盲識別對于實現(xiàn)基于Wi-Fi的智能通信或無人機的反制都具有重要意義。

Wi-Fi的鏈路層的調(diào)制方式采用的是BPSK/QPSK/QAM/CCK等，目前調(diào)制類型識別算法的研究中，各國研究者基于傳統(tǒng)的數(shù)理統(tǒng)計和新的深度學(xué)習的方法[3-9]進行了深入的研究，完成了各種調(diào)制方式在各種信噪比下的盲識別算法，取得了前所未有的研究成果。Wi-Fi采用的是低密度奇偶校驗碼(low density parity check code，LDPC)編碼，針對LDPC編碼方式的盲識別問題也吸引了各國專家進行了深入的研究[10-17]，Refaey等[10]設(shè)計了一種智能接收機，能夠從截獲的數(shù)據(jù)流中盲探測LDPC編碼。文獻[8]提出了一種新的LDPC信道編碼識別算法，從譯碼的角度來識別LDPC編碼類型。文獻[9]針對一個有限編碼數(shù)據(jù)集，提出了一種Cosine Conformity(CC)算法，能夠從3種編碼方式中識別LDPC編碼，相比同類算法，性能提升1.5 dB。文獻[13-17]從人工特征提取以及數(shù)理統(tǒng)計的方法著手就識別率、校驗矩陣、誤碼條件等方面的問題展開研究，LDPC編碼類型的盲識別的識別率取得了較大的提升。而LDPC編碼參數(shù)的盲識別卻是Wi-Fi鏈路層特征盲識別的疑難問題，存在識別率不高、計算復(fù)雜度高等問題，故現(xiàn)提出基于深度學(xué)習的LDPC編碼參數(shù)盲識別算法，以求在低復(fù)雜度、低延時的前提下，提高在各種誤碼條件下的識別準確率。

1 相關(guān)工作

根據(jù)802.11標準，Wi-Fi采用的是LDPC編碼，編碼參數(shù)有信息位碼長和編碼碼率兩種。其中信息位碼長分為648、1 296和1 944 bit三種，碼率有1/2、2/3、3/4和5/6四種。Wi-Fi編碼參數(shù)識別即從截獲接收的波形信號中識別其具體使用的編碼碼長及碼率，目前各國研究者對信道編碼盲識別進行了深入的研究。文獻[18]針對低信噪比條件下現(xiàn)有LDPC編碼碼率參數(shù)識別度不高的問題提出了一種新的編碼碼率識別算法，該算法首先利用信道輸出的軟信息，將編碼校驗關(guān)系映射到對數(shù)似然比域。其仿真結(jié)果表明，在給定先驗編碼集合的閉集應(yīng)用模式下，識別率可提高2～5 dB。文獻[19]針對LDPC編碼提出了一種新的編碼碼長和碼率的識別算法，該算法充分利用了數(shù)據(jù)的均值和均方差的統(tǒng)計特征，在高信噪比的條件下識別率較高。文獻[20]研究了在誤碼信道條件(高斯白噪聲)下IEEE 802.11標準的Wi-Fi的編碼方式-LDPC編碼碼長和碼率識別算法，其實驗結(jié)果表明調(diào)制階數(shù)越低，編碼參數(shù)的識別率越高。

上述學(xué)者針對LDPC編碼參數(shù)的盲識別研究都取得了較好的研究成果，進一步更新了鏈路層特征盲識別的研究成果。然而上述無論是編碼方式的研究還是LDPC編碼參數(shù)的識別都基于的傳統(tǒng)的人工特征提取+數(shù)理統(tǒng)計分析的方法，該方法面臨人工特征提取的特征差異性較大，并且統(tǒng)計特征難以發(fā)掘，其次數(shù)理統(tǒng)計的計算過程復(fù)雜，導(dǎo)致工程實踐難度較大，并且計算耗時較高，不利于工程實踐的低復(fù)雜度、低延時的要求。除此外，傳統(tǒng)數(shù)理統(tǒng)計算法在較高誤碼率的條件下的識別率不高，受誤碼率影響較大。目前，深度學(xué)習(deep learning，DL)算法由于良好的自適應(yīng)性和優(yōu)異的感知精度，備受研究者們青睞，故以深度學(xué)習算法為技術(shù)手段，通過搭建并且訓(xùn)練合適的神經(jīng)網(wǎng)絡(luò)模型，力求從解調(diào)的有誤碼的數(shù)據(jù)集中盲提取數(shù)據(jù)的深層次特征，挖掘數(shù)據(jù)的內(nèi)在聯(lián)系，實現(xiàn)可工程化的編碼參數(shù)盲識別算法。

2 算法提出

系統(tǒng)整體方案圖如圖1所示，圖像處理單元服務(wù)器(graphics processing unit server,GPU-Server)負責信息序列的生成及其LDPC編碼，編碼后的序列一方面經(jīng)過千兆以太網(wǎng)線進入發(fā)射機之后經(jīng)過調(diào)制、成型濾波處理后輸入到一體化收發(fā)器ADRV9009內(nèi)，經(jīng)過其上變頻、濾波處理后經(jīng)發(fā)射天線輻射到空氣中；另一方面編碼后的序列經(jīng)過另外一路千兆以太網(wǎng)線進入到接收機進行存儲，便于統(tǒng)計信道誤碼率。接收機經(jīng)過接收天線從有損信道接收到調(diào)制波形后經(jīng)過濾波、解調(diào)后，將時域比特數(shù)據(jù)傳輸?shù)紾PU-Server進行后續(xù)的神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練和預(yù)測，以便進一步從接收的IQ數(shù)據(jù)集中挖掘數(shù)據(jù)深層次的互聯(lián)關(guān)系，盲識別發(fā)送端所用LDPC編碼參數(shù)。接下來從LDPC編碼參數(shù)盲識別深度神經(jīng)網(wǎng)絡(luò)的設(shè)計、數(shù)據(jù)集的構(gòu)建、平臺的選擇三個方面進行詳細論述。

2.1 網(wǎng)絡(luò)構(gòu)建

IEEE 802.11標準規(guī)定的Wi-Fi的LDPC編碼信息位碼長有648、1 296和1 944 bit三種，碼率有1/2、2/3、3/4和5/6四種，故Wi-Fi的LDPC編碼參數(shù)一共有12種可能的組合。將該LDPC編碼參數(shù)的盲識別問題轉(zhuǎn)換為一個多分類問題。圖2給出了設(shè)計的深度網(wǎng)絡(luò)模型，模型采用深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)模型，R表示網(wǎng)絡(luò)節(jié)點個數(shù)。

圖2 深度神經(jīng)網(wǎng)絡(luò)模型圖 Fig.2 Deep neural network model diagram

模型一共11層，每層的神經(jīng)元的數(shù)量分別為1 024、512、256、128、64、32、64、128、256、512、1 024，最后輸出層Softmax的神經(jīng)元數(shù)量為13，與總分類數(shù)量匹配。解調(diào)后的比特序列通過預(yù)處理，保存為定長的一維張量，輸入到模型的輸入層。該深度網(wǎng)絡(luò)模型通過不斷的迭代、學(xué)習，自動提取數(shù)據(jù)內(nèi)在特征，優(yōu)化自己的網(wǎng)絡(luò)參數(shù)，最終預(yù)判數(shù)據(jù)所使用的編碼參數(shù)。表1給出了每層神經(jīng)網(wǎng)絡(luò)參數(shù)、激活函數(shù)以及優(yōu)化策略和各層的輸出數(shù)據(jù)維度列表。

表1 深度神經(jīng)網(wǎng)絡(luò)各層參數(shù)詳情列表Table 1 Detail list of neural network parameters

設(shè)計的深度網(wǎng)絡(luò)模型層數(shù)較多，為了防止過擬合，在每層的全連接層的優(yōu)化配置中都加入了l2的正則化項，優(yōu)化參數(shù)為2。除此外，在層與層之間加入了BatchNormalization優(yōu)化項，進一步避免網(wǎng)絡(luò)模型的過擬合。該深度神經(jīng)網(wǎng)絡(luò)模型采用遷移學(xué)習的模式，不斷調(diào)整模型的訓(xùn)練參數(shù)，例如學(xué)習率、batch-size、epoch等，逐步提高驗證集的預(yù)測準確率，直至得到滿意的結(jié)果。

2.2 數(shù)據(jù)集構(gòu)建

數(shù)據(jù)是深度學(xué)習的核心驅(qū)動力，使用的數(shù)據(jù)采用MATLAB仿真+軟件無線電半實物的模式生成。表2給出了LDPC編碼的碼長和碼率以及原始信息位長度之間的關(guān)系。從表2中可以看出，各種不同的信息位長度數(shù)據(jù)跟不同的碼率搭配，最終生成Wi-Fi所需要的3種編碼碼長。信息位碼長數(shù)據(jù)采用MATLAB隨機生成的方式，然后根據(jù)對應(yīng)的碼率，調(diào)用MATLAB的comm.LDPCEncoder()函數(shù)隨機生成多組編碼數(shù)據(jù)。如圖1所示，將這些生成的數(shù)據(jù)通過千兆以太網(wǎng)線灌入到軟件無線電平臺中，經(jīng)過處理后通過發(fā)射通道(transmit,TX)通道發(fā)射出去。在接收端，經(jīng)過相應(yīng)的濾波、解調(diào)后得到接收數(shù)據(jù)。為了滿足輸入層5 000 bit的張量要求，這里將接收到的多組編碼數(shù)據(jù)前后拼接，截取前面5 000 bit，作為一維的輸入數(shù)據(jù)，并且打上相應(yīng)的標簽。另外，為了準確研究誤碼率對編碼參數(shù)識別的影響，實驗時通過在收發(fā)機之間接入信道模擬器(型號：Spirent TAS4500,made in Dongguan Mastery Electronics Co.,Ltd.,Dongguan,China)取代收發(fā)天線，以便可以定量生成制定誤碼率的數(shù)據(jù)集。信道模擬器可以模擬射頻信道的主要特征，如多徑數(shù)量、延時、多普勒頻率偏移、信道噪聲等。通過設(shè)置信道模擬器的參數(shù)，控制信道質(zhì)量，進一步控制接收數(shù)據(jù)的誤碼率。通過如此的方式，不斷循環(huán)往復(fù)，最終生成在不同誤碼率條件下的50 000條有效數(shù)據(jù)。實驗時，按照8/2的比例分配給訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集。

表2 深度神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)集列表Table 2 Data list of deep neural network

2.3 實現(xiàn)平臺

數(shù)據(jù)的構(gòu)造采用MATLAB，數(shù)據(jù)的收發(fā)硬件系統(tǒng)采用GNU Radio軟件無線電平臺，硬件平臺由ZCU102+ADRV9009硬件平臺構(gòu)成，GPU的信號為NVIDIA GeForce GTX1080TI，所有數(shù)據(jù)的訓(xùn)練和測試都在GPU上進行，深度學(xué)習架構(gòu)軟件平臺為Keras 2.3.1，其以Tensorflow 2.0作為后端處理軟件。

3 實驗結(jié)果

基于圖1的總體研究方案，利用上述構(gòu)建的數(shù)據(jù)集對所提出的深度神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練，直至模型loss收斂，得到訓(xùn)練好的網(wǎng)絡(luò)權(quán)重參數(shù)集。論文設(shè)計了兩個實驗，分別從LDPC編碼參數(shù)識別的總體效果以及單項參數(shù)的識別率兩方面對所提深度神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果做進一步討論。

3.1 實驗1

為了驗證所訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型對所有Wi-Fi制式下的LDPC的編碼參數(shù)的預(yù)測性能。實驗1基于圖1的研究方案，通過不斷調(diào)整信道模擬器中噪聲參數(shù)的值以便進一步控制接收機接收序列的誤碼率。基于這種方法，生成了10 000條包含了12種編碼參數(shù)在不同誤碼率條件下的測試數(shù)據(jù)集，各編碼參數(shù)的數(shù)據(jù)總量大致相等。將該數(shù)據(jù)集灌入到所訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型中，通過比對數(shù)據(jù)的標簽label與網(wǎng)絡(luò)預(yù)測的pre_label是否一致來判定預(yù)測是否準確，并且基于平均統(tǒng)計的方法來評估網(wǎng)絡(luò)的總體性能。

圖3給出了所訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型總體的預(yù)測準確率的曲線圖。從圖3可以看出，隨著接收序列誤碼率的逐漸增加，網(wǎng)絡(luò)模型的編碼參數(shù)識別率逐漸降低。在誤碼率低于0.07時，網(wǎng)絡(luò)模型能夠保證95%的綜合預(yù)測準確率。當接收序列的誤碼率達到0.1時，模型仍然能夠達到91.5%的準確率。故圖3說明所訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型的普適性較好，魯棒性較高，能夠勝任各種不同條件下的預(yù)測任務(wù)，取得較高的預(yù)測準確率。

圖3 不同信噪比條件下LDPC編碼參數(shù)綜合識別率曲線圖Fig.3 Comprehensive recognition rate of LDPC coding parameters under different SNR

3.1 實驗2

為了進一步分析所訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型對各種不同編碼參數(shù)的預(yù)測性能的差異，基于上述測試數(shù)據(jù)的生成方法，實驗2針對12種編碼參數(shù)在不同信噪比條件下各生成了5 000條測試數(shù)據(jù)，通過實驗1的測試方法來具體分析各種編碼參數(shù)的預(yù)測性能。

圖4給出了在不同信噪比條件下LDPC的12種編碼參數(shù)在所訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型上的性能表現(xiàn)。從圖4可以看出，在誤碼率小于0.08時，各項編碼參數(shù)的準確率都優(yōu)于90%。碼長為1 296、碼率為1/2的編碼參數(shù)在誤碼率為0.1的條件下仍然能夠達到92%的預(yù)測準確率，性能表現(xiàn)最為優(yōu)異。并且，當碼長相同時，低碼率的數(shù)據(jù)的識別率較高。原因可能是對于截取的相同的5 000 bit的數(shù)據(jù)里，低碼率的約束比特較多，約束關(guān)系特征更容易提取。

圖4 不同信噪比條件下LDPC編碼各項參數(shù)識別率曲線圖Fig.4 Recognition rate of LDPC coding parameters under different SNR

4 結(jié)論

通信鏈路層特征盲提取是智能通信和通信對抗領(lǐng)域的重點研究內(nèi)容，其中的編碼參數(shù)識別一直是重難點問題，存在著在高誤碼條件下識別率不高、數(shù)理統(tǒng)計算法在工程實現(xiàn)時無法滿足低復(fù)雜度以及低延時的要求的問題。以最常見的無線互聯(lián)標準IEEE 802.11規(guī)定的Wi-Fi為切入點，通過將Wi-Fi的LDPC編碼參數(shù)盲識別問題轉(zhuǎn)換為一個分類問題，并且引入了深度學(xué)習算法。通過搭建深度學(xué)習網(wǎng)絡(luò)，構(gòu)建滿足要求的訓(xùn)練、驗證、測試數(shù)據(jù)集對模型進行訓(xùn)練和驗證。實驗結(jié)果得出如下結(jié)論。

(1)在無誤碼的條件下，編碼參數(shù)預(yù)測準確度高達95.32%。

(2)在高達10%的誤碼條件下，所訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型仍能夠確保LDPC編碼參數(shù)盲識別的綜合預(yù)測準確率優(yōu)于91.5%。相比同類算法，取得了較大的進步，并且現(xiàn)有的嵌入式深度學(xué)習平臺可輕松移植該網(wǎng)絡(luò)模型進行實際的應(yīng)用，保證了工程的可實踐性。