白 迪,崔勇強*,王曉磊,李永輝
(1.中南民族大學(xué)電子信息工程學(xué)院,武漢 430074;2.武漢大學(xué)電子信息學(xué)院,武漢 430072)
近幾年來,無人機“黑飛”事件[1-2]呈高發(fā)態(tài)勢,而無線(局域)網(wǎng)/無線保真(wireless fidelity,Wi-Fi)是目前使用最為廣泛的互聯(lián)無線通信協(xié)議標準,眾多無人機采用Wi-Fi作為其通信數(shù)據(jù)鏈,故研究Wi-Fi的鏈路層特征盲識別對于實現(xiàn)基于Wi-Fi的智能通信或無人機的反制都具有重要意義。
Wi-Fi的鏈路層的調(diào)制方式采用的是BPSK/QPSK/QAM/CCK等,目前調(diào)制類型識別算法的研究中,各國研究者基于傳統(tǒng)的數(shù)理統(tǒng)計和新的深度學(xué)習的方法[3-9]進行了深入的研究,完成了各種調(diào)制方式在各種信噪比下的盲識別算法,取得了前所未有的研究成果。Wi-Fi采用的是低密度奇偶校驗碼(low density parity check code,LDPC)編碼,針對LDPC編碼方式的盲識別問題也吸引了各國專家進行了深入的研究[10-17],Refaey等[10]設(shè)計了一種智能接收機,能夠從截獲的數(shù)據(jù)流中盲探測LDPC編碼。文獻[8]提出了一種新的LDPC信道編碼識別算法,從譯碼的角度來識別LDPC編碼類型。文獻[9]針對一個有限編碼數(shù)據(jù)集,提出了一種Cosine Conformity(CC)算法,能夠從3種編碼方式中識別LDPC編碼,相比同類算法,性能提升1.5 dB。文獻[13-17]從人工特征提取以及數(shù)理統(tǒng)計的方法著手就識別率、校驗矩陣、誤碼條件等方面的問題展開研究,LDPC編碼類型的盲識別的識別率取得了較大的提升。而LDPC編碼參數(shù)的盲識別卻是Wi-Fi鏈路層特征盲識別的疑難問題,存在識別率不高、計算復(fù)雜度高等問題,故現(xiàn)提出基于深度學(xué)習的LDPC編碼參數(shù)盲識別算法,以求在低復(fù)雜度、低延時的前提下,提高在各種誤碼條件下的識別準確率。
根據(jù)802.11標準,Wi-Fi采用的是LDPC編碼,編碼參數(shù)有信息位碼長和編碼碼率兩種。其中信息位碼長分為648、1 296和1 944 bit三種,碼率有1/2、2/3、3/4和5/6四種。Wi-Fi編碼參數(shù)識別即從截獲接收的波形信號中識別其具體使用的編碼碼長及碼率,目前各國研究者對信道編碼盲識別進行了深入的研究。文獻[18]針對低信噪比條件下現(xiàn)有LDPC編碼碼率參數(shù)識別度不高的問題提出了一種新的編碼碼率識別算法,該算法首先利用信道輸出的軟信息,將編碼校驗關(guān)系映射到對數(shù)似然比域。其仿真結(jié)果表明,在給定先驗編碼集合的閉集應(yīng)用模式下,識別率可提高2~5 dB。文獻[19]針對LDPC編碼提出了一種新的編碼碼長和碼率的識別算法,該算法充分利用了數(shù)據(jù)的均值和均方差的統(tǒng)計特征,在高信噪比的條件下識別率較高。文獻[20]研究了在誤碼信道條件(高斯白噪聲)下IEEE 802.11標準的Wi-Fi的編碼方式-LDPC編碼碼長和碼率識別算法,其實驗結(jié)果表明調(diào)制階數(shù)越低,編碼參數(shù)的識別率越高。
上述學(xué)者針對LDPC編碼參數(shù)的盲識別研究都取得了較好的研究成果,進一步更新了鏈路層特征盲識別的研究成果。然而上述無論是編碼方式的研究還是LDPC編碼參數(shù)的識別都基于的傳統(tǒng)的人工特征提取+數(shù)理統(tǒng)計分析的方法,該方法面臨人工特征提取的特征差異性較大,并且統(tǒng)計特征難以發(fā)掘,其次數(shù)理統(tǒng)計的計算過程復(fù)雜,導(dǎo)致工程實踐難度較大,并且計算耗時較高,不利于工程實踐的低復(fù)雜度、低延時的要求。除此外,傳統(tǒng)數(shù)理統(tǒng)計算法在較高誤碼率的條件下的識別率不高,受誤碼率影響較大。目前,深度學(xué)習(deep learning,DL)算法由于良好的自適應(yīng)性和優(yōu)異的感知精度,備受研究者們青睞,故以深度學(xué)習算法為技術(shù)手段,通過搭建并且訓(xùn)練合適的神經(jīng)網(wǎng)絡(luò)模型,力求從解調(diào)的有誤碼的數(shù)據(jù)集中盲提取數(shù)據(jù)的深層次特征,挖掘數(shù)據(jù)的內(nèi)在聯(lián)系,實現(xiàn)可工程化的編碼參數(shù)盲識別算法。
系統(tǒng)整體方案圖如圖1所示,圖像處理單元服務(wù)器(graphics processing unit server,GPU-Server)負責信息序列的生成及其LDPC編碼,編碼后的序列一方面經(jīng)過千兆以太網(wǎng)線進入發(fā)射機之后經(jīng)過調(diào)制、成型濾波處理后輸入到一體化收發(fā)器ADRV9009內(nèi),經(jīng)過其上變頻、濾波處理后經(jīng)發(fā)射天線輻射到空氣中;另一方面編碼后的序列經(jīng)過另外一路千兆以太網(wǎng)線進入到接收機進行存儲,便于統(tǒng)計信道誤碼率。接收機經(jīng)過接收天線從有損信道接收到調(diào)制波形后經(jīng)過濾波、解調(diào)后,將時域比特數(shù)據(jù)傳輸?shù)紾PU-Server進行后續(xù)的神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練和預(yù)測,以便進一步從接收的IQ數(shù)據(jù)集中挖掘數(shù)據(jù)深層次的互聯(lián)關(guān)系,盲識別發(fā)送端所用LDPC編碼參數(shù)。接下來從LDPC編碼參數(shù)盲識別深度神經(jīng)網(wǎng)絡(luò)的設(shè)計、數(shù)據(jù)集的構(gòu)建、平臺的選擇三個方面進行詳細論述。
IEEE 802.11標準規(guī)定的Wi-Fi的LDPC編碼信息位碼長有648、1 296和1 944 bit三種,碼率有1/2、2/3、3/4和5/6四種,故Wi-Fi的LDPC編碼參數(shù)一共有12種可能的組合。將該LDPC編碼參數(shù)的盲識別問題轉(zhuǎn)換為一個多分類問題。圖2給出了設(shè)計的深度網(wǎng)絡(luò)模型,模型采用深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)模型,R表示網(wǎng)絡(luò)節(jié)點個數(shù)。

圖2 深度神經(jīng)網(wǎng)絡(luò)模型圖 Fig.2 Deep neural network model diagram
模型一共11層,每層的神經(jīng)元的數(shù)量分別為1 024、512、256、128、64、32、64、128、256、512、1 024,最后輸出層Softmax的神經(jīng)元數(shù)量為13,與總分類數(shù)量匹配。解調(diào)后的比特序列通過預(yù)處理,保存為定長的一維張量,輸入到模型的輸入層。該深度網(wǎng)絡(luò)模型通過不斷的迭代、學(xué)習,自動提取數(shù)據(jù)內(nèi)在特征,優(yōu)化自己的網(wǎng)絡(luò)參數(shù),最終預(yù)判數(shù)據(jù)所使用的編碼參數(shù)。表1給出了每層神經(jīng)網(wǎng)絡(luò)參數(shù)、激活函數(shù)以及優(yōu)化策略和各層的輸出數(shù)據(jù)維度列表。

表1 深度神經(jīng)網(wǎng)絡(luò)各層參數(shù)詳情列表Table 1 Detail list of neural network parameters
設(shè)計的深度網(wǎng)絡(luò)模型層數(shù)較多,為了防止過擬合,在每層的全連接層的優(yōu)化配置中都加入了l2的正則化項,優(yōu)化參數(shù)為2。除此外,在層與層之間加入了BatchNormalization優(yōu)化項,進一步避免網(wǎng)絡(luò)模型的過擬合。該深度神經(jīng)網(wǎng)絡(luò)模型采用遷移學(xué)習的模式,不斷調(diào)整模型的訓(xùn)練參數(shù),例如學(xué)習率、batch-size、epoch等,逐步提高驗證集的預(yù)測準確率,直至得到滿意的結(jié)果。
數(shù)據(jù)是深度學(xué)習的核心驅(qū)動力,使用的數(shù)據(jù)采用MATLAB仿真+軟件無線電半實物的模式生成。表2給出了LDPC編碼的碼長和碼率以及原始信息位長度之間的關(guān)系。從表2中可以看出,各種不同的信息位長度數(shù)據(jù)跟不同的碼率搭配,最終生成Wi-Fi所需要的3種編碼碼長。信息位碼長數(shù)據(jù)采用MATLAB隨機生成的方式,然后根據(jù)對應(yīng)的碼率,調(diào)用MATLAB的comm.LDPCEncoder()函數(shù)隨機生成多組編碼數(shù)據(jù)。如圖1所示,將這些生成的數(shù)據(jù)通過千兆以太網(wǎng)線灌入到軟件無線電平臺中,經(jīng)過處理后通過發(fā)射通道(transmit,TX)通道發(fā)射出去。在接收端,經(jīng)過相應(yīng)的濾波、解調(diào)后得到接收數(shù)據(jù)。為了滿足輸入層5 000 bit的張量要求,這里將接收到的多組編碼數(shù)據(jù)前后拼接,截取前面5 000 bit,作為一維的輸入數(shù)據(jù),并且打上相應(yīng)的標簽。另外,為了準確研究誤碼率對編碼參數(shù)識別的影響,實驗時通過在收發(fā)機之間接入信道模擬器(型號:Spirent TAS4500,made in Dongguan Mastery Electronics Co.,Ltd.,Dongguan,China)取代收發(fā)天線,以便可以定量生成制定誤碼率的數(shù)據(jù)集。信道模擬器可以模擬射頻信道的主要特征,如多徑數(shù)量、延時、多普勒頻率偏移、信道噪聲等。通過設(shè)置信道模擬器的參數(shù),控制信道質(zhì)量,進一步控制接收數(shù)據(jù)的誤碼率。通過如此的方式,不斷循環(huán)往復(fù),最終生成在不同誤碼率條件下的50 000條有效數(shù)據(jù)。實驗時,按照8/2的比例分配給訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集。

表2 深度神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)集列表Table 2 Data list of deep neural network
數(shù)據(jù)的構(gòu)造采用MATLAB,數(shù)據(jù)的收發(fā)硬件系統(tǒng)采用GNU Radio軟件無線電平臺,硬件平臺由ZCU102+ADRV9009硬件平臺構(gòu)成,GPU的信號為NVIDIA GeForce GTX1080TI,所有數(shù)據(jù)的訓(xùn)練和測試都在GPU上進行,深度學(xué)習架構(gòu)軟件平臺為Keras 2.3.1,其以Tensorflow 2.0作為后端處理軟件。
基于圖1的總體研究方案,利用上述構(gòu)建的數(shù)據(jù)集對所提出的深度神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練,直至模型loss收斂,得到訓(xùn)練好的網(wǎng)絡(luò)權(quán)重參數(shù)集。論文設(shè)計了兩個實驗,分別從LDPC編碼參數(shù)識別的總體效果以及單項參數(shù)的識別率兩方面對所提深度神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果做進一步討論。
為了驗證所訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型對所有Wi-Fi制式下的LDPC的編碼參數(shù)的預(yù)測性能。實驗1基于圖1的研究方案,通過不斷調(diào)整信道模擬器中噪聲參數(shù)的值以便進一步控制接收機接收序列的誤碼率。基于這種方法,生成了10 000條包含了12種編碼參數(shù)在不同誤碼率條件下的測試數(shù)據(jù)集,各編碼參數(shù)的數(shù)據(jù)總量大致相等。將該數(shù)據(jù)集灌入到所訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型中,通過比對數(shù)據(jù)的標簽label與網(wǎng)絡(luò)預(yù)測的pre_label是否一致來判定預(yù)測是否準確,并且基于平均統(tǒng)計的方法來評估網(wǎng)絡(luò)的總體性能。
圖3給出了所訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型總體的預(yù)測準確率的曲線圖。從圖3可以看出,隨著接收序列誤碼率的逐漸增加,網(wǎng)絡(luò)模型的編碼參數(shù)識別率逐漸降低。在誤碼率低于0.07時,網(wǎng)絡(luò)模型能夠保證95%的綜合預(yù)測準確率。當接收序列的誤碼率達到0.1時,模型仍然能夠達到91.5%的準確率。故圖3說明所訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型的普適性較好,魯棒性較高,能夠勝任各種不同條件下的預(yù)測任務(wù),取得較高的預(yù)測準確率。

圖3 不同信噪比條件下LDPC編碼參數(shù)綜合識別率曲線圖Fig.3 Comprehensive recognition rate of LDPC coding parameters under different SNR
為了進一步分析所訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型對各種不同編碼參數(shù)的預(yù)測性能的差異,基于上述測試數(shù)據(jù)的生成方法,實驗2針對12種編碼參數(shù)在不同信噪比條件下各生成了5 000條測試數(shù)據(jù),通過實驗1的測試方法來具體分析各種編碼參數(shù)的預(yù)測性能。
圖4給出了在不同信噪比條件下LDPC的12種編碼參數(shù)在所訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型上的性能表現(xiàn)。從圖4可以看出,在誤碼率小于0.08時,各項編碼參數(shù)的準確率都優(yōu)于90%。碼長為1 296、碼率為1/2的編碼參數(shù)在誤碼率為0.1的條件下仍然能夠達到92%的預(yù)測準確率,性能表現(xiàn)最為優(yōu)異。并且,當碼長相同時,低碼率的數(shù)據(jù)的識別率較高。原因可能是對于截取的相同的5 000 bit的數(shù)據(jù)里,低碼率的約束比特較多,約束關(guān)系特征更容易提取。

圖4 不同信噪比條件下LDPC編碼各項參數(shù)識別率曲線圖Fig.4 Recognition rate of LDPC coding parameters under different SNR
通信鏈路層特征盲提取是智能通信和通信對抗領(lǐng)域的重點研究內(nèi)容,其中的編碼參數(shù)識別一直是重難點問題,存在著在高誤碼條件下識別率不高、數(shù)理統(tǒng)計算法在工程實現(xiàn)時無法滿足低復(fù)雜度以及低延時的要求的問題。以最常見的無線互聯(lián)標準IEEE 802.11規(guī)定的Wi-Fi為切入點,通過將Wi-Fi的LDPC編碼參數(shù)盲識別問題轉(zhuǎn)換為一個分類問題,并且引入了深度學(xué)習算法。通過搭建深度學(xué)習網(wǎng)絡(luò),構(gòu)建滿足要求的訓(xùn)練、驗證、測試數(shù)據(jù)集對模型進行訓(xùn)練和驗證。實驗結(jié)果得出如下結(jié)論。
(1)在無誤碼的條件下,編碼參數(shù)預(yù)測準確度高達95.32%。
(2)在高達10%的誤碼條件下,所訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型仍能夠確保LDPC編碼參數(shù)盲識別的綜合預(yù)測準確率優(yōu)于91.5%。相比同類算法,取得了較大的進步,并且現(xiàn)有的嵌入式深度學(xué)習平臺可輕松移植該網(wǎng)絡(luò)模型進行實際的應(yīng)用,保證了工程的可實踐性。