基于CNN-BiLSTM 的短波通信頻率預(yù)測研究*

2020-07-19 14:28:12夏吉業(yè)張海勇

通信技術(shù) 2020年6期

關(guān)鍵詞：特征模型

夏吉業(yè)，張海勇，徐池，賀寅

（海軍大連艦艇學(xué)院，遼寧大連 116018）

0 引言

短波通信自上世紀(jì)初出現(xiàn)以來，就一直被廣泛的應(yīng)用于無線通信中，在遠(yuǎn)程通信方面，相比于衛(wèi)星通信，短波通信能夠不依靠中繼用較小的發(fā)射功率達(dá)成通信，此外，短波通信在軍事通信中也占據(jù)著重要地位[1-2]，發(fā)展短波通信意義重大。

短波遠(yuǎn)程通信是通過電離層反射實(shí)現(xiàn)的，受電離層色散、時變[3]等特性及信道傳輸過程中存在的多普勒頻移、衰落、多徑時延、噪聲干擾[4]等現(xiàn)象影響，只有選擇適當(dāng)?shù)耐ㄐ蓬l率，才能使通信過程在優(yōu)質(zhì)信道中達(dá)成，保證短波遠(yuǎn)程通信的通信效果。因此，實(shí)現(xiàn)精準(zhǔn)的通信頻率預(yù)測在短波遠(yuǎn)程通信過程中尤為重要[5]。

傳統(tǒng)頻率預(yù)測方法主要有國際無線電咨詢委員會（CCIR）推薦方法（即340 報告）和亞大預(yù)測[6]，通過公式來進(jìn)行計算的方法進(jìn)行預(yù)測，之后國際電聯(lián)通信大會（ITU-R，即原CCIR）給出三個短波信道模型，即報告252、報告252 補(bǔ)編和報告894[7-8]。隨后國外推出了一系列頻率預(yù)測程序，主要有IONCAP、VOACAP、PropMan、NTIA/ITS 以及W6ELProp 等[5]，這些預(yù)測程序針對不同的適用環(huán)境和條件，在一定程度上提高了預(yù)測精度，但主要是在理想模式下進(jìn)行的，對氣候、太陽活動、電離層跳變等不確定因素不能很好估計[9]。在國內(nèi)方面，2007 年中國電波傳播研究所結(jié)合亞大地區(qū)電離層探測數(shù)據(jù)，對亞大模型進(jìn)行改進(jìn)，有效的提高了該地區(qū)頻率預(yù)測的精度[10-11]，但受地域限制，該方法在通信距離超過4000 公里時的預(yù)測精度較低，基本不能滿足遠(yuǎn)程通信時對通信頻率的預(yù)測需求。

隨著機(jī)器學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)算法的出現(xiàn)和發(fā)展，從本世紀(jì)初開始，研究者們利用人工神經(jīng)網(wǎng)絡(luò)強(qiáng)大的非線性預(yù)測能力，將其引入到短波頻率預(yù)測領(lǐng)域，并獲得了一些成果。最初的方法是用反向傳播（BP）神經(jīng)和網(wǎng)絡(luò)預(yù)測f0F2 月中值[12]，預(yù)測誤差在0.3 MHz以上，在太陽黑子周期劇烈變化時甚至達(dá)到1 MHz 以上；簡相超[13]等人將混沌理論和神經(jīng)網(wǎng)絡(luò)相結(jié)合方法，構(gòu)成混合模型來進(jìn)行短波頻率參數(shù)預(yù)測；金會彬[14]等人基于神經(jīng)網(wǎng)絡(luò)的foF2 預(yù)測方法，提高了對電離層暴期的預(yù)測結(jié)果；任淑婷[15]等人提出基于模糊小波神經(jīng)網(wǎng)絡(luò)[16-18]的短波頻率預(yù)測模型；趙德群[9]等人提出思維進(jìn)化小波神經(jīng)網(wǎng)絡(luò)（MEA-WNN）與混沌理論相結(jié)合的短波通信頻率預(yù)測方法，提高對f0F2 的預(yù)測精度。上述算法均存在一些缺陷，主要體現(xiàn)在對數(shù)據(jù)的處理太過復(fù)雜、對參數(shù)要求較為苛刻、選擇神經(jīng)網(wǎng)絡(luò)模型存在收斂慢、梯度消失或爆炸等問題。為避免神經(jīng)網(wǎng)絡(luò)在反向傳播時產(chǎn)生的梯度消失，結(jié)合揮深度學(xué)習(xí)算法[19-20]對處理非線性時間序列的獨(dú)特優(yōu)勢，2019年張雯鶴[21]等人提出一種基于長短期記憶神經(jīng)網(wǎng)絡(luò)（LSTM）模型預(yù)測f0F2 的方法，該模型具有收斂速度快、收斂性較好等特點(diǎn)，但僅對f0F2 月中值實(shí)現(xiàn)了預(yù)測和驗證；同年，尚教凱[22]等人基于LSTM 模型實(shí)現(xiàn)對未來24 小時的點(diǎn)對點(diǎn)遠(yuǎn)程短波通信可用頻率預(yù)測，但該方法使用單特征輸入時預(yù)測耗時較長，使用多特征輸入時結(jié)果存在時延，仍有提升空間。

為解決上述問題，本文提出一種基于卷積神經(jīng)網(wǎng) 絡(luò)（Convolutional Neural Network，CNN）和雙向長短期記憶神經(jīng)網(wǎng)絡(luò)（Bidirectional Long Short Term Memory，BiLSTM）相結(jié)合的模型，即CNN-BiLSTM模型，來實(shí)現(xiàn)對遠(yuǎn)程短波通信頻率的預(yù)測。

1 CNN-BiLSTM 模型的提出

1.1 卷積神經(jīng)網(wǎng)絡(luò)（CNN）

卷積神經(jīng)網(wǎng)絡(luò)（CNN）通過原始數(shù)據(jù)與卷積核相乘來提取局部特征，在一個網(wǎng)絡(luò)中可以通過選擇多種類型卷積核來達(dá)到提取多個局部特征的目的，因此CNN 相比其他網(wǎng)絡(luò)，其提取布局特征的能力更為突出。該網(wǎng)絡(luò)主要由卷積層、池化層和全連接層組成。其中，運(yùn)用卷積核對原始數(shù)據(jù)進(jìn)行卷積操作來提取特征的過程發(fā)生在卷積層，該層是CNN 網(wǎng)絡(luò)的核心層，其過程可用式（1）表示。

式中，σ為激活函數(shù)；? 為卷積操作；W為權(quán)值矩陣；b為偏置矩陣。

池化層的作用是將卷積層得到的輸出通過池化操作來對處理后的數(shù)據(jù)進(jìn)行壓縮，提高泛化能力。本文模型選用最大池化函數(shù)對卷積結(jié)果進(jìn)行池化操作，通過取最大值來完成對局部特征區(qū)域的數(shù)據(jù)壓縮過程，其過程如式（2）：

式中，di為通過卷積層提取的特征，m為池化寬度。

全連接層的作用是將前邊網(wǎng)絡(luò)提取到的特征信息綜合到一起，它的每個結(jié)點(diǎn)都連接著上一層的所有結(jié)點(diǎn)，因此其相關(guān)參數(shù)較多。通過全連接層使所提取的特征具有更高層的含義，從而達(dá)成該網(wǎng)絡(luò)模型所要實(shí)現(xiàn)的物理意義。

1.2 雙向長短期記憶神經(jīng)網(wǎng)絡(luò)（BiLSTM）

長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)最早由Hochreiter[23]于1997 年提出，是在循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）上的一種改進(jìn)，在RNN 基礎(chǔ)上引入記憶模塊，在提高了計算效率[24]的同時，有效的解決了RNN 出現(xiàn)的梯度消失或者爆炸問題[25]。

LSTM 模型具有較好的非線性時間序列的處理能力，但在實(shí)驗過程中發(fā)現(xiàn)，LSTM 的記憶能力有一定限度，并且該模型是一個單向傳遞的過程，即后一時刻的狀態(tài)對當(dāng)前時刻沒有任何影響，而在短波通信頻率預(yù)測過程中，認(rèn)為在一定的時間間隔內(nèi)，頻率的預(yù)測可以綜合考慮前、后時刻的輸入和狀態(tài)，來提高預(yù)測效果。因此，本文引入雙向長短期記憶神經(jīng)網(wǎng)絡(luò)（BiLSTM），該模型將兩層不同的LSTM 互連，使每個輸入都會從正反兩個方向經(jīng)過網(wǎng)絡(luò)，該模型一方面增強(qiáng)了處理非線性時間序列的能力，另一方面也能進(jìn)行更充分的學(xué)習(xí)訓(xùn)練，利用當(dāng)前輸入和后一時刻的狀態(tài)進(jìn)行短波頻率預(yù)測，因此在理論上有更好的預(yù)測效果。BiLSTM 模型結(jié)構(gòu)如圖1 所示。

圖1 雙向長短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

該模型的運(yùn)算結(jié)果如式（3）、式（4）所示。

1.3 Dropout 運(yùn)算

在CNN 網(wǎng)絡(luò)運(yùn)算過程中，為精確的逼近訓(xùn)練數(shù)據(jù)的局部特征，容易出現(xiàn)過擬合現(xiàn)象，為解決這一問題，本文提出的模型在CNN 網(wǎng)絡(luò)之后進(jìn)行Dropout 運(yùn)算。該算法由Alex[26]等人于2012 年提出，原理是在每個訓(xùn)練批次中，適當(dāng)忽略部分特征檢測器，減少相互作用，因此在網(wǎng)絡(luò)運(yùn)行過程中不會太過依賴某些局部特征，有效的降低模型過擬合，從而增強(qiáng)了模型的泛化能力。使用該算法的神經(jīng)網(wǎng)絡(luò)模型與標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)模型的對比如圖2 所示。

圖2 標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)與Dropout 網(wǎng)絡(luò)模型對比

該算法由于忽略部分檢測器，使當(dāng)前層的檢測器無需遍歷下一層的每個檢測器，降低了網(wǎng)絡(luò)模型的復(fù)雜程度，因此該算法在解決過擬合現(xiàn)象的同時，也大大減少了網(wǎng)絡(luò)模型的運(yùn)算時間。綜合考慮歷史經(jīng)驗及多次嘗試，在本文的模型中使用該算法忽略的檢測器比例為20%。

1.4 CNN-BiLSTM 模型

短波遠(yuǎn)程通信的最高可用頻率受電離層特性影響，具有一定空間和時間上相關(guān)性，不少學(xué)者也在進(jìn)行短波通信頻率時間柵格和空間柵格尺度的研究。結(jié)合在本文中分析得到的CNN 具有較好的提取空間局部特征能力與BiLSTM 在處理非線性時間序列時獨(dú)到的優(yōu)勢，提出基于CNN-BiLSTM 的融合模型短波通信頻率預(yù)測模型，結(jié)構(gòu)如圖3 所示。

該網(wǎng)絡(luò)模型主要可劃分為輸入層、CNN 層、Dropout 層、BiLSTM 層、全連接層和輸出層，其中CNN 層和BiLSTM 層為本模型的核心結(jié)構(gòu)，CNN 層是由多個一維卷積（Conv1D）層和一維最大池化（MaxPooling1D）層堆疊組成。利用該模型進(jìn)行遠(yuǎn)程短波通信頻率預(yù)測的過程如下。

將歷史通信頻率等相關(guān)數(shù)據(jù)集作為該網(wǎng)絡(luò)的輸入，經(jīng)數(shù)據(jù)歸一化、形成矩陣向量等預(yù)處理之后，進(jìn)入CNN 層利用多層卷積核與池化核參數(shù)對相關(guān)頻率數(shù)據(jù)進(jìn)行局部深層特征提取，提取完畢后得到多組特征向量再經(jīng)Dropout 層隨機(jī)丟棄部分特征以提高模型的穩(wěn)健性，隨后將處理后的輸出特征通過BiLSTM 網(wǎng)絡(luò)進(jìn)行訓(xùn)練，最后，將經(jīng)BiLSTM 訓(xùn)練得到的輸出結(jié)果進(jìn)行拼接融合，再經(jīng)全連接層進(jìn)行信息綜合后，得到模型預(yù)測的頻率值。

圖3 CNN-BiLSTM 模型結(jié)構(gòu)

2 實(shí)驗對比及分析

2.1 數(shù)據(jù)獲取與處理

短波通信的歷史數(shù)據(jù)是指通信雙方在達(dá)成較穩(wěn)定的短波通信過程中使用或設(shè)置的一些相關(guān)通信參數(shù)，包括通信時刻、雙方位置、通信頻率、通信功率等因素，由于該數(shù)據(jù)是實(shí)際通信過程中產(chǎn)生的，具有較高的可靠性和準(zhǔn)確性，若能積累一定數(shù)量較為連續(xù)的歷史數(shù)據(jù)，則可用來進(jìn)行短波通信頻率預(yù)測。受限于實(shí)際情況，無法得到足以支撐該模型需求的歷史通信頻率值作為樣本數(shù)據(jù)，本文采用ITS/REC533 軟件提取仿真數(shù)據(jù)，即2014 年8 月31 日09 時至2015 年1 月29 日08 時北京石景山到福建臺江兩點(diǎn)間，時間間隔為1 小時的短波最高通信頻率數(shù)值，組成樣本數(shù)據(jù)。該樣本數(shù)據(jù)集共有3624 h數(shù)據(jù)，其中，前3600 h數(shù)據(jù)（共150 天）作為模型的訓(xùn)練樣本，后24 h 數(shù)據(jù)作為模型的測試樣本，數(shù)據(jù)格式如表1 所示。

2.2 模型效果評價指標(biāo)

為對比預(yù)測結(jié)果的好壞，使用預(yù)測的均方根誤差（RMSE）和模型運(yùn)行時間作為評判標(biāo)準(zhǔn)。RMSE值越小，所用時間越短，就代表該模型預(yù)測的效果越好。其中，RMSE 的計算公式如式（5）所示：

式中，yt和分別為t時刻的通信頻率真實(shí)值和預(yù)測值，N為測試集的尺度。

表1 樣本數(shù)據(jù)表

2.3 預(yù)測結(jié)果與對比分析

單特征輸入LSTM 模型、多特征輸入LSTM 模型與本文提出的CNN-BiLSTM 模型進(jìn)行短波通信頻率預(yù)測的結(jié)果如圖4、圖5、圖6 所示。

圖4 單特征輸入LSTM 模型預(yù)測結(jié)果

圖5 多特征輸入LSTM 模型預(yù)測結(jié)果

圖6 CNN-BiLSTM 模型預(yù)測結(jié)果

圖中虛線為通信頻率的真實(shí)值，實(shí)線為通信頻率的模型預(yù)測值，這三種模型的RMSE 和模型運(yùn)行時間如表2 所示。

表2 三種模型RMSE 及運(yùn)行時間對比

對比上述圖表可以發(fā)現(xiàn)，在模型預(yù)測的準(zhǔn)確性方面，單特征輸入LSTM 預(yù)測模型RMSE 值僅為0.204，準(zhǔn)確度最高，從圖形中可以看出除初始1-3 h 的預(yù)測結(jié)果存在1 MHz 左右誤差外，與真實(shí)值吻合較好；CNN-BiLSTM 預(yù)測模型RMSE 值為0.544，準(zhǔn)確度次之，在預(yù)測MUF 值的高、低點(diǎn)存在1 MHz 左右的誤差外，基本與真實(shí)值保持一致；多特征輸入LSTM 預(yù)測模型RMSE 值為2.148，準(zhǔn)確度最低，預(yù)測結(jié)果除初始1 h誤差較大外，預(yù)測值與真實(shí)值存在約1 h 時延且有逐漸擴(kuò)大趨勢。在模型的運(yùn)行時間方面，預(yù)測準(zhǔn)確度較低的多特征輸入LSTM 預(yù)測模型用時最短，僅為8.68 s；CNN-BiLSTM 預(yù)測模型次之，用時38.44 s；而準(zhǔn)度度最高的單特征輸入LSTM 預(yù)測模型用時最長，為203.22 s，是多特征輸入LSTM 模型的23.4 倍，CNNBiLSTM 模型的5.3 倍。

綜上所述，在短波通信頻率預(yù)測方面，單特征輸入LSTM 模型具有預(yù)測精度高，但費(fèi)時較長的特點(diǎn)；多特征輸入LSTM 模型極大的縮短了預(yù)測時間，但預(yù)測結(jié)果存在1 h 時延，預(yù)測效果得不到保證；本文提出的CNN-BiLSTM 預(yù)測模型在基本保證預(yù)測精度的基礎(chǔ)上，極大的縮短了單特征輸入LSTM 模型預(yù)測所用時間，又有效的解決了多特征輸入LSTM 模型所存在的預(yù)測時延問題，因此該模型可用于短波通信頻率預(yù)測。

在實(shí)際通信過程中，要想獲得連續(xù)150 天的短波通信歷史數(shù)據(jù)難度較大，對固定臺站與移動臺站、移動臺站與移動臺站間的短波通信而言尤為如此。因此，出于短波通信的實(shí)際考慮，如何在保證短波通信頻率預(yù)測精度的基礎(chǔ)上，盡可能的減少所需要的通信歷史數(shù)據(jù)成為本文重點(diǎn)研究內(nèi)容。

為減少對通信歷史數(shù)據(jù)的需求，本文分別使用連續(xù)7 天、8 天、9 天、10 天、11 天、12 天，間隔1小時的仿真數(shù)據(jù)作為訓(xùn)練樣本，后1 天的仿真數(shù)據(jù)作為測試樣本，利用本文提出的CNN-BiLSTM 短波頻率預(yù)測模型進(jìn)行仿真實(shí)驗，并與單特征、多特征輸入LSTM 模型進(jìn)行對比，實(shí)驗結(jié)果如圖7 所示。

圖7 短波通信頻率預(yù)測效果

在圖7 中，（a）～（f）分別表示訓(xùn)練樣本為7-12天時的CNN-BiLSTM 模型仿真結(jié)果，（g）、（h）表示訓(xùn)練樣本為12 天時，使用單特征輸入LSTM 模型和多特征輸入LSTM 模型的仿真結(jié)果，藍(lán)色虛線為通信頻率的真實(shí)值，黃色實(shí)線為通信頻率的模型預(yù)測值。模型運(yùn)行時間及誤差如表3 所示。

表3 模型運(yùn)行及誤差表

從圖（a）～（f）及上表中可以看出，在預(yù)測準(zhǔn)確性方面，本文提出的CNN-BiLSTM 模型隨訓(xùn)練樣本天數(shù)的增加，預(yù)測精度不斷增加，在訓(xùn)練樣本數(shù)為12 天時，RMSE 值僅為0.227，除頻率最高處存在0.5 MHz 的誤差外，預(yù)測值與真實(shí)值基本吻合；在模型運(yùn)行時間方面，隨訓(xùn)練樣本天數(shù)增加，模型運(yùn)行時間基本呈遞增趨勢，但總體差距不大，最短運(yùn)行時間與最長運(yùn)行時間相差25.73 s；在樣本最大誤差率方面，隨訓(xùn)練樣本天數(shù)增加，誤差率逐步降低，在訓(xùn)練樣本為12 天時最大誤差率低至3.08%。

從圖（f）～（h）及上表中可以看出，在訓(xùn)練樣本數(shù)為12 天時，單特征輸入LSTM 模型和多特征輸入LSTM 模型的預(yù)測精度相對較低，預(yù)測最大誤差分別為4.5 MHz 和5.2 MHz，最大誤差率均達(dá)到20%以上，相比之下，本文提出的CNN-BiLSTM 預(yù)測模型在預(yù)測精度、最大誤差以及最大誤差率方面都有顯著提升。由此可以得出，在訓(xùn)練樣本數(shù)較少的情況下，CNNBiLSTM 預(yù)測模型的預(yù)測效果要優(yōu)于單特征、多特征輸入LSTM 預(yù)測模型。

綜上所述，本文提出的CNN-BiLST 模型可實(shí)現(xiàn)對未來1 天的短波通信頻率較為精準(zhǔn)的預(yù)測，并且相對于單特征、多特征輸入LSTM 預(yù)測模型，該預(yù)測模型在保證預(yù)測精度的同時，大幅縮減了對短波通信歷史數(shù)據(jù)的數(shù)量要求，增加了在實(shí)際短波通信過程中的適用性。

3 結(jié)語

本文概述了通信頻率預(yù)測發(fā)展現(xiàn)狀及存在問題，提出了CNN-BiLSTM 模型用于遠(yuǎn)程短波通信頻率預(yù)測，并與單特征、多特征輸入LSTM 預(yù)測模型進(jìn)行了對比仿真實(shí)驗，驗證了該模型可用于短波通信頻率預(yù)測，在訓(xùn)練樣本數(shù)較少的情況下，該模型的預(yù)測精度優(yōu)于單特征、多特征輸入LSTM 預(yù)測模型，對短波遠(yuǎn)程通信頻率的預(yù)測研究具有一定借鑒意義。該方法基于短波通信的歷史數(shù)據(jù)進(jìn)行通信頻率預(yù)測，如何更好的采集存儲歷史數(shù)據(jù)以及對歷史數(shù)據(jù)的處理利用等方面還值得進(jìn)行進(jìn)一步研究。