夏吉業(yè),張海勇,徐 池,賀 寅
(海軍大連艦艇學(xué)院,遼寧 大連 116018)
短波通信自上世紀(jì)初出現(xiàn)以來,就一直被廣泛的應(yīng)用于無線通信中,在遠(yuǎn)程通信方面,相比于衛(wèi)星通信,短波通信能夠不依靠中繼用較小的發(fā)射功率達(dá)成通信,此外,短波通信在軍事通信中也占據(jù)著重要地位[1-2],發(fā)展短波通信意義重大。
短波遠(yuǎn)程通信是通過電離層反射實(shí)現(xiàn)的,受電離層色散、時變[3]等特性及信道傳輸過程中存在的多普勒頻移、衰落、多徑時延、噪聲干擾[4]等現(xiàn)象影響,只有選擇適當(dāng)?shù)耐ㄐ蓬l率,才能使通信過程在優(yōu)質(zhì)信道中達(dá)成,保證短波遠(yuǎn)程通信的通信效果。因此,實(shí)現(xiàn)精準(zhǔn)的通信頻率預(yù)測在短波遠(yuǎn)程通信過程中尤為重要[5]。
傳統(tǒng)頻率預(yù)測方法主要有國際無線電咨詢委員會(CCIR)推薦方法(即340 報告)和亞大預(yù)測[6],通過公式來進(jìn)行計算的方法進(jìn)行預(yù)測,之后國際電聯(lián)通信大會(ITU-R,即原CCIR)給出三個短波信道模型,即報告252、報告252 補(bǔ)編和報告894[7-8]。隨后國外推出了一系列頻率預(yù)測程序,主要有IONCAP、VOACAP、PropMan、NTIA/ITS 以及W6ELProp 等[5],這些預(yù)測程序針對不同的適用環(huán)境和條件,在一定程度上提高了預(yù)測精度,但主要是在理想模式下進(jìn)行的,對氣候、太陽活動、電離層跳變等不確定因素不能很好估計[9]。在國內(nèi)方面,2007 年中國電波傳播研究所結(jié)合亞大地區(qū)電離層探測數(shù)據(jù),對亞大模型進(jìn)行改進(jìn),有效的提高了該地區(qū)頻率預(yù)測的精度[10-11],但受地域限制,該方法在通信距離超過4000 公里時的預(yù)測精度較低,基本不能滿足遠(yuǎn)程通信時對通信頻率的預(yù)測需求。
隨著機(jī)器學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)算法的出現(xiàn)和發(fā)展,從本世紀(jì)初開始,研究者們利用人工神經(jīng)網(wǎng)絡(luò)強(qiáng)大的非線性預(yù)測能力,將其引入到短波頻率預(yù)測領(lǐng)域,并獲得了一些成果。最初的方法是用反向傳播(BP)神經(jīng)和網(wǎng)絡(luò)預(yù)測f0F2 月中值[12],預(yù)測誤差在0.3 MHz以上,在太陽黑子周期劇烈變化時甚至達(dá)到1 MHz 以上;簡相超[13]等人將混沌理論和神經(jīng)網(wǎng)絡(luò)相結(jié)合方法,構(gòu)成混合模型來進(jìn)行短波頻率參數(shù)預(yù)測;金會彬[14]等人基于神經(jīng)網(wǎng)絡(luò)的foF2 預(yù)測方法,提高了對電離層暴期的預(yù)測結(jié)果;任淑婷[15]等人提出基于模糊小波神經(jīng)網(wǎng)絡(luò)[16-18]的短波頻率預(yù)測模型;趙德群[9]等人提出思維進(jìn)化小波神經(jīng)網(wǎng)絡(luò)(MEA-WNN)與混沌理論相結(jié)合的短波通信頻率預(yù)測方法,提高對f0F2 的預(yù)測精度。上述算法均存在一些缺陷,主要體現(xiàn)在對數(shù)據(jù)的處理太過復(fù)雜、對參數(shù)要求較為苛刻、選擇神經(jīng)網(wǎng)絡(luò)模型存在收斂慢、梯度消失或爆炸等問題。為避免神經(jīng)網(wǎng)絡(luò)在反向傳播時產(chǎn)生的梯度消失,結(jié)合揮深度學(xué)習(xí)算法[19-20]對處理非線性時間序列的獨(dú)特優(yōu)勢,2019年張雯鶴[21]等人提出一種基于長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)模型預(yù)測f0F2 的方法,該模型具有收斂速度快、收斂性較好等特點(diǎn),但僅對f0F2 月中值實(shí)現(xiàn)了預(yù)測和驗證;同年,尚教凱[22]等人基于LSTM 模型實(shí)現(xiàn)對未來24 小時的點(diǎn)對點(diǎn)遠(yuǎn)程短波通信可用頻率預(yù)測,但該方法使用單特征輸入時預(yù)測耗時較長,使用多特征輸入時結(jié)果存在時延,仍有提升空間。
為解決上述問題,本文提出一種基于卷積神經(jīng)網(wǎng) 絡(luò)(Convolutional Neural Network,CNN) 和 雙 向長短期記憶神經(jīng)網(wǎng)絡(luò)(Bidirectional Long Short Term Memory,BiLSTM)相結(jié)合的模型,即CNN-BiLSTM模型,來實(shí)現(xiàn)對遠(yuǎn)程短波通信頻率的預(yù)測。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)通過原始數(shù)據(jù)與卷積核相乘來提取局部特征,在一個網(wǎng)絡(luò)中可以通過選擇多種類型卷積核來達(dá)到提取多個局部特征的目的,因此CNN 相比其他網(wǎng)絡(luò),其提取布局特征的能力更為突出。該網(wǎng)絡(luò)主要由卷積層、池化層和全連接層組成。其中,運(yùn)用卷積核對原始數(shù)據(jù)進(jìn)行卷積操作來提取特征的過程發(fā)生在卷積層,該層是CNN 網(wǎng)絡(luò)的核心層,其過程可用式(1)表示。

式中,σ為激活函數(shù);? 為卷積操作;W為權(quán)值矩陣;b為偏置矩陣。
池化層的作用是將卷積層得到的輸出通過池化操作來對處理后的數(shù)據(jù)進(jìn)行壓縮,提高泛化能力。本文模型選用最大池化函數(shù)對卷積結(jié)果進(jìn)行池化操作,通過取最大值來完成對局部特征區(qū)域的數(shù)據(jù)壓縮過程,其過程如式(2):

式中,di為通過卷積層提取的特征,m為池化寬度。
全連接層的作用是將前邊網(wǎng)絡(luò)提取到的特征信息綜合到一起,它的每個結(jié)點(diǎn)都連接著上一層的所有結(jié)點(diǎn),因此其相關(guān)參數(shù)較多。通過全連接層使所提取的特征具有更高層的含義,從而達(dá)成該網(wǎng)絡(luò)模型所要實(shí)現(xiàn)的物理意義。
長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)最早由Hochreiter[23]于1997 年提出,是在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)上的一種改進(jìn),在RNN 基礎(chǔ)上引入記憶模塊,在提高了計算效率[24]的同時,有效的解決了RNN 出現(xiàn)的梯度消失或者爆炸問題[25]。
LSTM 模型具有較好的非線性時間序列的處理能力,但在實(shí)驗過程中發(fā)現(xiàn),LSTM 的記憶能力有一定限度,并且該模型是一個單向傳遞的過程,即后一時刻的狀態(tài)對當(dāng)前時刻沒有任何影響,而在短波通信頻率預(yù)測過程中,認(rèn)為在一定的時間間隔內(nèi),頻率的預(yù)測可以綜合考慮前、后時刻的輸入和狀態(tài),來提高預(yù)測效果。因此,本文引入雙向長短期記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM),該模型將兩層不同的LSTM 互連,使每個輸入都會從正反兩個方向經(jīng)過網(wǎng)絡(luò),該模型一方面增強(qiáng)了處理非線性時間序列的能力,另一方面也能進(jìn)行更充分的學(xué)習(xí)訓(xùn)練,利用當(dāng)前輸入和后一時刻的狀態(tài)進(jìn)行短波頻率預(yù)測,因此在理論上有更好的預(yù)測效果。BiLSTM 模型結(jié)構(gòu)如圖1 所示。

圖1 雙向長短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
該模型的運(yùn)算結(jié)果如式(3)、式(4)所示。

在CNN 網(wǎng)絡(luò)運(yùn)算過程中,為精確的逼近訓(xùn)練數(shù)據(jù)的局部特征,容易出現(xiàn)過擬合現(xiàn)象,為解決這一問題,本文提出的模型在CNN 網(wǎng)絡(luò)之后進(jìn)行Dropout 運(yùn)算。該算法由Alex[26]等人于2012 年提出,原理是在每個訓(xùn)練批次中,適當(dāng)忽略部分特征檢測器,減少相互作用,因此在網(wǎng)絡(luò)運(yùn)行過程中不會太過依賴某些局部特征,有效的降低模型過擬合,從而增強(qiáng)了模型的泛化能力。使用該算法的神經(jīng)網(wǎng)絡(luò)模型與標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)模型的對比如圖2 所示。

圖2 標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)與Dropout 網(wǎng)絡(luò)模型對比
該算法由于忽略部分檢測器,使當(dāng)前層的檢測器無需遍歷下一層的每個檢測器,降低了網(wǎng)絡(luò)模型的復(fù)雜程度,因此該算法在解決過擬合現(xiàn)象的同時,也大大減少了網(wǎng)絡(luò)模型的運(yùn)算時間。綜合考慮歷史經(jīng)驗及多次嘗試,在本文的模型中使用該算法忽略的檢測器比例為20%。
短波遠(yuǎn)程通信的最高可用頻率受電離層特性影響,具有一定空間和時間上相關(guān)性,不少學(xué)者也在進(jìn)行短波通信頻率時間柵格和空間柵格尺度的研究。結(jié)合在本文中分析得到的CNN 具有較好的提取空間局部特征能力與BiLSTM 在處理非線性時間序列時獨(dú)到的優(yōu)勢,提出基于CNN-BiLSTM 的融合模型短波通信頻率預(yù)測模型,結(jié)構(gòu)如圖3 所示。
該網(wǎng)絡(luò)模型主要可劃分為輸入層、CNN 層、Dropout 層、BiLSTM 層、全連接層和輸出層,其中CNN 層和BiLSTM 層為本模型的核心結(jié)構(gòu),CNN 層是由多個一維卷積(Conv1D)層和一維最大池化(MaxPooling1D)層堆疊組成。利用該模型進(jìn)行遠(yuǎn)程短波通信頻率預(yù)測的過程如下。
將歷史通信頻率等相關(guān)數(shù)據(jù)集作為該網(wǎng)絡(luò)的輸入,經(jīng)數(shù)據(jù)歸一化、形成矩陣向量等預(yù)處理之后,進(jìn)入CNN 層利用多層卷積核與池化核參數(shù)對相關(guān)頻率數(shù)據(jù)進(jìn)行局部深層特征提取,提取完畢后得到多組特征向量再經(jīng)Dropout 層隨機(jī)丟棄部分特征以提高模型的穩(wěn)健性,隨后將處理后的輸出特征通過BiLSTM 網(wǎng)絡(luò)進(jìn)行訓(xùn)練,最后,將經(jīng)BiLSTM 訓(xùn)練得到的輸出結(jié)果進(jìn)行拼接融合,再經(jīng)全連接層進(jìn)行信息綜合后,得到模型預(yù)測的頻率值。

圖3 CNN-BiLSTM 模型結(jié)構(gòu)
短波通信的歷史數(shù)據(jù)是指通信雙方在達(dá)成較穩(wěn)定的短波通信過程中使用或設(shè)置的一些相關(guān)通信參數(shù),包括通信時刻、雙方位置、通信頻率、通信功率等因素,由于該數(shù)據(jù)是實(shí)際通信過程中產(chǎn)生的,具有較高的可靠性和準(zhǔn)確性,若能積累一定數(shù)量較為連續(xù)的歷史數(shù)據(jù),則可用來進(jìn)行短波通信頻率預(yù)測。受限于實(shí)際情況,無法得到足以支撐該模型需求的歷史通信頻率值作為樣本數(shù)據(jù),本文采用ITS/REC533 軟件提取仿真數(shù)據(jù),即2014 年8 月31 日09 時至2015 年1 月29 日08 時北京石景山到福建臺江兩點(diǎn)間,時間間隔為1 小時的短波最高通信頻率數(shù)值,組成樣本數(shù)據(jù)。該樣本數(shù)據(jù)集共有3624 h數(shù)據(jù),其中,前3600 h數(shù)據(jù)(共150 天)作為模型的訓(xùn)練樣本,后24 h 數(shù)據(jù)作為模型的測試樣本,數(shù)據(jù)格式如表1 所示。
為對比預(yù)測結(jié)果的好壞,使用預(yù)測的均方根誤差(RMSE)和模型運(yùn)行時間作為評判標(biāo)準(zhǔn)。RMSE值越小,所用時間越短,就代表該模型預(yù)測的效果越好。其中,RMSE 的計算公式如式(5)所示:

式中,yt和分別為t時刻的通信頻率真實(shí)值和預(yù)測值,N為測試集的尺度。

表1 樣本數(shù)據(jù)表
單特征輸入LSTM 模型、多特征輸入LSTM 模型與本文提出的CNN-BiLSTM 模型進(jìn)行短波通信頻率預(yù)測的結(jié)果如圖4、圖5、圖6 所示。

圖4 單特征輸入LSTM 模型預(yù)測結(jié)果

圖5 多特征輸入LSTM 模型預(yù)測結(jié)果

圖6 CNN-BiLSTM 模型預(yù)測結(jié)果
圖中虛線為通信頻率的真實(shí)值,實(shí)線為通信頻率的模型預(yù)測值,這三種模型的RMSE 和模型運(yùn)行時間如表2 所示。

表2 三種模型RMSE 及運(yùn)行時間對比
對比上述圖表可以發(fā)現(xiàn),在模型預(yù)測的準(zhǔn)確性方面,單特征輸入LSTM 預(yù)測模型RMSE 值僅為0.204,準(zhǔn)確度最高,從圖形中可以看出除初始1-3 h 的預(yù)測結(jié)果存在1 MHz 左右誤差外,與真實(shí)值吻合較好;CNN-BiLSTM 預(yù)測模型RMSE 值為0.544,準(zhǔn)確度次之,在預(yù)測MUF 值的高、低點(diǎn)存在1 MHz 左右的誤差外,基本與真實(shí)值保持一致;多特征輸入LSTM 預(yù)測模型RMSE 值為2.148,準(zhǔn)確度最低,預(yù)測結(jié)果除初始1 h誤差較大外,預(yù)測值與真實(shí)值存在約1 h 時延且有逐漸擴(kuò)大趨勢。在模型的運(yùn)行時間方面,預(yù)測準(zhǔn)確度較低的多特征輸入LSTM 預(yù)測模型用時最短,僅為8.68 s;CNN-BiLSTM 預(yù)測模型次之,用時38.44 s;而準(zhǔn)度度最高的單特征輸入LSTM 預(yù)測模型用時最長,為203.22 s,是多特征輸入LSTM 模型的23.4 倍,CNNBiLSTM 模型的5.3 倍。
綜上所述,在短波通信頻率預(yù)測方面,單特征輸入LSTM 模型具有預(yù)測精度高,但費(fèi)時較長的特點(diǎn);多特征輸入LSTM 模型極大的縮短了預(yù)測時間,但預(yù)測結(jié)果存在1 h 時延,預(yù)測效果得不到保證;本文提出的CNN-BiLSTM 預(yù)測模型在基本保證預(yù)測精度的基礎(chǔ)上,極大的縮短了單特征輸入LSTM 模型預(yù)測所用時間,又有效的解決了多特征輸入LSTM 模型所存在的預(yù)測時延問題,因此該模型可用于短波通信頻率預(yù)測。
在實(shí)際通信過程中,要想獲得連續(xù)150 天的短波通信歷史數(shù)據(jù)難度較大,對固定臺站與移動臺站、移動臺站與移動臺站間的短波通信而言尤為如此。因此,出于短波通信的實(shí)際考慮,如何在保證短波通信頻率預(yù)測精度的基礎(chǔ)上,盡可能的減少所需要的通信歷史數(shù)據(jù)成為本文重點(diǎn)研究內(nèi)容。
為減少對通信歷史數(shù)據(jù)的需求,本文分別使用連續(xù)7 天、8 天、9 天、10 天、11 天、12 天,間隔1小時的仿真數(shù)據(jù)作為訓(xùn)練樣本,后1 天的仿真數(shù)據(jù)作為測試樣本,利用本文提出的CNN-BiLSTM 短波頻率預(yù)測模型進(jìn)行仿真實(shí)驗,并與單特征、多特征輸入LSTM 模型進(jìn)行對比,實(shí)驗結(jié)果如圖7 所示。



圖7 短波通信頻率預(yù)測效果
在圖7 中,(a)~(f)分別表示訓(xùn)練樣本為7-12天時的CNN-BiLSTM 模型仿真結(jié)果,(g)、(h)表示訓(xùn)練樣本為12 天時,使用單特征輸入LSTM 模型和多特征輸入LSTM 模型的仿真結(jié)果,藍(lán)色虛線為通信頻率的真實(shí)值,黃色實(shí)線為通信頻率的模型預(yù)測值。模型運(yùn)行時間及誤差如表3 所示。

表3 模型運(yùn)行及誤差表
從圖(a)~(f)及上表中可以看出,在預(yù)測準(zhǔn)確性方面,本文提出的CNN-BiLSTM 模型隨訓(xùn)練樣本天數(shù)的增加,預(yù)測精度不斷增加,在訓(xùn)練樣本數(shù)為12 天時,RMSE 值僅為0.227,除頻率最高處存在0.5 MHz 的誤差外,預(yù)測值與真實(shí)值基本吻合;在模型運(yùn)行時間方面,隨訓(xùn)練樣本天數(shù)增加,模型運(yùn)行時間基本呈遞增趨勢,但總體差距不大,最短運(yùn)行時間與最長運(yùn)行時間相差25.73 s;在樣本最大誤差率方面,隨訓(xùn)練樣本天數(shù)增加,誤差率逐步降低,在訓(xùn)練樣本為12 天時最大誤差率低至3.08%。
從圖(f)~(h)及上表中可以看出,在訓(xùn)練樣本數(shù)為12 天時,單特征輸入LSTM 模型和多特征輸入LSTM 模型的預(yù)測精度相對較低,預(yù)測最大誤差分別為4.5 MHz 和5.2 MHz,最大誤差率均達(dá)到20%以上,相比之下,本文提出的CNN-BiLSTM 預(yù)測模型在預(yù)測精度、最大誤差以及最大誤差率方面都有顯著提升。由此可以得出,在訓(xùn)練樣本數(shù)較少的情況下,CNNBiLSTM 預(yù)測模型的預(yù)測效果要優(yōu)于單特征、多特征輸入LSTM 預(yù)測模型。
綜上所述,本文提出的CNN-BiLST 模型可實(shí)現(xiàn)對未來1 天的短波通信頻率較為精準(zhǔn)的預(yù)測,并且相對于單特征、多特征輸入LSTM 預(yù)測模型,該預(yù)測模型在保證預(yù)測精度的同時,大幅縮減了對短波通信歷史數(shù)據(jù)的數(shù)量要求,增加了在實(shí)際短波通信過程中的適用性。
本文概述了通信頻率預(yù)測發(fā)展現(xiàn)狀及存在問題,提出了CNN-BiLSTM 模型用于遠(yuǎn)程短波通信頻率預(yù)測,并與單特征、多特征輸入LSTM 預(yù)測模型進(jìn)行了對比仿真實(shí)驗,驗證了該模型可用于短波通信頻率預(yù)測,在訓(xùn)練樣本數(shù)較少的情況下,該模型的預(yù)測精度優(yōu)于單特征、多特征輸入LSTM 預(yù)測模型,對短波遠(yuǎn)程通信頻率的預(yù)測研究具有一定借鑒意義。該方法基于短波通信的歷史數(shù)據(jù)進(jìn)行通信頻率預(yù)測,如何更好的采集存儲歷史數(shù)據(jù)以及對歷史數(shù)據(jù)的處理利用等方面還值得進(jìn)行進(jìn)一步研究。