孫 巖, 雷 超,董 恒,史新虎,屈淵博
(中國人民解放軍63726部隊,寧夏 銀川 750004)
當前形勢下,航天發射任務密度越來越高,機動參試逐漸常態化。測控設備到達機動點位后,設備準備周期相對較短,相位標定校準經常受到環境、天氣、周邊架設標校信標機位置等條件的影響,本文通過設備歷史記錄數據進行相位值預測,解決人工經驗值裝填可用性、穩定性差等局限性問題。
傳統無對塔標校環境下,采用理論計算、經驗值推導實驗等方法計算可用值。如王健等[1]通過分析微波自檢校相值與信號頻率之間的關系,歸納出相應的計算公式,提出了利用公式進行相位快速修正的方法。該方法解決了海上快速相位修正問題,但需較為煩瑣的理論模型建立及統計方法推導,同時存在環境適應性差和可推廣應用性等問題。隨著硬件條件的改善,數據庫和人工智能等技術的發展,目前基于數據驅動的序列預測方法已經普遍應用于各個行業,測控領域也逐漸應用算法輔助決策,數據驅動方法主要分為統計分析和機器學習2類,統計學方法利用統計模型或隨機過程模型描述參數,通過統計參數變化規律進一步分析總結規律。而機器學習的方法自適應性能好,無須過多地關注建模過程,利用原始記錄數據即可實現設備的關鍵參數長期分析預測。如楊羅蘭等[2]針對測控系統關鍵指標預測的問題,探索基于歷史數據的指標預測方法,具體分析了基于支持向量機(Support Vector Machine,SVR)的單步和多步指標預測方法,并使用實測數據進行了試驗和分析;岳瑞華等[3]針對設備校準中的預測問題,提出了基于粒子群優化支持向量機的預測方法,取得了較好的效果。Sokullu等[4]研究了利用全連接深度神經網絡實現信道估計的方法,討論了不同導頻尺寸下模型的性能。支持向量機和全連接神經網絡在預測領域取得了一定的效果,但存在泛化能力弱和無效連接過多等問題,本文進一步選用循環神經網絡開展預測,其作為機器學習中深度學習模型較為成功的方法之一,廣泛應用于時間序列預測與回歸過程中,在信息處理、參數序列建模、設備指標預測等領域起到了很好的效果。
循環神經網絡(Recurrent Neural Network,RNN)的主體思想是通過數據的隱藏層循環,實現序列演進方向的遞歸且所有節點按鏈式傳播。具體計算過程為
ht=f(U·Xt+W·ht-1)
(1)
Ot=g·(V·ht)
(2)
式中:ht為隱藏層輸出;f、g為激活函數;U、W為權重值;Xt為原始輸入值;Ot為模型輸出值。從結構和計算公式可以看出,輸出結果與輸入和隱藏層狀態有關,通過串聯式的記憶單元,實現了時間序列的前后關聯。
循環神經網絡記憶單元如圖1所示。本文選用循環神經網絡改進型門控循環單元(Gated Recurrent Unit,GRU)模型,通過優化超參數選擇機制,實現相位值準確的預測估計,為設備在無塔標校條件下,提供可用參考裝填值。

圖1 循環神經網絡記憶單元
GRU網絡是循環神經網絡的一種,是傳統循環神經網絡和長短時記憶網絡(Long-Short Term Memory RNN,LSTM)的改進模型[5],相較于LSTM訓練參數較少,利用更新門代替了LSTM的輸入門和遺忘門,簡化了LSTM結構,GRU模型單元如圖2所示。

圖2 GRU模型單元
單元的主要計算過程如下。
① 重置門計算,控制狀態結果受上一狀態的影響。
rt=σ(Wr·[ht-1,xt]
(3)
當前的狀態為
(4)
② 更新門和當前值計算:
zt=σ(Wz·[ht-1,xt]
(5)
計算隱狀態為
(6)
式中:σ為sigmoid型激活函數;tanh為雙曲正切型激活函數;W為權值。
近年來,多種仿生群智能算法被提出和應用于各個領域,大部分算法結合群體性生物特點,進行隨機性和趨向性尋優迭代,具有速度快、準確性高的優勢。仿生類鯨魚算法(Whale Optimization Algorithm,WOA)是一種新穎的、受自然啟發的元啟發式優化算法,通過模擬座頭鯨的狩獵行為,建立泡沫網搜索策略。在座頭鯨圍獵時,會通過對魚蝦群位置的判斷,移動自己的位置吐出氣泡,將魚蝦群不斷圍繞在隨自身位置變化吐出的氣泡中,最終將魚蝦群鎖定。氣泡網狩獵策略融合了座頭鯨收縮包圍獵物和螺旋狩獵方式的局部開發能力,以及隨機搜索獵物的全局尋優特點,具有操作簡單、搜索能力強、能夠跳出局部最優且收斂速度更快等優點[6]。本文利用WOA算法對GRU網絡模型參數進行優化,將每條鯨魚個體看作每種優化策略,并將鯨魚位置的維數對應GRU模型待優化參數的個數,可在鯨魚不斷更新自身位置的過程中獲得網絡的最優參數組合。與最終預測模型評估指標損失函數一致,同樣選擇適應度函數為均方根誤差(Root Mean Square Error,RMSE),可得:
(7)
式中:m為組內樣本個數;h(x)為預測值;y為實際校相值。算法主要計算過程分為以下3個步驟。
(1)包圍獵物過程。
鯨魚算法模擬自然界鯨魚捕獵,發現獵物后迅速更新位置進行包圍,計算公式為
D=|CX*(t)-X(t)|
(8)
X(t+1)=X*(t)-AD
(9)
式中:t為當前迭代次數;D為搜索個體與當前最優解的距離;A和C為系數;X*為當前最好的鯨魚位置向量,X(t)為當前鯨魚的位置向量。
A、C系數采用隨機生成變換,實現群智能算法常見的隨機搜索,可得:
A=2a·r-a
(10)
C=2r
(11)
a=2-2·t/M
(12)
式中:r和a分別為[0,1]、[0,2]的隨機數;M為算法的設置迭代次數。
(2)狩獵過程。
鯨魚狩獵過程最大的特點是采用螺旋式掃描的方式,不斷縮小范圍從而捕獲目標,其變換過程數據模型公式為
D=|X*(t)-X(t)|
(13)
X(t+1)=D·ebl·cos(2π·l)+X*(t)
(14)
式中:b為螺旋形狀控制參數;l為范圍[-1,1]的隨機 數。
游走變換后,位置同步模型過程中,以概率p完成收縮包圍,在狩獵過程中,鯨魚將以50%的概率包圍獵物(完成迭代尋優過程)。
(15)
(3)隨機重捕過程。
若|A|>1,那么鯨魚將離開現在所包圍的獵物去尋找新的獵物,即重復迭代過程。
鯨魚優化算法是一種新型元啟發式算法,通過鯨魚的狩獵行為,抽象出螺旋搜索過程算法,較其他智能優化算法有更好的避免局部最優的能力,但仍可能存在局部最優的可能,本文算法用于GRU模型神經元個數和步長尋優,主要作用是規避人為難以定義的參數值,可能出現偏離程度大、無準確規則的問題。鯨魚尋優算法陷入局部最優解時,提供的參數非最優情況,本文實驗過程中對10次迭代尋優和10次的一次尋優(取最差值)模型結果進行了比對,一次尋優即使出現陷入局部最優解,仍達到網絡模型參數優化設置要求,如表1所示。

表1 經驗值、局部最優、多次尋優對比
序列網絡GRU的預測準確性受到超參數神經元個數和時間步長設置的影響。時間步長為循環單元結構的個數,表示了某一個時刻的信息最多可由該時刻之前的若干個時刻的信息綜合得來。時間步長過小會失去不同時刻間信息的關聯性,過大則會減弱神經網絡的學習能力[7]。目前隱藏層神經元個數和時間步長獲取只能根據經驗,人工挑選一個大致可選的神經元個數范圍。本文針對隱藏層神經元個數和時間步長兩個超參數選擇問題,利用鯨魚算法WOA進行自適應參數尋優,避免人工設置影響預測準確性,通過尋優可得神經元個數為64,步長為5。WOA優化GRU模型過程如圖3所示。

圖3 WOA優化GRU模型過程
以某型號設備相位歷史數據為例,采用軟件自動記錄每次校相結果的方式,區分組合號(信道中各設備區分組合),不同組合號和頻點狀態下的數據分別進行分組,因信道影響較大,不能同時進行預測。將遠場信標機和設備天線上偏饋校零一體機數據分別記錄,本文預處理過程中若遠場和偏饋校相時間在20 min內則認為是同一組數據,此時偏饋校相數據同樣作為輸入條件使用;若校相記錄中同一組數據中無偏饋校相結果,則將組內值全部取0,屏蔽此處神經元作用[8]。校相記錄數據示例如表2所示。

表2 校相記錄數據示例
從表2中可以看出,溫濕度、相位值樣本間差異相對較大,需要進行參數值歸一化運算,通過最大最小值比例歸一化數據情況,溫度范圍為0~40 ℃,濕度范圍為0~100%,相位值范圍為0~360,利用范圍值進行歸一化處理,最終結果進行范圍恢復,可得:
(16)
通過缺失值和異常值剔除、歸一化等數據清洗[9]操作后,所得可用樣本總數量2392,訓練集和驗證集按8:2比例隨機劃分,訓練集樣本數1913,驗證集樣本數479。
WOA算法利用Python編寫,GRU模型基于Pytorch開源深度學習框架進行設計,使用 Intel?CoreTMi5-6300HQ CPU(主頻2.3 GHz),WIN7 64 位操作系統。
WOA優化模型迭代損失值(每輪組平均均方誤差最小值)變化情況如圖4所示。

圖4 WOA迭代損失值變化情況
利用迭代優化后選定的超參數,構建預測序列模型,為了更好地評估構建改進GRU模型的預測效果,選取 Adam 優化器對訓練損失值(Loss)進行優化,Adam 是目前深度學習模型訓練中比較流行的一種優化器,相較于其他優化器能夠自適應參數學習,具有收斂速度快、對內存需求小、能較好地處理噪音樣本等優點[10],經過模型訓練驗證,得到模型結果,利用設備早、中、晚不同時間段(溫濕度對相位值影響較大)多次校正相位值現場驗證,得到方位、俯仰相位值真實值與預測值對比情況,統計結果中對應的方位、俯仰校相值與預測值差的均值及標準差[11],如表3所示。

表3 校相記錄數據示例
從表3中可以看出,均值和標準差值均在5以下,預測值完全滿足設備使用標準,選取其中5次對比情況,如圖5所示。

圖5 相位預測值與真實值對比
為進一步說明WOA優化GRU模型的優勢,比較了傳統循環神經網絡、GRU模型(傳統參數值)和本文方法,在不同樣本劃分比例下的損失值比較情況如表4所示。

表4 不同劃分比例下模型情況
可以看出,在不同樣本劃分比例下,不明顯提高訓練時間的情況下,損失值有明顯的下降,經過計算后可得,在設備記錄數據上,WOA-GRU 模型相比GRU和RNN模型,其RMSE指標分別提升了 19.7% 和 24.4% 左右,能夠得到效果更好的模型預測結果。
針對測控設備使用中的相位值預測這一問題進行分析,提出一種利用仿生學鯨魚算法WOA優化序列模型GRU的預測方法,試驗后得出如下結論:WOA-GRU模型與普通GRU及RNN模型相比,在預測結果上更貼近實際相位值,擬合程度高,損失值更小,可以看出優化后的 GRU模型在預測相位值這類序列問題上具有較好的表現,證明了方法的可行性,能夠為測控設備機動參試狀態下的標校參數輔助選擇提供一種新的思路和方法。