基于學習的中段反導攔截時間和攔截點預測方法

2021-12-13 07:36:44楊子成鮮勇李少朋任樂亮張大巧

北京航空航天大學學報 2021年11期

關鍵詞：模型

楊子成，鮮勇，李少朋，任樂亮，張大巧

（火箭軍工程大學作戰保障學院，西安 710025）

導彈防御系統的建立和發展，對彈道導彈的生存能力產生了嚴重威脅。隨著針對彈道導彈各飛行分段的反導體系日益成熟，彈道導彈的作戰效能受到制約、突防難度大大增加。由于彈道導彈與反導系統的攻防對抗是體系對抗，具有參與要素多、系統建設昂貴、難以實彈對抗檢驗的特點，針對攻防對抗進行仿真研究是研究武器系統作戰效能、論證作戰方案的重要手段［1］。基于仿真的中段突防研究也是近年來彈道導彈突防研究的重點領域，已有相當多的研究成果。

地基攔截彈（Ground-based Interceptor，GBI）是中段反導動能殺傷武器，用于攔截在大氣層外中段飛行的彈道導彈彈頭，攔截實現方式采取直接碰撞。GBI由大氣層外殺傷器（Exo-atmospheric Kill Vehicle，EKV）和助推火箭2部分組成，目前已經進行多次反導攔截試驗。在2017年5月，美國使用GBI進行了一次洲際導彈反導攔截試驗，從加利福尼亞范登堡空軍基地發射的GBI攔截彈準確攔截一枚從太平洋中部馬紹爾群島里根試驗場起飛的洲際彈道導彈，反導試驗取得成功［2-3］。

GBI攔截彈在主動段關機后，主要依靠慣性自由飛行，在紅外導引頭發現目標后，引導EKV對來襲彈頭進行攔截。由于導引頭的探測距離有限，如果選擇合適時機進行機動規避攔截區域，使得地基雷達無法及時更新彈頭運動信息來引導GBI進行中段修正，從而使EKV在關機前導引頭沒有探測到來襲彈頭，則成功實現了突防。因此，在對攔截導彈進行威脅評估后，預測高威脅的攔截彈與來襲洲際導彈的相遇時間和攔截位置，可為機動規避提供決策依據。

國內外已經有不少學者對預測攔截點（Predicted Intercept Point，PIP）問題進行了相關研究。PIP問題求解對于攔截彈中制導以及中末制導交接班成功，進而準確命中目標有著重要的意義。對于防空導彈、空空導彈等戰術導彈，常采用基于簡化的運動模型建立攔截幾何，使用解析方法求解攔截點［4］；或者是加入導引通過迭代計算導彈運動學彈道來預測攔截點［5］。攔截幾何解析法求解方便，但是誤差較大；而迭代算法精度較高，但計算周期較長［6］。

對于彈道導彈中段攔截的PIP問題，Zarchan［7］提出了適用于采用脈沖方式機動的攔截彈的基于Lambert問題求解的PIP計算方法。由于攔截彈在主動段的飛行狀況比較復雜，采用Lambert數值解算求解PIP問題的方法僅適用于攔截彈自由段飛行過程。針對Lambert問題求解PIP方法的缺陷，謝經緯和陳萬春［8］提出蒙特卡羅仿真建立攔截射表，進行插值來得到對應的PIP方法。Song等［9-11］提出基于神經網絡的導彈狀態信息與最佳制導指令映射關系，并建立獨立的待飛時間預測網絡，將目標軌道簡化為開普勒軌道，通過預測得到的待飛時間得到PIP。

以上PIP問題求解都是立足于防御方角度，求解PIP用于攔截彈諸元計算或中制導。本文求解PIP用于彈道導彈對攔截彈的機動規避，從進攻方可獲取的攔截彈信息入手，建立PIP預測模型。此外，為便于彈載計算機實現在線解算，求解PIP的方法計算量不應過大。神經網絡在模式識別、預測評估、圖像等領域已經廣泛運用，在解決非線性問題方面也具有明顯的優勢。另外，神經網絡可以在線下對數據集進行學習，訓練好的網絡結構可以實現在線上實時輸出結果。因此，本文采用基于神經網絡的監督學習算法，在線下通過攻防仿真得到大量樣本作為神經網絡訓練的數據集，通過對仿真數據集學習，根據攔截彈的狀態信息線上求解攔截時間與攔截點的坐標信息。

1 導彈中段攻防模型

1.1 中段攻防對抗系統組成

中段攔截對抗示意圖如圖1所示。中段攻防模型主要包括彈道導彈飛行仿真模塊、GBI飛行仿真模塊、指揮控制模塊和預警探測模塊［12］。本文研究主要涉及彈道導彈飛行仿真模塊、GBI飛行仿真模塊。

圖1 中段攔截對抗示意圖Fig.1 Schematic diagram of midcourse interceptionand confrontation

1）彈道導彈飛行仿真模型

彈道導彈中段飛行時，主要受地球引力、科氏慣性力和牽連慣性力。動力學方程為

式中：i＝x，y，z；Pi、Ri、Gi、Fei、Fci分別為導彈所受推力、空氣動力、地球引力、牽連慣性力、科氏慣性力在發射坐標系中的分量；m為導彈當前質量。

3）紅外預警衛星探測模型

采用紅外預警衛星對處于主動段的導彈進行探測跟蹤，獲取到的導彈的狀態信息存在一定的誤差。根據紅外預警衛星的探測精度，建立誤差模型來模擬衛星探測過程中存在的誤差。

采用正態分布生成隨機探測誤差，誤差服從N（0，σ）。因此，誤差模型為

1.2 中段攔截系統作戰流程

根據公開資料分析，中段攔截系統的工作流程如下：

1）彈道導彈點火起飛后，防御方先通過高軌紅外預警衛星識別導彈尾焰的紅外信號，低軌紅外預警衛星對導彈進行跟蹤，并發出導彈來襲預警信息。

2）紅外預警衛星將信號傳輸至負責信息處理的地面站和指控中心，指控中心對數據進行處理并確定來襲導彈大致飛行方向和攻擊目標，從而對來襲導彈進行目標識別并進行威脅評估。

3）來襲導彈釋放彈頭并拋撒誘餌，在來襲彈頭進入前置部署雷達的探測范圍后，預警雷達跟蹤、探測彈頭的位置、速度等信息，并將獲取的信息傳輸給陸基精密雷達，并由陸基精密雷達對彈頭進行跟蹤，獲取更精確的信息。

4）指控中心進行諸元計算，制定火力分配方案，并將任務指令下發至火力單元；火力單元在接收到發射指令后發射GBI進行攔截。

5）GBI助推火箭關機后釋放EKV，指控中心根據陸基精密雷達獲取的來襲彈頭的信息，發出中制導指令，修正飛行彈道。

6）海基X波段雷達（Sea-based X band radar，SBX）發現來襲彈頭及誘餌，并嘗試從誘餌中識別區分出彈頭。

7）在紅外導引頭捕獲到來襲彈頭后，EKV在自身攜帶的紅外導引頭引導和姿軌控發動機控制下，對來襲彈頭進行直接碰撞殺傷。

8）指控中心根據陸基跟蹤雷達探測的信息和EKV發回的信息進行綜合研判，確定攔截是否成功，并決定是否展開后續攔截。

2 攔截時間及攔截點預測模型

2.1 預測模型輸入參數分析

對中段攔截系統的作戰流程進行分析，由于EKV需要在紅外導引頭的引導和姿軌控發動機推力作用下摧毀目標。如果可以在GBI主動段關機后，準確預測攔截時間和攔截點，為提前規劃彈道進行機動提供決策依據，避開EKV紅外導引頭的探測范圍或姿軌控發動機的最大可機動范圍，從而實現突防。

為了獲取預測攔截時間和預測攔截點所需的GBI信息，需要進攻方的探測設備對GBI實施探測、跟蹤，獲取位置、速度等信息。本文考慮采用紅外預警衛星，在GBI發射后識別GBI助推火箭尾焰的紅外信號，并對GBI跟蹤、識別。

為使建立的模型能夠準確地預測攔截時間和攔截點坐標，需要分析預測模型所需要的輸入參數。由于攔截時間和攔截點是彈道導彈和GBI雙方運動產生的結果，輸入參數必須包含攻防雙方的信息。

進攻方通過紅外預警衛星獲取的GBI信息僅有GBI在主動段飛行的位置、速度和點火時刻、主動段關機時刻。根據式（4），GBI在主動段關機后，飛行彈道模型相對簡單，因此采用GBI在主動段的關機時刻的位置、速度及關機時刻作為輸入參數。

因為在實際中，進攻方實際上只知道己方彈道導彈的相關坐標系，所以作為輸入參數的GBI的位置、速度都應在彈道導彈的相關坐標系下描述。此外，GBI的位置、速度在彈道導彈相關坐標系下描述，能夠體現彈道導彈與GBI之間的相對關系。

經分析，GBI的位置、速度采用在彈道導彈發射系下的坐標值描述。GBI主動段的關機時刻也采用相對于彈道導彈發射時刻的時間來描述。

2.2 攔截時間預測模型

攔截時間預測模型如圖2所示。該模型輸入參數為：GBI主動段關機時刻位置xs、ys、zs，速度vxs、vys、vzs（彈道導彈發射系下），關機時刻ts（相對于彈道導彈發射時刻），共7個參數；模型的輸出值為攔截時刻tp，是7輸入1輸出模型。

圖2 攔截時間預測模型示意圖Fig.2 Schematic diagram of intercept time prediction model

2.3 攔截點預測模型

攔截點預測模型如圖3所示。該模型輸入參數為：GBI主動段關機點位置xs、ys、zs，速度vxs、vys、vzs（彈道導彈發射系下），關機時刻ts（相對于彈道導彈發射時刻），共7個參數；模型的輸出值為攔截點坐標xp、yp、zp共3個參數，是7輸入3輸出模型。

圖3 攔截點預測模型示意圖Fig.3 Schematic diagram of intercept point prediction model

3 基于神經網絡的監督學習

監督學習、無監督學習等基于數據驅動的學習算法是人工智能、機器學習領域的重要算法。無監督學習與有監督學習都依賴于數據集，數據集是影響算法學習效果的重要影響因素，而兩者的區別在于監督學習采用的數據集的樣本有具體的標簽。

神經網絡是一種典型的基于數據驅動進行學習的人工智能算法［13-14］。本文采用基于神經網絡的監督學習算法從數據中學習經驗，通過中段攻防對抗仿真制作數據集，并以神經網絡的訓練方式實現數據驅動下的監督學習，從而實現在線預測。

網絡結構采用多層感知器（Multilayer Perceptron，MLP），MLP包括輸入層、隱藏層和輸出層［15］。其中，隱藏層包括多個全連接層（Fullconnected layer，FC）和激活函數。

3.1 攔截時間預測網絡

攔截時間預測模型輸入為（xs，ys，zs，vxs，vys，vzs，ts），輸出為tp。因此，預測網絡的輸入層節點數為7，輸出層節點數為1。

如果隱藏層中只有全連接層，那么整個網絡仍然是線性網絡，這會使得網絡難以解決非線性的問題［16］，為了提高網絡對非線性問題的擬合能力，在隱藏層中引入激活函數。

常用的激活函數包括sigmoid函數、雙曲正切函數tanh和線性整流函數（Rectified Linear Unit，ReLU）。

相比于sigmoid激活函數和tanh激活函數，ReLU激活函數的優點有：加速隨機梯度下降法的收斂速度，且計算方法更加簡單，只需要一個閾值過濾就可以得到結果，而不需要進行復雜的運算。

線性整流函數ReLU的計算方法為

攔截時間預測網絡結構如圖4所示，網絡結構參數如表1所示。

表1 攔截時間預測網絡結構Table 1 Intercept time prediction networ k str uctur e

圖4 攔截時間預測網絡結構Fig.4 Intercept time prediction network structure

網絡采用5層隱藏層，隱藏層激活函數采用線性整流函數。

3.2 攔截點預測網絡

攔截點預測模型輸入為（xs，ys，zs，vxs，vys，vzs，ts），輸出為（xp，yp，zp）。因此，預測網絡的輸入層節點數為7，輸出層節點數為3。

攔截點預測網絡結構如圖5所示，網絡結構參數如表2所示。

表2 攔截點預測網絡結構Table 2 Intercept point pr ediction network structure

圖5 攔截點預測網絡結構Fig.5 Intercept point prediction network structure

網絡采用5層隱藏層，隱藏層激活函數采用線性整流函數。

3.3 訓練樣本準備

監督學習依賴于數據集，本文采用中段攻防仿真系統進行紅藍攻防對抗仿真，將仿真數據作為訓練樣本，并將大量仿真得到的樣本構成數據集。

采用某型洲際彈道導彈作為進攻導彈，發射點為確定點，目標點在經度（x－5°，x＋5°）、緯度（y－5°，y＋5°）范圍內采用均勻分布隨機生成，x、y分別為西經經度值和北緯緯度值。每一個目標點對應一條標準彈道，共隨機生成10萬條標準彈道，對每條彈道分別進行攻防仿真。記錄GBI攔截彈相對于彈道導彈坐標系的關機點參數和關機時間，作為訓練樣本的輸入量；將攔截時間和攔截點坐標作為訓練樣本的標簽。得到共計10萬個樣本，并對樣本進行數據預處理，選擇70%的樣本組成訓練集，另外30%的樣本作為測試集。

數據預處理主要是對數據進行歸一化處理，將數據映射到［0，1］之間的范圍。由于發射系位置坐標值在106數量級，速度坐標值在103數量級，不進行歸一化處理對損失函數計算、梯度下降非常不利，從而影響神經網絡的訓練效果。

歸一化處理公式如下：

式中：x為樣本值；xmin為樣本值最小值；xmax為樣本值最大值；xnormlization為歸一化后的樣本值。

3.4 神經網絡訓練

在網絡結構確定后，還需要確定損失函數和優化器，對網絡進行訓練。損失函數表示預測值與標簽值之間的誤差大小［17］，優化器是求解損失函數最小值的優化算法。

1）損失函數選擇

本文采用均方誤差（Mean Square Error，MSE）作為損失函數，用來判斷預測值與真實值之間的誤差：

式中：M 為神經網絡輸出維度；＾yi為預測值；yi為真實值。

2）優化器選擇

在神經網絡訓練中的優化算法稱為優化器，一般是在梯度下降法的基礎上改進而來。常見的優化器包括隨機梯度下降（SGD）、AdaGrad、RMSProp、Adam等。本文選擇Adam作為優化器，相比經典的優化器存在收斂速度慢、學習率固定的問題，Adam具有自適應調整學習率、對網絡參數的魯棒性強的特點［18］。

網絡參數θ的優化算法如下［19］：

式中：s、t分別為一階矩、二階矩估計值；ρ1、ρ2為矩估計的指數衰減速率，取值范圍在區間［0，1）內；g為關于網絡參數θ的梯度。

對式（9）得到的結果進行修正：

采用上述方法對預測網絡進行訓練，當損失函數低于閾值后完成訓練，其他訓練參數如表3所示。

表3 預測網絡訓練參數Table 3 Prediction networ k tr aining parameter s

攔截時間與攔截點預測流程如圖6所示。圖7、圖8分別為攔截時間預測網絡、攔截點預測網絡的訓練過程。

圖6 攔截時間與攔截點預測流程Fig.6 Flowchart of prediction of intercept time and intercept point

圖7 攔截時間預測網絡訓練過程Fig.7 Intercept time prediction network training process

圖8 攔截點預測網絡訓練過程Fig.8 Intercept point prediction network training process

4 仿真結果及分析

預測網絡訓練好后，還需要對網絡的效果進行驗證。將測試集的輸入量輸入訓練好的網絡的權重矩陣中，將網絡輸出的結果與原測試集中的輸出值進行比較，從而驗證預測網絡的有效性。

4.1 攔截時間預測網絡驗證結果

將網絡模型輸出預測的結果與原測試集中的攔截時間進行比較，得到攔截時間預測誤差如表4所示。

表4 攔截時間預測誤差Table 4 Prediction error of intercept time

圖9為攔截時間預測網絡預測值誤差的統計直方圖，圖10為部分樣本預測值誤差折線圖，圖11為攔截時間預測誤差箱型圖。

圖9 攔截時間預測誤差統計直方圖Fig.9 Histogram of intercept time prediction error

圖10 攔截時間部分樣本預測誤差Fig.10 Intercept time partial sample prediction error

圖11 攔截時間預測誤差箱型圖Fig.11 Error box plot of intercept time prediction

攔截時間預測值誤差平均值為0.2240 s，最大值為1.4675 s，神經網絡得到的結果能夠較準確地預測GBI的攔截時刻，從而進一步得到GBI的待飛時間，用于下一步的彈道導彈中段突防規劃。

4.2 攔截點坐標預測網絡驗證結果

將網絡模型輸出預測的結果與原測試集中的攔截點坐標進行比較，得到攔截點坐標預測誤差如表5所示。

表5 攔截點坐標預測誤差Table 5 Prediction error of intercept point’s coordinates

圖12～圖14為攔截點坐標預測網絡各坐標軸方向坐標值預測值誤差的統計直方圖，圖15～圖17為部分樣本坐標值預測誤差折線圖，圖18為攔截點預測誤差柱狀圖，圖19為攔截點預測坐標軸誤差箱型圖。

圖12 X軸方向攔截點坐標預測誤差統計直方圖Fig.12 Histogram of X-axis intercept point’s coordinate prediction error

圖13 Y軸方向攔截點坐標預測誤差統計直方圖Fig.13 Histogram of Y-axis intercept point’s coordinate prediction error

圖14 Z軸方向攔截點坐標預測誤差統計直方圖Fig.14 Histogram of Z-axis intercept point’s coordinate prediction error

圖15 X軸方向攔截點坐標部分樣本預測誤差Fig.15 X-axis intercept point’s coordinate partial sample prediction error

圖16 Y軸方向攔截點坐標部分樣本預測誤差Fig.16 Y-axis intercept point’s coordinate partial sample prediction error

圖17 Z軸方向攔截點坐標部分樣本預測誤差Fig.17 Z-axis intercept point’s coordinate partial sample prediction error

圖18 各方向攔截點坐標預測誤差柱狀圖Fig.18 Bar chart of error in different directions of intercept point prediction coordinate axis

圖19 各方向攔截點坐標預測誤差箱型圖Fig.19 Error box plot in different directions of intercept point prediction coordinate axis

攔截點的預測值在距離上的誤差平均值為2016.48 m，誤差最大值為9255.64 m，由于GBI紅外導引頭的探測距離在200 km左右［20］，遠遠大于預測誤差，預測誤差對下一步突防規劃帶來的影響較小，精度滿足需要。

將包含誤差的攔截彈主動段關機參數作為彈道計算的初始狀態，使用四階龍格庫塔法進行積分，將脫靶量取得最小值時的攔截彈坐標作為積分計算結果的攔截點。從圖20可以看出，預測網絡的預測結果對于存在誤差的關機參數彈道計算的結果在精度上具有一定的優勢。

圖20 神經網絡預測結果與彈道仿真結果的比較Fig.20 Comparison of neural network prediction results and trajectory simulation results

5 結束語

本文主要研究了在中段突防過程中針對GBI關機參數預測攔截時間和攔截點的問題。由于神經網絡具有強大的擬合非線性問題的特點，本文采用基于神經網絡的監督學習算法，實現從攻防對抗仿真數據中獲取預測攔截時間和攔截的能力。首先，基于彈道導彈中段攻防對抗仿真得到的結果，構建了訓練數據集。然后，進行神經網絡的訓練，并根據結果進行調整。最后，確定網絡結構和訓練參數。

測試集的仿真驗證表明，訓練得到的網絡能夠準確預測攔截時間和攔截位置，證明了預測方法的有效性。實現了在洲際彈道導彈、GBI攔截彈發射點固定，洲際彈道導彈的目標點在一定的作戰區域范圍內變化的作戰想定下，根據進攻方紅外預警衛星探測數據對攔截時間、攔截點信息進行在線預測。預測的攔截時間和攔截點可用于下一步突防規劃研究當中。