無人機雙機空戰對抗側向機動路徑規劃*

2022-07-11 09:02:02孫豐礎甘旭升

現代防御技術 2022年3期

關鍵詞：規劃

孫豐礎，甘旭升

（空軍工程大學空管領航學院，陜西西安 710051）

0 引言

空戰對抗是現代作戰中奪取制空權的主要作戰樣式，對掌控空中態勢發展，達成戰術意圖具有重要意義。近年來，無人機技術雖得到快速發展，軍事裝備的無人化程度越來越高，但空戰對抗領域仍是有人機的舞臺，無人機還遠無法達到空戰對抗的性能要求。空戰戰術決策是空戰過程中的關鍵核心［1］。由于無人機自主決策能力的不足，對于復雜的空中態勢認知能力欠缺，使得其在空戰對抗中往往只能落入下風，難以達成戰術目的。但無人機替代有人機執行空戰任務是未來必然趨勢，將極大豐富空中作戰樣式，顛覆空戰場面貌。早在2016年6 月，人工智能ALPHA 就在空戰模擬實驗室中以100% 的概率戰勝了空戰專家、美軍退役上校Gene Leep［2］。雖然還只是模擬試驗，但已足夠驗證算法的有效性，離試飛驗證和實戰檢驗相差不遠。

國內外對無人機空戰問題展開了大量研究，基于智能算法［3-4］、神經網絡［5-6］、專家系統［7］、博弈論［8-9］、貝葉斯網絡理論［10-11］等算法是當前實現無人機自主機動決策的主要方法。文獻［5］提出一種基于深度神經網絡的強化學習方法，通過對敵方距離、速度、角度的態勢判斷決定我方采取的機動方式。文獻［6］通過啟發式因子對神經網絡進行改進，通過對空戰機動的學習訓練實現對抗中的機動。但基于神經網絡或其改進型的算法都需要借助于訓練庫，訓練庫的獲取和質量會影響算法的效果。文獻［12］提出一種BAS-TIMS 算法，可在一對一對抗中形成一定態勢優勢。文獻［13］則是引入了博弈論的思想，通過敵方可能采取的機動動作計算己方最佳的機動策略，以毀傷概率最大化的原則作為機動選擇依據。使用專家系統和貝葉斯網絡理論能夠實現空戰決策機動，但存在決策效率不夠高的問題。文獻［14］則是將遺傳算法和強化學習算法相結合，可實現無人機一對一對抗下的機動決策。上述的各類文獻中，大多是單機空戰對抗，不涉及態勢的判斷和目標分配的問題，使用會存在一定的局限性。文獻［15］對多機空戰進行了研究，可實現二對一對抗中的協同決策，但主要對抗領域為近距對抗，未考慮敵電子干擾作用。

雙機編隊是空中作戰最基本的作戰單元，大量攻防戰術均可通過長僚機之間的配合實現，更是大規模集群作戰的基礎，而對抗空戰則是奪取局部制空權的主要作戰樣式。因此，研究無人機二對二模式下的對抗空戰技術具有較強的現實意義。本文主要對無人機中距對抗下的二對二對抗環境進行研究，基于A-star 算法設計無人機側向機動“咬尾”路徑，規避敵機火控雷達鎖定和干擾吊艙干擾，在機動途中按照優先形成對抗優勢的原則展開雙機協同和目標分配，盡早構成武器發射條件。

1 側向機動威脅模型

無人機在于敵機對抗過程中可能受到兩方面的威脅，一是火控雷達的鎖定，二是電子干擾吊艙的干擾。無人機一旦被火控雷達鎖定就會陷入及其被動的狀況，需要立即采取大載荷機動動作，逃出火控雷達的照射范圍。火控雷達的照射范圍一般在機身前向一定角度范圍內。無人機進入敵機電子干擾范圍內時，自身的雷達信號接收將會受到影響，會出現目標丟失、多目標閃現、位置漂移、假信號等現象。因此，無人機在電子干擾范圍內時，難以進行正確的態勢判斷，空空導彈的命中率也會顯著下降。論文在進行無人機的側向機動決策算法設計時充分考慮了敵機的火控雷達和電子干擾吊艙作用范圍，如圖1 所示。

圖1 敵機威脅態勢圖Fig.1 Enemy threat situation map

無人機是否進入敵機的威脅范圍內主要通過相對角度和距離判斷，火控雷達威脅判斷如式（1）所示：

式中：heh為敵機航向向量；heu為敵機與我方無人機連線，方向指向我方無人機；αef為敵機火控雷達輻射角度的一半；lue為無人機到敵機的距離；lef為敵機火控雷達的作用距離。同理，電子干擾威脅判斷如式（2）所示：

式中：αee1和αee2為電子干擾吊艙的輻射角度范圍；lee為電子干擾的作用距離，且通常條件下電子干擾的作用距離會大于火控雷達的輻射距離以實現防衛的目的。

2 武器發射達成條件

在中距空戰對抗中，航空器使用的武器主要指空空導彈，其必須達成2 個條件才能發射，一是敵機被機載火控雷達鎖定，二是在空空導彈的最大發射距離之內。因此，無人機在機動過程中，除避開敵機武器威脅外，還需要積極達成武器發射條件。從圖1 中可以看出，在我火控雷達作用距離小于敵機火控雷達和電子干擾作用距離的情況下，攻擊敵機的最佳方法為實施尾后攻擊。而事實上，無人機由于機體較小，載荷能力受限，其攜帶的火控雷達工作距離往往會小于有人機的火控雷達，以對頭或側方位的進入方式都不能構成有利態勢，最佳的攻擊方位便是實施尾后攻擊。無人機武器發射應當滿足：

式中：huh為無人機的航向向量；hue為無人機到敵機的方向向量；αuf為無人機火控雷達輻射角度的一半；lef為無人機火控雷達的工作距離。

3 基于A-star 算法的側向機動算法

3.1 基本A-star 算法

A-star 算法是一種較為經典的啟發式搜索算法，該算法于1968 年由P.E.Hart 等提出［16］。A-star 算法將Dijkstra 算法和BFS 算法的搜索策略結合了起來。Dijkstra 算法以起始點為中心依次外推，以尋找距目標點最短的路徑。BFS 算法是一種啟發式的搜索策略，具有搜索快速的特點，它先對當前點與目標點之間的路徑距離進行估算，并選擇與目標點距離最近的待選節點作為下一節點。但BFS 存在明顯的缺陷，不能保證找到最優解［17］。

A-star 算法將2 種算法的優勢相結合，既加入了啟發式信息函數以提高搜索速度，又考慮了當前節點的歷史代價信息，具有路徑尋優能力強、規劃速度快的特點。相對于蟻群算法［18］和遺傳算法［14］，Astar 算法的全局規劃能力稍弱，但具有更快的規劃速度，其每一步的決策主要是基于歷史信息和局部信息，使其規劃速度也顯著提升，可以滿足空戰對抗中態勢更迭迅速的決策需求。其不依賴全局信息的特性也使其可以應對更大的規劃空間。算法的代價函數為

式中：g(m)為當前節點m的歷史代價信息；h(m)為節點m未來的代價估計。根據路徑點狀態轉移規則的不同，需要制定open 表和close 表。算法從起始點開始計算open 表中的節點相應的代價值并選擇最優的節點作為下一節點進行狀態轉移。狀態轉移之后需要更新open 表和close 表，同時將待選節點的父節點記為當前節點，依次類推直至達到終點。當遇到待選節點為空的情況時，需要將當前節點放入close 表中，并將狀態回退至父節點進行重新計算下一節點。到達終點后，根據各個節點記錄的父節點信息進行回溯即可完成路徑的規劃，算法流程如圖2 所示。

圖2 A-star 算法流程圖Fig.2 A-star algorithm flow chart

3.2 動態柵格規劃環境構建

A-star 算法對路徑的規劃需要有離散化的規劃空間，通常采取的措施是按照地理環境或空間構設一個靜態柵格環境。靜態柵格環境可以較好地滿足目標偵察、低空突防、轉場飛行等任務的規劃，但對空戰對抗任務而言，態勢以敵我相對位置為判斷依據，因此需要建立動態的柵格規劃空間。本文采取以敵我相對位置來確定柵格規劃環境的方法，根據變化的敵我態勢調整柵格環境，如圖3 所示。

圖3 動態柵格環境圖Fig.3 Dynamic grid environment map

柵格環境相對敵我飛機而言始終固定，但相對大地坐標而言在不停地旋轉，其單位步長的尺寸也在拓展或收縮。柵格坐標的旋轉變換公式為

式中：(x，y)為柵格坐標系坐標；(x′，y′)為大地坐標系坐標；α為柵格坐標與大地坐標所成的角度；β為無人機在柵格坐標中的位置向量與x軸形成的夾角，規定逆時針旋轉為正。采用動態柵格環境規劃路徑可以使規劃空間保持不變，始終維持規劃速度的品質。

3.3 側向機動算法設計

在柵格環境內，無人機位置狀態的轉移會有一定的規則限制，從而滿足航空器轉彎率的最大限制。無人機以敵機當前位置為規劃終點前進，單次狀態轉移過程中只考察臨近符合轉彎率限制的節點，計算其代價值。設置的狀態轉移規則如圖4所示。

圖4 無人機側向機動狀態轉移規則Fig.4 UAV lateral maneuvering state transfer rules

無人機當前節點的上一節點為父節點，鄰近節點中符合轉彎率的節點為待選節點。對待選節點進行依次計算，得出最優的節點。由于缺乏適當的啟發式因子，傳統的A-star 算法并不能很好地進行“咬尾”機動，只能在向目標點突進的過程中進行威脅規避，這樣會影響空戰機動的效率，因此本文加入了一個啟發式因子，作為“咬尾”路徑的引導，如圖5 所示。

圖5 無人機路徑引導點示意圖Fig.5 Schematic diagram of UAV path guidance points

p1至p4分別為無人機在各個階段的路徑規劃引導點。無人機在接近敵機的過程中隨著距離的接近不斷變化引導點，可以使無人機更好地從尾后實施攻擊。狀態轉移中的代價函數為

式中：g（n）為代價函數中的歷史信息，計算路徑中在敵機火控雷達和電子干擾區內的路徑長度；Cf為火控雷達的威脅系數；Ce為電子干擾威脅系數；l為節點n至敵機的距離，顯然，距離越近，威脅對無人機的作用更強；h（n）為代價函數中的期望信息；Cd為距離代價系數；l*為節點n至引導點的距離，具體計算方法為

其中，l1~l4分別為無人機至點p1~p4的距離；θ為敵機航向向量heh與無人機至敵機的方向向量hue之間的夾角；θ1為敵機航向與威脅區域邊界所成夾角（如圖5 中所示）。

3.4 速度規劃方法

無人機的速度規劃需要根據任務實施階段區別對待。無人機中距空戰分為2 個階段，分別為前出接敵階段和戰術機動階段。在前出接敵過程中，無人機根據體系雷達信息靠近敵機鄰近空域，在該階段中主要以巡航速度飛行。在戰術機動階段，無人機需要通過快速的機動盡快搶占有利態勢，在敵機威脅區域內時則需要加速擺脫威脅。

本文對速度的規劃建立在規劃的路徑基礎之上，通過對每一個路徑節點規劃加速度值的方式規劃每一段路徑內的速度變化方式。由于受發動機推力和機體氣動性能限制，無人機的加速度同樣有上下限，通過將加速度值進行離散化的方式計算每一個路徑節點的最優速度控制方案。但以這樣的方式仍無法滿足空戰對抗中快速的速度變化要求，因此論文在態勢更新后的路徑重規劃中同時進行速度重規劃，更新的的頻率越高，路徑和速度的變化越平滑，越能貼近實際的需求。速度規劃目標函數如式（8）~（12）所示：

式中：am為離散化的加速度；L(n)為第n段路徑的長度；V(am)為節點m規劃的速度；Cvf，Cve，Cvl，Cvc，Cva，Cvmax，Cvmin均為常數；Vc為無人機的最佳巡航速度；Csmax和Csmin為無人機的最大、最小速度代價值，當無人機持續使用最大或最小速度時該代價值會累積增大；Vuavmax和Vuavmin為無人機的最大最小速度。

4 雙機協同決策方法

4.1 基本戰術策略

本文重點研究的是二對二中距空戰。我方無人機前出接敵過程中面臨的敵機編隊有可能以2 種方式應對我機，一種是雙機協作先合力擊落我1 架無人機實現空中力量優勢；另一種是雙機各自分離，從不同方位對我構成攻擊態勢，力爭盡早能夠從一個方向上達成攻擊條件。我方雙機則需要根據敵機態勢采取應對措施，對于第1 種情況則由1架無人機進行逃逸機動，避免被擊落，另1 架則積極進攻，力爭奪得空中力量優勢；對于第2 種情況則采取編隊分離，以“鉗形”攻擊戰術與敵機搶占空中優勢，盡早構成武器發射條件，戰術決策流程如圖6所示。

圖6 無人機空戰對抗戰術決策流程Fig.6 UAV air combat tactical decision process

4.2 攻擊目標分配函數

相對于一對一［12］或二對一［15］的空戰對抗機動決策，在二對二的空戰對抗中還需要進行目標分配以實現更好地協同。為盡早達成二對一的優勢態勢，需要無人機分別規劃對敵機的攻擊路徑后進行信息交互，選擇出最優的攻擊方案，目標分配流程如圖7 所示。

圖7 無人機目標分配協同決策流程Fig.7 Collaborative decision-making process for drone target allocation

4.3 空戰決策動態跟新策略

無人機的單次決策是基于當前態勢的機動策略，隨著敵我態勢的轉變，原有決策方案很快就會失效，因此需要根據變換的態勢進行決策更新。在路徑規劃中，無人機首先對敵機態勢進行一次更新，而后根據最新的態勢規劃機動方案。規劃完畢后與編組無人機進行信息交互，計算最優的協同方案并完成協同決策。而后，在接下去的Δt時間內執行機動決策方案并展開新一輪的規劃。由于算法設計中，對路徑和速度的規劃中對規劃空間都進行了離散化處理，并不符合實際飛行的決策需求，因此需要加快迭代更新頻率，提升決策方案的有效性。空戰機動決策的總體流程如圖8 所示。

圖8 無人機雙機對抗決策更新流程Fig.8 UAV dual-aircraft confrontation decision update process

5 仿真與分析

論文基于Matlab 構建無人機空戰對抗仿真運行平臺，首先進行單機對抗的路徑規劃試驗，運行參數如表1 所示。

表1 無人機空戰仿真參數設置Table 1 UAV air combat simulation parameter setting

無人機的空戰路徑仿真如圖9 所示；圖9（a）中速度規劃曲線如圖10 所示，無人機決策時間變化曲線如圖11所示；無人機加速度變化曲線如圖12所示。

圖10 無人機速度變化曲線Fig.10 UAV speed curve

圖11 無人機機動決策耗時曲線Fig.11 UAV maneuvering decision time-consuming curve

圖12 無人機加速度變化曲線Fig.12 UAV acceleration change curve

從單機驗證結果來看，無人機可以進行較好地機動并進行“咬尾”攻擊。無人機的速度規劃可分為3 個階段進行：第一階段為前出接敵階段，在該階段內無人機與敵機距離較遠，既無法鎖定敵機，也不會被敵機鎖定，因此沒有做大速度機動的必要，只需要以巡航速度接近敵機即可；第二階段，無人機可能進入敵機的火控雷達照射范圍內，且需要盡快鎖定敵機，應進行大速度的機動，在避開敵機的同時形成咬尾態勢；第三階段為咬尾鎖定階段，當無人機形成優勢態勢之后，應當與敵機保持相對穩定的空中態勢，以便于導彈能夠進一步鎖定敵機，因此速度又會再次回調。結合圖9 b）的態勢圖可知，無人機的速度規劃具備根據空中態勢進行自適應調整的能力，算法設計有效。在決策時間方面，論文無人機決策的平均時間為0.015 7 s，人最快的視覺反應時間為0.15~0.20 s，隨著態勢的復雜度上升或生理狀態的下降，人的反映時間會進一步加長。而航空器控制回路的反應時間可假設有人機與無人機相同。由此可見，相較于有人機的空戰決策速度，無人機的決策效率顯著提升，能夠滿足現有的空戰對抗需求，算法同樣有效。

圖9 無人機單機空戰航跡Fig.9 Single drone air combat track

再對雙機空戰對抗機動效果進行仿真驗證，如圖13 所示。

圖13 無人機雙機空戰對抗航跡Fig.13 UAV dual-aircraft combat confrontation track

從雙機對抗的仿真結果中可以看出，對于來自于不同方向的敵機，無人機能夠進行較好地側向機動，其中無人機航跡2 率先對敵機2 形成尾后攻擊態勢，若命中目標，則可形成二對一空戰優勢，鎖定勝局。無人機航跡1 則繼續追擊敵機航跡1。

6 結束語

本文基于A-star 算法設計了無人機中距空戰對抗中側向機動“咬尾”攻擊的決策方法，在路徑搜索過程中，通過加入引導式的啟發式因子，可使無人機在威脅規避的同時機動至敵機尾后實施攻擊。從航跡決策時間和速度控制效果來看均達到了預期。在雙機對抗中，通過內部決策的協同，按照盡快實現空中力量優勢的原則分配對抗目標，能夠完成雙機協同下的側向機動攻擊。下一步將根據更多的空中態勢和更復雜的情景，展開對應的機動方式的研究，豐富無人機的空戰對抗決策庫。