喬 浩,李師堯,李新國
(1. 西北工業大學航天學院, 西安 710072; 2. 陜西省空天飛行器設計重點實驗室, 西安 710072)
多飛行器的協同能夠大幅提高系統整體的作戰效能。按照各成員在飛行過程中是否進行通信,可將協同分為動態協同與靜態協同兩種。由于高超聲速飛行器再入過程中高度、速度變化劇烈,且通常要經歷“黑障”區域,因此僅再入初期進行信息交互的靜態協同更適用于此類飛行器的協同問題。多高超聲速飛行器的協同再入是現有單成員再入任務的一個擴展,不僅具有單個飛行器再入的所有特點,同時也具有其獨特之處,即:在滿足常規到達目標區域的同時,對各成員到達時間提出要求。
現有導彈協同方面的研究工作主要集中在常規戰術導彈層面。2006年,Jeon等[1]首先提出了針對反艦導彈命中時間可控的制導方法;2010年,Shin等[2]研究了針對海洋目標與空中目標的協同防御問題,將協同問題由單純攻擊擴展到主動防御場景; 2015年,Zhang等[3]采用基于偏置比例導引法的分布式協同制導方法研究了多枚反艦導彈的同時攻擊問題,并考慮了視場約束。2016年,吳云潔等[4]研究了主從編隊反艦導彈在末制導階段位置與姿態的一體化控制問題,采用動態面控制方法設計了串級型模型,設計了閉環的制導算法。與上述方法不同,Zhao等[5]提出一種軌跡曲線矯正的方法,將尋的過程的軌跡定義為特定形式的多項式,通過調節系數控制導彈滿足終端落角及時間約束,具有較好的幾何意義。2018年,呂騰等[6]研究了有向拓撲下無徑向速度測量的多導彈協同制導問題,實現了平面內的多彈攻擊問題;同年,張帥等[7]研究了帶有引誘角色的有限時間協同制導問題,能夠適應不同的攔截角以及初始發射條件。張聰等[8]針對反艦彈道導彈研究了制導與控制的一體化協同飛行方法,采用領-從彈的結構實現了有攻擊角度約束的多彈協同攻擊。2019年,趙恩嬌等[9]研究了通信拓撲切換下的多飛行器協同攔截方法,解決了機動目標的協同攻擊問題。
在上述協同制導問題中,大多引入了恒定速度或可控速度假設,將原動力學問題轉化為簡單的運動學問題進行研究。但這一簡化對于高超聲速飛行器并不適用。在已公開文獻中,國內外針對高超聲速再入飛行器的協同問題研究較少,涉及高超協同的大部分研究對象為高超聲速巡航導彈,研究過程與常規導彈相類似,不能用于協同再入問題的研究。
2015年,趙啟倫等[10]研究了高超聲速武器與常規導彈協同攻擊的可行性,形成多對一的打擊態勢。同年,李聰穎等[11]將再入導彈應用于反艦場景,利用SQP優化方法研究了多彈協同飽和攻擊的最優彈道,證明了同一攻擊過程有一定的時間可調節范圍,并研究了序列再入且同時命中目標的協同攻擊問題。此外,王少平等[12]也針對這類導彈的協同攻擊進行了可行性層面的討論。
2017年,Liang等[13]對雙高超聲速滑翔導彈的協同制導問題進行了研究,是該類型導彈協同方法研究在國內外公開文獻中的首次。同年,Chu等[14]將高超聲速滑翔導彈的協同再入問題轉化為優化問題,采用改進的模型預測靜態規劃方法實現多枚導彈同時命中目標。2018年,Wang等[15]將航向偏差角定義為速度前置角,并以之作為控制量,在視線坐標系內研究了多枚再入滑翔導彈的協同制導與控制問題。2019年,Yu等[16]提出一種解析的多彈協同再入制導方法,降低了總飛行時間的預測與校正難度。但由于該解析方法建立在簡化的氣動力模型之上,要求飛行器具有特定形式的升阻比(文中采用常值與二次型升阻比進行研究),對于以無動力滑翔為主要飛行方式的高超聲速再入飛行器并不適用。同年,Li等[17]采用阻力加速度剖面與預測校正方法相結合的思路,研究了多高超聲速滑翔導彈時間協同再入制導問題,取得了較好的效果。但由于使用了大圓弧假設,需要在每個制導周期對參考阻力加速度剖面進行更新,計算量較大,增加了算法的復雜性。
基于參考軌跡的制導方法是再入問題中形式簡單、求解迅速的一類方法。Saraf等[18]提出的衍化阻力加速度方法具有較好的軌跡長度處理能力。沈振等[19]在再入走廊內采用兩段折線與走廊邊界設計參考阻力加速度剖面,提高了標準軌跡制導方法的實時性。王濤等[20]在阻力加速度方法中引入預測校正思想,由走廊上、下邊界插值獲得標準軌跡,并在三維空間對航向進行校正,提升了再入飛行能力。
本文提出一種基于參考軌跡的多高超聲速飛行器靜態協同再入制導方法。采用真實軌跡長度進行設計,避免了擾動環境下的參考軌跡不足;依據軌跡長度與飛行時間的對應關系,以公共軌跡長度作為參考軌跡設計時的協調變量;之后采用時域信息轉換的方法,將協同邏輯轉變為容易實現的狀態收斂問題。最后給出完整的協同再入制導方法。
以總能量E為自變量,假設地球為均質圓球,并忽略地球自轉,對應的動力學模型為:
(1)
式中:下標i為成員編號;V為速度大小;r為地心距;R0為地球半徑;θ,φ分別為經、緯度;γ、ψ分別為航跡傾角與航向角;Rflight為軌跡長度;t為飛行時間;g為地球引力加速度;σ為傾側角;L與D分別為升力、阻力加速度??偰芰縀定義為:
(2)
式中:μ為地球引力常量。在實際求解中將其歸一化,定義初始能量為0,終端能量為1,任意時刻能量表示為(E-E0)/(Ef-E0)。路徑約束主要有:
(3)

對于升阻比較大的再入飛行器,通常為改善軌跡質量,還需要考慮平衡滑翔約束,取平衡滑翔約束中的傾側角σ=0°,有平衡滑翔條件為:
L-g+V2/r=0
(4)
此外,還要考慮終端高度hf,速度Vf,剩余航程Stogo,f以及航向偏差Δψf等的約束。
現有的軌跡設計與制導方法在解決軌跡長度問題時往往基于大圓弧假設,使得軌跡長度需要在制導環節進行更新迭代??紤]到再入任務一旦確定,飛行器與目標之間對應的初始縱程Rl隨即確定,因此將真實軌跡長度定義為:
Rflight=PmRl
(5)
式中:Pm定義為機動系數,其最大、最小值對應了最長、最短實際軌跡長度問題。可采用偽譜法進行優化確定[21]。以CAV-H為研究對象,采用表1數據作為標準再入的初始與終端狀態。

表1 初始和終端要求Table 1 Initial and terminal requirements
對應有Pm∈[1,1.1373]。本文在進行參考軌跡設計時采用與衍化阻力加速度方法類似的設計思路。由于軌跡長度根據飛行任務直接給定,因此不需要進行軌跡長度的迭代。參考阻力加速度剖面的跟蹤器采用二階誤差動力學模型進行設計[20]。
選取不同的機動系數進行軌跡設計,統計各機動系數對應的時間,獲得二者對應關系如圖1所示??梢?,再入飛行時間在一定范圍內與機動系數近似成線性關系。即機動系數越大,再入的總飛行時間越長。由二者之間的擬合曲線可以大致預測某一機動系數條件下的總飛行時間,為針對艦船等時間敏感目標的再入問題提供了設計依據。

圖1 機動系數與總飛行時間Fig.1 Maneuver coefficient-total flight time
需要指出的是,在設計參考軌跡時同一個機動系數對應的阻力加速度剖面形式并不唯一,即同一個軌跡長度可以對應不同的參考阻力加速度剖面。在仿真中發現,即使軌跡長度相同,不同形式的阻力加速度剖面也會對應不同的飛行時間。軌跡長度與阻力加速度剖面不一一對應這一問題從側面反映了再入過程的復雜性。因此需要研究阻力加速度剖面形式對總飛行時間的影響。令Pm=1.08,分別取靠近再入走廊上邊界與下邊界兩種形式,對應阻力加速度剖面與飛行時間如圖2和圖3所示。

圖2 指定機動系數兩種不同阻力加速度剖面Fig.2 Different drag profiles with determined Pm

圖3 不同剖面對應的飛行時間Fig.3 Time profiles with different drag profiles
可見,在給定機動系數之后,滿足軌跡長度的參考阻力加速度剖面不唯一。其中慢速軌跡對應的阻力加速度剖面在初始時相對較高,但在能量約0.4之后,對應的阻力加速度明顯更小。時間的演化曲線表明,在飛行的大部分能量區域內,接近準平衡滑翔邊界的阻力加速度剖面對應的時間變化更慢,僅在能量約0.8的位置時間變化開始加快。對應的高度變化以及三維曲線如圖4和圖5所示。

圖4 高度與能量關系Fig.4 Altitude vs. normalized energy

圖5 快速與慢速到達三維軌跡Fig.5 Trajectories with different arrival time
圖4中能量0.4對應的高度約46 km,在此之前慢速軌跡對應的下降速率較快,飛行器快速下降至大氣較為稠密的高度,隨之以更接近準平衡滑翔的軌跡飛行,軌跡高度更高,對應的阻力更小,滑翔時間也更長。由三維軌跡可以看出,末段慢速軌跡對應的軌跡更陡,相對俯沖更快,與能量0.8之后的時間演化曲線一致。
綜上可知,機動系數與軌跡長度之間的對應關系是唯一的,軌跡長度與總飛行時間之間對應關系的唯一性是有條件的,當參考阻力加速度剖面的設計規則給定后,軌跡長度與飛行時間一一對應,且近似成正比例關系。當參考阻力加速度剖面的形式不限制時,即使給定軌跡長度,總飛行時間也具有一定的可調范圍,其中慢速飛行對應的彈道形式為:初始快速下降進入稠密大氣層,并在該區間維持較長時間飛行,末段彈道快速下壓。
考慮一種協同攻擊任務:多枚導彈自相距數百公里的陣位發射,要求同時到達指定區域。假設各成員型號相同,助推段末端或天基釋放對應的初始能量狀態相同,即初始速度、高度相同。令各成員初始航跡傾角一致,初始航向瞄準目標。利用機動系數與軌跡長度一一對應,而軌跡長度在剖面形式給定的情況下與到達時間一一對應的特點,對多陣位發射問題設計如圖6所示的雙層再入協同框架。

圖6 基于參考軌跡的雙層協同框架Fig.6 Cooperative framework based on reference trajectory
其中協調層用于在任務之前收集各成員的陣位信息,根據各成員的機動性能,確定各自可選軌跡長度的范圍,通過協調單元進行比對,確定公共軌跡長度。由于不同成員具有的初始速度、高度一致,終端約束一致,當公共軌跡長度確定后即可進行公共阻力加速度剖面的設計,之后將公共阻力加速度剖面作為協調信息分發給各成員。執行層在獲得分發信息之后,各成員求解本地軌跡曲率子問題,獲得各自參考軌跡。結合不同的軌跡跟蹤方法即構成基于參考軌跡的協同再入制導方法。此外,該協同框架對初始陣位同樣有一定要求,即各成員飛行器軌跡長度區間的交集需要非空。
首先確定各飛行器對應的初始縱程Rl,i,之后利用該信息采用優化方法確定各陣位對應的機動系數區間。由于機動系數與初始縱程有關,當初始縱程不同時無法直接進行比對(相當于度量標準不同),因此實際中直接利用軌跡長度區間進行比對,即:Pm,i×Rl,i。結合軌跡長度與飛行時間在有限條件下一一對應的特點,協同軌跡設計轉化為依據各成員陣位信息,求取符合各成員機動性能的公共軌跡長度。為方便表述,此處以Rf代表成員飛行器的軌跡長度,各陣位軌跡長度區間為[Rfi,min,Rfi,max],對應的公共軌跡長度Rflight須滿足:
(6)
可見,公共軌跡長度受各成員最長與最短軌跡的限制。在確定公共軌跡長度之后,即以該軌跡長度作為公共參考阻力加速度剖面的設計依據,由協調單元完成軌跡長度子問題,并進行公共參考阻力加速度剖面的分發;軌跡曲率子問題由各成員本地解算。相比獨立再入各成員的計算量大幅減少。
軌跡曲率問題采用三段式動態航向偏差走廊的方式進行求解[22]。航向偏差走廊的迭代更新方法為:
(7)

在完成多成員協同再入的標準軌跡設計之后,各成員還需要對標準軌跡進行跟蹤以完成整個再入協同制導。由于各成員具有公共的縱向參考軌跡,因此可采用二階跟蹤誤差模型設計統一的軌跡跟蹤器,由各成員飛行器各自在線根據與參考狀態的偏差進行縱向軌跡跟蹤。軌跡曲率子問題采用動態航向偏差走廊在軌跡跟蹤過程中進行航向控制。
本質上講,阻力加速度跟蹤器是一種通過跟蹤參考阻力加速度剖面,實現高度、速度匹配的設計方式,而速度與高度有多種組合可以滿足阻力加速度的需求,因此實際阻力加速度關于參考阻力加速度剖面最終的收斂,并不能說明軌跡長度及期望飛行時間與設計值一致。對Pm=1.08在表4所示的擾動環境下進行500次蒙特卡洛打靶,對應的阻力加速度剖面跟蹤效果如圖7所示。

圖7 擾動環境下阻力加速度跟蹤曲線Fig.7 Tracking curves of drag profile with disturbance
可以看出,不同擾動條件下阻力加速度跟蹤曲線的過渡方式、過渡快慢存在差異,這就導致了實際軌跡長度、總飛行時間必然產生較大的偏差。直接跟蹤參考阻力加速度剖面對軌跡長度、總飛行時間沒有直接的跟蹤效果的這一特點,限制了跟蹤阻力加速度剖面方法在協同任務中的使用,因此本文采用另一種軌跡跟蹤思路。在協同任務中,各成員依據協調信息(公共軌跡長度)確定公共參考阻力加速度剖面之后,可以結合本地軌跡曲率問題完成參考軌跡的全狀態生成。這些狀態包含了豐富的軌跡信息,其中高度、速度、軌跡長度(與縱程不同)、航跡傾角為縱向參數,航向偏差、經度、緯度為側向參數,飛行時間依據公式(1)確定。由于各成員對應的縱向參考軌跡是相同的,可以考慮使用狀態跟蹤器對縱向狀態進行跟蹤,軌跡的曲率問題由動態航向偏差走廊進行控制。在由參考軌跡獲得的豐富狀態信息中,時間是一個確定的序列,參考軌跡一旦確定,飛行過程中的時間變化是相同的,即由協調變量確定的參考軌跡給出了一個協調一致的期望終端時間。因此可以對原能量域中的狀態信息關于飛行時間進行插值,獲得時域內的全狀態信息,此時協同軌跡跟蹤問題轉化為:各成員采用相應的軌跡跟蹤器,使最終到達期望末端時刻的各飛行狀態符合誤差要求,協同的效能評估可采用到達指定時間各成員的狀態偏差進行評定。
作為狀態跟蹤器中較為成熟的方法,線性二次調節器(LQR)最早被應用于線性系統的最優控制問題中,其增益的求解形式簡單,對不同任務有較好的適應性,因此被很多學者應用于標準軌跡制導方法的設計[18]。需要注意的是,LQR方法是一種狀態跟蹤器,需要以狀態信息的形式給出參考軌跡。由參考阻力加速度剖面解算出狀態參數既可通過對阻力加速度剖面求導獲得,也可通過沿參考阻力加速度剖面進行標稱跟蹤獲得。前者需要采用平均高度等假設,相對而言后者獲得的狀態信息更為精確,求解過程也更為簡便。因此本文在使用LQR方法進行軌跡跟蹤時采用沿公共參考阻力加速度剖面進行標稱跟蹤的方法獲得參考軌跡的全狀態信息。基于參考軌跡的多陣位協同再入制導流程如圖8所示。

圖8 協同再入制導流程Fig.8 Flow chart of cooperative reentry guidance

假設協同再入任務八個備選陣位如表2所示。

表2 各成員初陣位信息Table 2 Initial states of different members
采用優化的方法求解各成員初始陣位對應的最長、最短軌跡以及軌跡長度區間如圖9,圖10所示??梢?,最短軌跡接近于沿初始彈目連線,但在一些陣位要稍大,這主要是由于在一些距離目標位置較近的陣位,最短軌跡受到過程約束以及傾側角演化速率的限制,需要進行一定的側向飛行以滿足熱流、過載與動壓的約束。

圖9 不同初始陣位對應的最長、最短軌跡Fig.9 The longest and shortest trajectories of each member

圖10 不同陣位最大、最小軌跡長度統計Fig.10 Statistics of maximum and minimum trajectories length
可見,依據式(7)該陣型對應的公共軌跡長度區間為空。主要原因是M3距離目標過遠,需要相對其余成員提前發射。因此除M3外7個成員參與此次協同,最長、最短軌跡分別為7325.8 km、 6707.5 km。考慮到軌跡長度在下邊界附近會造成傾側角反轉次數過多,在無特殊要求時應與下邊界保持一定范圍,此處取Rflight=6850 km為仿真校驗的公共軌跡長度。
確定公共軌跡長度之后,即可確定滿足不同陣位需求的公共參考阻力加速度剖面,如圖11所示。

圖11 擾動環境下阻力加速度跟蹤曲線Fig.11 Tracking curves of drag profile with disturbance
各成員相應的速度-高度、航跡傾角變化曲線如圖12和圖13所示。

圖12 參考高度-速度變化曲線Fig.12 Reference altitude-velocity

圖13 參考航跡傾角變化曲線Fig.13 Reference flight path angle
由協調信息確定的各成員參考總飛行時間為1410 s。當縱向參數與終端高度、速度約束確定后,再入飛行的總時間也是確定的。因此當各成員遵守相同的協調信息時,各成員在標稱環境下的時間演化曲線也是一致的,如圖14所示。

圖14 時間演化曲線Fig.14 Flight time

圖15 各成員傾側角指令Fig.15 Bank angle of each member
各成員對應的實際傾側角指令如圖15所示。可以看出,各成員在相應能量點處的傾側角幅值一致,僅傾側角的符號不同,這一不同是由不同陣位對航向的不同需求造成的,動態的航向偏差走廊通過調整傾側角符號的反轉位置以及反轉次數,使自不同陣位出發的各個成員最終均到達目標區域。仿真結果如圖16至圖18所示。
對各成員的終端狀態進行統計,如表3所示??梢?,標稱環境下的跟蹤結果符合終端狀態偏差的要求。

表3 標稱狀態下各成員終端偏差Table 3 Terminal deviation of different members in nominal state

圖16 各成員地面軌跡投影Fig.16 Ground track of each member

圖17 各成員航向偏差Fig.17 Heading error of each member

圖18 各成員三維軌跡Fig.18 Three dimensional trajectory of each member
對于側向運動不大的飛行任務,一般只需采用固定的航向偏差走廊即可,但對于本文的多飛行器協同任務,不同陣位對應的側向運動范圍很大,因此各成員在實際飛行過程中應考慮對飛行方向的控制,以滿足末端剩余航程與航向偏差的要求。以根據M2成員參考軌跡獲得的增益矩陣作為公共增益,各成員飛行中依據本地狀態與參考狀態的偏差結合預置的增益進行制導指令更新。在模擬擾動環境下考慮側向制導邏輯,對參與協同任務的7個成員各自進行200次三維蒙特卡洛打靶。模擬擾動環境的偏差分布類型與參數如表4所示。
各成員終端狀態以及終端狀態偏差分布的統計打靶結果如圖19所示。
由于最終的協同效果由所有成員到達截止時間的狀態偏差進行評價,此處將所有成員的統計打靶結果視作同一個待統計過程,相應的偏差及相關參數的統計結果如表5所示。

表4 模擬擾動環境Table 4 Disturbance environment for simulation

圖19 多成員蒙特卡洛仿真結果Fig.19 Multi-member Monte Carlo simulation results

表5 多成員蒙特卡洛仿真結果統計Table 5 Multi-member Monte Carlo simulation results statistics
在縱向軌跡確定的情況下,各成員終端的剩余航程與航向偏差主要受側向制導邏輯的影響。動態的航向偏差走廊本質上與直接搜索最佳的傾側角符號反轉點等效,都是通過調節傾側角的反轉時機進行飛行方向的調整。各成員終端剩余航程偏差與航向偏差的統計結果說明了側向制導邏輯的有效性。
各成員三維蒙特卡洛打靶對應的地面軌跡與三維軌跡分別如圖20和圖21所示。

圖20 不同陣位地面軌跡Fig.20 Ground tracks for different initial positions

圖21 三維軌跡Fig.21 Three dimensional trajectories
不同陣位對應的終端位置如圖22所示。可以看出,各成員最終都落在了距目標一定距離的指定區域內,軌跡的終端位置較為集中。

圖22 不同初始陣位對應的終端位置分布Fig.22 Terminal positions for different initial positions
由于再入過程中的過程約束主要與縱向的軌跡參數有關,而多陣位協同問題中各成員具有相同的縱向軌跡參數,因此在相同的擾動環境下,各成員的過程約束演化過程一致。以M2成員為例進行說明,500次蒙特卡洛仿真對應的過程約束如圖23所示。可見,在給定的模擬擾動環境下,對應的熱流、過載與動壓滿足約束條件,確保了各成員在協同再入過程中,均處在滿足再入約束的飛行狀態內。

圖23 擾動環境下的熱流、動壓與過載約束Fig.23 Path constraints in disturbed environments
針對多再入飛行器的多陣位協同問題,本文給出一種基于公共參考軌跡的靜態協同再入制導方法。研究表明:采用實際軌跡長度替代傳統的大圓弧假設,能夠更好描述飛行過程中的真實軌跡;機動系數在量化真實軌跡長度的同時,能夠建立實際軌跡長度與總飛行時間之間的聯系,且二者表現出一種有條件的一一對應關系,當阻力加速度剖面的形式確定后,確定的軌跡長度對應唯一的飛行時間序列,這一點為多成員的協同再入提供了切入點;基于參考軌跡的雙層再入協同框架能夠有效完成不同陣位多成員的協同再入問題,且具有形式簡單,流程清晰的特點;提出的時域信息提取與協同邏輯轉換策略可以將原協同再入問題轉換為簡單的截止時間狀態收斂問題,對靜態協同問題具有較好的適應性;以LQR方法為基礎的狀態跟蹤器能夠較好適應多陣位成員的參考軌跡跟蹤問題。統計打靶的結果表明,本文所提方法能夠在保證不同陣位飛行器同時到達目標區域的同時,使終端狀態偏差符合需求,且具有一定的魯棒性。