羅 生,孫衛國,張 萍,楊永勝
(1上海交通大學航空航天學院,上海 200240;2中國空空導彈研究院,河南洛陽 471009)
20世紀50年代,由于制導系統攔截飛行器的引入、人造衛星的發射和航天中有關機動追擊問題的需要,美國數學家Isaacs[1]組織開展了對抗雙方都能自由決策行動的理論追逃問題研究,取得了突破性的成果。1965年,Isaacs整理出版了世界上第一部微分對策著作《微分對策》。1971年,美國科學家Friedman[2]采用了兩個近似離散對策序列精確定義了微分對策,建立了微分對策值與鞍點存在性理論,從而奠定了微分對策理論的數學基礎。
微分對策因其理論上的最優性,已應用于戰術導彈的制導律設計[3-4]。Tahk[5]等人設計利用梯度法求得微分對策制導的數值解,但模型極為復雜。Basar[6]設計了神經網絡微分制導律,但不能實時計算。我國院士湯善同[7]采用微分對策強迫奇異攝動方法設計了零階組合反饋制導律,這種制導易于彈上實時實現,但其是針對有強大地面雷達指示的防空導彈設計的。
文中采用伴隨理論,解決終端控制的最優制導問題,避免了必須對矩陣方程式的直接求解,并通過仿真驗證了所設計制導律的性能。
微分對策屬于雙邊的最優控制問題,其狀態方程可以寫成:

式中:x為狀態變量;u為導彈控制策略;w為目標機動策略;A、B、D為狀態矩陣。
初始條件:x(0)=x0
性能指標函數:

式中:P(t)、R(t)、γ 為加權矩陣,t0為開始時刻,tf為終端時刻。
假設在導彈發射后,攔截目標的某個時刻,目標和導彈都知道對方在此時刻之前的所有信息。如果導彈首先采取機動u1,然后目標根據導彈采取最優規避w1,指標函數為minumaxwJ =J(u1,w1)。這種條件下,導彈攔截目標將消耗最大能量,即有J(u1,w1)=Jmax。如果目標不按照最優機動w1機動,即w≠w1,必有J(u1,w1)≥J(u1,w),即導彈消耗的能量J(u1,w)<Jmax;相反,如果目標首先采用機動策略,則有J(u,w2)≥J(u2,w2),即J(u,w2)>Jmin。
綜合可知minumaxwJ≥minwmaxuJ,即存在:J(u1,w1)≥J(u2,w2)。當u1=u2=u*、w1=w2=w*時,有J(u1,w1)=J(u2,w2)時,此時稱(u*,w*)為鞍點,鞍點(u*,w*)實際上就是雙方最優控制界柵點,微分對策實際上就是鞍點的求解,微分對策制導實際上就是假設目標根據導彈信息進行最優規避條件下來求解導彈的最優機動。
制導律模型如圖1所示。

圖1 制導律模型
其中:
狀態矩陣:


只考慮對末端脫靶量進行要求,得:

則指標函數簡化為:

對于單邊最優的制導問題,可以應用施瓦茨不等式求出解析解,而對于微分對策的雙邊最優問題用這種方法是無法解決的。這里應用一種在脈沖仿真中常用的伴隨方法對微分對策進行求解。
應用伴隨理論,寫出原系統狀態方程的伴隨方程:

其中伴隨矩陣AT為:

考慮末端只對脫靶量進行要求,則末端伴隨狀態為:
λ1(tf)=bx1(tf),b為常數
λ2(tf)=λ3(tf)=0
因為λ1為常數,令λ1=bx1(tf),則可得到:


把方程(5)代入到狀態方程(1)中,并對其進行積分運算,設可以得到微分對策制導律表達式為:


為了驗證所設計微分制導律的性能,用Matlab搭建二維線性攔截模型,對理想比例制導(IPN)、單邊最優制導(OPN)、微分對策制導(DOPN)進行仿真驗證。
為了模擬強電磁空戰中,導彈發射后可能無法準確獲得目標信息的情況,這里假設制導律中沒有目標加速度補償。設彈目相對速度Vc=700m/s、導彈過載限幅umax=50g、一階導彈時間常數T=0.3s。
a)理想比例導引(IPN):

b)單邊最優(OPN):

c)微分對策(DOPN):

其中取:γ=2.75;b=1000。
為了充分驗證制導律對目標的截獲能力,選取階躍機動、正弦機動和B_B機動作為評估基準,具體模型如下:
a)階躍機動
w=Ant
b)正弦機動
w =Antsin(ωt),取ω=5rad/s
c)B_B機動

仿真中目標機動幅值取:Ant=9g。
在終端時間tf為1s和3s兩種末制導情況下分別仿真。表1為三種制導律對于不同機動目標的脫靶量情況。

表1 三種制導律脫靶量
圖2為目標階躍機動情況下導彈過載響應和能量消耗曲線。

圖2 目標階躍機動下導彈過載響應、能量消耗
圖3為目標在正弦機動情況下,導彈的過載響應曲線和能量消耗曲線。

圖3 目標正弦機動下導彈過載響應、能量消耗
從脫靶量上看,對于復雜目標機動,IPN和OPN表現出明顯的不適應性,而DOPN則具有很強魯棒性。從能量消耗的角度來衡量,IPN能量消耗大,而DOPN和OPN消耗能量小于IPN,并且DOPN還要小于OPN。
文中應用伴隨理論成功推導了基于雙方最優策略下的微分對策制導律,并通過對目標三種不同典型機動的仿真,以及將仿真結果與比例導引、最優導引的對比,得出微分對策制導對多種形式的目標機動都具有很高的制導精度和小的能量消耗,是一種更高級的制導律,具有很大的應用前景。
但微分對策制導律也有其自身缺點,比如形式復雜,需要較多的精確信息,這些是影響微分對策能否成功應用的關鍵。
[1]Isaacs R.Differential games[M].New York:John Wiley&Sons,1965.
[2]Friedman A.Differential games[M].New York:Wiley Interscience,1971.
[3]Cherry G W.A general explicit,optimizing guidance law for rocket-propellant spacecraft,AIAA 64-638[R].1964.
[4]Shaw R L.Fighter combat:the art and science of air-toair warfare[M].2nd ed.UK:Patrick Stephens Ltol,1988.
[5]M J Tahk,H Ryu,J G Kim.An iterative numerical method for a class of quantitative pursuit-evasion games[C]//AIAA Conference on Guidance,Navigation,and Control,1998:175-182.
[6]Basar T,Olsder G J.Dynamic noncooperative game theory[M].Philadelphia:SIAM,1999.
[7]湯善同.微分對策制導規律與改進的比例導引制導規律性能比較[J].宇航學報,2002,23(6):38-42.
[8]張嗣瀛.微分對策[M].北京:科學出版社,1987.