許佳駱, 胥 彪, 馮建鑫, 張金鵬
(1. 南京航空航天大學,南京 210016; 2. 中國空空導彈研究院,洛陽 471009; 3.航空制導武器航空科技重點實驗室,洛陽 471009)
由于軍事技術進步,現代強機動性能飛行器對于制導性能的指標要求較高。傳統的比例制導律、最優制導律在應對高機動目標時,需要準確的目標加速度信息,而不準確的目標加速度信息會對制導效果產生極大影響。微分對策制導律對于精確目標加速度信息的依賴程度較小,制導過程中只需要目標的機動能力信息,而不需要精確的目標加速度信息。
微分對策問題(diferntial games, DG)最早由Isaacs提出。 Gutman利用簡化的模型設計出一種微分對策制導律。Shinar假設攻防雙方均具有1階動態響應,提出了一種基于零化脫靶量方法的微分對策制導律DGL/1。該微分對策制導律利用狀態轉移矩陣對微分對策問題進行降階,并采用哈密頓方法進行極大極小值求解,得到的制導律幅值為導彈的最大加速度,而加速度方向由脫靶量符號決定,其中計算脫靶量符號時需要用到目標的加速度信息。Shinar等假設對目標加速度觀測存在延遲,利用延遲的目標加速度信息,結合已知的目標最大機動能力以及目標動態響應延遲估計出實時的目標加速度,利用估計的加速度代替實時目標加速度進行脫靶量計算,設計延遲目標加速度信息條件下的微分對策制導律DGL/C。隨后,Shinar等針對時間延遲對于制導律設計的影響進行詳細論述。Glizer等針對目標的速度、加速度存在觀測延遲的情況,設計出考慮雙信息延遲的微分對策制導律DGL/CC。Glizer等又給出了一種考慮多信息延遲的微分對策制導律。Oshman 等針對DGL/C制導律,利用無延遲的目標加速度方向觀測對延遲目標加速度信息進行補償,設計出利用目標加速度方向觀測改進的制導律DGL/S。相較于DGL/C制導律,該制導律對于目標加速度的預測值更加準確,進一步降低了脫靶量,提升制導效果。以上制導律都基于DGL/1制導律的框架,針對不同的延遲信息條件進行研究,利用目標機動能力值與動態響應方程對目標加速度可達域進行預測,同時利用低延遲的加速度相關的信息進行補償,隨后利用這些預測得到目標加速度進行脫靶量的計算,提升延遲信息條件下的制導效果。
上述制導律得益于零化脫靶量模型的特點,在進行極大極小值求解時可以將問題轉化為求解脫靶量的符號。但是這類制導律是一種bang-bang類型的控制,同時在面對新的制導要求如攻擊角時,求解困難較大,而狀態依賴黎卡提方程方法(state-dependent Riccati equation, SDRE)可以極大地降低微分對策問題的求解難度。
Bardhan利用零化視線角速率的方式進行制導律設計,并采用SDRE的方法對極大極小值問題進行求解。同時基于無窮穩定理論將黎卡提方程的微分項舍去,將問題轉化為每一決策階段的SDRE求解,設計出利用SDRE方法求解微分對策問題的SDRE-DG制導律。該制導律不需要剩余時間的估計,而之前的微分對策制導律都需要利用剩余時間來對脫靶量進行估計。Bardhan等又將狀態空間擴展為視線角速率與攻擊角,由于采用了SDRE方法,問題的求解難度降低。這些制導律利用SDRE方法進行求解,將問題轉化為狀態依賴參數(state-dependent coefficient, SDC)和代數黎卡提方程的求解。這類制導律可以對支付函數進行設計以滿足不同的性能指標,同時舍去黎卡提方程的微分項以避免剩余時間估計,利用實時計算的SDC將問題轉化為代數黎卡提方程的求解。 Cloutier等對于SDRE方法進行了總體論述。?imen對于SDRE方法進行了詳細的論述分析,并著重對穩定性、求解方法、結構進行介紹與分析。孫平等集中解釋了SDRE問題集中于狀態相關參數的構造、權重矩陣的選擇以及代數黎卡提的求解。Menon等介紹了SDC的構造原則,同時介紹了Schur法和Kleinman法兩種方法來解決代數黎卡提的實時求解問題。
上述文獻都未對目標存在非博弈機動的情況進行考慮。而Farhan在微分對策問題的設計過程中,將導彈與目標的機動分為追逃機動和干擾機動,給出了一種考慮目標進行干擾機動的微分對策制導律。
本文利用SDRE的方法研究了導彈微分博弈制導問題,引入了目標加速度方向觀測,提高了制導精度。在實際應用中,實時且精確的目標加速度往往難以獲得,假設導彈只能獲得具有一定時間延遲的目標加速度,結合Oshman等的方法進行目標加速度方向觀測,即對目標加速度的極性進行觀測,可以得到補償后的目標加速度值的符號。將補償后預測得到的目標加速度取代上述微分對策制導律所需要的實時目標加速度,最終設計出考慮目標加速度方向觀測的微分對策制導律,該制導律可以更好地實現延遲信息條件下的機動目標攔截。
考慮彈-目追逃問題,動力學模型如下

(1)
同樣,目標的動力學模型為

(2)
式中,x
,z
和x
,z
分別為導彈與目標在慣性系的x
,z
軸上的坐標;V
和V
分別為導彈與目標的速度;φ
和φ
為導彈與目標的飛行路徑角;a
和a
為導彈與目標垂直于速度的加速度;τ
和τ
為導彈與目標的1階動態響應時間;u
2和u
2為導彈與目標垂直于速度的加速度指令。結合圖1,獲得導彈與目標的相對運動方程

(3)

(4)

本文基于零化視線角速率的方法進行制導律設計,對公式(4)進行求導得到

(5)
式中,u
和u
分別為導彈與目標垂直于視線方向的加速度指令。

圖1 導彈和目標碰撞幾何圖形Fig.1 Missile-target engagement configuration

(6)
式中,γ
為目標相對于導彈可以獲得的機動大小,其值越大在支付函數中對于目標的機動懲罰越大,代表目標相對于導彈所能獲得的機動越小,其取值取決于目標相對于導彈的機動能力強弱;q
(x
)為關于視線角速率的權重系數;r
(x
)和r
(x
)為導彈與目標機動指令的權重系數。

(7)

針對式(6)所示的微分對策問題,傳統方法需要求解哈密頓-雅可比-貝爾曼-伊薩克斯偏微分方程,但是該偏微分方程往往難以求解,可以使用狀態依賴黎卡提方程對其進行求解。求解過程主要分為:狀態依賴參數SDC與狀態依賴黎卡提方程SDRE求解。
針對式(6)所述的微分對策問題,需要對式(8)進行線性化,已知

(8)
如果f
(0)=0,那么就可以將f
(x
)轉化為a
(x
)x
,獲得
(9)
式中,a
(x
),b
(x
),c
(x
)為需要實時計算的SDC
(10)

(11)

(12)

針對式(6)的微分對策問題,利用哈密頓方法進行求解,獲得哈密頓方程

λ
(a
(x
)x
+b
(x
)u
+c
(x
)u
)(13)
式中,λ
為協變量。方程要獲得最小值時需要滿足
(14)
由式(12)得到鞍點解

(15)
假設λ
=p
(x
)x
,p
(x
)為協變量λ
與x
相關的系數,對λ
求導并結合公式(12)和(13)



(16)



(17)
x
為1階,并假設r
(x
)=1和r
(x
)=1,那么式(15)所示的狀態依賴黎卡提方程轉為一元二次方程(b
(x
)-γ
c
(x
))p
(x
)-2a
(x
)p
(x
)-q
(x
)=0(18)
可以直接進行一元二次方程求解
p
(x
)=
(19)
獲得SDRE-DG微分對策制導律
u
=
(20)
該制導律不需要進行剩余時間估計。
不同于SDRE-DG制導律,該微分對策制導律在微分對策問題設計過程中考慮了目標存在非博弈機動,將導彈與目標的控制量分為兩部分
u
=u
+u
(21)
u
=u
+u
(22)
式中,u
為導彈的追捕機動,u
為目標的逃逸機動,而u
與u
為導彈與目標進行的非博弈機動,選擇支付函數J
=
(23)
式中,q
(x
)為關于視線角速率的權重系數,r
(x
)為關于導彈追捕機動指令的權重系數,r
(x
)為關于目標逃逸機動指令的權重系數,而導彈與目標的非博弈機動由于其隨機性,在支付函數中并進行考慮。結合式(5),(19),(20)獲得了考慮目標非博弈機動的微分對策問題
(24)
獲得哈密頓函數

(25)
式中,λ
為協變量。方程要取得最小值需要滿足式(26)
(26)
不同于SDRE-DG制導律,由于引入了非博弈機動,需要假設λ
=p
(x
)x
+ξ
,其中p
(x
)為協變量λ
與x
相關的系數,ξ
為一個與狀態空間同階的向量得到了鞍點解
(27)
對協變量λ
進行求導得



(28)
同時由式(26)獲得

(29)
結合式(28)和(29),獲得兩個黎卡提方程

(30)

(31)
假設r
=1和r
=1,并求解得
(32)

(33)
假設目標進行的機動全部是非博弈機動,即u
=u
=a
,獲得考慮非博弈機動的微分對策制導律對脆弱性指數用歐式距離聚類聚成3類,如果這個國家所得的V大于0.9,則這個國家的狀態為非常脆弱;如果這個國家所得V在之間,則這個國家的狀態為脆弱;如果這個國家所得V值小于0.6,則這個國家的狀態為穩定。
u
=-b
(px
+ξ
)
(34)
將式(10)~(12)以及式(32)代入得


(35)
該制導律包含了對目標加速度進行補償的擴展項,相較于SDRE-DG制導律可以更為有效地應對機動目標。
a
(t
-Δt
)。同時導彈可以獲得實時的目標加速度方向信息sgn(a
(t
))。結合Oshman等提出的方法,利用目標加速度方向信息sgn(a
(t
))補償延遲目標加速度信息a
(t
-Δt
)。

(36)

(37)
如果沒有其他信息進行進一步補償,則可以利用預測的目標加速度可達域的中心代替目標加速度信息。而利用目標加速度方向的方法則是基于實時的目標加速度方向這個可以得到的低延遲信息,進一步將目標加速度信息可達域縮小,目標加速度可達域的上界或者下界變為0,并利用縮小后的目標加速度可達域中心值當作目標加速度值。相較于未進行補償的延遲目標加速度估計,得到的目標加速度值更加接近實際值。
當sgn(a
(t
)min)=sgn(a
(t
)max)時a
(t
)=a
(t
-Δt
)e
-Δ/(38)
當sgn(a
(t
)min)≠sgn(a
(t
)max)時a
(t
)=
(39)
式中,sgn(·)為符號函數。
隨后利用補償后獲得的目標加速度可達域中心值a
(t
)代替式(34)中的a
,可以得到考慮目標加速度方向觀測的微分對策制導律

(40)
相較于第3節中考慮非博弈機動的制導律,新的考慮加速度方向觀測的制導律不需要實時的目標加速度信息,可以更為有效地應對延遲目標加速度信息條件下的機動目標攔截問題。
下面將在目標進行常值機動和目標進行蛇形機動的情況下,分別對制導律的制導效果進行仿真研究。為了方便表達,將第4節中考慮目標加速度方向觀測的制導律命名為SDRE-ODG,并與SDRE-DG制導律進行仿真對比研究
仿真過程中,利用式(1)~(2)建立導彈與目標的運動學空間。利用式(8)~(10)在每一個決策階段計算得到狀態依賴參數a
(x
),b
(x
),c
(x
),并利用狀態依賴參數并結合式(18)和(39)計算得到SDRE-DG制導律與SDRE-ODG制導律的制導量。將制導量代入到運動學中,實現導彈的攔截運動仿真。通過兩種制導律進行對比,以便于進一步論證新制導律的制導效果。

表1 目標進行常值機動時初始參數
由視線角速率對比圖2可以看出,在目標進行常值機動的情況下,SDRE-ODG制導律相較于SDRE-DG制導律視線角速率收斂效果更好。SDRE-ODG制導律由于包含了對目標加速度的補償項,在初期可以更為有效地利用導彈的機動能力。由加速度指令對比圖3可以看出,早期SDRE-ODG制導律的控制量大于SDRE-DG制導律,在后期則較小。相應的SDRE-ODG制導律在末制導前期收斂快于SDRE-DG制導律,而在后期則收斂速度較慢并趨于0。而從軌跡對比圖4可以看出,SDRE-ODG制導律制導下,導彈的軌跡更為平直,結合式(18)和(33)可以看出,這主要是由于SDRE-ODG制導律相較于SDRE-DG制導律多出了補償目標機動的擴展項。在上述仿真條件下,前期SDRE-ODG制導律的值大于SDRE-DG,而后期則相反。這樣SDRE-ODG制導律軌跡在前期轉向較快,總體上軌跡較為平直。

圖2 目標進行常值機動時視線角速率Fig.2 Line of sight rate when target conducts constant maneuvers

圖3 目標進行常值機動時導彈加速度指令Fig.3 Missile’s acceleration command when target conducts constant maneuvers

圖4 目標進行常值機動時軌跡Fig.4 Trajectory when target conducts constant maneuvers
從脫靶量對比表2來看,SDRE-ODG制導律的脫靶量值為0.23 m,而SDRE-DG制導律的脫靶量值為1.36 m,主要是由于SDRE-DG制導律在視線角速率的收斂上,對于目標機動的補償效果弱于SDRE-ODG制導律。可以看出,SDRE-ODG制導律在延遲信息條件下,應對進行常值機動的目標時的攔截效果較好。

表2 目標進行常值機動時脫靶量對比


表3 目標進行階躍機動時初始參數
由視線角速率對比圖5可以看出,在制導初期的兩個制導律的視線角速率收斂相同,這主要是由于在攔截初期的目標加速度為0,導致SDRE-ODG制導律相較于SDRE-DG制導律在補償目標機動的方面沒有區別,使得兩個制導律的收斂效果相同。而在4 s左右目標開始機動,使得兩者在收斂性方面開始出現差異。同5.1節仿真一樣,SDRE-ODG制導律在對于目標的機動具有補償作用,其在目標機動時可以更好地實現視線角速率的收斂,最終導致在4 s后兩者在視線角速率的收斂性的差異。而從機動指令對比圖6可以看出,在4 s左右時SDRE-ODG制導律的機動指令大于SDRE-DG制導律,而后則小于SDRE-DG制導律,這進一步說明SDRE-ODG制導律對于目標機動的補償效果,可以更為有效地利用導彈機動能力。而從導彈的軌跡圖7可以看出,制導初期兩種制導律的軌跡完全一樣,而后期的RE-ODG制導律的軌跡更加平直,進一步證明SDRE-ODG制導律在攔截機動目標方面效果更好。
從脫靶量對比表4來看,SDRE-ODG制導律的脫靶量值為0.48 m,而SDRE-DG制導律的脫靶量為1.46 m,主要是由于SDRE-DG制導律在視線角速率的收斂上,對于目標機動的補償效果弱于SDRE-ODG制導律。可以看出,SDRE-ODG制導律在延遲信息條件下,應對進行階躍機動目標時的攔截效果較好。

圖5 目標進行階躍機動時視線角速率Fig.5 Line of sight rate when target conducts step maneuvers

圖6 目標進行階躍機動時導彈加速度指令Fig.6 Missile’s acceleration command when target conducts step maneuvers

圖7 目標進行階躍機動時軌跡Fig.7 Trajectory when target conducts step maneuvers

表4 目標進行階躍機動時脫靶量對比


表5 目標進行蛇形機動時初始參數
由視線角速率對比圖8可以看出,在應對進行蛇形機動的目標時,SDRE-ODG制導律相較于SDRE-DG制導律可以對目標機動作出補償,其在視線角速率收斂方面較好,可以實現最后收斂至0值附近,而SDRE-DG制導律在目標變機動值后視線角速率離開0值附近。而從機動指令對比圖9可以看出, SDRE-ODG制導律的控制量在SDRE-DG制導律的周圍波動。其中第一次變動是SDRE-ODG制導律在目標機動的每個階段可以有效利用導彈機動,視線角速率收斂較快,此后不再需要高機動值,導致SDRE-ODG制導律的機動值比SDRE-DG制導律小。隨后由于目標變機動,SDRE-ODG制導律的機動值發生較大變化,從視線角速率變化可以看出,SDRE-DG制導律對于目標變機動反應較小。而SDRE-ODG對于目標變機動反應較大,其在3.7 s時視線角速率變化沒有SDRE-DG大,并很快再次趨向收斂。從攔截軌跡對比圖10可以看出,SDRE-ODG制導律的軌跡更加平直。
從脫靶量對比表6看出,SDRE-ODG制導律的脫靶量為0.65 m,而SDRE-DG制導律的脫靶量為1.47 m,這和視線角速率收斂性的結果相符。SDRE-DG制導律由于在目標變機動后視線角速率發生突變,在末期未完全收斂至0,而SDRE-ODG制導律的收斂效果較好,最終SDRE-ODG在脫靶量上較小,攔截效果較好。

圖8 目標進行蛇形機動時視線角速率Fig.8 Line of sight rate when target conducts serpentine maneuvers

圖9 目標進行蛇形機動時導彈加速度指令Fig.9 Missile’s acceleration command when target conducts serpentine maneuvers

圖10 目標進行蛇形機動時軌跡Fig.10 Trajectory when target conducts serpentine maneuvers

表6 目標進行蛇形機動時脫靶量對比
綜上所述,SDRE-ODG制導律包含了對目標機動的補償項,制導律可以更為有效地利用導彈的機動能力,在延遲條件下有效地實現視線角速率收斂,可以更為有效地實現對機動目標的攔截。
本文研究了導彈微分博弈制導問題,在設計微分對策問題的過程中,引入目標的非博弈機動并進行微分對策問題求解。隨后在延遲信息條件下,利用目標加速度方向觀測的方法,對延遲的目標加速度進行補償,得到預測的目標加速度并代入到制導律中,最終得到考慮目標加速度方向觀測的微分對策制導律。
本文提出的考慮目標加速度方向觀測的制導律在延遲信息條件下,相較于傳統微分博弈導律可以更為有效地實現對機動目標的攔截。從仿真結果表明,本文提出的制導方法使得視線角速率可以更快地收斂,同時對于機動目標可以更為有效地進行攔截,降低脫靶量,提高了制導精度。