項盛文 范紅旗 達 凱 付 強
在實際的末制導攔截場景中,目標狀態不可避免地受噪聲污染并且不是所有的狀態量都能直接被量測,因此估計器是制導系統中的一個關鍵組件.由于目標機動通常是未知且難以預測的,目標狀態估計是一個典型的混合估計問題,即包含基礎狀態估計和模式決策兩個任務.目前,常用的混合估計方法可以分為兩類:單模方法和多模方法.Li 等[1-2]對這兩類方法進行了全面的分析和總結.值得注意的是,無論選用哪種方法,模式決策延遲都是影響系統估計精度的關鍵因素.具體而言,在單模方法中模式決策延遲表現為目標機動檢測延遲;而在多模方法中則表現為模型概率收斂的時間.Shinar 等[3]指出對于大機動目標攔截(Highly maneuvering target interception,HMTI)問題,目標狀態估計延遲特別是目標橫向加速度的估計延遲,是引起系統非零脫靶量的主要因素.因此,為了盡可能地提高系統估計和制導的精度,模式決策延遲的取值越小越好.否則,由模式失配引起的不精確狀態估計會誤導攔截器生成錯誤的控制指令,并最終導致系統攔截精度降低(模式延遲太大且沒有足夠長的時間讓估計器收斂).
近年來,研究者分別從不同的角度考慮如何降低模式延遲對制導性能的影響:一種是研究新型導引律以適應模式決策延遲;另一種則聚焦于怎樣降低系統的模式決策延遲.在導引律設計方面,學者們提出了一系列延遲信息模式下的微分對策導引律.Shinar 等[4]假定目標橫向加速度分量存在一個固定的估計延遲,基于狀態可達集提出了一種新型導引律DGL/C (Differential games law,DGL).文獻[5]在同時考慮目標橫向加速度和相對速度存在延遲的條件下提出了DGL/CC.對于隨機Bang-Bang 機動目標,DGL/CC 與DGL/C 相比可進一步降低系統脫靶量.文獻[6]則考慮更一般情形,假定彈目相對距離、相對速度和目標加速度均存在估計延遲,提出了一種多信息延遲模式下的微分對策導引律.然而,對于HMTI 問題,單一的估計器和導引律的簡單組合并不能適應所有的目標機動情形[7].采用集成估計導引(Integrated estimation and guidance,IEG)的思路,組合使用一組不同精度和帶寬的估計器和一個獨立的模式決策器,可以顯著提高末制導精度并越來越受到研究領域的關注[8-11].其中,基于邏輯的IEG 方法具有潛在的應用前景[12-13],該方法也在多個攔截場景中得到了驗證.另一方面,為了降低模式決策延遲,研究者們從目標機動特性出發進行了不同的嘗試.事實上,雷達和光電導引頭可以觀測到與目標機動緊密相關的特征信息,這也為目標機動的快速辨識提供了可能.相關研究結果表明,集成雷達特征信息可以有效降低目標機動檢測的延遲并提高制導系統的精度[14-15].
為了定量評估模式決策延遲對制導性能的潛在影響,需進一步回答該問題:給定系統誤差邊界后,模式決策器最大可容許的模式決策延遲(Maximal admissible mode decision delay,MAMDD)是多少? 對于該問題,文獻[16]分析了離散時間系統狀態估計誤差特性并推導了模式延遲的上邊界和模式逗留時間的下邊界[16].文獻[17]將該工作推廣至連續時間情形.考慮末制導的攔截特性,文獻[18]通過將零控脫靶量(Zero-effort miss,ZEM)估計誤差的均值限定在捕獲區邊界內提出了一種MAMDD 的數值計算方法,然而該方法未考慮ZEM 估計誤差的方差.文獻[19]同時考慮ZEM 估計誤差的均值和方差,引入可靠性評價指標得到了系統可接受模式決策延遲的范圍,但沒有給出MAMDD的具體數值.
本文針對HMTI 問題,在IEG 系統框架下,分析給定系統性能約束條件下模式決策器的性能指標,為模式決策器的設計提供指標參考.主要創新點包括:1)給出了離散時間系統ZEM 估計誤差模型;2) 同時考慮ZEM 估計誤差一階矩和二階矩,利用一致性約束條件提出了一種MAMDD 的數值計算方法.研究結果表明在末制導前段采用一致性約束、后段采用捕獲區約束可保證更好的攔截性能.
本文僅考慮圖1 所示的一彈一目平面攔截場景,表1 給出了全文的符號描述,下面對攔截問題做3 個假設[3-6,11-12,15-19]:

圖1 平面攔截幾何Fig.1 Planer interception geometry

表1 符號說明Table 1 Description of symbols
1) 彈目的控制動態可用一階轉移函數近似,對應的時間常數分別記為τp和τe;
2) 彈目飛行速度恒定,分別用Vp和Ve表示;
在圖1 中,P (Pursuer)和E (Evader)分別表示導彈和目標;X軸沿彈目初始視線方向;Y垂直于X軸;(xp,yp) 和 (xe,ye) 分別為P、E 的當前位置;φp和φe分別為彈目的速度偏角,定義為速度矢量和X軸正方向的夾角.對于高速大機動目標末制導攔截場景,速度偏角滿足小角度條件(sinφp≈φp,sinφe≈π-φe),彈目相對運動軌跡可沿初始視線方向進行線性化[12].假定彈目接近速度恒定、起始時刻t0=0s, 給定彈目起始距離r0后,攔截的終止時刻滿足

剩余飛行時間定義為tgo=tf-t,其中,t∈[0,tf].

其中,x1=ye-yp為彈目沿Y軸的相對距離;x2為相對橫向速度;up和ue分別表示P 和E 的橫向加速度指令且滿足有界條件

系統的動態方程可寫成如下的矢量形式

通過終端投影變換

可將方程(4)轉換為一個標量問題.此時,系統新的狀態量為零控脫靶量z(t), 系統的脫靶量則為tf時刻的z(t),即z(tf).在式(6) 中,d=[1,0,0,0]T;Φ(tf,t)為滿足齊次方程的狀態轉移矩陣,求解可得到

由式(6)容易得到z(t) 滿足

其中,gT(t)=[g1(t),g2(t),g3(t),g4(t)]且

將目標的橫向加速度控制指令ue(t) 建模為一個跳變的馬爾科夫過程[16]

其中,m(t) 為目標當前時刻的運動模式,它表示目標橫向加速度指令的具體取值,且滿足{m(t)∈M=[m1,m2,···,m|M|]},其中M為目標運動模式集、|M|為模型集的勢,w(t) 為量化誤差,建模為零均值的高斯白噪聲,功率譜密度為sw.
不失一般性,我們假定在 [0,tf]內目標僅發生一次模式切換.用tsw表示模式切換時刻,m1,m2分別表示模式切換前后目標的運動模式量,則m(t) 可表示為

其中,u(t) 為階躍函數,定義為

將式(10)中的ue代入式(4),可以得到

假定系統的時間采樣間隔為T且在每一個T內彈目的橫向加速度指令保持恒定,容易得到與式(13)等價的離散模型為

其中,


假定雷達導引頭測量每一時刻彈目的相對位置和導彈自身的加速度,則系統的觀測方程可以寫成[20]

圖2 給出了一種典型的基于邏輯的IEG 系統架構[8,17-19].在該制導系統中,通過引入一個獨立的模式決策器用于估計目標當前的運動模式(即目標橫向加速度指令),并為估計器和導引律提供目標的運動模式信息.這種系統架構的優勢可從以下兩方面進行理解.一方面,模式決策器的輸出可以輔助估計器選擇合適的的動態模型;當目標發生機動后,估計器能夠根據目標的運動模式信息快速切換至正確的模型.另一方面,模式決策器的輸出可以輔助制導律單元選擇合適的導引律.例如,當目標當前的運動模式量取值很小時(即|v|很小),對應的目標橫向加速度很小,此時可選用DGL/0 導引律,因為其計算效率更高;若目標當前的運動模式量取值較大(即|v|很大),此時目標加速度不能直接忽略,可將導引律切換至DGL/1 以保證更高的攔截精度;此外,如果模式決策器能夠提供目標運動模式的符號或方向,可根據這一信息進一步縮小目標加速度的可達集[21].本節將基于該制導系統架構推導目標存在運動模式切換時ZEM 估計誤差的分布,在此基礎上進一步分析模式決策延遲對系統制導精度的影響.

圖2 一個典型的基于邏輯的IEG 制導系統框架[18]Fig.2 A typical logic-based IEG guidance system frame[18]
對式(11)進行離散化處理后,目標加速度指令滿足

其中,ksw表示模式切換離散時刻

將式(22)代入式(14),可以得出離散系統的動態方程滿足

記模式決策器的時間延遲步長為j,則離散系統目標模式切換以及對應模式決策器的輸出可用圖3 表示.從圖3 容易得出估計器的動態模型滿足

圖3 目標模式切換和模式決策器輸出示意圖Fig.3 Diagram of target's mode switch and mode decision-maker's outputs

由式(24)和式(21)可以看出,系統的狀態方程和測量方程具有線性形式.因此,選用線性Kalman 濾波器作為最優估計器.下面根據目標模式切換時間、模式決策器延遲和攔截終止時刻的關系分三種情形分別討論ZEM 估計誤差的分布.
情形1.ksw≥kf.在這種情形下,目標的橫向加速度指令在整個末制導期間始終為m1,估計器使用的模型不存在失配.此時系統的狀態方程為

從式(25)容易看出估計器的濾波方程為

其中,Kk+1表示tk+1時刻的離散Kalman 增益矩陣,滿足



由于 E{ωk}=0 和 E{vk}=0,則狀態估計誤差的均值(記作ξk)滿足

且狀態估計誤差的協方差矩陣(記作 Σk)具有如下的迭代形式

情形 2.ksw<kf≤ksw+j.這里需要分兩種情況分別討論.
1)k∈[0,ksw).此時狀態估計誤差的均值和協方差分別同式(32)和式(33).
2)k∈[ksw,kf].目標的運動模式發生了切換,此時系統的動態方程滿足

估計器的濾波方程為式(27),因為導彈仍然認為目標的運動模式為m1,即在此期間內系統存在模式失配.根據狀態估計誤差的定義,x~k滿足

容易得出狀態估計誤差的均值為

協方差矩陣的遞歸形式與式(33)相同.式(36)中的前一項描述了起始狀態估計誤差的影響,而后一項則度量了模式失配的影響.
情形 3.ksw+j <kf.類似地,需要分三種情況分別討論.
1)k∈[0,ksw).在此區間內,目標運動模式未發生改變,因此狀態估計誤差的均值由式(32)確定,協方差矩陣由式(33)確定.
2)k∈[ksw,ksw+j).在此區間內,目標的運動模式發生切換但模式決策器未檢測對應的改變,系統存在模式失配.狀態估計誤差的均值和協方差分別滿足式(36)和式(33).
3)k∈[ksw+j,kf].在此區間內,目標的運動模式由m1切換至m2,并且模式決策器已經正確檢測出目標的運動模式.因此,系統的狀態方程滿足式(34),而濾波方程為

由式(37)和式(34)容易得到狀態估計誤差均值將由式(32) 確定,誤差協方差矩陣由式(33)確定.
定義ZEM 的估計誤差為估計的ZEM 值與系統真實的ZEM 值之差,即


綜上所述,每一時刻的ZEM 估計誤差均服從有偏的高斯分布,均值為μk, 方差為.當目標的運動模式和估計器執行的模式匹配時(即模式切換前和模式正確匹配后),ZEM 估計誤差的均值滿足如下的迭代方程

由前文分析可知,每一時刻的ZEM 估計誤差均服從均值為μk、方差為的高斯分布,即受基于跟蹤濾波器殘差進行機動檢測理論的啟發,構造如下的中心加權的檢驗統計量

不考慮系統的起始狀態估計誤差,當目標運動模式不發生切換時,此時,服從自由度為1 的χ2分布,即相反,當目標運動模式改變后,ZEM 的誤差隨著模式決策延遲的增大逐漸增大,對應的取值增大;而當誤差增大到一定程度后的條件將不滿足,此時認為系統的模式決策延遲不可接受.因此,在給定系統容許的虛警概率后,根據上述的一致性約束條件可計算得出MAMDD.
下面通過一個典型的TBM 攔截場景介紹MAMDD 的具體求解過程,仿真參數見表2[11,17-20].系統可容許的虛警率α設定為0.05,查表可知3.84.評判標準如下:當ZEM 估計誤差位于系統容許的誤差范圍內,對應的模式決策延遲是制導系統可接受的;反之,則認為該模式決策延遲超出了系統可容許的范圍之內.圖4 給出了tsw=2.0 s、Δm=10 g 時的變化.如圖所示,目標模式切換前(tsw≤2.0 s,即tgo≥1.03 s),ZEM 估計誤差的均值為零,對應的取值為零,因此始終位于置信邊界范圍內.目標模式切換后(tsw>2.0 s,即tgo<1.03 s),由于系統模式決策延遲的存在,ZEM 估計誤差增大,也隨之增大.經過一段時間后,的取值超出系統給定的置信邊界此時,我們認為ZEM 的估計誤差過大,估計的ZEM 將不可靠,它會誤導導彈生成錯誤的制導指令從而導致系統的制導性能下降.在這種思路下,

圖4 tsw=2.0 s和 Δ m=10 g下的Fig.4 under tsw=2.0 sand Δm=10 g

表2 仿真參數Table 2 Simulation parameters
初始化.初始化攔截場景和估計器參數,目標模式切換時刻tsw,模式變化量, Δm=m2-m1和系統可接受虛警率α.
步驟 1.根據式(42)計算tk時刻ZEM 估計誤差的均值.
步驟 2.根據式(40)計算tk時刻ZEM 估計誤差的方差.
步驟 3.根據式(43)計算tk時刻檢驗統計量.
步驟 4.判斷tk時刻的大小,若當前時刻滿足,則 MAMDD=tk-tsw;否則,回到步驟1.
圖5 給出了tsw=1.0 s(對應tgo=2.03 s)、Δm分別取10 g 和20 g 兩種情形下的取值.仿真過程中,我們將模式決策延遲設置為無窮大.如圖5所示,如果目標在同一時刻進行模式切換,機動的強度越小,對應的取值越小.因為在該情形下,Δm取值越小,ZEM 估計誤差的均值也越小,對應的值就越小.圖6 給出了 Δm=20 g、tsw分別取1.0 s和2.0 s (對應tgo=1.03 s)兩種情形下的取值.可以看出,目標機動時刻越晚,對應的取值越小.由前面的分析可知,目標模式切換不影響ZEM 估計誤差的方差,因此在 Δm相同情形下,在每一時刻的取值相等.目標機動越早(紅色虛線),由于模式決策延遲無窮大,每一時刻ZEM 估計誤差的取值越大,對應的值也就越大.

圖5 tsw=1.0 s時不同機動幅度下的Fig.5 under different maneuver magnitude for tsw=1.0 s

圖6 Δm=20 g時不同機動時刻下的Fig.6 under different maneuver time for Δm=20 g
圖7 給出了 Δm分別取5 g,10 g,15 g,20 g,30 g 時系統MAMDD 與目標模式切換時刻的關系.在仿真實驗中,我們假定攔截器的參數始終保持不變,僅改變目標的機動參數.如圖7 所示,MAMDD 隨著模式切換時刻呈現先減小后增大并最終達到無窮大的變化趨勢,這與文獻[18]給出的結果是一致的.可以看出,當目標機動時刻較早時(即對應tgo取值較大),ZEM 估計誤差的方差取值較大,的取值相對較小(見式(43)).此時,與置信邊界相交的時間較長,這意味著MAMDD 的取值越大,即系統對模式決策器的要求相對寬松.當目標機動時刻越來越接近攔截終止時刻(即tgo取值減小)時,ZEM 估計誤差的均值和方差均逐漸減小,對應的取值也隨著時間逐漸減小.當滿足<3.84 時,ZEM 估計誤差對攔截精度的影響可以忽略.如果目標在此時機動將無益于逃逸,MAMDD 的取值趨向于無窮大,系統對模式辨識器的性能不作要求.此外,對比不同機動幅度下MAMDD 的曲線可以看出,當 Δm的取值較小時,對應的MAMDD 的值越大.這表明,對于弱機動類型目標,攔截系統對于模式決策器的要求也相對寬松.

圖7 不同 Δ m 條件下MAMDD 與模式切換時刻Fig.7 MAMDD with mode switch time for different Δm
表3 對比了5 組不同機動幅度下分別采用捕獲區邊界作為ZEM 誤差邊界[18]和利用本文一致性約束條件作為ZEM 誤差邊界的MAMDD.對比5 組數據結果可以看出,在攔截周期的前段選用一致性約束條件系統對模式決策器的性能要求更為嚴格;而在攔截周期的后半段選用捕獲區邊界作為約束條件系統對模式決策器的要求更加苛刻.具體來看,當tsw<2.2 s(即tgo=0.83 s)時,采用一致性約束條件得出的MAMDD 小于采用捕獲區邊界的MAMDD.當tsw≥2.2 s,采用捕獲區約束條件獲取的MAMDD 大于一致性約束條件下的MAMDD (注意當tsw=2.2 s、Δm取20 g 和30 g 時,兩種方法求得的MAMDD 可看作近似相等).因此,為對模式決策器提出更為嚴格的要求以確保系統的攔截精度,在末制導前段可以采納一致性約束條件,而在末制導后段應選用更為嚴格的捕獲區邊界作為ZEM 估計誤差的約束條件.

表3 兩種方法MAMDD 對比Table 3 Comparison of MAMDD with two methods
本文在基于邏輯的集成估計導引的制導系統框架下,針對末制導攔截場景推導了離散時間ZEM估計誤差模型;然后提出了一種滿足一致性約束條件的系統最大可容許模式決策延遲的數值計算方法,可為模式決策器的設計提供性能參考.實驗結果表明,為確保系統的攔截精度,在末制導前段可選用一致性約束作為ZEM 估計誤差的限制條件,在后段應選用捕獲區邊界的限制條件.開展目標運動模式辨識技術研究是下一步的主要工作.