毛 寧,范軍芳,李 斌
(1.北京信息科技大學 自動化學院, 北京 100192;2.現代測控技術教育部重點實驗室(北京信息科技大學), 北京 100192;3.北京理工大學 宇航學院, 北京 100081; 4.北京理工大學 無人機自主控制技術北京市重點實驗室, 北京 100081)
一般來說,制導律主要是使導彈能根據當前其相對于目標運動的信息決定如何改變當前的速度和方向,控制導彈以最少或零脫靶量攻擊指定目標。在過去的幾十年中,比例導引制導律由于其易于實現和對非機動目標的有效性而得到了廣泛的研究和應用[1-3]。近年來,多飛行器協同制導吸引了越來越多的關注,多個飛行器通過空間以及時間上的相互配合能夠實現更高的作戰效率同時實現更高的性價比。同時針對具有良好防御能力的重點目標來說,利用群體優勢對敵防御體系和目標進行多層次、全方位的打擊,實現突防能力的整體提升[4]。
一個實現齊射攻擊的有效方法是攻擊時間控制,通過對攻擊時間的控制可實現多個導彈同時擊中目標,從而提高打擊效果[5]。攻擊時間控制的制導律設計實際上是一種以最終攻擊時間誤差為跟蹤誤差的跟蹤問題。在定義了攻擊時間誤差后,許多系統控制理論,如帶誤差反饋的偏置比例導引、滑模控制、李雅普諾夫函數等,都可以用來使跟蹤誤差為零[6-8]。文獻[9]提出了基于傳統最優控制理論的攻擊時間控制制導律,證明了該制導律的封閉解是經典比例導引制導律與攻擊時間誤差反饋項的組合。在文獻[9]的基礎上,文獻[10]研究了攻擊角度和攻擊時間制導律,文獻[11]提出了一種針對平面內的靜止目標的導引系數,只根據導彈的彈目距離和相對剩余時間誤差(其余導彈剩余時間均值與導彈剩余時間之差)來調整,使得導彈集群剩余時間方差為零的變系數比例導引協同制導方法。文獻[12]利用李雅普諾夫函數法,對二維和三維情形提出了一種新的攻擊時間制導律,但當初始航向誤差等于零時,該制導律是不可行的。
雖然上述內容被證明在多枚導彈同時攻擊時是可行的,攻擊時間控制通常需要剩余飛行時間信息。文獻[13-14]研究表明:在大的初始航向誤差下,傳統的剩余飛行時間估計方法不夠準確。為了解決這個問題,利用比例導引制導律的性質和概念,在無剩余飛行時間信息時,相等的路徑長度能保證同時攻擊的精度。
本文研究基于二階連續時間多智能體系統一致性理論,利用兩段式制導實現多彈一致的協同制導策略。該方法不需要提前裝定協同時間和剩余飛行時間信息,避免了剩余飛行時間估計誤差對協同時間和制導精度的影響。所提出的一種兩階段制導律來實現多枚導彈同時攻擊的方法中,在第一階段,采用線性分布一致性控制律為后段生成有利的初始條件,在第二階段,所有導彈由具有相同導航比的比例導引制導律控制。提出的方法只需要兩個額外的量測量:一個是導彈目標相對距離,另一個是導彈航向誤差或目標視角,這些信號可以直接從主動雷達導引頭獲得。由于不需要剩余飛行時間信息,在實際應用中,特別是對于較大的初始航向誤差,本文提出的制導律更加有效。
建立彈目相對運動的三維數學模型,圖1為慣性坐標系下導彈攻擊靜止目標的三維示意圖。其中,M、T分別表示導彈和目標,VM、R和σ分別為導彈速度、彈目相對距離和導彈速度方向誤差角,θλ和ψλ分別為視線高低角和視線方位角,θM和ψM分別為速度矢量相對視線系的高低角和方位角。當導彈攻角很小時,θM和ψM近似為體視線角,可由導引頭的框架角間接得到。

圖1 彈目運動關系三維示意圖
彈目相對運動三維數學模型的方程為
(1)

速度方向誤差角
σ=arccos(cosθMcosψM)
(2)
導彈在比例導引制導律下的過載指令為
(3)
其中,N為導航比。
當導彈初始彈目距離R(0)、初始速度方向誤差角σ(0)和導航比N相同時,采用比例導引制導律的彈道形狀一致。
證明:對式(2)求導可得速度方向誤差角變化率
(4)
由于σ∈[0,π),式(4)簡化為
(5)
式(1)中的第一式除以式(5)得:
(6)
解式(6)得:
(7)
由式(7)可以看出,比例導引制導律的彈道特性與當導彈初始彈目距離R(0)、初始速度方向誤差角σ(0)和導航比N有關。
將式(7)代入式(5)得:
(8)
由式(8)可得,為了使速度方向誤差角收斂,應選擇導航比N≥2。
引理1:設第i枚導彈的速度為VMi,導彈和目標的相對距離為Ri,當導彈初始剩余飛行時間tgoi(0)、初始速度方向誤差角σi(0)和導航比N相同時,采用比例導引的彈道形狀一致,剩余飛行時間相同。
證明:將式(7)兩邊同時除以導彈速度VMi得:
(9)
由式(9)可以看出,引理成立。
用無向圖ζ(A)={v,ε,A}來代表多導彈之間的通訊拓撲,v和ε分別表示圖的節點和連接節點的邊,vi代表第i枚導彈。矩陣A=[aij]∈Rn×n為圖的加權鄰接矩陣,若導彈i和導彈j可以相互通訊,則(vi,vj)∈ε?aij>0,反之則aij=0,假設節點之間沒有連通性,即aii=0,i=1,2,…,n,由于ζ(A)是無向圖,有aij=aji。
引理2[15]:定義圖ζ(A)的Laplacian矩陣定義為L(A)=[lij]∈Rn×n,其中

(10)
L(A)有以下性質:
1) 0是L(A)的一個特征值,1=[1,1,…,1]T∈Rn是對應的特征向量;

3)L(A)的第二小特征值表示為λ2(L(A)),如果圖是連通的,則它大于0;
一致性算法的收斂性與通信網絡拓撲結構圖的Laplacian矩陣和它的譜性質有密切的關系。對于一個給定無向圖ζ(A)={v,ε,A},當且僅當該圖連通時,其Laplacian矩陣的秩滿足rank(L(A))=n-1,其特征值:0=λ1<λ2≤λ3≤…≤λm=λmax。λ2(L(A))表示圖的連通度,決定了一致性算法的收斂速度,λ2(L(A))越大,系統收斂到一致的速度越快。
考慮由m個二階智能體組成的多智能體系統。每個智能體的動態方程為
(11)
其中,ηi(t)和ξi(t)是第i個智能體的狀態;ui(t)為控制輸入。
如果存在分布式控制輸入ui(t),i=1,2,…,m,使得對任意初始條件ηi(0)和ξi(0),多智能體系統(11)的狀態滿足
(12)
其中,i≠j,i∈v,j∈v。
則稱多智能體系統式(11)在控制輸入ui(t)作用下獲得漸近期望一致性。
經典的標準一致性算法:

(13)
其中,β>0,c>0,α=cβ。
為了提高系統的收斂速度,提出一種快速一致性算法:

c(ξi-ξd)
(14)

對于一個穩定的閉環控制系統而言,系統的閉環極點離虛軸越遠,系統的收斂速度越快。
定理1:具有m個智能體的多智能體系統,在其通信拓撲結構圖無向且連通時,當時間區間的長度κ∈(0,κ*)時,系統式(11)在快速一致性算法式(14)下狀態收斂到一致且滿足式(12),系統最大時間區間的長度κ*滿足式(15)。

(15)
定理2:當時間區間的長度κ∈(0,κτ)時,相比系統在標準一致性算法式(13)下,系統的狀態在快速一致性算法式(14)下收斂到一致的速度更快,κτ滿足式(16)。
(16)
當時間區間長度κ∈(0,κτ)時,在標準一致性算法和快速一致性算法下的系統除了有相同的1個s=0和m個s=-c的極點外,在快速一致性算法下系統的剩余閉環極點在標準一致性算法下系統的剩余閉環極點的左邊。系統的狀態收斂到一致的速度與選取的過去平均狀態信息的時間區間有關。
多智能體系統協同控制中的通訊延遲是實際存在的,會對系統的穩定性造成影響,對系統的最大允許延遲進行分析。
考慮不變延遲時的快速一致性算法:

c(ξi-ξd)
(17)

具有m個智能體的多智能體系統,在其通信拓撲結構圖無向且連通時,系統允許的延遲為τ∈(0,τ*),τ*為系統允許的最大延遲并滿足式(18)。

(18)
證明:考慮延遲時的快速一致性算法式(17)可寫為

c(ξi-ξd)
(19)
系統在考慮延遲時的快速一致性算法式(19)下的閉環極點滿足方程

(20)
為了保證系統狀態的收斂性,式(20)的根需要全部在左半平面。
等效為式(21)的根全部在左半平面。
(21)
其中i=1,2,3,…,m。
化簡式(21)得
(22)
即
(23)
由于c>0,可知式(23)有m個極點在s=-c處,有1個極點在s=0處。
式(23)的第二式變為
(24)
下面計算保證式(24)有一根在虛軸上的最大延遲。
將s=jω,e-jωτ=cos(ωτ)-jsin(ωτ),e-jω(κ+τ)=cos(ω(κ+τ))-jsin(ω(κ+τ))代入式(24),有
jsin(ω(κ+τ))]=0
(25)
即

(26)
利用三角函數的和差化積公式

(27)
式(26)可寫為

(28)
由式(28)的第二式解得

(29)

-ω2=0
(30)

(31)


(32)
此時,

(33)
將式(33)代入式(32)有
(34)
化簡得

(35)


(36)
此時,

(37)
式(37)代入式(36)有

(38)
化簡得

(39)
系統允許的最大延遲τ*滿足
(40)
由式(40)看出系統的最大允許延遲與系統通信網絡拓撲結構圖的Laplacian矩陣的特征值和選取的過去狀態的時間區間有關。當系統的延遲τ∈(0,τ*)時,存在不變延遲系統的狀態在快速一致性算法下收斂到一致的速度更快,原因是除了有相同的1個s=0和m個s=-c的極點外,在快速一致性算法下系統的剩余閉環極點在標準一致性算法下系統的剩余閉環極點的左邊。
對m枚導彈攻擊同一靜止目標的情況,將飛行彈道分為兩段,第一段制導段控制剩余飛行時間和目標視角趨于一致,當剩余飛行時間和目標視角滿足要求后,第二段制導段切換為相同的比例導引制導律。整個飛行過程不需要準確的剩余飛行時間信息。
利用二階連續時間系統一致性理論,定義協調變量

(41)
其中,i=1,2,…,m表示導彈編號。

(42)
為了保證在中制導段所有導彈的剩余飛行時間和目標視角趨于一致,第一段控制律設計為

(43)
將式(43)代入式(42)有
(44)
當名義剩余飛行時間和目標視角一致后,切換為比例導引制導律

(45)
綜上,分段協同制導律可表示為


(46)
其中ε1和ε2是足夠小的正數。
通過仿真驗證三維分段協同制導律的性能,考慮由3枚導彈組成的系統,假定各導彈只與相鄰導彈通信,如圖2所示。

圖2 3枚導彈協同攻擊通訊拓撲結構圖
對快速一致性算法和考慮延遲的快速一致性算法進行仿真驗證。
通信網絡拓撲結構圖的Laplacian矩陣L(A)為

(47)
矩陣L(A)的特征值為:λ1=0,λ2=1,λ3=3。
導彈的初始參數由表1所示,期望的狀態ξd=-0.5,中制導段控制律參數選取β=1,c=0.25,α=cβ=0.25末制導段比例導引制導律導航比N=4,導彈最大可用加速度amax=100 m/s2。

表1 導彈仿真參數
系統在標準一致性算法下的仿真結果如圖3所示,分別給出彈目距離、彈道曲線、協調變量變化曲線和加速度指令曲線。仿真結果表明,3枚導彈在兩段式協同制導律下同時命中目標,協同時間約為57.0 s。由圖3(c)、圖3(d)可看出:中制導段初始需要較大的加速度指令控制各導彈的名義剩余飛行時間和目標視角趨于一致,在28.3 s滿足切換條件|ηi-ηj|≤ε1,|ξi-ξj|≤ε2后,進入末制導段,各導彈在相同的三維比例導引制導律下同時到達目標。

圖3 標準一致性算法下協同攻擊的仿真曲線
對系統在快速一致性算法下的情況進行仿真,根據定理2可求得快速一致性算法下的時間區間長度κτ=1.05 s,仿真結果如圖4所示。仿真結果表明:3枚導彈同時達到時間約為54.7 s。由圖4(c)、圖4(d)可看出,在快速一致性算法下各導彈名義剩余飛行時間和目標視角趨于一致的速度加快,在23.5 s 就滿足了切換條件,然后進入末制導段切換為三維比例導引制導律,協同時間與標準一致性算法下的情況相比也縮短。
對考慮系統延遲的情況進行仿真,快速一致性算法的時間區間長度κτ=1.05 s,根據式(18)可求得系統允許的最大延遲τ*=0.48 s,分別對延遲τ*=0.4 s和τ*=0.49 s的兩種情況進行仿真,仿真結果如圖5和圖6所示。由協調變量變化曲線和加速度指令曲線可看出,當系統延遲超過允許的最大延遲時,系統失穩。

圖4 快速一致性算法下協同攻擊的仿真曲線

圖5 快速一致性算法下τ*=0.4 s時協同攻擊的仿真曲線

圖6 快速一致性算法下τ*=0.49 s時協同攻擊的曲線
研究通過控制導彈的狀態達到一致以實現協同的分段協同制導律,基于一致性理論提出一種兩段式協同制導策略,同時為了加快狀態趨于一致的速度,設計了一種快速一致性算法,給出了系統在快速一致性算法下的最大允許延遲。將快速一致性算法應用到協同制導中,通過與標準一致性算法的仿真對比,發現快速一致性算法下的各導彈狀態趨于一致的時間縮短,彈間需要通訊的時間減少,使各導彈更快的進入末制導段,增強了抗敵方電子干擾的能力。