張利民 李 茜,2 李偉勛
1.中原工學院 電子信息學院, 鄭州 451191
2.天津工業大學 機械工程學院,天津 300387
3.天津職業技術師范大學 理學院,天津 300222
巡航導彈攻擊方向和時間的協調對于提高突防概率有著特殊意義[1-3]。近幾年,同時考慮攻擊角度和時間的制導規律設計成為研究熱點[4-6]。例如,2016年,廖沫等[7]分析了戰術導彈協同作戰模式和關鍵技術,重點針對導彈協同任務規劃技術進行分析和研究,提出三級結構的導彈協同任務規劃體系,并基于V圖和A*算法進行了優化設計。2018年,李文等[8]基于李雅普諾夫方法推導了帶指定攻擊角度的時間控制導引律,使導彈按指定落角和落向以指定攻擊時間打擊目標,并借助Dubins最短路徑,彈道軌跡邊界分析了多約束條件下可指定攻擊時間的取值范圍。2019年,吳放等[9]為解決速度變化對導彈攻擊時間和攻擊角度的控制問題,提出一種基于成型理論和非奇異終端滑模理論的控制制導律,并證明了其Lyapunov穩定性。2020年,許志等[10]針對導彈速度不可控且變化規律未知條件下時間與角度控制的問題,提出了一種分段解析迭代的導彈速度預測及在線航程修正方法。
PSO(Particle Swarm Optimization)是一種基于群智能的全局優化方法。算法根據粒子在解空間中所處的情況進行搜索,沒有復雜的尋優操作,易實現,且需要調節的參數少,收斂速度快,已廣泛應用于各種優化問題[11-15]。
本文提出以Gauss偽譜法(Gauss pseudospectral method,GPM)思想基礎,直接基于非線性導引運動學模型,將控制時域離散化為有限時間段,在考慮過程約束和禁飛區約束等約束條件下,將具有指定時間和終端入射角的反艦導彈最優航跡規劃最優控制問題轉化為一個PSO能求解的非線性規劃問題,然后采用混沌PSO算法求解該問題,另外,本文還對傳統過載目標函數進行了改進,降低了末段控制需求。
導彈-目標的相對運動關系如圖1所示。

圖1 導彈-目標相對位置圖
本文假定所攻擊的目標靜止,導彈速度為固定值V,選擇坐標系XOY為地面坐標系的水平面。
圖1中,(Xm,Ym)和γm表示導彈當前的位置和航向角,A表示其法相加速度, 始終與導彈速度V垂直來改變其方向,(Xt,Yt)和γt表示攻擊的目標位置和航向角。根據圖1,導彈-目標的質點模型課表示為[16]:
(1)
式中,(x,y)為導彈的位置,t為時間,γ為導彈航向角,A為導彈法向加速度,u為導彈法向歸一化過載。
PSO算法首先初始化為一群隨機粒子,再迭代尋找其最優解。在迭代過程中,每一個粒子跟蹤兩個極值并更新自己,其中一個極值是粒子本身所找到的最優解,即個體極值;另一個是種群當前所尋到的最優解,即全局極值[11-13]。
但是PSO優化易陷入局部極值點,可以利用混沌搜索,跳出局部最優[17-18]。其基本思想是:采用混沌序列對粒子的速度和位置進行初始化,此方法不僅不改變粒子群的隨機性,還能提高種群的多樣性和粒子的遍歷性;以當前群最優解為基礎產生混沌序列,并用序列中的最優位置代替粒子群中的一個位置,產生局部最優解的鄰域點,這樣有助于惰性粒子逃離局部最優解。
在混沌搜索的算法中,為了保持種群的多樣性,加強搜索的分散性,在保留一定數量最優微粒的同時,算法根據群體的最佳位置動態收縮搜索區域,并在搜索區域內隨機產生微粒來代替性能較差的微粒。
由于導彈的航跡優化屬于最優控制問題,需將其轉換為PSO能求解的非線性規劃問題。借鑒GPM的思想,本文將最優控制的狀態變量和控制變量在一系列Gauss點上離散,并以這些離散點為節點構造Lagrange插值多項式對其進行近似。通過對全局插值多項式求導,近似狀態變量對時間的導數,將微分方程約束轉換為一組代數約束,性能指標中的積分項由Gauss積分計算。經上述變換,可將最優控制問題轉化為一系列具有代數約束的參數優化問題,即非線性規劃問題(NLP)[19-20]。再利用混沌PSO算法對其進行求解。
考慮動力學方程

(2)
其中,x(t)∈Rn和u(t)∈Rm分別為狀態量和控制量,函數f:Rn×Rm×R→Rn。傳統的最優控制問題可以寫為如下的標準形式:

(3)
滿足邊界等式約束
φ(x(t0),t0,x(tf),tf)=0
(4)
和過程不等式約束
C(x(t),u(t),t0,tf)≤0
(5)
其中,φ:Rn×R×Rn×R→Rq和C:Rn→Rr。
2.3.1 時域變換
采用GPM需要將航跡規劃問題的時間區間[t0,tf]轉換到[-1,1]:
(6)
2.3.2 全局插值多項式近似狀態與控制變量
(7)
以及τ0=-1作為節點構成K+1階Lagrange插值多項式,并以此為基函數構造狀態變量的近似表達式,即:
(8)
其中,Lagrange插值基函數為
(9)
且使節點處的近似狀態與實際狀態相等,即Xi=X(τi)=x(τi)。同樣,對于控制變量有
u(τk)=U(τk),(k=1,…,K)
(10)
即:
(11)
2.3.3 動力學微分方程約束
對式(8)求節點上微分,有
(12)
其中,微分矩陣可以離線確定,即:
(13)
從而動力學微分方程約束轉換為代數約束:
(14)
其中,k= 1,…,K。
2.3.4 終端狀態約束
狀態變量的近似表達式未包括終端時刻節點,終端狀態應滿足動力學方程約束:

(15)
將式(11)離散化并用Gauss積分近似,可得:
X(τf)=X(τ0)+
(16)
其中,ωk為Gauss加權系數。
2.3.5 性能指標函數的近似
將傳統的Bolza型性能指標函數中的積分項用Gauss積分來近似,得到近似性能指標函數[18]:
(17)
其中,Φ(X0,t0,Xf,tf).為邊值條件,ωk同前。
根據上述數學變換,最優控制問題可轉換為:求離散節點上的狀態Xi,i=0,…,K和控制變量Uk,k= 1,…,K,以及初末時刻t0、tf(若未給定),使得性能指標(17)最小,并滿足終端狀態約束(16),以及原最優控制問題的邊界條件(4)和過程約束(5)
從而將原最優控制問題轉化成非線性規劃問題(NLP),即:
minF(y),y∈RM
s.t.gj(y)≥0,j=1,2,…,p
hj(y)=0,j=1,2,…,l
(18)
其中,y為包含狀態變量、控制變量和端點時間的設計變量,p為不等式約束的個數,l為等式約束的個數。
1)初始邊界條件約束
x(t0)=x0,y(t0)=y0,γ(t0)=γ0
(19)
2)終端條件約束
終端狀態約束條件為:
x(tf)=xf,y(tf)=yf,γ(tf)=γf
(20)
3)控制約束
導彈的法向加速度要滿足一定的約束為:
-Amax≤A≤Amax,Amax>0
(21)
4)戰場禁飛區約束
戰場禁飛區通常包括地形、敵方火力等,本文以圓盤表示為:
(x(t)-xq)2+(y(t)-yq)2>Rq,q=1,2,…,N
(22)
式中,(xq,yq)和Rq分別表示第q個禁飛區的中心和半徑,N表示禁飛區個數。
按照多導彈協同作戰的性質,導彈的攻擊路徑規劃問題要滿足的要求主要是使能量消耗最小。已發表的文獻中一般所采用的過載最小性能指標為:
(23)
式中,u為式(1)中導彈法向歸一化過載。為了保證末段軌跡的平直,降低控制需求,本文在(23)中引入一個時間加權函數f1(t),其值隨時間增大而增大,以保證導彈末端平直:
(24)
其中,
(25)
由于初始邊界條件約束和終端條件約束,分別在軌跡的初始和末端起重要作用,因此也引入一個性能指標:
(26)
其中,
(27)
(28)
且,f2(t)和f3(t)為時變加權函數,f2(t)隨著時間增大逐漸減小,即當軌跡離初始點越遠其值越小,而f3(t)逐漸增大,即當軌跡離目標越近其值越大。
這里取
(29)
(30)
對于變量值域約束,混沌粒子群算法中有對其進行處理,所以此處可以忽略其性能指標函數的影響。
當有禁飛區約束時,針對每個禁飛區的約束,引入一個性能指標,

(31)
與之對應的距離有關的變加權函數fq(x,y),q=1,…,N,當前規劃位置距離禁飛區越近其值越大,否則越小,這里取
(32)
這樣,我們得到一個最終的指標函數
J=J1+J2+J3
(33)
本文所從事的研究是針對地面固定目標情形開展的。對于面移動目標,可以采用導彈飛行中多次規劃的滾動時域方法,也是我們后續的工作,超出了本文的研究范疇。
導彈協同攻擊靜止目標的最優航跡規劃問題可描述為:在滿足動力學微分方程約束(1)、邊界條件 (19)和(20)、過程不等式約束(21)和(22)下,尋求最優控制量u(t),使性能指標(33)最小。
仿真1:無禁飛區仿真
假設飛行空域無禁飛區。利用CLSPSO對4枚導彈協同攻擊原點處靜止目標進行航跡優化。法向加速度最大值Amax=45m/s2,各參數設置如表1所示。仿真結果如圖2~圖4所示。

表1 仿真參數設置

圖2 無禁飛區三導彈協同攻擊航跡圖

圖3 無禁飛區三導彈協同攻擊航向角曲線

圖4 無禁飛區三導彈協同攻擊法向加速度曲線
圖2中可看出,4枚導彈在飛行初期各自按使過載最小的圓弧形軌跡飛行,以消耗所規定的飛行時間,當接近目標點時,均以設計好的入射角度飛向目標,其末端角度如圖3所示,末端控制量如圖4所示。可以看出導彈協同攻擊的位置、角度與時間都精確滿足要求,而且對應于性能指標J1的要求,末段彈道平直,并使導彈后期飛行軌跡平滑,對應于性能指標J2的要求,末段過載需求降低,并能精確地打擊目標。另外,仿真條件為:Matlab2016,惠普ProOne 400,精度要求小于等于10-3m,GPM結點至少50個時,規劃出一條最優航跡所需時間為0.809017s,如果采用C語言實現,效率可以提高2個數量級以上[14],優化時間短。
仿真2:有禁飛區仿真
假設仿真1中的航跡上有四個禁飛區(單位:m):
(1)(x(t)+ 7500)2+(y(t)+ 2000)2≤10002
(2)(x(t)+ 6000)2+(y(t)-6000)2≤8002
(3)(x(t)+ 2500)2+(y(t)-2500)2≤8002
(4)(x(t)+4000)2+(y(t)+6000)2≤4802
4個圓盤如圖5中所示。引入這些約束作為過程約束,得到的仿真結果如圖6~圖8所示。

圖5 禁飛區位置圖

圖6 導彈飛行航跡圖

圖7 航向角曲線

圖8 法向加速度曲線
從圖7可以看出,所規劃的最優航跡在經過禁飛區時均有一個明顯的航向角變化過程,由于約束和性能指標J3的存在,可成功地繞過禁飛區。而對于導彈3和導彈4,由于初始飛行方向和過載最大值的影響,其在繞過禁飛區前不能有較大的轉彎,因此在尋找最優航跡時,最終找到一條離禁飛區比較近的最優飛行航跡;而對應于性能指標J1的要求,圖6中4枚導彈的末段飛行彈道依然平直;對應于性能指標J2的要求,從圖8可以看出末端過載需求仍然相對比較低。另外,雖然有禁飛區的約束影響,但飛行時間沒有變化,而且同條件下的優化時間顯示了這種算法的魯棒性。
根據GPM的基本原理,以導引非線性模型作為動力學方程,充分考慮了導彈的性能約束和戰場環境約束,研究了基于混沌粒子群算法的多導彈指定入射角和時間條件下協同攻擊目標的航跡優化設計。通過引進目標加權函數,保證了末段彈道的平直。仿真結果表明,本方法所設計出的航跡能安全地繞過禁飛區,末段彈道特性理想,優化時間短,在工程上具有一定的應用參考價值。