黃 偉, 徐建城, 吳華興, 李俊兵
(1. 空軍工程大學(xué)航空航天工程學(xué)院, 陜西 西安 710038; 2. 西北工業(yè)大學(xué)電子信息學(xué)院, 陜西 西安 710072)
導(dǎo)彈協(xié)同編隊(duì)是未來(lái)局部戰(zhàn)爭(zhēng)的主戰(zhàn)模式,各軍事強(qiáng)國(guó)都不遺余力的開展相關(guān)技術(shù)的研究工作[1-2],導(dǎo)彈編隊(duì)控制的主要任務(wù)是有效地生成和保持預(yù)定的編隊(duì)幾何形態(tài),韋常柱[3]等采用小擾動(dòng)線性化方法設(shè)計(jì)了導(dǎo)彈編隊(duì)保持控制器;穆曉敏[4]等建立了由編隊(duì)隊(duì)形控制及編隊(duì)離入隊(duì)管理等模塊組成的編隊(duì)控制系統(tǒng);周慧波[5]等將編隊(duì)控制問題轉(zhuǎn)化為跟蹤問題,所提出的制導(dǎo)律算法具有一定的魯棒性。以上成果主要基于單枚從彈與領(lǐng)彈的相對(duì)位置關(guān)系,未將導(dǎo)彈編隊(duì)作為整體考慮,各枚從彈控制算法的收斂時(shí)間存在較大差異,不適用于大規(guī)模導(dǎo)彈編隊(duì)的隊(duì)形控制。近些年來(lái),一致性算法[6-7]成為解決大規(guī)模編隊(duì)控制問題的有效方法,林志云[8]等基于相對(duì)坐標(biāo)系,應(yīng)用圖拉普拉斯方法建立了隊(duì)形控制一致性算法;文獻(xiàn)[9-10]提出基于二階運(yùn)動(dòng)學(xué)模型的飛行器編隊(duì)一致性算法,并將虛擬結(jié)構(gòu)法、領(lǐng)從法、行為法等標(biāo)準(zhǔn)化在一致性算法框架內(nèi)。然而,以上基于一致性理論的編隊(duì)控制算法在設(shè)計(jì)過程中均假設(shè)導(dǎo)彈自動(dòng)駕駛儀是非慣性系統(tǒng),無(wú)遲滯的響應(yīng)由制導(dǎo)系統(tǒng)生成的制導(dǎo)指令。實(shí)際中,外環(huán)制導(dǎo)回路生成的制導(dǎo)指令是通過內(nèi)環(huán)自動(dòng)駕駛儀實(shí)現(xiàn)的,受自動(dòng)駕駛儀動(dòng)態(tài)特性的影響[11-12],可能導(dǎo)致控制算法的發(fā)散,影響編隊(duì)閉環(huán)系統(tǒng)的穩(wěn)定性;其次,現(xiàn)有一致性算法中的參數(shù)僅限定了其取值范圍,未經(jīng)參數(shù)優(yōu)化過程,不能實(shí)現(xiàn)在某種性能指標(biāo)下的編隊(duì)最優(yōu)控制。
鑒于此,針對(duì)領(lǐng)從結(jié)構(gòu)導(dǎo)彈編隊(duì)隊(duì)形控制問題,提出一種基于參數(shù)優(yōu)化并考慮自動(dòng)駕駛儀動(dòng)態(tài)特性的一致性編隊(duì)控制算法。首先,將導(dǎo)彈自動(dòng)駕駛儀等效為一階慣性環(huán)節(jié),基于坐標(biāo)變換得到了制導(dǎo)指令與所需控制力的關(guān)系模型;其次,建立了導(dǎo)彈編隊(duì)一致性控制算法,構(gòu)建了編隊(duì)閉環(huán)制導(dǎo)控制系統(tǒng)方程,應(yīng)用代數(shù)圖論證明了閉環(huán)系統(tǒng)的穩(wěn)定性;最后,以編隊(duì)各成員位置和速度的累計(jì)誤差建立指標(biāo)泛函,基于最優(yōu)控制提出了算法中待定系數(shù)的優(yōu)化方法,從而進(jìn)一步提高了導(dǎo)彈編隊(duì)系統(tǒng)的性能。
為便于描述導(dǎo)彈編隊(duì)相對(duì)運(yùn)動(dòng)關(guān)系,選取地面某點(diǎn)為坐標(biāo)原點(diǎn)建立地理坐標(biāo)系(OXYZ)e,如圖1所示。導(dǎo)彈編隊(duì)由1枚領(lǐng)彈和2枚從彈組成。編隊(duì)過程中,要求各枚從彈在制導(dǎo)控制系統(tǒng)的作用下與領(lǐng)彈生成并保持既定的相對(duì)位置關(guān)系和速度關(guān)系。

圖1 導(dǎo)彈編隊(duì)示意Fig.1 Missile formation in 3D space
將導(dǎo)彈簡(jiǎn)化為質(zhì)點(diǎn),并僅考慮導(dǎo)彈的彈道傾角和彈道偏角,導(dǎo)彈所需的控制力矢量F=[FxFyFz]T定義在以導(dǎo)彈質(zhì)心為原點(diǎn)、以速度矢量方向?yàn)閄軸向的彈道坐標(biāo)系(OXYZ)m中,其分量分別為導(dǎo)彈軸向、俯仰方向和偏航方向的控制力。由此,導(dǎo)彈在三維空間中的運(yùn)動(dòng)可描述為
(1)


圖2 導(dǎo)彈制導(dǎo)控制系統(tǒng)Fig.2 Control system of missile guidance
如圖2所示,根據(jù)編隊(duì)指標(biāo)要求,假設(shè)控制器輸出的制導(dǎo)指令為Vd=[VexdVeydVezd]T,即地理坐標(biāo)系中3個(gè)軸向的理想速度,導(dǎo)彈控制系統(tǒng)響應(yīng)制導(dǎo)指令,計(jì)算所需的控制力矢量F,從而控制導(dǎo)彈的飛行狀態(tài)。總體設(shè)計(jì)階段,導(dǎo)彈自動(dòng)駕駛儀可以等效為一階慣性環(huán)節(jié),即
(2)
式中,V=[vxvyvz]T表示導(dǎo)彈在地理坐標(biāo)系中飛行速度矢量;τ為等效環(huán)節(jié)時(shí)間常數(shù);s為拉普拉斯算子。式(2)的微分方程形式為
(3)
式中,各項(xiàng)運(yùn)動(dòng)參數(shù)均定義在地理坐標(biāo)系下,而導(dǎo)彈控制力矢量F定義在彈道坐標(biāo)系下,為了建立F與Vd之間的關(guān)系式,通過坐標(biāo)變換,可得地理坐標(biāo)系下控制力矢量Fe與F之間的變換式為
(4)
式中,Tem為彈道坐標(biāo)系到地理坐標(biāo)系的轉(zhuǎn)換矩陣,由此可得
(5)
再由式(3)可得導(dǎo)彈控制力F與制導(dǎo)指令Vd之間的關(guān)系式為
(6)
由式(6)可知,根據(jù)導(dǎo)彈制導(dǎo)系統(tǒng)計(jì)算得到的Vd,控制系統(tǒng)即可得到所需的控制力矢量F,在導(dǎo)彈編隊(duì)過程中,設(shè)計(jì)滿足編隊(duì)要求的控制算法,得到制導(dǎo)指令Vd是編隊(duì)控制的關(guān)鍵。
領(lǐng)從結(jié)構(gòu)導(dǎo)彈編隊(duì)過程中,領(lǐng)彈一般配置有高性能通信和探測(cè)裝置[13],實(shí)現(xiàn)對(duì)遠(yuǎn)距離目標(biāo)的探測(cè),其運(yùn)動(dòng)狀態(tài)不受從彈的影響。由此,控制算法的設(shè)計(jì)目標(biāo)為:得到編隊(duì)各從彈的制導(dǎo)指令Vd,使編隊(duì)各成員趨于理想位置的同時(shí),速度與領(lǐng)彈趨于一致。基于一致性理論,所設(shè)計(jì)的從彈i制導(dǎo)控制算法式為


(7)

結(jié)合導(dǎo)彈自動(dòng)駕駛儀等效式(3),可得從彈i閉環(huán)制導(dǎo)控制系統(tǒng)方程為


(8)

(9)
將導(dǎo)彈編隊(duì)作為整體考慮,應(yīng)用代數(shù)圖論知識(shí),編隊(duì)閉環(huán)制導(dǎo)控制系統(tǒng)方程矩陣形式為
(10)
定理1導(dǎo)彈編隊(duì)各成員在控制算法式(7)的作用下,若參數(shù)γ的取值滿足下式,即
可保證式(10)所表示的編隊(duì)閉環(huán)制導(dǎo)控制系統(tǒng)方程的收斂,即各枚導(dǎo)彈趨于理想位置的同時(shí),速度趨于一致。
證明式(10)是齊次線性方程標(biāo)準(zhǔn)形式,其解
(11)
將矩陣Σ寫為Jordan型Σ=SJS-1,即
exp(Σt)=Sexp(Jt)S-1
(12)
矩陣Σ的特征方程為
det(λI2n-Σ)=det((λ2+τ-1λ+γ)In+(τ-1λ+γ)L)
(13)
負(fù)拉普拉斯矩陣-L的特征方程為

(14)
式中,μi是-L的第i個(gè)特征值,將式(13)重寫為
det(λI2n-Σ)=

(15)
比較式(14)和式(15),式(13)的根可求解為
λ2+τ-1(1-μi)λ+γ(1-μi)=0
(16)
則矩陣Σ的特征值為
(17)
根據(jù)普拉斯矩陣L的性質(zhì),有Re(μi)≤0,則Re(μi-1)<0。令ηi=μi-1,根據(jù)復(fù)數(shù)輻角縮放原理[10],當(dāng)γ的取值滿足下式時(shí),即
(18)
式(16)的所有根具有負(fù)實(shí)部,即Re(λ)<0,由式(11)和式(12)可得
(19)
即式(10)收斂,從而保證位置誤差和速度誤差趨于零,即

(20)
證畢
將導(dǎo)彈編隊(duì)控制算法的設(shè)計(jì)過程描述為最優(yōu)控制問題,在假設(shè)導(dǎo)彈自動(dòng)駕駛儀為一階慣性環(huán)節(jié)的前提下,式(3)所描述的系統(tǒng)狀態(tài)方程標(biāo)準(zhǔn)形式為

(21)
式中,X=V;A=-τ-1;U=Vd;B=τ-1。在控制算法式(7)的作用下,閉環(huán)編隊(duì)制導(dǎo)控制系統(tǒng)方程形如式(10),其收斂性得到了證明。然而,式(7)僅給出了控制算法的結(jié)構(gòu),其中還包含待定系數(shù)γ,式(18)給出了保證算法收斂時(shí),γ的取值范圍。本節(jié)對(duì)待定系數(shù)γ進(jìn)一步優(yōu)化,使之在某一指標(biāo)泛函下達(dá)到最優(yōu)。
基于導(dǎo)彈編隊(duì)過程中各成員位置和速度的累計(jì)誤差,所建立的指標(biāo)泛函為
(22)
結(jié)合式(10)和式(11)可得
(23)
由此,將指標(biāo)泛函J轉(zhuǎn)換為參數(shù)方程J(γ),在式(18)的約束下,待定系數(shù)γ的最優(yōu)值可由下式得出[14],即
(24)

(25)
在上述假設(shè)條件下,式(10)所表示的閉環(huán)系統(tǒng)方程簡(jiǎn)化式為

(26)
式(26)為二階微分方程形式,為了保證閉環(huán)系統(tǒng)的穩(wěn)定性,消除非周期性規(guī)律變化的起始誤差,待定系數(shù)γ應(yīng)滿足

(27)
式(26)的解為
(28)
式中
將式(28)代入式(25),可得參數(shù)化指標(biāo)函數(shù)為

(29)
由于K1<0和K2<0,僅考慮穩(wěn)態(tài)過程,則

(30)
進(jìn)而待定系數(shù)γ的最優(yōu)值可由式(24)得出。
結(jié)構(gòu)優(yōu)化和參數(shù)優(yōu)化是解決最優(yōu)控制問題的基本過程,在式(7)給出控制算法結(jié)構(gòu)的基礎(chǔ)上,通過上述方法即可實(shí)現(xiàn)對(duì)控制算法的參數(shù)優(yōu)化,從而進(jìn)一步提高了導(dǎo)彈編隊(duì)系統(tǒng)的性能。
下面仿真驗(yàn)證控制算法式(7)的有效性。仿真條件如下:
條件1假設(shè)領(lǐng)彈裝備有合成孔徑雷達(dá)導(dǎo)引頭(synthetic aperture radar seeker, SARS),受成像分辨率和脫靶量約束,其制導(dǎo)律算法[13]為
(31)
式中,jh和jv分別為領(lǐng)彈水平面控制量和垂直面控制量;V和R分別為彈目相對(duì)速度和相對(duì)距離;φ和ω分別為導(dǎo)彈前置角和目標(biāo)線角速度;β為彈目高低角;q11/k1和q22/k1均為權(quán)值系數(shù),其他與SARS相關(guān)的仿真參數(shù)詳見文獻(xiàn)[13]。領(lǐng)彈的初始位置坐標(biāo)為(0, 5 km,0),初始速度為(500 m/s, 0, 200 m/s);目標(biāo)位置坐標(biāo)為(40 km, 5 km, 40 km)。
條件2從彈1的初始位置坐標(biāo)為(2 km, 7 km, 0),初始速度為(800 m/s, 0, 300 m/s);從彈2的初始位置坐標(biāo)為(0, 3 km, 2 km),初始速度為(700 m/s, 0, 200 m/s)。

≤εξ
條件4設(shè)導(dǎo)彈自動(dòng)駕駛儀慣性環(huán)節(jié)時(shí)間常數(shù)τ=0.3 s,經(jīng)參數(shù)優(yōu)化取γ=9。
在式(7)作用下,導(dǎo)彈編隊(duì)運(yùn)動(dòng)軌跡如圖3所示。

圖3 三維空間導(dǎo)彈軌跡Fig.3 Missiles trajectory in 3D space
如圖3可知,由于算法式中一致性項(xiàng)的作用,可實(shí)現(xiàn)編隊(duì)隊(duì)形的快速收斂,仿真t=48 s時(shí)收斂至預(yù)期的隊(duì)形,仿真時(shí)間48~97 s,算法實(shí)現(xiàn)了對(duì)預(yù)期隊(duì)形的保持。
圖4給出了從彈1和從彈2與預(yù)期位置的相對(duì)誤差隨制導(dǎo)時(shí)間的變化規(guī)律。

圖4 從彈相對(duì)位置誤差Fig.4 Followers relative position error
在式(7)的作用下,隨著制導(dǎo)時(shí)間的增加,從彈1及從彈2的相對(duì)位置誤差趨于零。圖5給出了從彈1與領(lǐng)彈相對(duì)速度的變化情況。

圖5 從彈與領(lǐng)彈相對(duì)速度Fig.5 Relative velocity between leader and follower
由圖5可知,在控制算法的作用下,導(dǎo)彈編隊(duì)可實(shí)現(xiàn)位置和速度收斂。圖6給出了地理坐標(biāo)系下從彈1加速度矢量隨制導(dǎo)時(shí)間的變化規(guī)律。

圖6 從彈1加速度Fig.6 Follower1 acceleration
各軸向加速度分量在制導(dǎo)初始階段較大,隨著編隊(duì)隊(duì)形的逐步收斂而不斷減小。
圖7給出了編隊(duì)控制過程中,在以從彈1質(zhì)心為坐標(biāo)原點(diǎn)建立的彈道坐標(biāo)系下,從彈1所需的控制力矢量隨制導(dǎo)時(shí)間的變化規(guī)律,與空氣阻力X相關(guān)的參數(shù)為:空氣密度ρ=1.2 kg/m3導(dǎo)彈的質(zhì)量為m=200 kg;阻力系數(shù)c=0.1;導(dǎo)彈的特征面積為S=0.15 m2。

圖7 從彈1需用控制力Fig.7 Follower1 required control force
由圖7可知,從彈1各軸向控制力分量隨制導(dǎo)時(shí)間的增加不斷減小,結(jié)合某型導(dǎo)彈裝備實(shí)際,令導(dǎo)彈極限過載nmax=38g,所需控制力分量均在限定范圍之內(nèi)。
圖8給出了在未經(jīng)參數(shù)優(yōu)化情況下,從彈位置誤差的變化規(guī)律,令γ=7,仿真t=88 s時(shí)生成了既定的編隊(duì)隊(duì)形,88~97 s為隊(duì)形保持階段。

圖8 未參數(shù)優(yōu)化的位置誤差Fig.8 Position errors without parameter optimization
對(duì)比參數(shù)優(yōu)化情況(見圖4),隊(duì)形收斂時(shí)間增加,位置和速度累計(jì)誤差增大。
為了進(jìn)一步說(shuō)明本文算法的創(chuàng)新性,下面對(duì)文獻(xiàn)[9]所提出的編隊(duì)控制算法進(jìn)行仿真,算法[9]式為
ζi


(32)
式中,ξi和ζi分別表示導(dǎo)彈編隊(duì)成員i的位置和速度;ξ*和ζ*分別表示理想位置和理想速度;β和γ均為算法系數(shù),設(shè)定β=1和γ=1。導(dǎo)彈編隊(duì)由3枚導(dǎo)彈組成,編隊(duì)拓?fù)渚W(wǎng)絡(luò)中含有一棵以領(lǐng)彈為根節(jié)點(diǎn)的有向生成樹,其領(lǐng)彈的運(yùn)動(dòng)狀態(tài)不受從彈影響,領(lǐng)彈和從彈的初始位置和初始速度如前所述;設(shè)定理想位置ξ*=ξl以及理想速度ζ*=ζl,ξl和ζl分別表示領(lǐng)彈位置和領(lǐng)彈速度。各枚導(dǎo)彈在三維空間的運(yùn)動(dòng)軌跡如圖9所示。

圖9 應(yīng)用算法式(32)的編隊(duì)軌跡Fig.9 Formation trajectory based on equation (32)
由圖9可知,在式(32)的作用下,3枚導(dǎo)彈的位置收斂且速度趨于一致。然而,由于式(32)中不能設(shè)定導(dǎo)彈各成員間的相對(duì)位置關(guān)系參數(shù),相比本文提出的控制算法,不能實(shí)現(xiàn)既定位置關(guān)系的生成和保持,僅能使編隊(duì)各成員的位置收斂至同一平衡點(diǎn);再者,式(32)在設(shè)計(jì)過程中未涉及自動(dòng)駕駛儀動(dòng)態(tài)特性和參數(shù)優(yōu)化過程,實(shí)際應(yīng)用過程中,閉環(huán)制導(dǎo)控制系統(tǒng)不能保證漸進(jìn)穩(wěn)定性和優(yōu)性。綜合上述分析,本文提出的導(dǎo)彈編隊(duì)控制算法相比文獻(xiàn)[9],更加適用于導(dǎo)彈編隊(duì)隊(duì)形控制過程。
基于多智能體一致性理論,設(shè)計(jì)適用于領(lǐng)從結(jié)構(gòu)導(dǎo)彈編隊(duì)控制過程的制導(dǎo)律算法,研究總結(jié)如下:①將導(dǎo)彈自動(dòng)駕駛儀簡(jiǎn)化為一階慣性環(huán)節(jié),基于坐標(biāo)變換,得到了導(dǎo)彈控制力與制導(dǎo)指令之間的關(guān)系模型;②建立了基于一致性理論的導(dǎo)彈編隊(duì)控制算法,實(shí)現(xiàn)編隊(duì)成員趨于理想位置的同時(shí),速度趨于一致,適用于編隊(duì)隊(duì)形的生成與保持;③提出了參數(shù)優(yōu)化方法,實(shí)現(xiàn)待定系數(shù)的取值在某一指標(biāo)泛函下達(dá)到最優(yōu)。該算法對(duì)于導(dǎo)彈編隊(duì)系統(tǒng)的總體設(shè)計(jì)具有一定的理論參考價(jià)值。