左仁偉, 李穎暉,*, 呂茂隆, 聶鴻雁
(1. 空軍工程大學(xué)航空工程學(xué)院, 陜西 西安 710038; 2. 空軍工程大學(xué)空管領(lǐng)航學(xué)院, 陜西 西安 710051;3. 中聯(lián)西北工程設(shè)計(jì)研究院有限公司, 陜西 西安 710077)
多領(lǐng)導(dǎo)者包容控制是近年來(lái)多智能體協(xié)同控制領(lǐng)域的研究熱點(diǎn)之一,其主要任務(wù)是通過(guò)設(shè)計(jì)控制協(xié)議,驅(qū)使一組跟隨者運(yùn)動(dòng)至多個(gè)領(lǐng)導(dǎo)者所圍成的最小幾何空間(凸包)中[1]。包容控制可有效規(guī)避復(fù)雜危險(xiǎn)環(huán)境中的動(dòng)態(tài)障礙物干擾,顯著提高任務(wù)執(zhí)行效率和系統(tǒng)安全裕度,在多智能體遂行敵區(qū)搜索、火災(zāi)營(yíng)救以及合作運(yùn)輸?shù)热蝿?wù)中有著廣闊應(yīng)用前景[2-3]。然而,實(shí)際網(wǎng)絡(luò)化多智能體對(duì)信道帶寬和傳輸頻率有著較高要求。當(dāng)信號(hào)傳輸通道帶寬受限、智能體之間交互頻繁時(shí),網(wǎng)絡(luò)通信可能出現(xiàn)信號(hào)阻塞/數(shù)據(jù)丟包等不利情形,嚴(yán)重降低控制系統(tǒng)的實(shí)際運(yùn)行性能。為在有限通信資源的基礎(chǔ)上保證群系統(tǒng)安全穩(wěn)定運(yùn)行,學(xué)者們提出以事件發(fā)生來(lái)驅(qū)動(dòng)信號(hào)傳輸?shù)氖录|發(fā)通信機(jī)制[4-6]。相比傳統(tǒng)采樣周期固定的時(shí)間觸發(fā)通信機(jī)制,事件觸發(fā)通信機(jī)制具有網(wǎng)絡(luò)通信頻次低和信道帶寬占用小等優(yōu)勢(shì),因而廣泛應(yīng)用于航天器組網(wǎng)[7]、智能電網(wǎng)[8]、自動(dòng)駕駛汽車編隊(duì)[9]、高速列車協(xié)同[10]等實(shí)際系統(tǒng)。
值得注意的是,上述成果[4-10]均屬于靜態(tài)事件觸發(fā)通信機(jī)制,即基于靜態(tài)觸發(fā)函數(shù)解算下一信號(hào)傳輸時(shí)刻,其系統(tǒng)能耗與帶寬占用相對(duì)較高。為進(jìn)一步放寬事件觸發(fā)閾值,Girard在靜態(tài)事件觸發(fā)機(jī)制(static event-triggered mechanism, SETM)的基礎(chǔ)上提出一種動(dòng)態(tài)事件觸發(fā)機(jī)制[11](dynamic event-triggered mechanism, DETM),該機(jī)制的關(guān)鍵特征是觸發(fā)函數(shù)包含一個(gè)額外的內(nèi)部動(dòng)態(tài)變量,其動(dòng)態(tài)可被視為靜態(tài)觸發(fā)函數(shù)的濾波輸出。相比于SETM,DETM具有更大的事件觸發(fā)閾值和更少的信號(hào)傳輸頻次,因而吸引了大量學(xué)者關(guān)注;Ge等為調(diào)度智能體間的通信,開(kāi)發(fā)了一種動(dòng)態(tài)事件觸發(fā)通信機(jī)制,減少了智能體間不必要的數(shù)據(jù)交換,獲得了更高的通信資源利用效率[12];Ahmad等針對(duì)配備動(dòng)態(tài)阻尼器的輪轂式電動(dòng)汽車,研究了分布式動(dòng)態(tài)事件觸發(fā)通信和主動(dòng)懸架控制的協(xié)同設(shè)計(jì)問(wèn)題[13];Coutinho等采用協(xié)同設(shè)計(jì)方法,同時(shí)設(shè)計(jì)DETM和增益調(diào)度控制器,并利用狀態(tài)相關(guān)的調(diào)度函數(shù)對(duì)控制器進(jìn)行參數(shù)化[14]。然而,上述事件觸發(fā)機(jī)制均要求智能體連續(xù)監(jiān)測(cè)系統(tǒng)狀態(tài)信息,以便實(shí)時(shí)判斷是否滿足觸發(fā)條件,在一定程度上會(huì)造成傳感器資源浪費(fèi)。
為進(jìn)一步放松該限制條件,Anta等提出一種無(wú)需連續(xù)監(jiān)測(cè)系統(tǒng)狀態(tài)信息的自觸發(fā)機(jī)制,該機(jī)制只需目標(biāo)當(dāng)前狀態(tài)信息即可解算下一采樣時(shí)刻,并在該時(shí)刻進(jìn)行狀態(tài)測(cè)量、控制律計(jì)算、執(zhí)行器更新[15]。在文獻(xiàn)[15]的基礎(chǔ)上,自觸發(fā)機(jī)制被大量應(yīng)用于線性系統(tǒng)[16]、非線性系統(tǒng)[17]、線性多智能體[18-20]以及非線性多智能體[21-23]的控制設(shè)計(jì)中;Wang等擴(kuò)展了傳統(tǒng)自觸發(fā)反饋系統(tǒng)L2穩(wěn)定性的相關(guān)工作,基于采樣狀態(tài)預(yù)測(cè)下一事件的開(kāi)始和完成時(shí)間,放寬了傳統(tǒng)工作中過(guò)程噪聲幅值受系統(tǒng)狀態(tài)限制的假設(shè)條件[16];Wang等設(shè)計(jì)了一種能夠有效補(bǔ)償輸入遲滯非線性的自觸發(fā)控制方法,保證跟蹤誤差由設(shè)計(jì)參數(shù)的顯式函數(shù)限定[17];Xu等構(gòu)建了一種完全分布式自觸發(fā)機(jī)制,在線調(diào)度每個(gè)線性智能體網(wǎng)絡(luò)信道的信息傳輸[20];Chen等針對(duì)一類傳感器飽和情形下的非線性多智能體,提出了一種基于神經(jīng)網(wǎng)絡(luò)的自觸發(fā)一致性控制方案[21]。上述文獻(xiàn)工作為推進(jìn)研究自觸發(fā)通信機(jī)制下高階不確定非線性多智能體協(xié)同控制問(wèn)題提供了堅(jiān)實(shí)的理論基礎(chǔ)。然而,以上工作在設(shè)計(jì)事件觸發(fā)機(jī)制時(shí)沒(méi)能綜合考慮動(dòng)態(tài)事件觸發(fā)和自觸發(fā)機(jī)制的優(yōu)勢(shì)[24-26]。如何設(shè)計(jì)一種無(wú)需連續(xù)監(jiān)測(cè)系統(tǒng)狀態(tài)信息且觸發(fā)閾值較大的動(dòng)態(tài)自觸發(fā)通信機(jī)制是目前亟需解決的關(guān)鍵難題。
鑒于此,本文在DETM[11-14]和自觸發(fā)機(jī)制[15-23]的基礎(chǔ)上提出一種新型動(dòng)態(tài)自觸發(fā)通信機(jī)制,在具有更大觸發(fā)閾值的同時(shí)無(wú)需連續(xù)監(jiān)測(cè)系統(tǒng)狀態(tài)信息,進(jìn)一步減少對(duì)網(wǎng)絡(luò)帶寬、通信成本以及智能體自身能量等有限資源的不必要消耗;采用徑向基神經(jīng)網(wǎng)絡(luò)(radial basis function neural networks, RBFNNS)在線逼近系統(tǒng)不確定項(xiàng),并設(shè)計(jì)自適應(yīng)律實(shí)時(shí)更新網(wǎng)絡(luò)權(quán)值信息;利用高增益觀測(cè)器在線估計(jì)系統(tǒng)全狀態(tài)變量,并在此基礎(chǔ)上構(gòu)建一種輸出反饋多領(lǐng)導(dǎo)者包容控制協(xié)議,驅(qū)使所有跟隨者收斂到領(lǐng)導(dǎo)者所圍成的動(dòng)態(tài)凸包中,同時(shí)保證閉環(huán)系統(tǒng)所有信號(hào)半全局一致終結(jié)有界(semi-globally uniformly ultimately bounded, SGUUB)。
本文利用有向圖G(V,ε)刻畫(huà)N+M個(gè)智能體的通信拓?fù)?其中V∈N1:N+M表示節(jié)點(diǎn)集,ε?V×V表示邊集,i∈N1:n表示i=1,2,…,n。若智能體j能夠接收到智能體i的信息,則記(i,j)∈G。記智能體i的鄰域?yàn)镹i{j/(j,i)∈ε}。定義圖G對(duì)應(yīng)的加權(quán)鄰接矩陣為A[aij]∈R(N+M)×(N+M),當(dāng)(j,i)∈ε時(shí)aij>0,當(dāng)(j,i)?ε時(shí)aij=0。假設(shè)節(jié)點(diǎn)不存在自環(huán),即aii=0。定義圖G的度矩陣為Ddiag[Di]∈R(N+M)×(N+M),式中Di=∑j∈Niaij。定義圖G對(duì)應(yīng)的Laplacian矩陣如下:

考慮具有N+M個(gè)節(jié)點(diǎn)的高階非線性多智能體,其中節(jié)點(diǎn)1,2,…,N表示跟隨者,節(jié)點(diǎn)N+1,N+2,…,N+M表示領(lǐng)導(dǎo)者。智能體i的動(dòng)力學(xué)模型描述如下:
(1)

本文針對(duì)事件觸發(fā)通信下的高階非線性多智能體,提出一種輸出反饋包容控制方法,通過(guò)局部信息交互保證所有跟隨者輸出y1,y2,…,yN均收斂到由領(lǐng)導(dǎo)者輸出yN+1,yN+2,…,yN+M所圍成的動(dòng)態(tài)凸包中,同時(shí)保證閉環(huán)系統(tǒng)所有信號(hào)SGUUB。
以下技術(shù)引理將用于推導(dǎo)本文的主要結(jié)論。
引理 1[27]定義向量和矩陣如下:
P=diag{pi}=diag{1/qi}
式中:1=[1,…,1]T。由上述定義可知P=PTf0和Q=QTf0。

式中:μ=mini≠j‖μi-μj‖/2。根據(jù)文獻(xiàn)[30]可知,RBFNNs能夠在緊集Ωx?Rq內(nèi)以任意精度逼近函數(shù)F(x),即F(x)=WTS(x)+(x),x∈Ωx,式中W∈Rp為最優(yōu)權(quán)值向量,(x)∈R為逼近誤差并滿足條件|(x)|≤m,m為正數(shù)。
(2)


(3)

(4)


本文采用如下的高增益觀測(cè)器估計(jì)系統(tǒng)全狀態(tài)信息[31]:
(5)

(6)
式中:Ψ=ηn+ρ1ηn-1+…+ρn-2η2+ρn-1η1。

(7)

隨后,計(jì)算H的i階導(dǎo)數(shù)可得
(8)


(9)


(10)
式中:?,δ和γ為正的設(shè)計(jì)參數(shù)。


(11)
對(duì)上式左右兩端分別進(jìn)行積分可得

(12)

基于上述分析,設(shè)計(jì)如下的輸出反饋包容控制協(xié)議:

(13)


(14)
式中:Γ=L?I;L=diag[Γ1,Γ2,…,ΓN];Γ=L?I為正的設(shè)計(jì)參數(shù)。
進(jìn)一步,將式(13)代入式(3)可得


(15)
本節(jié)首先分析動(dòng)態(tài)事件觸發(fā)通信下高階非線性多智能體的穩(wěn)定性結(jié)果,然后證明Zeno現(xiàn)象不存在。
定理 1考慮由動(dòng)力學(xué)系統(tǒng)(1)所組成的多智能體網(wǎng)絡(luò),在輸出反饋包容控制協(xié)議(13)、自適應(yīng)更新律(14)以及動(dòng)態(tài)事件觸發(fā)通信機(jī)制(9)的作用下,閉環(huán)系統(tǒng)所有信號(hào)SGUUB,同時(shí)領(lǐng)導(dǎo)者和跟隨者之間的包容誤差收斂到原點(diǎn)附近的任意小鄰域內(nèi)。
證明首先構(gòu)造Lyapunov函數(shù)如下:

(16)

根據(jù)式(14)~式(16),求V關(guān)于時(shí)間的導(dǎo)數(shù)可得

(17)

由文獻(xiàn)[29]的推論4.2和文獻(xiàn)[2]的引理1可知,存在常數(shù)Wm,Sm,εm,ym使得‖W‖≤Wm,‖S‖≤Sm,‖‖≤m,成立。另一方面,根據(jù)式(8)下方結(jié)論可得+λ2X3+λ3X4)。將上述不等式代入式(17)可得

(18)
式中:
λmax(P)λmax(L1)(λmax(L-1)(ξm+2)?+
2WmSm+kξm+ym+m)-4δλmin(P)-
2λmax(A1)‖Λ‖+λmax(L1)Zm)


(λmax(A1)+λmax(L1))λmax(P)Smξm)
β=σ-(λmax(A1)+λmax(L1))λmax(P)Smξm-
Smλmax(P)λmax(A1)
結(jié)合式(16)可進(jìn)一步改寫不等式(18)為
(19)
式中:參數(shù)μ具有如下形式:
求解不等式(19)可得
V(t)≤(V(0)-ω/μ)e-μt+ω/μ
(20)



(21)
式中:

隨后,將式(21)改寫為
(22)

(23)
式中:ν和ι設(shè)置為
結(jié)合式(22)和式(23)可得
(24)

(25)
根據(jù)式(25)可進(jìn)一步得到:
(26)
(27)

(28)
至此已得到事件觸發(fā)間隔的下確界。



(29)

(30)
計(jì)算|eξi(t)|2的右上迪尼導(dǎo)數(shù)可得
(31)
為獲得D+|eξi(t)|2的上界,由式(15)可得


(32)


(33)
結(jié)合式(30)和式(33)可得自觸發(fā)間隔:

(34)
由此構(gòu)建如下的動(dòng)態(tài)自觸發(fā)通信機(jī)制:
(35)
由式(34)可知

(36)
所提出的動(dòng)態(tài)自觸發(fā)通信機(jī)制(35)兼具了DETM[11-14]和自觸發(fā)機(jī)制[15-23]的優(yōu)勢(shì),一方面通過(guò)引入動(dòng)態(tài)變量(29)獲得更大的事件觸發(fā)閾值,降低了網(wǎng)絡(luò)信號(hào)采樣頻次;另一方面取消了連續(xù)監(jiān)測(cè)系統(tǒng)狀態(tài)信息這一限制性假設(shè)條件,僅需當(dāng)前狀態(tài)信息即可解算下一采樣時(shí)刻,在保證群系統(tǒng)包容誤差快速收斂的基礎(chǔ)上動(dòng)態(tài)調(diào)整網(wǎng)絡(luò)信號(hào)采樣頻率,進(jìn)一步節(jié)省網(wǎng)絡(luò)通信資源與傳感器資源。
本節(jié)以高超聲速飛行器(hypersonic flight vehicle, HFV)群系統(tǒng)為例,驗(yàn)證所提出控制方法的有效性和理論分析的正確性。
考慮由4個(gè)領(lǐng)導(dǎo)者和4個(gè)跟隨者組成的HFV群系統(tǒng),其中第i架HFV的縱向動(dòng)力學(xué)方程表示如下:
(37)
式中:hi,γi,αi,qi,xi,Vi分別為高度,航跡角,迎角,俯仰角速度,前向位移,速度;ηij,mi,Iiyy,gi,ζij,ωij分別為第j個(gè)廣義彈性模態(tài),飛行器質(zhì)量,轉(zhuǎn)動(dòng)慣量,重力加速度,阻尼比,自然頻率;Li,Di,Ti,Mi,Nij分別為升力,阻力,推力,俯仰力矩,廣義彈性力,其表達(dá)式如下:
(38)


為方便模型分析,現(xiàn)有文獻(xiàn)廣泛采用一類面向控制的模型解耦方法,其將運(yùn)動(dòng)學(xué)模型(37)分為垂直動(dòng)態(tài)[hi,γi,αi,qi]T和前向動(dòng)態(tài)[xi,Vi]T。由文獻(xiàn)[34]可知,在巡航段航跡角γi通常較小,為簡(jiǎn)化模型可采用近似值sinγi≈γi。此外,由于在巡航段迎角αi足夠小,導(dǎo)致Tisinαi遠(yuǎn)小于Li,因此現(xiàn)有文獻(xiàn)通常忽略Tisinαi對(duì)航跡角γi動(dòng)態(tài)的影響[34]。綜上,建立不確定垂直動(dòng)態(tài)如下:
(39)
式中:
復(fù)合擾動(dòng)
由結(jié)構(gòu)彈性和外部干擾Δih,Δiγ,Δiα,Δiq(如陣風(fēng),湍流和大氣擾動(dòng))生成。建立前向動(dòng)態(tài):
(40)
式中:
此外,復(fù)合擾動(dòng)
式中:Δix,ΔiV為外部干擾。
為方便控制設(shè)計(jì),定義一組狀態(tài)變量{xij},i∈N1:4,由此可將垂直動(dòng)態(tài)(39)轉(zhuǎn)化為如下Brunovsky標(biāo)準(zhǔn)型:
(41)
通過(guò)定義xi(t)=[xi1(t),xi2(t),…,xi4(t)]T∈R4,可將式(41)進(jìn)一步轉(zhuǎn)化為如下形式:
(42)

式(42)表明,垂直動(dòng)態(tài)(39)已經(jīng)轉(zhuǎn)化為與式(1)相同的形式,因此可以直接應(yīng)用所提出的控制方法。同時(shí),對(duì)前向動(dòng)態(tài)采用相同的系統(tǒng)轉(zhuǎn)化方法。
考慮4個(gè)領(lǐng)導(dǎo)者和4個(gè)跟隨者組成的HFV群系統(tǒng),其中Laplacian矩陣設(shè)置如下:

設(shè)置作動(dòng)器δie和Φi的幅值限制分別為δie∈[-20°,20°]和Φi∈[0.05,1.2]。同時(shí),設(shè)置HFV群系統(tǒng)的初始位置如下:
h1(0)=85 830 ft,x1(0)=960 ft
h2(0)=85 480 ft,x2(0)=1 070 ft
h3(0)=84 660 ft,x3(0)=580 ft
h4(0)=84 130 ft,x4(0)=1 280 ft
h5(0)=86 000 ft,x5(0)=900 ft
h6(0)=85 700 ft,x6(0)=2 000 ft
h7(0)=85 200 ft,x7(0)=0 ft
h8(0)=83 800 ft,x8(0)=1 200 ft

在仿真實(shí)驗(yàn)中,設(shè)計(jì)參數(shù)對(duì)系統(tǒng)的收斂性能有著多重影響:設(shè)計(jì)較大的k,?和Γi會(huì)提升系統(tǒng)收斂速率,但同時(shí)也會(huì)增大包容誤差的收斂范圍。因此,需要在收斂速率和跟蹤精度之間進(jìn)行權(quán)衡。此外,選擇較小的正常數(shù)σ能夠減小自適應(yīng)估計(jì)誤差的收斂范圍,但也會(huì)帶來(lái)更加嚴(yán)重的抖振現(xiàn)象。由文獻(xiàn)[31]可知,參數(shù)κ通常設(shè)置為一個(gè)小的正常數(shù),且通過(guò)選擇較小的設(shè)計(jì)參數(shù)ρ1,ρ2,ρ3,λ1,λ2和λ3,能夠?qū)菡`差的收斂范圍調(diào)整至任意小。另一方面,設(shè)置較大的γ和較小的δ,可以減小包容誤差的收斂范圍,但同時(shí)也會(huì)增加信號(hào)采樣頻次。因此,在實(shí)際工程中,參數(shù)γ和δ的選取應(yīng)在收斂性能和通信成本之間進(jìn)行平衡調(diào)整。

仿真以0.01 s的固定步長(zhǎng)運(yùn)行300 s,所獲得的結(jié)果如圖1~圖7所示。圖1為HFV群系統(tǒng)的飛行軌跡和跟蹤性能。

圖1 HFV群系統(tǒng)的飛行軌跡和跟蹤性能Fig.1 HFV swarms flight trajectories and tracking performance



圖2 群系統(tǒng)編隊(duì)隊(duì)形變化過(guò)程Fig.2 Formation changing process of swarm system
HFV剛體狀態(tài)的運(yùn)行軌跡如圖3所示,可見(jiàn)所提出的控制方法具有快速的收斂速度和光滑的瞬態(tài)性能,并且面對(duì)外部干擾展示出較強(qiáng)的魯棒性。

圖3 HFVs剛性狀態(tài)Fig.3 Rigid-body states of HFVs
圖4分別展示了所提出DETM以及動(dòng)態(tài)自觸發(fā)機(jī)制(dynamic self-triggered mechanism, DSTM)下的采樣信號(hào)和控制輸入。

圖4 采樣信號(hào)與控制輸入Fig.4 Sampling signals and control inputs
圖5分別給出了DETM和DSTM下的信號(hào)采樣誤差eξi(t),i∈N1:4。


圖6 采樣瞬間Fig.6 Sampling instants
為進(jìn)一步說(shuō)明所提出事件觸發(fā)機(jī)制的優(yōu)越性,將DETM,DSTM與現(xiàn)有SETM[35]進(jìn)行對(duì)比,其觸發(fā)條件為
為公平對(duì)比,對(duì)3種事件觸發(fā)通信機(jī)制設(shè)置相同的參數(shù)。仿真結(jié)果如圖7和表1所示。

表1 3種觸發(fā)機(jī)制下的采樣次數(shù)Table 1 Sampling times of three triggering mechanisms

圖7 3種觸發(fā)機(jī)制下的采樣次數(shù)Fig.7 Sampling times of three triggering mechanism
相比于靜態(tài)事件觸發(fā)通信機(jī)制[35],所提出動(dòng)態(tài)事件觸發(fā)通信機(jī)制的信號(hào)采樣次數(shù)更少,具有更高的通信資源利用率。另一方面,盡管動(dòng)態(tài)自觸發(fā)通信機(jī)制的信號(hào)采樣次數(shù)更多,但具有無(wú)需連續(xù)監(jiān)測(cè)系統(tǒng)狀態(tài)信息的顯著優(yōu)勢(shì),更貼近于實(shí)際工程應(yīng)用。
本文研究了動(dòng)態(tài)自觸發(fā)通信機(jī)制下,高階非線性多智能體的輸出反饋包容控制問(wèn)題。首先綜合考慮動(dòng)態(tài)事件觸發(fā)和自觸發(fā)機(jī)制的優(yōu)勢(shì),提出一種動(dòng)態(tài)自觸發(fā)通信機(jī)制,在具有更大觸發(fā)閾值的同時(shí)無(wú)需連續(xù)監(jiān)測(cè)系統(tǒng)狀態(tài)信息,減少了信號(hào)采樣頻次和系統(tǒng)能量耗散;進(jìn)而依據(jù)智能體鄰接個(gè)體的相對(duì)信息為智能體設(shè)計(jì)輸出反饋控制協(xié)議,驅(qū)使跟隨者收斂到由多個(gè)領(lǐng)導(dǎo)者圍成的動(dòng)態(tài)凸包中,實(shí)現(xiàn)網(wǎng)絡(luò)的多領(lǐng)導(dǎo)者包容控制;最后以HFV群系統(tǒng)為例驗(yàn)證了所提出方法的有效性。未來(lái)的研究方向包括時(shí)變拓?fù)洹⑶袚Q拓?fù)湎聞?dòng)態(tài)自觸發(fā)通信機(jī)制設(shè)計(jì),以及所提出控制方法在實(shí)際HFV縮比模型上的仿真實(shí)驗(yàn)研究。