董睿沖,徐 濤,王曉麗*
(哈爾濱工業(yè)大學(xué)(威海)信息科學(xué)與工程學(xué)院,山東 威海 264209)
最近幾年來,無人機(jī)技術(shù)的迅猛發(fā)展使得固定翼無人機(jī)和旋翼無人機(jī)在各個(gè)領(lǐng)域得到了廣泛的應(yīng)用[1]。無人機(jī)的海陸空協(xié)同作戰(zhàn)在海洋作戰(zhàn)中具有多個(gè)優(yōu)勢(shì)。首先,無人機(jī)能夠在復(fù)雜的海洋環(huán)境中迅速響應(yīng)和部署;其次,無人機(jī)能夠通過高空俯瞰和遠(yuǎn)距離偵察,提供全面的情報(bào)支持,提升作戰(zhàn)主體的感知能力和對(duì)戰(zhàn)場(chǎng)情況的認(rèn)知;此外,無人機(jī)在海洋作戰(zhàn)中能夠執(zhí)行風(fēng)險(xiǎn)較高的任務(wù),減少人員傷亡風(fēng)險(xiǎn),提高作戰(zhàn)效能和安全性。無人機(jī)編隊(duì)的協(xié)同作戰(zhàn)將在海洋作戰(zhàn)中發(fā)揮重要作用,為作戰(zhàn)指揮和決策提供更多的選擇和靈活性。多無人機(jī)編隊(duì)控制問題一直是無人機(jī)領(lǐng)域中備受關(guān)注的研究方向,國(guó)內(nèi)外眾多學(xué)者投入了大量的研究工作。南京信息工程大學(xué)自動(dòng)化學(xué)院莊亞楠團(tuán)隊(duì)在有向拓?fù)浣Y(jié)構(gòu)下,針對(duì)無人機(jī)之間存在通信噪聲干擾,研究了基于事件觸發(fā)的多無人機(jī)群快速編隊(duì)控制[2]。南京郵電大學(xué)的LEI JI教授團(tuán)隊(duì)研究了通信帶寬有限情況下多無人機(jī)系統(tǒng)的編隊(duì)控制問題,利用位置和速度的組合誤差,協(xié)同設(shè)計(jì)了具有事件觸發(fā)機(jī)制的一致性控制協(xié)議,以減少網(wǎng)絡(luò)上的信息傳輸量[3]。在國(guó)外,俄羅斯科學(xué)院Pereslavl-Zalessky 程序系統(tǒng)研究所的學(xué)者論述并考慮了在不穩(wěn)定環(huán)境下運(yùn)行的一組無人機(jī)編隊(duì)控制,提出了一種基于自適應(yīng)Kohonen神經(jīng)網(wǎng)絡(luò)的方法,應(yīng)用了智能幾何控制的原理,為在復(fù)雜環(huán)境中實(shí)現(xiàn)無人機(jī)群的運(yùn)動(dòng)提供了理論支撐[4]。沙特阿卜杜勒阿齊茲國(guó)王大學(xué)航空航天工程系的學(xué)者提出了一種新的二階非線性多智能體系統(tǒng)(MAS)的分布式共識(shí)算法用于解決多架無人機(jī)協(xié)同控制的問題[5]。
領(lǐng)航–跟隨法是無人機(jī)編隊(duì)控制領(lǐng)域的一個(gè)研究重點(diǎn),具有廣泛的應(yīng)用前景。該研究方向旨在實(shí)現(xiàn)一個(gè)或多個(gè)無人機(jī)作為領(lǐng)航者,引導(dǎo)其他無人機(jī)進(jìn)行協(xié)同飛行。國(guó)內(nèi)外許多學(xué)者在這一領(lǐng)域開展了深入的研究,并提出了各類創(chuàng)新方法和技術(shù)。在文獻(xiàn)[6]中,將旋翼無人機(jī)設(shè)定為跟隨者,地面小車設(shè)定為領(lǐng)航者,并采用線性二次調(diào)節(jié)器(LQR)方法和滑模控制設(shè)計(jì)了控制器,成功實(shí)現(xiàn)了編隊(duì)控制。另一方面,在文獻(xiàn)[7]中,基于虛擬領(lǐng)航–跟隨者模型,提出了一種創(chuàng)新的反步控制方法,能夠快速實(shí)現(xiàn)編隊(duì)狀態(tài)的穩(wěn)定。在文獻(xiàn)[8]中,研究者在領(lǐng)航–跟隨者結(jié)構(gòu)下,通過設(shè)計(jì)適當(dāng)?shù)幕C婧突?刂坡桑軌驅(qū)崿F(xiàn)對(duì)群體系統(tǒng)的集中控制,使得每個(gè)個(gè)體能夠按照預(yù)定的規(guī)則和策略行動(dòng)。滑模控制方法的穩(wěn)定性和魯棒性使得群體控制可以在各種環(huán)境和條件下有效工作,具有一定的魯棒性和適應(yīng)性[9]。
雖然目前該領(lǐng)域成果豐碩,但現(xiàn)有研究仍存在一些問題。其一為對(duì)無人機(jī)進(jìn)行建模時(shí)缺乏足夠的精確性。目前大部分研究在建立模型或線性化運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)模型的過程中。由于簡(jiǎn)化程度較高,無法完全考慮許多不確定因素,實(shí)際控制過程中模型存在不確定性,這使得控制精度的進(jìn)一步提高受到限制。
數(shù)據(jù)驅(qū)動(dòng)控制(Data-driven Control)是一種在控制器設(shè)計(jì)中不依賴于受控系統(tǒng)的數(shù)學(xué)模型信息,而是僅使用系統(tǒng)的離線/在線數(shù)據(jù)和經(jīng)過數(shù)據(jù)處理得到的信息的方法。通過嚴(yán)格的數(shù)學(xué)分析,其穩(wěn)定性和收斂性可以保證其魯棒性[10]。為了解決無人機(jī)編隊(duì)模型建立不準(zhǔn)確的問題[11-12],使用數(shù)據(jù)驅(qū)動(dòng)的方法來控制無人機(jī)和編隊(duì)被證明是有效的,具有實(shí)際重要意義[13-14]。
本文提出了針對(duì)控制器設(shè)計(jì)過程中需要求解一個(gè)復(fù)雜的代數(shù)黎卡提方程的問題,提出一種基于數(shù)據(jù)驅(qū)動(dòng)的算法,近似得到黎卡提方程(ARE)唯一解。同時(shí),本文針對(duì)無人機(jī)編隊(duì)中由于內(nèi)部參數(shù)攝動(dòng)導(dǎo)致的模型不精確問題并提出了數(shù)據(jù)驅(qū)動(dòng)的方法。在適用于明確已知的線性系統(tǒng)模型的同時(shí),只需要一段時(shí)間內(nèi)的輸入和狀態(tài)信息,即可求解出最優(yōu)的反饋控制策略。
本文研究多無人機(jī)編隊(duì)系統(tǒng)在實(shí)際應(yīng)用中的問題,例如無人機(jī)集群對(duì)抗和多無人機(jī)協(xié)同搜索。研究對(duì)象為十字形四旋翼無人機(jī)。基于虛擬領(lǐng)航-跟隨者模型,考慮到存在系統(tǒng)參數(shù)攝動(dòng)的情況下,論文探討了由多個(gè)四旋翼無人機(jī)組成的編隊(duì)最優(yōu)控制問題。四旋翼無人機(jī)是強(qiáng)耦合和欠驅(qū)動(dòng)系統(tǒng),它有6 個(gè)自由度。
常見的四旋翼無人機(jī)非線性動(dòng)力學(xué)模型被表示為
式中:(x,y,z)分別表示無人機(jī)對(duì)地的空間位置;α表示沿機(jī)體坐標(biāo)系OEXE軸旋轉(zhuǎn)的滾轉(zhuǎn)角;β表示沿機(jī)體坐標(biāo)系OEYE軸旋轉(zhuǎn)的俯仰角;γ表示沿機(jī)體坐標(biāo)系OEZE軸旋轉(zhuǎn)的偏航角;m表示無人機(jī)的總質(zhì)量;g表示重力加速度;l表示無人機(jī)結(jié)構(gòu)軸的長(zhǎng)度;Ji(i=x,y,z)表示無人機(jī)的三軸轉(zhuǎn)動(dòng)慣量,Ui(i= 1, 2, 3, 4 )的定義如下:
式中:U1為所有轉(zhuǎn)子產(chǎn)生的推力之和;U2,U3,U4是同滾轉(zhuǎn)、俯仰和偏航運(yùn)動(dòng)相關(guān)聯(lián)的量;Fi(i=1,2,3,4)表示4 個(gè)電機(jī)的推力;Ti(i= 1, 2, 3, 4 )表示4 個(gè)電機(jī)的扭矩。
本文的控制目標(biāo):針對(duì)每個(gè)四旋翼無人機(jī)(1),設(shè)計(jì)最優(yōu)編隊(duì)控制器ui(i= 1, 2, …,N),使整個(gè)編隊(duì)系統(tǒng)在指定隊(duì)形下飛行。為達(dá)到這一目標(biāo),本文的設(shè)計(jì)方法在傳統(tǒng)線性二次型調(diào)節(jié)的基礎(chǔ)上,融合了數(shù)據(jù)驅(qū)動(dòng)的思想。
為了簡(jiǎn)化控制器設(shè)計(jì)并更真實(shí)地模擬四旋翼無人機(jī)的飛行過程,我們將無人機(jī)的強(qiáng)耦合非線性模型進(jìn)行解耦。這種解耦后的線性系統(tǒng)能夠更好地描述無人機(jī)的飛行行為。
同時(shí),我們重新定義了狀態(tài)變量,以利于對(duì)無人機(jī)編隊(duì)控制器的設(shè)計(jì):
式中:
為了確保解唯一性,在小振蕩模型下進(jìn)行線性化。利用常用近似:
在無人機(jī)姿態(tài)角很小的情況下,這種簡(jiǎn)化方法是合理的。
定義平衡點(diǎn):
平衡時(shí)固定的控制輸入:
這個(gè)輸入量所代表的為無人機(jī)的 4 個(gè)轉(zhuǎn)子產(chǎn)生的用于抵消無人機(jī)自身重力的上升力,它使無人機(jī)平穩(wěn)地懸停在規(guī)定的平衡點(diǎn)處。從而可以得知該無人機(jī)的線性動(dòng)力學(xué)模型的狀態(tài)空間表達(dá)式為
式中:
由式(10)可得,狀態(tài)x和y僅與姿態(tài)角β,α相關(guān),與控制輸入U(xiǎn)1無關(guān)。以此簡(jiǎn)化后的系統(tǒng)如下:
通過解耦簡(jiǎn)化的4 個(gè)線性子系統(tǒng),我們可以觀察到根據(jù)卡爾曼提出的系統(tǒng)能控能觀性判據(jù),這些線性子系統(tǒng)都具備能夠被控制和被觀察的性質(zhì)。
根據(jù)3.1 的內(nèi)容,對(duì)于無人機(jī)的編隊(duì)控制器,需要對(duì)4 個(gè)子系統(tǒng)單獨(dú)設(shè)計(jì)。下面以位置子系統(tǒng)x為例,第i架無人機(jī)的數(shù)學(xué)模型為
式中:
這架無人機(jī)與理想狀態(tài)間的誤差表示為
式中:ρ0表示無人機(jī)的期望飛行狀態(tài);ρi0表示第i架無人機(jī)與期望飛行狀態(tài)之間的差值,可將其假設(shè)成[xi0vi00 0]T。
對(duì)誤差變量進(jìn)行求導(dǎo)可得:
以無人機(jī)編隊(duì)為整體來說:
式中:N表示編隊(duì)中受控制無人機(jī)數(shù)量;n表示控制對(duì)象狀態(tài)變量的維數(shù);輸入變量的維度為m,狀態(tài)子系統(tǒng)位置x中,m= 1,n= 4。
在實(shí)際應(yīng)用中,無人機(jī)的負(fù)荷與理想情況存在差異,有些時(shí)候無人機(jī)沒法查清負(fù)荷的情況。所以模型中的質(zhì)量和轉(zhuǎn)動(dòng)慣量不是已知的。基于這些情況,我們可以改寫編隊(duì)的誤差狀態(tài)空間如下:
ΔA, ΔΒ為攝動(dòng)的動(dòng)力學(xué)參數(shù),定義范數(shù)有界的不確定參數(shù):
式中:Gi,Ei(i=1,2)是由常數(shù)組成的矩陣,Mi(i= 1, 2)是一個(gè)有界未知的矩陣且滿足:
在這一節(jié)中,我們著重解決多無人機(jī)系統(tǒng)自適應(yīng)最優(yōu)控制問題,其主要內(nèi)容為“領(lǐng)航者–跟隨者”網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。我們通過數(shù)據(jù)驅(qū)動(dòng)策略,對(duì)無人機(jī)的輸入信號(hào)、擾動(dòng)信號(hào)及狀態(tài)信息進(jìn)行采樣,并進(jìn)行一些處理操作即可解決在無人機(jī)模型未知的情況下,多無人機(jī)編隊(duì)的控制問題。這意味著我們能夠?qū)崿F(xiàn)高效的編隊(duì)控制,無論無人機(jī)內(nèi)部參數(shù)的變動(dòng)或模型信息的不確定性如何。
設(shè)計(jì)編隊(duì)模型狀態(tài)反饋分布式控制器:
式中:c為一個(gè)常系數(shù);K*為狀態(tài)反饋矩陣;dij表示系統(tǒng)矩陣A對(duì)應(yīng)的入度矩陣D中的元素,將式(19)代入式(21),可以得到:
將式(26)改寫為編隊(duì)整體:
式中:L為編隊(duì)的拉普拉斯矩陣;為對(duì)角矩陣,維數(shù)與L相等;此外對(duì)于i= 1,2…N,?i>0,使得ai≠ 0。
L?cK*使各無人機(jī)的運(yùn)動(dòng)和位置狀態(tài)盡量一致;使各無人機(jī)和期望狀態(tài)之間的誤差盡可能小,這樣能夠使各個(gè)無人機(jī)都盡量跟蹤領(lǐng)航者。
本文結(jié)合編隊(duì)控制器的設(shè)計(jì),考慮了具體的線性二次型問題。對(duì)于此類受控系統(tǒng)被假設(shè)為線性系統(tǒng)的問題,用控制輸入狀態(tài)變量和組成的二次型函數(shù)表示系統(tǒng)的性能指標(biāo)。通過將自適應(yīng)動(dòng)態(tài)規(guī)劃融入線性二次型設(shè)計(jì)方法,利用無人機(jī)的輸入數(shù)據(jù)和狀態(tài)數(shù)據(jù)進(jìn)行迭代學(xué)習(xí),以近似求解最優(yōu)控制器的問題。這樣,我們能夠得到一個(gè)能夠有效解決線性二次型最優(yōu)控制問題的控制器設(shè)計(jì)方法。
對(duì)于系統(tǒng)來說,線性狀態(tài)反饋ui=-K*ζi被期待用來使下面的性能指標(biāo)函數(shù)成立:
式中:Q=QT≥0,R=RT≥0,Q,R均為已知的定常矩陣,且是可觀測(cè)的。
將ui=-K*ζi代入式(28)有:
為了求取K*,不妨假設(shè)存在一個(gè)常量矩陣P,使得:
將上式代入:
將式(30)中的等式左側(cè)微分形式展開:
式中:Ac=A-BK*。 若上式等號(hào)恒成立, 則的值為0。
令K*=R-1BTP*,有:
式中,P*=P*T>0(矩陣正定)對(duì)于上述黎卡提方程來說是唯一存在的解。
公式(34)是一個(gè)非線性方程,其解為矩陣P,通過解析方法求得方程的解非常困難。
針對(duì)式(34)中P*的求解問題,本文提出一種基于數(shù)據(jù)驅(qū)動(dòng)的算法,若初始狀態(tài)反饋矩陣給定,通過求解對(duì)應(yīng)tk(k= 0,1,..,)時(shí)刻的Pk矩陣,迭代更新線性反饋矩陣Kk+1,最終近似得到黎卡提方程(ARE)唯一解P*。
引理1:在任意給定一個(gè)穩(wěn)定的狀態(tài)反饋矩陣后,我們將在k= 0,1,2... 的情況下重復(fù)以下步驟:
1)實(shí)對(duì)稱正定矩陣Pk由下述方程求解:
式中:Ak=A-BKk。
2)反饋矩陣可以通過式(36)進(jìn)行代換:
有以下3 個(gè)性質(zhì)成立:
1)A-BKk是赫爾維茨穩(wěn)定的。
以上使用了策略迭代方法,可以對(duì)策線性連續(xù)系統(tǒng)。最開始提供初始輸入策略K0,該策略可以使系統(tǒng)穩(wěn)定。然后通過式(35)求取Pk實(shí)現(xiàn)策略評(píng)估,在式(31)中不難發(fā)現(xiàn)Pk和初始狀態(tài)是與性能指標(biāo)J相關(guān)聯(lián)的。為了更新策略,通過式(36)代換得到下一個(gè)循環(huán)中的Kk+1。不過必須有較為精準(zhǔn)的線性系統(tǒng)A,B的信息來實(shí)現(xiàn)引理 1 中的迭代循環(huán)過程,本文已給出2 個(gè)與其相關(guān)的矩陣。若無人機(jī)系統(tǒng)存在參數(shù)攝動(dòng),則精確的矩陣信息將無法獲得,所以引理1 所提出的策略迭代方法實(shí)用性較差。
在這篇論文中,結(jié)合了引理1 和自適應(yīng)動(dòng)態(tài)規(guī)劃的思想,基于數(shù)據(jù)驅(qū)動(dòng),我們提出一種自適應(yīng)最優(yōu)控制算法。這種方法在適用于明確已知的線性系統(tǒng)模型的同時(shí),只需要一段時(shí)間內(nèi)的輸入和狀態(tài)信息,即可求解出最優(yōu)的反饋控制策略。這意味著我們可以通過數(shù)據(jù)驅(qū)動(dòng)的方法來實(shí)現(xiàn)無人機(jī)的最優(yōu)控制,無需依賴于準(zhǔn)確的系統(tǒng)模型。
將第i架無人機(jī)與期望位置之間的誤差變量的數(shù)學(xué)模型改寫如下:
將上式中的系統(tǒng)參數(shù)代入可轉(zhuǎn)移性能指標(biāo)函數(shù),以克朗克積的形式表示內(nèi)部多項(xiàng)式如下:
式中:0 ≤ti,0<ti,1<…<ti,s<ti+1,0<ti+1,1<… ,s表示在ti與ti+1之間的采樣次數(shù)。
將式(39)擴(kuò)展成如下形式:
式中:
在利用最小二乘法求解式(40)Kk+1時(shí),解的唯一性是非常關(guān)鍵的因素,而滿秩是確定解唯一性的充分條件,即Θk必須做到滿秩。使Θk滿秩的充分條件如下。
引理2:對(duì)于每次迭代k= 0,1…,存在一個(gè)充分大的lk> 0,如果有下面的秩條件成立:
那么式(40)中Θk滿秩。為了節(jié)省空間,此處省略證明。
式(41)成立時(shí),式(40)有唯一解,應(yīng)用最小二乘法求解,式(40)進(jìn)一步寫成:
假設(shè)每個(gè)區(qū)間 [ti, 0,ti,s]為一個(gè)采樣周期,在解決上述方程時(shí),必須有充足的樣本數(shù)據(jù),即迭代過程中,都應(yīng)該存在充分大的s進(jìn)行預(yù)處理以確保數(shù)據(jù)的可靠。首先,考慮到零輸入時(shí)本文解耦得到的子系統(tǒng)具有發(fā)散性,為使系統(tǒng)保持穩(wěn)定,我們可以使用初始控制策略K0;其次,選擇探測(cè)噪聲也是非常重要的。一般而言,計(jì)算秩條件可以檢查最小二乘法中的秩問題,但無法通過分析進(jìn)行確認(rèn)。
為了滿足秩條件,應(yīng)確保每個(gè)迭代步驟至少有10 個(gè)相對(duì)應(yīng)的采樣周期的數(shù)據(jù),即s≥10。當(dāng)探測(cè)噪聲有周期性時(shí),其周期應(yīng)遠(yuǎn)小于采樣時(shí)間間隔。
由控制器設(shè)計(jì)ui=-K*ζi、式(40)以及式(50)構(gòu)成基于數(shù)據(jù)驅(qū)動(dòng)的自適應(yīng)最優(yōu)控制算法,流程圖如圖1 所示。其中c為常數(shù),表示Pk需要達(dá)到的誤差精度,ω表示控制輸入的參數(shù)攝動(dòng)。

圖1 基于數(shù)據(jù)驅(qū)動(dòng)的自適應(yīng)最優(yōu)控制算法流程圖Fig. 1 Flowchart of data-driven adaptive optimal control algorithm
對(duì)于具有 “領(lǐng)航者–跟隨者” 有向通信拓?fù)浣Y(jié)構(gòu)的多無人機(jī)系統(tǒng),上述基于數(shù)據(jù)驅(qū)動(dòng)的自適應(yīng)最優(yōu)控制器能夠有效地解決在系統(tǒng)內(nèi)部參數(shù)攝動(dòng)情況下的編隊(duì)控制器設(shè)計(jì)問題。接下來,我們將提供該控制算法的可行性證明,以驗(yàn)證該算法的有效性和可行性。
定理1:若有初始控制策略使系統(tǒng)穩(wěn)定的同時(shí)滿足引理2 中的秩條件,那么方程式的解迭代序列可以收斂到相應(yīng)的P*,K*。
首先證明該策略迭代方法的收斂性。
由式(30)可得:
可以推出:
或者:
當(dāng)k=0時(shí),K1=R-1BP0,代入上式:
根據(jù)式(45)有:
因此,P*≤P1≤P0。又因?yàn)镻*是黎卡提方程的解,必為正定矩陣,P0正定且有界,所以A-BK1是符合Hurwitz 穩(wěn)定性判據(jù)的。令k= 0,1…,通過上式反復(fù)進(jìn)行驗(yàn)證,可得P*≤Pk+1≤Pk。由于Pk為遞減的矩陣序列且有下界P*,故存在,P∞滿足式(34)且是該方程的唯一解。因此有,該迭代策略是收斂的。
當(dāng)給定一個(gè)使系統(tǒng)穩(wěn)定的狀態(tài)反饋矩陣Kk,如果Pk是式( 33 ) 的解, 并且Kk+1通過唯一決定。由式(38)可得,Kk、Pk滿足引理1 中提到的3 個(gè)性質(zhì)。另一方面,如果令Pk=P,且K使下式成立:
定理2:對(duì)于公式(21),當(dāng)P*,K*為3.3 節(jié)中求出的線性二次型最優(yōu)反饋矩陣時(shí),線性反饋控制器u=-K*ζ可以使編隊(duì)穩(wěn)定,且使無人機(jī)編隊(duì)系統(tǒng)性能指標(biāo)能夠達(dá)到最小。
針對(duì)公式(21)選取李雅普諾夫函數(shù):
對(duì)等式兩邊進(jìn)行求導(dǎo),并代入式(21)可得:
得到:
由此可得,所選的Lyapunov 函數(shù)V(t) > 0且。本文提出的編隊(duì)控制器可以使編隊(duì)狀態(tài)穩(wěn)定,即
在上述控制策略下的無人機(jī)編隊(duì)系統(tǒng)性能指標(biāo)為
又因?yàn)镻*是黎卡提方程(ARE)的唯一解,K*=R-1BTP*,由LQR 的原理可知,u=-K*ζ為最優(yōu)控制器,可使上述系統(tǒng)性能指標(biāo)達(dá)到最小。
為了驗(yàn)證本文提出的控制方法的有效性,在本節(jié)中,我們進(jìn)行了基于數(shù)據(jù)驅(qū)動(dòng)的自適應(yīng)最優(yōu)控制編隊(duì)的仿真實(shí)驗(yàn)。實(shí)驗(yàn)假設(shè)無人機(jī)可以對(duì)狀態(tài)數(shù)據(jù)進(jìn)行交換,并確保編隊(duì)網(wǎng)絡(luò)中至少存在一個(gè)有向連通圖。
在本實(shí)驗(yàn)中,我們驗(yàn)證了一個(gè)由4 架四旋翼無人機(jī)構(gòu)成的編隊(duì)。該系統(tǒng)的通信拓?fù)鋱D如圖2 所示。

圖2 編隊(duì)通信拓?fù)鋱DFig. 2 Formation communication topology diagram
圖中:UAV0 表示虛擬領(lǐng)航者,UAV1~UAV4表示跟隨者無人機(jī)。假定只有UAV2 與UAV0 有信息交換。
圖2 所對(duì)應(yīng)的入度矩陣與鄰接矩陣為
由此得到該編隊(duì)系統(tǒng)的拉普拉斯矩陣為
由信息交換能夠進(jìn)行與否, 可以判斷ai= 0(i= 1,3,4),a2= 2。其中a2的數(shù)值決定了編隊(duì)狀態(tài)趨近于期望狀態(tài)的速度,故應(yīng)在允許范圍內(nèi)選擇盡量大的值。
假設(shè)編隊(duì)隊(duì)形是一個(gè)平面正方形,其中領(lǐng)航者位于正方形的幾何中心。
在上述假設(shè)下隊(duì)形矩陣如下描述:
跟隨者與領(lǐng)航者的距離矩陣為
各個(gè)跟隨者相對(duì)于虛擬領(lǐng)航者的的初始狀態(tài)信息。

表1 各無人機(jī)初始狀態(tài)Table 1 Initial state of each UAV
首先,求解位置子系統(tǒng)x方向,假設(shè)在求解時(shí)Q=I4,R=1。無人機(jī)的初始狀態(tài)數(shù)據(jù)為xi= [5,2,2,1]T。采樣周期設(shè)定為T= 0.01 s,采樣時(shí)間設(shè)定為5 s,初始的狀態(tài)反饋矩陣為K0= [1,3,4,3],探測(cè)噪聲由周期信號(hào)疊加:
仿真結(jié)果如下:
從圖3 可以觀察到,在給定初始狀態(tài)的條件下,無人機(jī)最終趨于穩(wěn)定。因此,整個(gè)過程收集到的數(shù)據(jù)均有效,并滿足引理 2 對(duì)數(shù)據(jù)矩陣秩的要求。圖5 具體表現(xiàn)了反饋增益矩陣的迭代過程,即每次迭代得到的反饋增益矩陣與期望的差值。三次迭代后算法基本收斂,這成功地驗(yàn)證了定理1。得出最優(yōu)反饋增益矩陣如下:

圖3 位置x 數(shù)據(jù)采集時(shí)的狀態(tài)響應(yīng)曲線Fig. 3 Status response curve for data acquisition of position x

圖4 位置x 子系統(tǒng)最優(yōu)反饋增益迭代過程Fig. 4 Optimal feedback gain iteration process of position x subsystem

圖5 編隊(duì)位置狀態(tài)x 的誤差變量響應(yīng)曲線Fig. 5 Error variable response curve for formation position state x

圖6 位置z 數(shù)據(jù)采集時(shí)的狀態(tài)響應(yīng)曲線Fig. 6 Status response curve for data acquisition of position z
下面給出編隊(duì)的狀態(tài)響應(yīng)曲線:
從圖5 可以看出,編隊(duì)能在15 s 內(nèi)收斂到期望狀態(tài)。
由對(duì)稱性可知,狀態(tài)子系統(tǒng)x與y是一致的,受篇幅所限,不在此給出位置狀態(tài)y的仿真結(jié)果。
對(duì)于位置狀態(tài)z的控制器,其簡(jiǎn)化后是一個(gè)二階系統(tǒng),與x,y均不同,所以必要獲得的未知參數(shù)變少。
假設(shè)該最優(yōu)狀態(tài)控制器的Q=I2,R= 1。在線數(shù)據(jù)采集時(shí)無人機(jī)的初始狀態(tài)數(shù)據(jù)為zi= [3, -2]T。數(shù)據(jù)采集的步驟中,采樣周期和采樣時(shí)間分別設(shè)置為0.01 s、2 s,迭代開始的狀態(tài)反饋矩陣為K0= [1,1.5],探測(cè)噪聲同樣選擇周期信號(hào)的疊加:
圖7 展示的是狀態(tài)z控制器的迭代過程。因?yàn)橄到y(tǒng)的階數(shù)相對(duì)較低,所以狀態(tài)的收斂速度更快,第二次迭代后,得到了最優(yōu)狀態(tài)增益矩陣:

圖7 位置z 子系統(tǒng)最優(yōu)反饋增益迭代過程Fig. 7 Optimal feedback gain iteration process of position z subsystem
觀察圖8 后發(fā)現(xiàn),在z方向只需8 s 的調(diào)整即可使?fàn)顟B(tài)達(dá)到穩(wěn)定。

圖8 狀態(tài)z 的誤差變量響應(yīng)曲線Fig. 8 Error variable response curve for state z
當(dāng)虛擬領(lǐng)航者的期望狀態(tài)如下:
圖9 顯示了編隊(duì)運(yùn)動(dòng)的仿真結(jié)果,圖像化了編隊(duì)實(shí)現(xiàn)懸停的調(diào)節(jié)過程。因?yàn)楹?jiǎn)化后偏航角子系統(tǒng)的模型與狀態(tài)z子系統(tǒng)相似,受篇幅所限,不在此給出編隊(duì)姿態(tài)角的誤差仿真結(jié)果。

圖9 編隊(duì)?wèi)彝HS飛行軌跡Fig. 9 Formation hovers over a three-dimensional flight trajectory
本文研究了在存在系統(tǒng)參數(shù)攝動(dòng)情況下的四旋翼無人機(jī)編隊(duì)問題,考慮到無人機(jī)編隊(duì)在實(shí)際應(yīng)用中的廣闊前景以及對(duì)復(fù)雜任務(wù)需求的完成。通過結(jié)合分布式一致性和線性二次型理論,為了解決無人機(jī)參數(shù)攝動(dòng)導(dǎo)致的模型參數(shù)未知問題,利用數(shù)據(jù)驅(qū)動(dòng)構(gòu)造了自適應(yīng)動(dòng)態(tài)規(guī)劃的最優(yōu)編隊(duì)控制器的方法。該方法對(duì)每個(gè)子系統(tǒng)進(jìn)行編隊(duì)控制設(shè)計(jì),從而采用了虛擬領(lǐng)航–跟隨者模型,并簡(jiǎn)化了四旋翼無人機(jī)動(dòng)力學(xué)的非線性系統(tǒng),將其簡(jiǎn)化為4 個(gè)線性子系統(tǒng),隨后提供了詳細(xì)的設(shè)計(jì)步驟和證明。最后,通過Lyapunov 方法分析論證了算法的穩(wěn)定性,并給出了仿真驗(yàn)證的結(jié)果。這為以后在真實(shí)環(huán)境中實(shí)現(xiàn)四旋翼無人機(jī)編隊(duì)飛行提供了堅(jiān)實(shí)的理論支持。