楊正全, 付程
(中國民航大學交通科學與工程學院, 天津 300300)
近年來,隨著無人機技術的日趨完善,無人機被廣泛應用于電塔巡檢[1],地震勘測[2]等各個領域,隨著無人機應用的不斷深入,單個無人機已不能滿足逐漸復雜的任務要求,多無人機協同完成任務已成為無人機任務的主要表現形式,為提升任務的實現效果,多個無人機共同執行任務時通常要從不同的初始地點起飛,向某一目標地區進行集結。而無人機集結位置是否最優,集結時間的長短作為無人集結的關鍵指標,影響著多無人機的集結效果,進而影響著整個任務的完成效果。
對于多無人機的控制,主要分為集中式控制和分布式控制[3],集中式控制控制算法需要一個統一的控制中心來與多無人機系統中的無人機進行信息傳遞來指揮無人機的飛行,而無人機之間基本不需要信息交互,因此對這個控制中心有著較高的計算要求和通信要求,并且一旦控制中心遭到干擾或者被破壞,那么整個無人機編隊可能會陷入癱瘓狀態,相比于集中式控制方式,分布式控制方式中的無人機依靠無人機自身的控制器通過獲取鄰居無人機信息來調整自身姿態地與其他無人機進行協作來完成集結任務,并且在分布式控制下,倘若某架無人機出現故障對整個多無人機系統的影響也較小,因此,分布式控制方式更有利于多無人機完成集結任務。
近年來,類似多無人機集結任務的多智能體分布式最優問題得到中外大量學者的關注,有關分布式最優算法的拓撲結構主要分為無向圖、權重平衡的有向圖,以及權重不平衡的有向圖,對于無向圖的分布式算法方面,文獻[4]提出有關無人機集結的分布式算法,使無人機能夠在給定時間內完成集結。Li[5]研究了每個智能體為單積分動力學的分布式資源優化問題,提出了在達到最優性前提下結構簡單,計算負擔小的分布式投影算法,并采用增量無源性理論分析了算法的收斂性。Zou等[6]研究了非線性歐拉-拉格朗日系統的分布式優化問題,并且在分布式優化算中引入集合約束。Li等[7]研究了包含局部可行集約束和耦合不等式約束的連續時間網絡的分布式優化問題。Xu等[8]研究了帶有集合約束,等式約束和不等式約束的分布式優化問題,并采用比例積分策略的方法來傳遞狀態信息。文獻[9]考慮到多智能體在任務期間外部擾動的情況,提出了抗干擾的分布式優化算法,算法能夠控制多智能體系統在固定時間內收斂到最優解。文獻[10]考慮了帶有集合約束的固定時間分布式優化問題,
設計的分布式優化算法能夠滿足多智能體在固定時間收斂到滿足集合約束內的最優值。權重平衡有向圖方面,Xu等[11]利用動態平均一致性,提出基于有向圖的增廣梯度式分布算法(Aug-DGM)。Yang等[12]研究了帶有等式和不等式約束分布式優化問題,并且局部目標函數是非二次和非光滑的。
前人針對無向圖和權重平衡的有向圖的分布式優化算法開展了一系列研究,但是對于多無人機集結任務來說,受到外部信號干擾和無人機自身通信設備的影響,通訊情況為無向圖和權重平衡的有向圖顯然是集結時的理想情況,因此研究權重不平衡的有向圖的分布式優化算法對于多無人機集結十分重要。Zhu等[13]研究了權重平衡有向圖下的分布式優化問題,并且算法擺脫了對于零特征值左特征向量的依賴。文獻[14]提出了基于梯度跟蹤和比例積分策略的固定步長的分布式優化算法。Li等[15]研究了基于比例積分(PI)控制率和事件觸發通信機制的多智能體系統分布式優化算法,該算法可以在減少多智能體之間通信開銷的同時,使算法達到指數收斂。
前人針對權重不平衡有向圖的分布式優化算法進行更深入的研究,克服了權重不平衡有向圖的不平衡性,但是上述研究在進行分布式優化時,對于優化時間考量較少。文獻[9-10]提出固定時間的優化算法,但是對于收斂的固定時間依賴于算法的參數的設定,并不能做到在人為給定時間內達到最優。文獻[4]提出了給定時間內的分布式最優算法,但是分布式算法的通訊圖為無向圖,因此設計基于權重不平衡有向圖下給定時間的分步式優化算法不僅能夠滿足多無人機給定時間最優集結的要求,還可以豐富分布式優化理論,具有很要的現實意義。
鑒于此,采用通信網絡拉普拉斯矩陣零特征值對應的左特征向量來消除權重不平衡有向通信網絡的不平衡性,采用時域映射的方法解決無人機在給定時間內的集結問題,并將二者與分布式優化的控制思想結合起來,提出一種新的多無人機集結控制算法,在算法的可行性分析方面,結合凸分析理論和李雅普諾夫穩定性論,從理論的角度驗證了算法能夠控制無人機收斂到全局最優的位置,并通過MATLAB仿真進一步驗證算法的可行性。以期充分考慮無人機集結時通信網絡的不平衡性與集結時間的限制,更符合無人機真實的任務環境,使算法更具有現實意義,同時也豐富分布式優化理論的研究。
R為實數集;Rn為n維歐式空間;Rm×n為m×n的實矩陣;In為n維單位矩陣;給定n個列向量y1,y2,…,yn,col(y1,y2,…,yn)為堆疊向量yi(i=1,2,…,n);diag(·)表示對角矩陣;設矩陣F∈Rm×n;FT為矩陣F的轉置矩陣;‖F‖為矩陣F的歐式范數;‖y‖為向量y的歐式范數,F?G為矩陣F和矩陣G的克羅內克積。

引理1若圖G為強連通的,LN為圖G的拉普拉斯矩陣,則有以下內容成立。
(1)對于LN零特征值λ1(LN),存在正的左特征向量ξ=(ξ1,ξ2,…,ξN)T并且左特征向量ξ有以下性質。


對于連續可微函數f:Rn→R,▽f為f梯度;f為強凸函數,當且存在m∈R>0,滿足式(1)。
(x-y)T[▽f(x)-▽f(y)]≥m‖x-y‖2,
?x,y∈R,x≠y
(1)
函數f是C-lipchitz連續的當且僅當
‖f(x)-f(y)‖≤C‖x-y‖2, ?x,y∈R
(2)
式(2)中:常數C>0。
在分布式通信情況下,假設N(N>2)架無人機需要集結到同一個任務區域,無人機的出發點任意選取,在進行集結時,要求N架無人機的集結點選取為全局最優,并且為了保證后續任務能夠正常進行,要求N架無人機在給定時間T內全部集結完畢,綜上所述,將以上文字問題改寫為分布式問題,可表示為

(3)
式(3)中:xi為每架無人機的位置;fi(xi):Rn→R為無人機的局部決策函數;f(x)為全局決策函數;x為無人機在滿足全局最優情況下的位置。
為了解決上述無人機最優集結問題,需要滿足以下假設。
假設1多無人機間通信關系圖G是強連通的。
假設2局部目標函數fi是連續可微的并且是mi-強凸函數,其中常數mi>0。
假設3對于梯度▽fi是C-lipchitz的,其中C>0。
假設D∈Rn×m,vec(D)為堆疊D每列的向量從而獲得一個n×m的列向量,在這個基礎上有兩個關鍵引理成立,具體如下。
引理2A∈Rv×j,B∈Rj×v,則有tr(AB)=tr(BA)=[vec(AT)]Tvec(B)。
引理3A∈Rv×j,B∈Rj×p,C∈Rp×l,則有vec(ABC)=(CT?A)vec(B)。
為了解決式(3)表示的問題,提出基于連續時間的分布式優化算法,其中多無人機間的通信網絡是權重不平衡的,這表示各個無人機間的通信不是暢通無阻的,而是受到權重不平衡有向網絡限制的,算法的目標是使多無人機在給定時間內集結到全局最優的位置。
對多無人機實施以下算法。
(4)

借鑒文獻[4]的時域轉換的方法,將上述給定時間的優化算法轉化為無限時域的分布式優化問題。上述算法中,多無人機的集結時間上界為T,當t∈[0,T)時,采用以下時域坐標映射將有限時域t變換為無限時域τ,可表示為
(5)
逆變換記為
(6)
將式(6)左右兩邊對τ進行求導可得
(7)
因此,根據以上建立的有限時域和無限時域的關系,得出以下基于無限時域τ內的表達式為
(8)
令x=col(x1,x2,…,xn),y=col(y1,y2,…,yn),Z=diag(z11,z22,…,zNN),z=col(z1,z2,…,zn),▽f=col[▽f1(x1),▽f2(x2),…,▽fN(xN)]。
可將上述算法重寫為
(9)

接下來證明式(9)的有效性,第一步是證明平衡點與最優解的關系

col(x*,y*)是式(9)的平衡點,因此有
(10)
式(10)中:a為常數。

將式(10)的兩個等式左乘ξT?In,結合上面的結果,可以推出

(11)
因此,證明了系統的平衡點既是最優點,引理6成立
在假設2~假設4成立并滿足式(12)成立。
(12)

(13)
式(13)中:

(14)

(15)
構造Lyapunov函數,可表示為
V1(X,Y)=XT(E?In)X
(16)
V1(X,Y)關于式(17)的導數為

(17)
定義H=(X1,X2,…,XN)∈Rn×N,D=(d1,d2,…,dN),其中,di=col(di1,di2,…,din)∈Rn,J=(1N,η2,η3,…,ηN)∈RN×N,因此coli(HT)=d1i1N+d2iη2+…+dNiηN,HT=JDT,H=DJT,通過引理3,X=vec(H)=vec(DJT)=(IN?D)vec(JT),定義P=(Y1,Y2,…,YN),并結合引理4可得
XT(E?In)Y=[(IN?D)vec(JT)]T(E?In)vec(P)
=vec(JT)Tvec(PDTE)
=tr(JPDTE)

(18)

XT(E?In)Y=tr(PEB)
=vec(BT)Tvec(PE)
(19)
對于任意ζ>0,根據YOUNG不等式,可得



(20)
因此有

(21)






=λ2‖κ‖2
(22)

綜上,

(23)
定義:
V2(X,Y)=XT(E?In)Y
(24)
V2(X,Y)關于式(24)的導數為


(25)
因為E=diag(ξ1,ξ2,…,ξN),所以可以得到YT(E?In)Y≥ξmin‖Y‖2根據假設3,g(X)≤M‖X‖,根據YOUNG不等式有
(26)
因此有

(27)
定義:
V3(X,Y)=YT(E?In)Y
(28)
V3(X,Y)關于式(28)的導數為
(29)
綜上定義:
(30)

(31)

為問題(1)的最優解。接下來考慮系統的擾動系統g(τ,ω)+u(τ),根據文獻[16],存在一些正常數δ、?使得

考慮10架無人機從隨機位置出發,10架無人機構成權重不平衡有向通信網絡,假設通信網絡構成的鄰接矩陣為

(32)
10架無人機的局部目標函數如式(33)所示,其中fi(x)∈R2。
(33)


圖1 10架無人機的初始位置Fig.1 Initial position of 10 drones

圖3 無人機狀態軌跡xi2Fig.3 Drone state trajectory xi2
研究無人機集結問題,設計控制無人機集結的算法,使無人機在集結過程中依靠權重不平衡的通信網絡下收集的有限的鄰機信息來進行不斷地自我位置調整,最終實現在全局最優集結位置進行集結,集結時考慮集結時間這一無人機任務的關鍵因素,使整個無人機機隊能夠在給定時間內達到集結位置,在算法收斂性證明時,將有限時間的分布式優化問題轉化為無限時間的分布式優化問題,降低了證明的復雜性,通過理論證明了算法能夠漸進收斂到全局最優的位置,最后通過MATLAB仿真進一步驗證了算法的可行性。未來將研究帶有約束的給定世間最優集結問題以及帶有約束的基于權重不平衡有向網絡的多無人機最優集結問。