張 毅,于 浩,楊秀霞,姜子劼
(海軍航空大學,山東 煙臺 264001)
隨著通信技術和計算機網絡技術的發展,多智能體系統在無人系統協同控制、電力、交通等領域得到了廣泛應用[1-3]。多智能體系統最顯著的特征就是能夠實現基于分布式通信網絡的協同控制,避免了集中式控制存在的可靠低、魯棒性差的問題。
一致性問題作為研究多智能體系統的一個重要問題,受到國內外許多學者的廣泛關注,并取得了豐碩的研究成果。文獻[4]通過設計一致性控制策略實現了多智能體系統在預定的時間收斂。文獻[5]研究了多智能體系統的方向一致性問題,提出了系統達到一致的條件,Ren[6]等研究了拓撲切換下多智能體系統的一致性問題。文獻[7]研究了均等通信時滯下多智能體系統的控制問題,給出了時滯系統的穩定性條件。文獻[8]基于一致性理論,設計分布式控制律對有向切換拓撲通信條件下的多智能體系統進行了研究。
近年來,基于競爭-合作思想的分組一致性控制成為多智能體系統的研究熱點。在實際應用中,復雜的多智能體系統往往由多個子網絡構成,子網絡內智能體是合作關系,而不同子網絡間是競爭關系,各個子網絡因任務的不同需收斂到各自的狀態值,而同個子網絡中的智能體具有相同的任務需收斂到相同的狀態值。Altafini[9]等通過將通信邊的權值設為負值來描述不同子網絡中智能體間的競爭關系。文獻[10]基于競爭原則和競爭-合作原則分別設計了多智能體系統的分組一致性控制協議,但未考慮時滯對系統的影響。文獻[11]針對無拓撲結構的分組一致性問題,設計了有無時滯兩種情況下的控制協議,但其采用的模型為一階系統,實際的應用范圍較小。文獻[12]在文獻[11]的基礎上將模型推廣為二階系統,但僅考慮了在固定時滯情況下控制律的設計。
上述文獻針對分組一致性的研究都是基于無向通信拓撲進行的,而對于有向通信拓撲下控制律的設計卻鮮有研究;另外,上述文獻僅研究了固定時滯的情形,即某一確定大小的時滯在系統中一定會發生的情況,而實際應用中,通信時滯可能是以某一概率隨機出現的,所以含確定性時滯的控制律應用于實際系統具有一定的局限性。
本文在一致性控制和時滯系統理論的研究成果上,重點解決了隨機時滯情況下多智能體系統的分組一致性控制問題。相比于已有的研究成果,本文通過將時滯信息與當前信息相結合,基于競爭原則進行分組一致性控制算法的設計,研究不同時滯情況對多智能體系統收斂性能的影響,解決了有向連通二部圖的通信拓撲結構下具有隨機時滯的多智能體系統控制問題,并通過構造Lyapunov-krasovskii函數給出了系統達到分組一致性的條件。
在多智能體系統中,可用通信拓撲來表示智能體間的信息交換。設系統中包含n個智能體,其通信拓撲用G=(V,E,A)表示,其中V={v1,v2,…,vn}表示n個節點,即n個智能體組成的集合,vi表示第i個智能體。E={e1,e2,…,en}?V×V,表示拓撲圖的邊集,即智能體之間的通信鏈路集,其任一元素eij=(vi,vj)∈E表示第i個智能體能接收到第j個智能體的信息,邊集權值矩陣為A=[aij],其中aij≠0(i≠j),aij=0(i=j),Ni={vj∈V|(vi,vj)∈E}表示第i個智能體鄰居的集合。定義圖G的入度矩陣為
D=diag{di,i=1,2,…n}

定義1(二部圖[13]):設G=(V,E)表示系統的通信拓撲,如果節點的集合V可分為兩個互不互不相交的子集(G1,G2),使各個邊(vi,vj)所連接的兩個節點vi和vj分別屬于這兩個不同的節點集(vi∈G1,vj∈G2),則稱圖為G二部圖,如圖1所示。

圖1 含有5個節點的有向二部圖

引理1[14]Moon不等式:設C∈Rn×n是任意的正定矩陣,對于任意的向量x,y∈Rn滿足以下不等式
-2xTy≤xTC-1x+yTCy
(1)

考慮具有n個節點的二階多智能體系統

(2)
其中,I={1,2,…,n},xi(t)、vi(t)、ui(t)分別為第i個智能體在t時刻的位置、速度以及控制輸入。
本文的控制目標是研究系統(2)在隨機時滯的情況下實現分組一致,通過設計控制律使得同一子網絡中智能體的狀態趨于一致。受文獻[10]啟發,本文用(xi(t)+xj(t))、(vi(t)+vj(t))表示智能體i和智能體j之間存在競爭關系,并考慮時滯產生的隨機性,得到基于競爭原則的分組一致性控制律

(3)
其中,τ為時滯參數,γ>0,表示位置狀態和速度狀態的權重系數,ε(t)為隨機變量,表示智能體發生時滯的隨機性,0≤ε(t)≤1。
當ε(t)=0時,表示在t時刻第i個智能體能夠接收到第j個智能體傳輸的當前信息,此時控制律為:
即為不含時滯時分組一致性控制律的形式。
當ε(t)=1時,表示智能體間無法完成當前狀態信息的傳輸,此時控制律為
vi(t-τ)+vj(t-τ))]
即為純時滯情況下分組一致性控制律的形式。
需要說明的是,多智能體系統的時滯取決于通信狀況,當智能體間的通信數據量較小、通信質量高時,時滯量很小趨近于0;而當通信壓力較大、通信質量較差時,時滯則會影響系統的穩定性,因此研究智能體間的通信時滯,需考慮時滯產生的隨機性。為此,在上述控制律的設計中,本文用服從二項分布的隨機變量ε(t)來描述t時刻通信時滯的隨機性,更加具有實際的應用價值。
假設ε(t)服從參數為p∈(0,1)的二項分布,可得E[ε(t)]=E[(ε2(t)]=p。
將控制律帶入系統模型(1)中,得到

(4)

(5)

定理:假設多智能體系統有n個智能體組成,系統時滯參數為τ,那么對于方程(5),若存在正定對稱矩陣P,Q,R>0滿足

(6)
則控制律(3)能夠使系統(2)在基于連通二部圖的通訊拓撲下達到分組一致。

證明:構造具有如下形式的Lyapunov-krasovskii函數。


(7)
令
教師可以利用超星學習通和超星泛雅網絡教學平臺的統計功能,及時了解學生的學習動態和課程內容的瀏覽利用情況,在此基礎上進行客觀公正的學生評價,同時對教學過程和教學效果進行有益的反思,以利于今后課程的教學設計和教學改進工作。

(8)
對(8)式求導可得

=2(1-ε(t))φT(t)PMφ(t)
+2ε(t)φT(t)PNφ(t-τ)

+ε(t)φT(t-τ)NT]R[(1-ε(t))Mφ(t)
+ε(t)Nφ(t-τ)]
+τε2(t)φT(t)MTRMφ(t)
+τε(t)(1-ε(t))φT(t)MTRNφ(t-τ)
+τε(t)(1-ε(t))φT(t-τ)NTRMφ(t)
+τε2(t)φT(t-τ)NTRNφ(t-τ)
2ε(t)φT(t)PNφ(t-τ)
≤2ε(t)φT(t)PNφ(t)+τε(t)φT(t)PNR-1NTPTφ(t)

(9)
進而可得


(10)
其中K=2(1-ε(t))PM+2ε(t)PN
+τε(t)PNR-1NTPT+Q+τ(1-ε(t))2MTRM
系統中含有的隨機變量ε(t)可由期望來代替,即E[ε(t)]=p。
為方便后續簡化,令
進而可得
對式(10)取數學期望得

(11)
其中W=2Pη+2pPN+τpPNR-1NTPT+Q+τηTRη。

(12)
因式(12)含非線性項,為將其轉化為線性矩陣不等式,利用引理2,將W化為如下形式:

(13)
其中,Ψ=2Pη+2pPN+Q+τηTRη。
得到一致性判據
所以當滿足上述定理時,具有隨機時滯的多智能體系統的位置和速度狀態可達成一致。
為驗證控制律設計的正確性和有效性,令n=4,即4個智能體對本文設計的控制算法進行驗證,多智能體系統的通信拓撲如圖2所示,易知,節點v1、v2以及節點v3、v4分別屬于不同的子網絡G1、G2。若控制律(3)成立,則兩個子網絡中的智能體將分別收斂到同一狀態。

圖2 多智能體系統通信拓撲
設各連接邊權重為1,未連接邊的權重為0,位置速度權重系數γ=1.5。設系統的初始狀態為:x1(0)=-6,x2(0)=5,x3(0)=-1,x4(0)=3;v1(0)=-2,v2(0)=5,v3(0)=-5,v4(0)=0。
為研究時滯以不同概率發生時對系統一致性的影響,設時滯時間τ=0.3s,分別取隨機概率為0.2、0.6,得到如下仿真結果:
1)時滯τ=0.3s
從圖3中可以得知,在設計的控制律作用下,隨著仿真時間的增加,4個智能體的位置和速度狀態能夠實現隨機時滯下的分組一致。

圖3 隨機概率為0.2時系統的狀態響應

圖4 隨機概率為0.6時系統的狀態響應

圖6 隨機概率為0.6時系統的狀態響應
對比上述兩種情況下的仿真結果可以看出,當多智能體系統存在的時滯時間一定時,隨著產生時滯概率的增大,系統的位置和速度兩個狀態信息的波動變大,系統達到一致的速度明顯變慢。
時滯τ=0.5s
對比(1)、(2)兩種情況下的仿真結果可知,當系統中時滯產生的概率相同時,隨著時滯時間的增加,4個智能體達到一致的時間明顯變長。
本文基于有向二部圖的通信拓撲結構,研究了多智能體系統在隨機時滯作用下實現分組一致的問題。考慮時滯產生的隨機性,設計了含當前/時滯符合狀態信息的分組一致性控制律,使得對問題的研究更加符合應用實際;利用Lyapunov穩定性理論,得到了在該控制律下多智能體系統實現分組一致性的充要條件。仿真結果驗證了本文控制律設計的正確性和有效性。