羅俊芝,張雪飛,詹環
(陸軍裝甲兵學院基礎部,北京 100072)
多智能體系統是由多個智能體組成的集合,智能體之間以及智能體與環境之間通過通信、協商與協作來共同完成單個智能體所不能解決的問題。多智能體系統有著廣泛的應用背景,比如航天器的編隊控制問題,水下多機器人系統的勘探任務分配問題等,都可以轉化為多智能體系統的控制問題。隨著科技的發展,一項復雜的任務可以通過多個結構、功能都相對簡單的智能體來完成。因此,多智能體系統的控制研究已經成為了一個熱門的研究方向。如文獻[1]對多智能體系統的隊形控制方法及應用進行了綜述,給出隊形控制的研究概況;文獻[2]通過引入虛擬領導者產生期望軌跡的方法,研究了離散時變多智能體系統有限時間一致性控制;文獻[3]則基于脈沖控制,針對時延異構多智能體編隊控制進行研究;文獻[4]則對無人機編隊形成與防碰撞進行研究,提出了基于信息一致性的無人機編隊形成時避免碰撞的控制策略;文獻[5]在研究了時變拓撲結構下,系統有Leader 領導下多智能體系統的跟蹤控制問題。文獻[6]研究了時變拓撲網絡結構下的多無人機系統的一致性控制問題;文獻[7]研究了時變拓撲結構下的多無人機領航跟隨一致性和軌跡跟蹤問題;文獻[8]研究了具有時滯和時變系數的離散多智能體系統的一致性。盡管目前關于多智能體系統的研究成果頗多,但是大部分研究是在系統線性模型的基礎上展開的。由于多智能體系統的實際背景比較復雜,線性模型不能夠精確描述多智能體系統的模型,因此基于非線性模型的多智能體系統研究更有意義。目前已有一些研究成果對此進行了關注[9-16],如文獻[9]利用滑??刂蒲芯糠蔷€性多智能體系統一致性控制問題;文獻[10]則針對非線性傳輸的多智能體系統的自適應一致性控制問題進行了研究;文獻[11]關注了脈沖控制下的非線性多智能體系統部分分量一致性問題。文獻[12]針對一類非線性多智能體系統,研究了滿足預定性能的協同控制問題;文獻[13]研究了非線性多智能體系統的輸出調節問題,等等。該文基于多智能體系統的非線性模型,研究系統的一致性控制問題,考慮到智能體之間信息傳輸通過網絡進行,傳輸效果與網絡環境有很大關系,如果網絡環境不好,可能造成信息傳輸時滯存在較大差異,考慮到智能體之間信息傳輸的實際情況,該文引入網絡時滯延遲值的概率分布模型,對非線性多智能體系統的一致性控制進行研究。
該文從系統的非線性模型入手,假設系統的各節點之間信息傳輸時存在時滯,并且假定已知網絡傳輸延遲值的隨機分布,也就是網絡傳輸時滯取定某些數值的概率分布已知,把多智能體系統進一步建模成非線性時滯系統,給出一致性協議的設計方法,給出系統的一致性控制策略。最后通過數值仿真事例,驗證所提方法的可行性和有效性。
在給出系統模型之前,先給出文中用到的假設和引理。
假設假定非線性函數f(x)滿足下面的Lipschitz條件,也就是?x,y∈Rn,有:

其中,L為一正常數。
引 理若x∈Rn,P=PT∈Rn×n,H∈Rm×n,Rank(H)=l<n,則下面的條件是等價的:
1)xTPx<0,?x∈{x∶Hx=0,x≠0}。
2)存在σ∈R,使得P-σHTH<0。
3)?X∈Rn×n,使得P+XH+HTXT<0。
4)H⊥TPH⊥<0,其中,H⊥是H的核,也就是HH⊥=0。
假設多智能體系統有N個節點Agent 組成,借助復雜網絡的思想,用G=(V,E,A)表示這N個智能體構成的拓撲結構,其中V={v1,v2,…,vN} 表示頂點的集合,vi表示第i個Agent;E?V×V表示邊組成的集合;eij=(vi,vj) 表示從vi到vj的邊,權值定義為aij,A=[aij]表示鄰接矩陣,其中,aij≥0;L=[cij]表示鄰接矩陣對應的Laplace 矩陣。
假設多智能體系統的第i個節點的內部動力學模型表示為:

其中,xi(t)∈R2為系統狀態變量;f(xi(t))是非線性向量函數,且滿足假設1;ui(t)為一致性控制策略,具體設計控制協議時可以根據給出的一致性充分條件得到。
一致性控制協議采用如下形式:

其中,i=1,2,…,N,α是智能體之間的耦合常數,aij是鄰接矩陣A=[aij]n×n的元素,η(t)代表信息傳遞出現的時延函數。
把式(3)代入式(2),得:

對于給定的兩個常數η0和ηm(不妨假設η0≥ηm),定義:

考慮到特別大的網絡時延發生的概率非常小,所以總存在常 數ηM≥η0,使得Probη{η(t)∈(ηM,+∞)}=0,也就是時延大于ηM的概率為零,設,并 令,從而存在 0 ≤β0≤1,滿足Prob{β(t)=1}=β0,Prob{β(t)=0}=1-β0。

其中,ξ=(ξ1,ξ2,…,ξN)T是A對應Laplace 矩陣的特征向量,且ξT1N=1,ξTL=0。


在上述式(5)的模型基礎上,根據隨機控制和多智能體控制理論,研究系統的一致性控制策略,并給出其存在的充分條件。
定理對于給定的正常數η0>0、ηm>0、ηM>0 和β0>0,如果存在正定矩陣P>0和Qi≥0,使得下式成立:


則式(2)的系統在式(3)的控制協議下是漸近穩定的。
證明:考慮式(5)誤差系統

若Mξ(t)=0,則:

如果(M⊥)TΩM⊥<0,由引理可以得到從而式(5)的誤差系統漸近穩定。

為了討論方便,假設存在4 個Agent 節點,并且4 個節點之間的關系拓撲為對稱拓撲,4 個Agent 之間的彼此信息交互程度相同。取拓撲結構鄰接矩陣對應的Laplace 矩陣為如下形式:

取α=0.5,β0=0.3,η0=0.2,ηm=0,ηM=0.8。
通過求解定理中的條件,可以得到:

取初始狀態量x0=(10,5,7,4),仿真曲線如圖1。

圖1 初始狀態為x0=(10,5,7,4)下系統的狀態變量

圖2 初始狀態為x0=(10,5,7,4)下系統的控制變量
通過仿真曲線可以看出,系統的4 個Agent 的狀態變量能趨于一致,這說明了文中所設計的一致性協議是有效的。驗證通過設計與狀態時延有關的控制協議,系統中同級Agent 的狀態最終能夠實現一致性。
針對一類非線性系統,首先在假定系統非線性模型滿足匹配條件的前提下,研究非智能體系統的一致性條件;其次,針對系統諸節點信息傳遞的隨機時滯的概率分布,把時滯落在某個區間的概率引入系統的模型中,進而借助復雜網絡和系統穩定性理論,給出系統達到一致性的充分條件,其與此隨機時滯的概率相關,考慮了時滯出現的概率對系統一致性的影響。通過仿真模擬,驗證所提控制協議的可行性和有效性。傳輸時滯的上下界的大小以及出現概率值的大小對于系統的一致性的影響,是下一步要開展的工作研究的重點,也更具挑戰性和實際意義。