張麗瓊,李偉勛,劉 佳
(1.天津職業技術師范大學理學院,天津 300222;2.天津職業技術師范大學自動化與電氣工程學院,天津 300222)
多智能體系統(multi-agent system,MAS)是由多個智能體組成,將大而復雜的系統建設成小的、彼此互相通信并協調的、易于管理的系統。近年來多智能體系統已經應用于人類生活的方方面面,如無人駕駛機器、分布式機器人通信、機器人編隊、交通運輸、蜂擁現象、復雜神經網絡和電腦通信等,原理都是通過設計合理的算法和控制協議,讓各個智能體之間互相通信,從而使多智能體的各個狀態趨于一致[1-10]。Dong等[1]研究了在切換拓撲和時變的情況下,二階多智能體系統的編隊跟蹤及其在四旋翼編隊飛行中的應用。Tang等[2]研究的是脈沖新特征下,網絡多智能體系統的跟蹤控制及其在機器人系統中的應用,為機器人的發展提供了一個嶄新的前進方向。Li等[3]研究了二階多智能體系統量化蜂擁控制。He等[4]對無線傳感器網絡中基于共識的時間同步做了研究,這是對復雜網絡的研究。Wang等[5]分別在固定和切換拓撲結構下,研究了具有多智能體系統領導跟隨的編隊控制。Jadbabaie等[6]提出了在多智能體系統的研究中使用最近鄰規則的移動自治智能體組的協調,為研究多智能體系統一致性提供了新思路。研究發現,時滯對多智能體系統一致性的影響及其廣泛,文獻[7-9]考慮了在具有時變通信時滯下多智能體系統的一致性問題,與實際工程問題相符。此外,一旦涉及實際問題,人們往往希望系統能夠在較短時間內完成任務。Wang等[10]就是在有限時間內對多智能體系統的一致性問題進行研究,因此多智能體系統能夠快速有效地解決實際工程問題,表明了多智能體系統在社會生活中的重要地位。
多智能體系統的組一致性研究作為一個分支得到了廣泛關注。組一致性是指在整個多智能體系統中,系統會因為環境狀況等因素,出現收斂成多個穩定狀態的現象,也是各個智能體達到各自所在組的一致狀態。Yu等[11]首次研究具有切換拓撲和通信延遲的多智能體系統的組一致性的概念。2年后,Yu等[12]對具有向信息交換的多智能體系統的群共識進行了研究。Xie等[13]得到了多智能體系統組一致性的充分必要條件。學者對多智能體系統的組一致性進行了諸多研究,Wen等[14]關于具有輸入飽和的異構多智能體系統的群體共識問題進行了研究。Feng等[15]考慮了雙積分器動態多智能體系統在固定通信拓撲下的群組一致性控制。在理論與實際相結合時,群組一致性的研究具有重要的意義。本文在已有結論的基礎上,研究多智能體系統的三組一致性問題。
把多智能體系統的通信拓撲建模成有向圖。圖的基本概念如下:
令G=(N,T,A)是一個拓撲圖,其中一個非空的有限集 N={n1,n2,…,nm}叫做 G 的頂點集,N 中的元素稱為頂點;集合T?N×N為G的有向邊,可以用{ej,ei}來表示;A=[aij]m×m是 G 的一個加權鄰接矩陣。如果{ej,ei}∈T,則 aij≠0 表示第 i個智能體能夠接收到第j個智能體的信息,否則aij=0;另外假設所有aii=0,用={nj∈N:(nj,ni)∈T}表示節點i的鄰居節點的集合。有向圖G的拉普拉斯矩陣L定義為L=(lij)m×m,且計算式為L=D-A,其中,矩陣D為圖的度矩陣,節點的入度矩陣用in-degree表示,且定義為degin(vi)=節點的出度矩陣表示為out-degree,定義為
考慮m個智能體,假設所有智能體是同質的,且智能體的狀態都屬于狀態空間R,則
智能體i的動力系統模型為

式中:pi∈R和qi∈R分別為表智能體系統的位置狀態和速度狀態;ui∈R為系統的控制輸入;f(qi(t),t)為連續可微向量函數。
領導者的動態模型為

式中:pj*∈R和qj*∈R分別為領導者的位置狀態和速度狀態;f(qj*(t),t)為連續可微向量函數。
本文是在一維環境下考慮多智能體系統的組一致性,也可以通過Kronecker積將結果推廣到高維空間,這將是以后要研究的重點問題。為了讓所有智能體與它所跟隨的領導者達成一致,設計如下控制協議

定義1在任意初始條件下,若多智能體系統滿足以下式子

則稱多智能體系統能夠達到三組一致性。
引理1文獻[12]在連通的拓撲圖中,每個節點與其他各個子組中節點的權重之和為0,如下式

假設1文獻[5]非線性動態f(qi(t),t),f(qj*(t),t)是連續可微的向量函數,則存在一個正常數ρ使得以下不等式成立

引理2文獻[5](Schur補引理)矩陣s11,s12為對稱陣且,則下列條件相互等價
(1)S< 0

引理3文獻[15]對任意向量a、b和一個正定矩陣Φ,有以下式子成立

根據控制協議(3)和上述的引理1,則系統(1)可以寫成下面的矩陣形式

式中:F(q(t),t)=(f(q1(t),t),f(q2(t),t),…,f(qm(t),t))T;p(t)=(p1(t),p2(t),…,pm(t))T;q(t)=(q1(t),q2(t),…,qm(t))T;p*(t)=(p1*(t),p2*(t),p3*(t))T;q*(t)=(q1*(t),q2*(t),q3*(t))T。
由上述智能體的動力系統和領導者的動力系統,可以得出誤差系統的動力模型。
令ξi(t)=pi(t)-p1*(t),ηi(t)=qi(t)-q1*(t),(i∈N1);ξi(t)=pi(t)-p2*(t),ηi(t)=qi(t)-q2*(t),(i∈N2);ξi(t)=pi(t)-p3*(t),ηi(t)=qi(t)-q3*(t),(i∈N3);ξ(t)=[ξ1(t),…,ξm(t)]T,η(t)=[η1(t),…,ηm(t)]T,則誤差系統的矩陣形式如下

式中:F(t)=(f1(t),f2(t),…,fm(t))T,且fi(t)=(f(qi(t),t)-f(qj*(t),t);L+B=M。
基于多智能體系統和上述的誤差系統,定義新的

定理1針對非線性多智能體系統(1)和(2),在控制協議(3)的作用下,若對于給定的正常數 τM、δ、ρ,存在正定矩陣P、Q、R滿足以下的不等式


則多智能體系統是能夠達到群組一致性的。
證明針對系統(6),建立一個Lyapunov候選泛函數為



根據牛頓萊布尼茲公式,可得

則系統(6)可表示為

式中:N=C+E。
再對Vi(t)進行求導,得

根據式(10)和假設并整理,可以得到下式

由引理3可將式(11)整理為

再由假設1可將式(12)處理為如下不等式

再根據式(8)可以得到不等式

由Lyapunov穩定性理論,可知誤差系統(6)能夠趨于穩定,即等價于該系統達到了群組一致,證畢。
特別地,若時滯為0時,仍然可借助Lyapunov穩定性理論和線性矩陣不等式等工具,通過運用Schur補引理等相關的引理,實現多智能體系統的群組一致性,基于鄰居的運動狀態設計如下算法

推論1針對非線性多智能體系統(1)和(2),根據控制協議(15),對于給定的正常數,要使多智能體系統實現群組一致性,則需存在正定矩陣,滿足以下線性矩陣不等式

為了進一步展現結果的有效性,運用數學工具對多智能體系統進行仿真模擬,該系統的所有智能體共分為3組,每組都有一個領導者,每一區域表示一組,組與組之間用黑色的有向箭頭連接,有向的拓撲結構如圖1所示。

圖1 有向的拓撲結構
取增益常數,按照上述的有向拓撲結構圖給出非線性動力系統無時滯時的位置誤差軌跡和速度誤差軌跡分別如圖2和圖3所示。在有時滯的條件下,系統的位置誤差軌跡和速度誤差軌跡分別如圖4和圖5所示。

圖2 無時滯時的位置誤差軌跡

圖3 無時滯時的速度誤差軌跡

圖4 有時滯時的位置誤差軌跡

圖5 有時滯時的速度誤差軌跡
從圖2和圖3可以看出,二階非線性多智能體系統在無時滯的情況下,其跟隨者的位置和速度與領導者的位置與速度之間的誤差曲線趨于0,同時也說明了該系統實現了組一致性;從圖3和圖4可以看出,智能體與領導者之間的誤差也趨于0,即多智能體系統在有時滯的影響下也能夠實現組一致性。
(1)無時滯非線性多智能體系統的群組一致性
假設智能體的初始狀態為:[-1.0,-0.9,-0.5,0.6,0.9,1.0,0.7,0.8,0.2,1.0,0.5,-0.3,0.4,-0.4,0.2,-0.2,0.1,-0.1,0.8,-0.8]。
(2)有時滯非線性多智能體系統的群組一致性
假設智能體的初始狀態為:[-10,-9,-11,12,9,1,-1,8,2,10,6,-12,7,-4,11,-4,6,-7,9,-8]。
本文設計了分布式領導跟隨控制協議,運用Lyapunov穩定性理論和線性矩陣不等式分別給出了連續時間多智能體系統在有通信時滯和通信時滯為0的2種情形下能夠實現3組一致性的充分條件。為了能讓理論成果得到進一步的論證,采用Matlab數學軟件對結果進行了數值模擬,通過仿真圖可以看到多智能體系統在控制協議下誤差的各個狀態均趨于0,說明多智能體系統實現了組一致性。