曲成剛,曹喜濱,張澤旭
(1.哈爾濱工業大學衛星工程技術研究所,150080哈爾濱;2.哈爾濱工業大學深空探測基礎研究中心,150080哈爾濱)
多智能體系統的研究是分布式智能控制研究的一個重要分支,它的目標是將大的復雜的系統(軟硬件系統)分解成小的、彼此相互通訊及協調、易于管理的系統(即智能體),從而實現復雜系統的有機集成[1].多智能體的編隊控制是指智能體之間形成或達到期望的距離和方位角.在陸地智能機器人編隊、水下自主航行器編隊、艦隊的編隊、無人機群編隊、導彈集群編隊控制,衛星星座的調度等方面,智能體之間的協同控制是一個不可回避的重要問題[2-6].
多智能體系統的編隊控制形式主要包括隊形形成、朝向目標、隊形保持、隊形變換和障礙規避等.目前主要的隊形控制方法有:1)人工勢場法,即通過定義人工勢場得到相應的隊形,但存在著隊形單一,不同的隊形需要定義不同的人工勢場,勢函數過于復雜等缺點[7-11];2)虛擬結構法,其缺點是應用范圍很大程度上受到虛擬結構法形成的隊形的限制[12];3)領航者-跟隨者法,對領航者的依賴程度大,一旦領航者失效會導致整個隊伍失效[13];4)基于行為的領航者-跟隨者方法,該方法雖然通過增加候補領航者在一定程度上降低了對領航者的依賴程度,但也可能存在候補領航者在領航者之前失效的可能,此時,候補領航者就沒有意義了[14].
本文將人工勢場法和虛擬領航者法相結合,得到一種新穎的多智能體隊形控制方法,不僅解決了對領航者的依賴問題,還能通過增加和布置虛擬體靈活地得到更多不同的隊形.在編隊控制過程中,智能體的運動規則是通過人工勢場來確定的,智能體被完全驅動時,每個智能體的控制力可以看作是智能體所受合力減去智能體勢能總和的梯度,這樣的控制力使得智能體的總勢能達到最小,利用局部勢能可以使智能體群體形成一些規定間距的幾何形狀.此外,在控制過程中引入了虛擬領航者(不是指真實存在的),智能體和這些虛擬領航者之間的作用和真實智能體之間的作用是一樣的,虛擬領航者的目的是指導群組或操縱這些群組的運動.
如圖1所示,假設一群由n個智能體(黑色表示,圖中為8個)和m個虛擬體(灰色表示,圖中為3個)組成的多智能體系統.智能體的受力情況如圖中箭頭所示,這些力包含了智能體與任何一個相鄰智能體的相互作用力.這個相互作用力是由人工勢場產生的,其大小為fI,相應的勢場函數為VI.

圖1 隊形控制示意
智能體的勢場函數定義為

虛擬體的勢場函數定義為

式中:rij、hik分別表示第i個智能體與第j個智能體和第i個智能體與第k個虛擬體之間的距離;αI、αh分別表示控制增益的標量;d1、h1分別表示智能體和虛擬體的勢場影響范圍;d0、h0分別表示智能體和虛擬體的最小勢能點半徑,當智能體與智能體之間的距離大于d0時,智能體之間表現為引力場,小于d0時,智能體之間表現斥力場,同理對于h0亦同,從而得到光滑的人工勢函數.
對VI和Vh求偏導數可以表示智能體在相鄰智能體和相鄰虛擬體的人工勢場中受到的勢場力,它們的大小分別表示為

以及

根據上述勢函數定義及假設,可知勢場力函數為連續函數.
除了上述兩個力外,智能體還受到一個可控的耗散力fv,當智能體達到期望的速度時(也只有在智能體達到期望值時),fv為零.后文將用李亞普諾夫函數來證明其穩定性.
在多智能體集群運動的隊形控制中,考慮將參考點設在第0個虛擬體上,由于所有的智能體都跟隨參考點運動,所以該虛擬體就相當于隊伍的“虛擬領航者”.只要事先設定虛擬領航者的航向和速度,根據各智能體與其相對位置和相對速度就可以得到各智能體的位置和速度,進而得到整個智能體系統的航行狀態,如圖2所示.

圖2 智能體在慣性坐標系中的表示
假設pi為第i個智能體在慣性坐標系的位置,其中pi∈R3,i=1,2,…,n;第i個智能體的速度定義為vi=˙pi;假設智能體在完全驅動的情況下,得到智能體系統的運動方程為

假設第i個智能體的控制力為ui,其中i=1,2,…,n;這群智能體在虛擬領航者的引導下以v0(t)速度運動.以一個虛擬領航者為原點(如圖中0號虛擬領航者表示)建立一個無旋轉的慣性坐標系,第i個智能體相對原點的位置矢量用ri表示;相對地,其速度為˙ri=vi-v0.
智能體在運動坐標系中表示為

由于矢量rij=ri-rj,控制力ui可以表示為

其中hi0≡ri,該控制律可以根據需要通過不同虛擬領航者的人工勢場加以修改.
如果沒有能量耗損,根據李雅普諾夫穩定性判據,多智能體系統是局部漸近穩定的,當存在不確定性時,相應的穩定平衡也存在對稱性.在一般情況下,考慮定義在狀態空間的李雅普諾夫函數一般形式為

上式對時間求導得

求導過程中使用了式(1)中控制律ui,因此,如果選擇fvi=-ai˙r,ai>0,(i=1,2,…,n),則 ˙Φ是負定的,而有且只有當對所有的i都有˙ri=0的時候,˙Φ等于0.
系統期望達到的運動狀態是各智能體與虛擬領航者之間的相對速度為零,即;從而使得每個智能體與領航者之間的相對位置為常值,即保持一定的編隊構型.由于Φ≥0,則當 Φ˙ <0時,即在足夠長的時間內,Φ(t)=0;又因為式(2)中構成Φ的三項均大于等于零,因此當Φ(t)=0時,必有
利用LaSalle不變性原理可以得到:已經臨近穩定并且無耗散的平衡狀態將以這種無耗散形式達到漸進穩定.
考慮一組通過定義的動態智能體系統,V0是常數,控制律由式(1)給出(其中控制律是光滑的),˙ri=0這種平衡可表示為下面的形式:

上式對所有的i,j=1,2,…n,j≠i和k=1,2,…,m-1都成立.假設h1和d1都已經被定義,將會在一定區域內達到全局漸進穩定,平衡點是全局人工勢能之和最小處.在沒有對稱性的情況下,穩定的全狀態空間可以得到實現;在有對稱的情況下,所有智能體的相對速度也將歸零,每個對稱變量將變成穩定的常數.
在集群運動的情況下,根據智能體個數的不同,智能體的位置呈現不盡相同的不確定性,即智能體的位置不唯一.為了打破這種不確定性,可以通過在原有的虛擬領航者的對稱位置或沒有智能體的位置上增加新的虛擬領航者來實現.
1)隊形形成.考慮由4個智能體(深灰色)和2個虛擬領航者構成的二維編隊隊形拓撲圖如圖3所示,其中4個智能體在2個虛擬體的作用范圍內.

圖3 多智能體系統編隊信息交換拓撲圖
假設虛擬領航者的運動方程為

其中i=1,2.智能體之間的期望距離為2;在笛卡爾坐標系下,1號虛擬領航者和2號虛擬領航者的速度都為[2,0],初始位置分別為[4,0],[2,0]; 4個 智能體的初始位置為[0,- 1.5],[0,-0.8],[0,1.5],[0,1.4],初始速度均為[0,0].為了更好地觀察隊形的變化,在笛卡爾坐標系下顯示仿真結果.根據虛擬領航者的動力學模型,虛擬領航者將進行勻速直線運動,仿真結果如圖4~5所示,其中圖4(a)為4個智能體和2個虛擬領航者構成的系統在隊形形成過程中,智能體運動平面內的運動軌線圖,圖4(b)為最終形成的隊形圖,圖5中(a)和(b)分別為智能體系統分別沿X軸和Y軸的速度變化曲線.

圖4 4個智能體和兩個虛擬領航者的編隊

圖5 4個智能體的速度變化曲線
由仿真結果可以看出,由4個智能體和2個虛擬領航者在人工勢場下系統的運動速度和智能體之間的距離都能夠達到期望值.
2)隊形變換.考慮將上面仿真得到的正方形隊形變換到直線形隊形,4個智能體與5個虛擬領航者之間、智能體之間的信息交換拓撲圖,以及各智能體在虛擬領航者作用范圍內的期望位置如圖6所示.

圖6 多智能體系統隊形變換信息交互拓撲
同樣假設智能體之間的期望距離為2,5個虛擬領航者的速度都為[2,0],它們之間的距離也為2,虛擬領航者將進行勻速直線運動.仿真結果如圖7~8所示.圖7(a)和(b)為智能體系統分別沿X軸和Y軸的速度變化曲線,圖8中(a)至(f)描述了隊形的變換過程.

圖7 4個智能體的速度變化曲線
從仿真結果可以看出,4個智能體在5個虛擬領航者的作用下形成了直線隊形,速度和位置都達到了期望值.

圖8 多智能體系統隊形變換過程
對多智能體的研究主要針對智能體個體之間的相互通信、協同合作及沖突消解,本文針對協同合作提出了一種基于人工勢場結合虛擬領航者的多智能體系統協同控制方法.這種方法首先建立智能體與虛擬領航者之間的人工勢場函數,其次通過對智能體的運動學方程的分析,給出智能體的控制力,進而完成隊形保持與變換,并利用多智能體系統的動能和勢能的總和作為李亞普諾夫函數,驗證了多智能體的集群運動和系統的穩定性.仿真實驗表明,該方法能夠實現隊形的保持與變換,具有一定的應用前景.
[1]劉金琨,王樹青.復雜系統多智能體不一致性問題的研究[J].控制與決策,1999,14(3):249-252.
[2]BELTA C,KUMAR V.Abstraction and control for groups of robots[J].IEEE Transactions on Robotics,2004,20 (5):865-875.
[3]王曉燕,王新民,肖亞輝,等.無人機三維編隊飛行的魯棒H∞控制器設計[J].控制與決策,2012(12): 1907-1911,1916.
[4]王銀濤,嚴衛生.多自主水下航行器系統一致性編隊跟蹤控制[J].控制理論與應用,2013,30(3):379-384.
[5]馬培蓓,紀軍.多導彈三維編隊控制[J].航空學報,2010,31(8):1660-1666.
[6] SU Housheng.Flocking in multi-agent systems with multiple virtual leaders based only on position mesurements[J].Communications in Theoretical Physics,2012,57(5): 801-807.
[7]KOKSAL M I,GAZI V,FIDAN B,et al.Tracking a maneuvering target with a swarm of non-holonomic agents using artificial potentials and sliding mode control[C]//In Proceedings ofthe 16th Mediterranean Conference on Control and Automation.Piscataway: IEEE,2008:1174-1179.
[8]周稼康,胡慶雷,馬廣富,等.基于一致性算法的衛星編隊姿軌耦合的協同控制[J].系統工程與電子技術,2011,33(4):825-832.
[9]MOHAMED E F,EL-METWALLY K,HANAFY A R. An improved TangentBugmethod integrated with artificial potential field for multi-robot path planning[C]//2011 International Symposium on Innovations in IntelligentSystems and Applications (INISTA). Piscataway:IEEE,2011:555-559.
[10]LIANG Y,LEE H H.Decentralized formation control and obstacle avoidance for multiple robots with nonholonomic constraints[C]//Proceedings of the 2006 American Control Conference.Minneapolis,Minnesota:[s.n.],2006:5596-5601.
[11]LEONARD N E,FIORELLI E.Virtual leader,artificial potentials and coordinated control of groups[C]// Proceedings of the IEEE Conference on Decision and Control.Piscataway:IEEE,2001:2968-2973.
[12]REN W,BEARD R W.A decentralized scheme for spacecraft formation flying via virtual structure approach[C]//Proceedings of the American Control Conference. Piscataway:IEEE,2003:1746-1751.
[13]CHEN X P,SERRANI A,OZBAY H.Control of leader follower formations of terrestrial UAVs[C]// Proceedings of the IEEE Conference o n Decision and Control.Piscataway:IEEE,2003:498-503.
[14]BALCH T,ARKIN R C.Behavior-based formation control formultirobotteams[J].IEEE Transactions on Robotics and Automation,1998,14(6):926-939.