邵星靈,岳曉輝,劉 俊,李 杰,唐 軍
(1.中北大學儀器與電子學院,太原 030051; 2.中北大學儀器科學與動態測試教育部重點實驗室,太原 030051)
多智能體系統是由若干個具有有限計算、通信、控制能力的個體,借助特定的信息交互機制所形成的一類高度可重構、按需設計、分布式自主智能的網絡化自治系統,因具備顯著的任務執行效能、魯棒性與靈活性,引發了包括物理、生物、軍事、社會和工程科學等領域國內外研究學者的廣泛關注[1-2]。分布式多智能體協同控制技術是確保多智能體系統高效、自主協作的關鍵使能技術[3-4],其內涵在于通過鄰居間的局部信息交互與分享,基于可利用的量測信息設計多智能體一致性協議,使得智能體相關狀態趨同,從而實現既定的共同控制目標。根據具體控制任務的不同,多智能體分布式協同控制可大致分為協同一致性[5]、協同編隊[6-7]、定點集結[8]和協同目標跟蹤[9]等。
協同目標跟蹤是多智能體系統的主要應用場景之一,最具代表性的載體形式如多無人機協同目標跟蹤[10-11]和多無人車協作目標包圍等,具有明顯的軍民兩用價值。例如,在軍事領域,為適應復雜動態戰場環境和偵察、打擊、毀傷評估等多樣化作戰任務需求,往往需要在指定的空域內部署多無人機系統,對敵方敏感目標執行協同環繞觀測與隱蔽性跟蹤任務,最終在確保自身安全性的前提下,實現對非合作目標的多維度信息收集與實時精準定位功能;在民用場合,為實現核電站核能源泄露或化工廠危險化學氣體溯源追蹤、監測與危險評估,以高效率、低成本、無人員傷亡為特征的多無人機系統以可變的繞飛半徑,對污染源目標進行協同監測已成為應對以上難題的重要手段。不難發現,為確保復雜環境下順利執行上述協同目標跟蹤任務,通過調整多智能體自身與目標及其他智能體之間的相對位置及相位分布,以目標為圓心、最佳觀測距離為半徑實施協同伙伴繞飛循環跟蹤,即所謂的多智能體協同目標環繞控制技術,是發揮多智能體群體目標跟蹤任務效能、實現重要區域/隱蔽目標的特征深度挖掘與學習分類、增強自主與協作能力的關鍵。與持續目標跟蹤模式相比,具有在高度隱蔽性條件下實現全方位目標動態覆蓋、防止目標信息丟失或機動逃逸等優勢。然而,復雜未知的運行環境、嚴苛的任務約束、目標運動信息的不確定性給多智能體協同目標環繞控制技術提出了諸多挑戰,具體表現在:首先,機載傳感設備測量精度不足和對模型機理認識不充分,將不可避免地導致系統呈現顯著的非線性特性,此外,在實際工程應用中,復雜未知的作業環境引發的多源擾動會導致單體控制性能退化,嚴重制約了全局精準協同控制效能;其次,為保證安全觀測距離和避免相鄰智能體碰撞,通常需根據特定任務剖面及多智能體數量規模設計相應的環繞半徑、環繞角速度及智能體間相對角間距,如何滿足上述混合約束是多智能體協同目標環繞面臨的又一大技術難題;最后,受實際工作環境下探測手段匱乏、非合作式目標運動特性難以預測等因素制約,目標關鍵信息的獲取與感知往往具有極大的不確定性。特別地,對于高機動的運動目標,往往需要多智能體具有更高效、敏捷的協作能力和反應速度,以完成對目標的實時監測和跟蹤。因此,亟需構建具有強抗擾性、可滿足混合約束、適應目標運動不確定性的協同控制方法,是解決多智能體系統協同目標環繞問題的重要途徑,也是未來復雜作戰/作業環境下多樣化任務驅動下多智能體一致性技術的主要發展趨勢。
國內外研究學者針對單智能體環繞追蹤目標的研究工作起步較早,取得了大量具有借鑒價值的學術成果。美國空軍研究實驗室(Air Force Rese-arch Laboratory,AFRL)的Cao等[12]提出了一種基于相對距離和相對速度的控制方案,通過設計合適的Lyapunov函數,完成了任意初始位置下對靜止目標的環繞跟蹤。澳大利亞國立大學的Deghat等[13]針對目標監測問題,設計了不依賴目標位置的控制器和觀測器,實現了非完整機器人在純方位量測下對目標的環繞跟蹤。大連海事大學的Liu等[14]僅利用相對視線距離和相對視線角的量測信息,在參數不確定性、未建模動態和環境干擾并存的情況下,實現了欠驅動無人船對未知運動目標的追蹤。韓國忠南大學的Oh等[15]提出了一種基于微分幾何的對峙跟蹤制導律,并通過實驗驗證了該方法的有效性。CEM實驗室的Ghommam等[16]針對速度未知且時變的移動目標,提出了一種基于視覺的四旋翼無人機環繞目標跟蹤算法,通過攝像機確定四旋翼相對于目標的位置,實現了特定高度下四旋翼以指定半徑對運動目標的環繞觀測。南京理工大學的Zhang等[17]研究了一種考慮目標狀態的控制方案,結合飽和控制和有限時間控制技術,確保了無人機和目標之間的相對距離在有限時間內收斂到預設的期望值。
相對于單體目標跟蹤,受限于多體跟蹤目標任務的復雜性,針對多智能體協同目標環繞的研究相對遲緩,目前還處于起步階段。南京理工大學的Zhang等[18]利用有限時間一致性協議,實現了多個非完整機器人對單目標的協同環繞跟蹤。加拿大皇家軍事學院的Marasco等[19]通過對非線性分散系統的分析, 實現了一組無人機對單一目標的包圍控制。湖南大學的Yi等[20]針對協同目標環繞跟蹤問題,基于相位協同的分布式控制策略,在無擾環境下完成了既定的控制目標。
然而,上述研究結果在目標量測信息的依賴性、處理復雜多擾的不確定性、滿足目標環繞所需的混合約束條件等方面存在一些不足:首先,大部分控制或制導律設計都假定目標量測信息足夠豐富,即目標的速度和加速度都是精確可測的,在現實中受多種因素制約往往難以滿足;其次,已有研究對目標跟蹤過程中廣泛存在的不確定性欠缺考慮,對復雜多擾環境施加于閉環控制性能的影響缺乏重視;此外,如何在多智能體分布式一致性框架下,構造合適的相位一致性協議,滿足所必須的混合約束條件目前還是開放性問題。
本文在總結國內外相關研究工作不足的基礎上,提出了一種基于固定閾值事件觸發擴張狀態觀測器(Extended State Observer based on a Fixed Thresh-old Event,FTESO)的多智能體協同目標環繞控制方法。與已報道相關工作的區別之處在于:
1) 與已有的基于領航—跟隨合作式框架下的多智能體時變編隊控制策略[26-27]相比,其設計目標主要關注多條參數化路徑上的位置同步,領航者信息往往事先已知或者存在有效通信鏈路可以獲得。而本文解決的是一種針對未知運動目標的非合作式協同環繞跟蹤問題,環繞任務需要繞飛半徑、環繞角速度和相對角間距達到預先設計要求;此外,由于待跟蹤的目標與多智能體之間不存在主動通信,其量測信息不夠豐富,如速度、加速度往往不可測或測不準,因此該協同任務處置更具挑戰性。
2) 與已報道的基于Lyapunov導航向量場的目標環繞制導律[28-29]相比,其構造過程中大多假設目標速度與加速度可測;而本文提出的多智能體相位協同一致性協議不依賴目標速度及加速度信息,并且可確保環繞半徑、環繞角速度和相對角間距達到預先設計要求,可實現無需目標速度和加速度先驗信息條件下的多智能體協同目標包圍控制。
3) 與文獻[21]涉及的依賴連續信息傳輸/更新的ESO相比,設計了一種FTESO,不僅能夠對相對速度和多源未知擾動進行同步精確估計,而且可以通過調節事件觸發閾值,顯著降低單體測量端的信息更新與傳輸頻率,在不影響環繞跟蹤品質的前提下有效節約了單體計算/能量資源。
如果將每個多智能體都視為一個節點,單體間存在的信息交互看成連接節點的邊,那么整個系統的通信拓撲結構可以通過無向圖G={V,E,A}來刻畫。其中V={1,2,…,N}表示點集,E?V×V表示邊集,A=[aij]∈RN×N表示加權鄰接矩陣。無向邊(j,i)=(i,j)∈E表示節點i和它的鄰居j之間可以進行信息交互,此時對應的邊權重aji=aij=1;否則,aij=0。假設系統中不存在自環,即aii=0。
引理1[22-23]對于無向圖G中?i,j∈V,有
引理2[22-23]若無向圖G是連通的,則
考慮一個由N個智能體組成的同構多智能體系統,對于其中的任何一個智能體,運動學模型可以描述為
(1)
式中,pi=[pi,x,pi,y]T和vi=[vi,x,vi,y]T分別代表智能體i的位置和速度矢量;fi(pi,vi)是一個與系統狀態相關的未知非線性函數;ui=[ui,x,ui,y]T表示智能體i的控制輸入;Δi=[Δi,x,Δi,y]T表示施加在智能體i上的未知有界外部干擾。值得指出的是,本文所考慮的多智能體模型可以涵蓋一大類非線性不確定物理系統,如無人機、無人船、機械臂等,與文獻[7]涉及的線性多智能體對象相比,充分考慮了系統未知模型非線性和外部環境擾動的影響。此外,本文并不需要全狀態可測,討論了更為一般和實際的輸出反饋情形。
定義運動目標的位置為pt=[pt,x,pt,y]T。如圖1所示,在慣性坐標系E={Xe,Ye}下,智能體i與目標之間的相對距離和相對視線角可以表征為

(2)

圖1 多智能體協同目標對峙跟蹤示意圖Fig.1 Schematic diagram of multi-agent cooperative target confrontation tracking
本文的任務是達成控制目標(3)~(5),完成多智能體對未知目標的協同環繞跟蹤,確保每個智能體以期望的環繞半徑和環繞角速度對目標實施對峙封鎖;此外通過調控智能體間的相對角間距,實現對目標的全方位動態監測。
(3)
(4)
(5)
其中,ρd和ωd分別代表期望的環繞半徑和環繞角速度;φij代表智能體間期望的環繞角間距,滿足φij=-φji∈[-π,π]。
根據智能體i與目標的相對運動關系,構建相對運動學模型如下
(6)

(7)

(8)
設計固定閾值事件觸發條件為
(9)

假設2[24]存在正定函數V,B∶R3→R和正常數λi1、λi2、λi3、λi4、ci1、ci2滿足如下不等式

(10)
(11)

(12)
其中,ηi(t)=[ηi,1,ηi,2,ηi,3]T∈R3,i=1,2,…,N。

(13)
固定閾值事件觸發條件可改寫為
(14)

(15)
其中
證明:定義FTESO的觀測誤差為

(16)
從而歸一化觀測誤差可描述為
(17)
對ηi,m求導,并結合式(13)和式(17)可得
m=1,2
(18)
且
(19)
整理式(18)~式(19)可得
(20)
借助假設1和2,利用式(13)和式(17),則正定Lyapunov函數V關于時間的導數可以表示為
(21)
隨后,進一步可得
(22)
(23)
(24)
其中,對于式(24)右端中的第一項可放縮為

(25)
對于第二項,可放縮為如下形式
(26)
整合式(24)~式(26),觀測誤差的上界可表示為
(27)

圖2所示為多智能體協同目標環繞的控制結構框圖。基于分布式一致性原理,構造具有飽和特性的多智能體相位同步誤差為

(28)
式中,ξ是正常數。當智能體i與智能體j之間存在信息交互時,aij=1;否則,aij=0。

圖2 多智能體協同目標環繞的控制結構框圖Fig.2 Control structure diagram of multi-agent system circle around the target
根據速度方向場理論可知,任意方向的速度向量均可由空間任意兩點連線的徑向量和垂直于該連線的法向量構成。如圖3所示,本文假定智能體都逆時針方向環繞目標,則以目標為坐標原點建立視目坐標系,目標與智能體i之間的期望相對速度可設計為

(29)


圖3 期望的相對速度示意圖Fig.3 Schematic of the desired relative velocity

(30)
對式(30)求導,并結合式(8)可得
(31)
基于式(31)和FTESO的估計結果,設計不依賴目標加速度信息的多智能體相位一致性控制協議
(32)

聯立式(9)和式(31)、式(32),以ri,p和ei,v為變量的相對運動系統動態可重寫為
(33)


μi1=ki1-1>0,μi2=ki3-1>0,i=1,2…,N
(34)
證構造Lyapunov函數為
(35)
對V1求導并考慮式(33),可得
(36)

(37)
利用Young’s不等式,結合固定閾值事件觸發條件(9)和定理1,可得
(38)
其中,κi=[κi,x,κi,y]T,δi=[δi,x,δi,y]T。
(39)

(40)
求解式(40)可得
(41)

(42)

注意到式(2)中的視線角θi,其導數可表示為
=ωd-ki2hi+γi
(43)
其中
(44)

(45)

(46)
構造Lyapunov函數為
(47)
對V2求導,并應用引理1可得
γi-γj)]
(48)
對式(48)在(0,t)上積分并移項得
(49)

(50)

需要說明的是,本文考慮的分布式控制策略可適用于任意數量的多智能體協同目標環繞跟蹤任務。由于每個智能體僅與其相鄰的智能體進行信息交互,故相較于集中式控制策略,分布式控制策略具有更強的靈活性、擴展性以及容錯性,可按需設計增加或減少智能體個數。此外,本文涉及的分布式控制策略可以充分節省每個智能體的計算性能,有效降低控制系統對傳感器和通信帶寬的要求,同時所提單體控制算法的具體實現都是基于代數和遞推方程組,并不存在數值優化和迭代等耗時程序,因此目前主流的數字微處理器完全可以勝任該算法的實時執行與處理。
本文以6個智能體為例,構建多智能體網絡系統,分別對不同運動模式的目標實施協同環繞跟蹤,以驗證所提控制算法的有效性。智能體間的通信拓撲結構如圖4所示,表1具體給出了智能體與目標的初始位置參數、控制目標參數及一致性協議增益。此外,每個智能體的模型未知非線性為
f1=[0.1(p1,x+p1,y)sin(0.2t), 0.1(v1,x+v1,y)sin(0.2t)]T
f2=[0.1(p2,x+p2,y)cos(0.8t), 0.1(v2,x+v2,y)cos(0.8t)]T
f3=[0.1(p3,x+p3,y)sin(0.5t), 0.1(v3,x+v3,y)sin(0.5t)]T

圖4 智能體間的通信拓撲Fig.4 Communication topology among agents

表1 仿真初始化參數
f4=[0.1(p3,x+p3,y)sin(0.2t), 0.1(v3,x+v3,y)cos(0.2t)]T
f5=[0.1(p3,x+p3,y)sin(0.8t), 0.1(v3,x+v3,y)cos(0.8t)]T
f6=[0.1(p3,x+p3,y)sin(0.5t), 0.1(v3,x+v3,y)cos(0.5t)]T
作用于每個智能體的外部干擾為
Δ1=[0.5(sin(0.5t)-cos(0.8t)), 0.5(cos(0.5t)-cos(0.8t))]T
Δ2=[0.5(sint+sin(0.5t)), 0.5(cost+sin(0.5t))]T
Δ3=[0.5(sint-cos(0.8t)), 0.5(cost-cos(0.8t))]T
Δ4=[0.5(cos(0.5t)-sin(0.8t)), 0.5(sin(0.5t)-sin(0.8t))]T
Δ5=[0.5(cost+cos(0.5t)), 0.5(sint+cos(0.5t))]T
Δ6=[0.5(cost-sin(0.8t)), 0.5(sint-sin(0.8t))]T
(1)工況1:目標作勻速直線運動

圖5 工況1的協同環繞控制效果Fig.5 Synergistic encirclement control effect under condition 1

圖6 工況1的控制目標實現情況Fig.6 Simulation results of control objects under condition 1

圖7 工況1場景下FTESO對智能體1的相對速度和集總干擾估計效果Fig.7 Estimation effect of relative velocity and the lumped disturbance utilizing FTESO under condition 1
(2)工況2:目標作余弦機動


圖8 工況2的協同環繞控制效果Fig.8 Synergistic encirclement control effect under condition 2

圖9 工況2的控制目標實現效果Fig.9 Simulation results of control objects under condition2

圖10 工況2場景下FTESO對智能體1的相對速度和集總干擾估計效果Fig.10 Estimation effect of relative velocity and the lumped disturbance utilizing FTESO under condition 2
(3)FTESO和ESO的性能對比
以智能體1為例,將FTESO與基于時間觸發機制的傳統ESO進行對比,以驗證本文所提的FTESO在降低采樣消耗方面的性能優勢。為保證對比實驗的公平性,所有涉及的參數與工況2保持一致,且仿真實驗均在采樣頻率為1kHz的MATLAB/Simulink環境中進行。
圖11中(a)-(b)、(c)-(d)和(e)-(f)分別描述了傳統ESO和事件觸發ESO在相同條件下的觀測性能對比。如圖11(a)-(b)所示,FTESO能夠顯著降低測量端ESO的更新數據量;如圖11(c)-(d)所示,相較于基于時間觸發機制驅動的傳統ESO,FTESO在增大采樣間隔方面展現出巨大優勢,可實現在非周期采樣條件下對不可測相對速度和未知集總干擾的精準估計,極大地減少了觸發信號的更新頻次;由圖11(e)-(f)可以看出,FTESO的估計效果并沒有明顯惡化。為進一步說明FTESO的優越性,通過對兩種不同采樣機制中觸發次數和估計誤差進行量化比較(見表2),不難發現,所提的FTESO可以在不顯著犧牲觀測性能的前提下,有效釋放測量端信號采樣與傳輸負擔,緩解單體計算/能量資源受限的窘境。

(a)

(b)

(c)

(d)

(e)

(f)圖11 FTESO和傳統ESO[25]的性能比較Fig.11 Performance comparisons between FTESO and traditional ESO[25]

表2 FTESO和ESO觀測性能對比
本文針對外部干擾、模型非線性、目標加速度信息未知情況下多智能體的對峙目標跟蹤問題,提出了一種基于固定閾值事件觸發擴張狀態觀測器的多智能體協同目標環繞控制方案。理論證明和仿真結果表明:1)所提的FTESO可快速準確地估計出目標與各個智能體之間的相對速度和集總干擾,可確保在不犧牲估計精度的前提下,有效降低測量回路信息數據量;2)無論面對勻速直線運動目標還是余弦機動目標,本文所提一致性協議均能實現預期的協同環繞目標跟蹤。值得注意的是,若進一步增大所提FTESO的觸發固定閾值,勢必導致測量端信號相鄰采樣間隔延長,干擾估計精度和目標環繞控制精度都會進一步惡化。因此,事件觸發模塊參數的選取應優先考慮目標環繞控制性能,在性能指標得以滿足的前提下可進一步微調觸發閾值,以降低多智能體測量/計算資源不必要的損耗。考慮到多智能體之間協同避障是實現協作任務安全性的前提保障,未來將會在所提策略的框架下引入勢場函數法,消除多智能體之間的沖突行為,確保多智能體在目標環繞過程中具備良好的防撞規避能力。