高安安,胡愛(ài)花,江正仙
(江南大學(xué) 理學(xué)院,江蘇 無(wú)錫 214122)
隨著通信網(wǎng)絡(luò)技術(shù)的發(fā)展,多智能體系統(tǒng)越來(lái)越受到重視,并廣泛應(yīng)用于同步控制[1-3]、機(jī)器人協(xié)同[4]、傳感器網(wǎng)絡(luò)[5-6]、無(wú)人機(jī)編隊(duì)[7]控制等方面,其中,一致性問(wèn)題是多智能體系統(tǒng)研究的熱點(diǎn)問(wèn)題,也是根本性問(wèn)題。
在一致性問(wèn)題中,多智能體系統(tǒng)的安全一致性問(wèn)題成為關(guān)注重點(diǎn)。簡(jiǎn)單來(lái)說(shuō),安全一致性指存在網(wǎng)絡(luò)攻擊時(shí),多智能體系統(tǒng)的一致性情況。由于網(wǎng)絡(luò)攻擊對(duì)網(wǎng)絡(luò)的一致性具有破壞性的影響,因此,研究具有網(wǎng)絡(luò)攻擊的多智能體一致性問(wèn)題變得至關(guān)重要。常見(jiàn)的網(wǎng)絡(luò)攻擊有:拒絕服務(wù)(Denial of Service,DoS)、竊取、騷擾、欺騙等。目前對(duì)于網(wǎng)絡(luò)攻擊下的一致性問(wèn)題已取得了一些成果,如:文獻(xiàn)[8]研究了存在DoS 攻擊和輸入飽和下的領(lǐng)導(dǎo)-跟隨者網(wǎng)絡(luò)的安全一致性問(wèn)題;文獻(xiàn)[9]研究了DoS 攻擊下基于采樣控制的多智能體一致性;文獻(xiàn)[10]則研究了雙層網(wǎng)絡(luò)結(jié)構(gòu)下存在DoS 攻擊的安全一致性。
值得指出的是,不同于上述文獻(xiàn)[8-10]中一致性誤差系統(tǒng)漸近收斂到零,在安全一致性相關(guān)研究中,有些文獻(xiàn)實(shí)現(xiàn)了一致性誤差系統(tǒng)的均方有界收斂,如:采用脈沖控制方法,文獻(xiàn)[11]研究了欺騙攻擊下多智能體的均方有界一致性問(wèn)題;文獻(xiàn)[12]考慮了帶有隨機(jī)噪聲的智能體狀態(tài)方程,得到了欺騙攻擊下多智能體系統(tǒng)均方有界一致的充分條件;文獻(xiàn)[13]在系統(tǒng)存在時(shí)延和噪聲的條件下,設(shè)計(jì)了一種狀態(tài)估計(jì)器,實(shí)現(xiàn)了多智能體狀態(tài)估計(jì)誤差的均方有界一致。相較于DoS 攻擊,欺騙攻擊形式更為復(fù)雜[11-12],通過(guò)注入虛假信息到控制器,對(duì)系統(tǒng)一致性造成了破壞性影響,同時(shí)難以被檢測(cè)和識(shí)別。因此,本文考慮網(wǎng)絡(luò)中存在欺騙攻擊的非線性多智能體系統(tǒng),進(jìn)一步研究均方有界一致性問(wèn)題。
在多智能體一致性研究中,現(xiàn)有文獻(xiàn)中采用了多種控制方法,包括采樣控制、間歇控制、牽引控制、事件觸發(fā)控制和脈沖控制等。如文獻(xiàn)[14]研究了牽引控制下多智能體的一致性問(wèn)題;文獻(xiàn)[15-16]使用事件觸發(fā)控制方法,得到了多智能體系統(tǒng)的一致性。多智能體安全一致性研究中,這些控制方法也被加以使用,如:文獻(xiàn)[17-18]研究了基于事件觸發(fā)控制的多智能體安全一致性;文獻(xiàn)[19]考慮了時(shí)延情況下多智能體安全一致性問(wèn)題。另外,針對(duì)一致性問(wèn)題,單一控制方法往往無(wú)法獲得良好的一致性效果,因此多種控制方法的組合也被廣泛應(yīng)用于多智能體一致性問(wèn)題的研究,在一致性收斂速度和控制成本方面有較好的改善。脈沖控制方法僅在離散時(shí)刻點(diǎn)施加控制,經(jīng)濟(jì)有效。但傳統(tǒng)脈沖控制周期固定,本文結(jié)合事件觸發(fā)機(jī)制,提出分布式事件觸發(fā)脈沖控制方法,深入研究多智能體系統(tǒng)的安全一致性。由于脈沖控制對(duì)于脈沖間隔有嚴(yán)格要求,因此事件觸發(fā)條件的設(shè)計(jì)具有挑戰(zhàn)性。
基于上述討論,針對(duì)欺騙攻擊下多智能體系統(tǒng)的安全一致性,本文在固定脈沖時(shí)間間隔控制[11]的基礎(chǔ)上,進(jìn)一步結(jié)合事件觸發(fā)機(jī)制[18],得到了領(lǐng)導(dǎo)-跟隨者多智能體系統(tǒng)在事件觸發(fā)脈沖控制下的安全一致性。最后,通過(guò)數(shù)值仿真驗(yàn)證了理論結(jié)果的有效性。
本文提出了一種具有觸發(fā)時(shí)間間隔上界的事件觸發(fā)脈沖控制方案:當(dāng)控制器的觸發(fā)時(shí)間間隔達(dá)到給定的時(shí)間上界,即使事件觸發(fā)條件沒(méi)有滿足,也會(huì)進(jìn)行觸發(fā),產(chǎn)生脈沖信號(hào),同時(shí)更新觸發(fā)條件;進(jìn)一步,與單一固定脈沖時(shí)間間隔的脈沖控制方法相比,引入的事件觸發(fā)機(jī)制能夠加快一致性速度,靈活地控制脈沖時(shí)間間隔。

考慮一個(gè)包含N個(gè)跟隨者的領(lǐng)導(dǎo)-跟隨者多智能體系統(tǒng)網(wǎng)絡(luò)模型,領(lǐng)導(dǎo)-跟隨者多智能體系統(tǒng)的網(wǎng)絡(luò)模型描述如下:


在原有固定時(shí)間脈沖控制的基礎(chǔ)上,為了能夠優(yōu)化調(diào)整脈沖時(shí)間間隔,引入事件觸發(fā)機(jī)制。在本文中,事件觸發(fā)時(shí)刻即是脈沖時(shí)刻,而事件觸發(fā)時(shí)刻由事件觸發(fā)條件控制。接下來(lái),將會(huì)分析給出事件觸發(fā)條件。
對(duì)于智能體i,先考慮脈沖時(shí)間間隔固定,設(shè)脈沖時(shí)間間隔為h,且h1<h<h2,即:

再設(shè)無(wú)最大觸發(fā)時(shí)間間隔限制的事件觸發(fā)條件為:

本節(jié)主要介紹脈沖控制器遭受欺騙攻擊的情況。首先,給出系統(tǒng)遭受的攻擊為ξi(t),接著給出系統(tǒng)遭受攻擊的概率,設(shè)隨機(jī)變量θi(t)表示事件智能i在t時(shí)刻被攻擊的結(jié)果:令θi(t)=1 表示攻擊成功,θi(t)=0 表示攻擊失敗;并且P(θi(t)=1)=,P(θi(t)=0)=1-,其中∈[0,1]是一個(gè)常數(shù)。接下來(lái),我們給出脈沖控制模型。如果欺騙攻擊成功,則第i個(gè)智能體接收的脈沖信號(hào)將被錯(cuò)誤的數(shù)據(jù)所取代;如果沒(méi)有攻擊或者攻擊失敗,則脈沖信號(hào)為式(2),即:

針對(duì)上述多智能體系統(tǒng),為了便于理論分析,給出如下假設(shè)。
假設(shè)1 智能體網(wǎng)絡(luò)存在以領(lǐng)導(dǎo)者為根節(jié)點(diǎn)的有向生成樹(shù)。
假設(shè)2 對(duì)于非線性函數(shù)f(·),存在非負(fù)常數(shù)rij(i=1,2,…,N,j=1,2,…,n)使得對(duì)于任意x1,x2∈Rn有下式成立:

假設(shè)3 隨機(jī)變量θi(t)(i=1,2,…,N) 相互之間是獨(dú)立的。

結(jié)合式(9),受到欺騙攻擊的多智能體系統(tǒng)(1)可以進(jìn)一步表示為:

定義1[11]如果存在一個(gè)閉集z和一個(gè)正常數(shù)σ,對(duì)任意的xi(0) ∈Rn,誤差系統(tǒng)ζ(t)的數(shù)學(xué)期望(用符號(hào)表示則為E{‖ζ(t)‖})收斂于集合z,則稱多智能體(1)是均方有界一致的:

本節(jié)將給出遭受欺騙攻擊的多智能體系統(tǒng)(1)在控制協(xié)議(9)下實(shí)現(xiàn)安全一致性的充分條件。
定理1在假設(shè)1 至假設(shè)4 成立的條件下,如果存在正定矩 陣P和正數(shù)α>0,c>0,ε>0,φ∈(0,1),μ=(1+ε)φ∈(0,1)使得下式成立:

則誤差系統(tǒng)(12)實(shí)現(xiàn)了均方有界一致,且界限為z1,其中:


至此,誤差系統(tǒng)實(shí)現(xiàn)了均方有界一致,這意味著多智能體系統(tǒng)(1)在控制協(xié)議(9)下實(shí)現(xiàn)了安全一致性。需要指出的是,事件觸發(fā)機(jī)制可能導(dǎo)致芝諾行為的發(fā)生,從而破壞系統(tǒng)的穩(wěn)定性。接下來(lái),我們將排除芝諾行為。

本章將通過(guò)兩個(gè)例子來(lái)驗(yàn)證理論結(jié)果的有效性:例1 是具有1 個(gè)領(lǐng)導(dǎo)者和4 個(gè)跟隨者的多智能體系統(tǒng);例2 則是網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中不存在以領(lǐng)導(dǎo)者為根節(jié)點(diǎn)的有向生成樹(shù)的仿真事例。
例1:考慮一個(gè)具有4 個(gè)跟隨者和1 個(gè)領(lǐng)導(dǎo)者的多智能體系統(tǒng),領(lǐng)導(dǎo)者和跟隨者的網(wǎng)絡(luò)拓?fù)淙鐖D1 所示。

圖1 例1的多智能體的網(wǎng)絡(luò)拓?fù)鋱DFig.1 Multi-agent network topological graph of example 1
圖1 中數(shù)字0 代表領(lǐng)導(dǎo)者智能體,數(shù)字1~4 代表跟隨者智能體,則可以得到拉普拉斯矩陣為:

領(lǐng)導(dǎo)者與跟隨者2 和跟隨者3 有牽引關(guān)系,可以表示為D=diag{0,3,2,0}。
多智能體系統(tǒng)中領(lǐng)導(dǎo)者的運(yùn)動(dòng)方程為:

跟隨者的運(yùn)動(dòng)方程滿足:

因P(θi(t)=1)=,可取攻擊發(fā)生概率θˉ=0.1;取攻擊數(shù)據(jù)為ξi(t)=[0.11,-0.11]T,則有ξ=0.0242。為了便于分析,設(shè)定參數(shù)c=0.35,ε=0.2。用Matlab 求解定理1 中式(13)和式(14)可得α=2,μ=0.543。由式(15)可得h2<,再根據(jù)不等式h<h2,可設(shè)定固定脈沖時(shí)間間隔h=0.3,結(jié)合定理1 式(16)計(jì)算可得誤差邊界為0.366。由于本文使用事件觸發(fā)控制,且事件觸發(fā)條件表示為:Fi(t)=,則設(shè)定事件觸發(fā)條件的參數(shù)為γ=0.1,η=0.1。
圖2 是智能體xi1(i=0,1,2,3,4)和智能體xi2在事件觸發(fā)脈沖控制下的運(yùn)行狀態(tài)。可以看出智能體的狀態(tài)由離散逐漸收斂,但并沒(méi)有達(dá)到一致,而是在一定范圍內(nèi)波動(dòng),即達(dá)到了均方有界一致。

圖2 例1中xi(i=0,1,…,4)在事件觸發(fā)脈沖控制下的狀態(tài)Fig.2 States of agents xi(i=0,1,…,4) under event-triggered impulsive control in example 1
由于欺騙攻擊隨機(jī)發(fā)生,為了減少仿真結(jié)果的誤差干擾,運(yùn)行程序50 次,并計(jì)算‖ζ(i)(t)‖(i=1,2,…,50)的值取平均,并把平均值定義為平均誤差。圖3 是在固定脈沖時(shí)間間隔與事件觸發(fā)脈沖控制下智能體的平均誤差,圖中虛線的數(shù)值為誤差邊界0.366。從圖3(a)、(b)可以看出智能體的平均誤差均小于給定的誤差邊界,而且在事件觸發(fā)脈沖控制下,平均誤差的收斂更快。

圖3 固定脈沖時(shí)間間隔與事件觸發(fā)脈沖控制下智能體的平均誤差Fig.3 Average error of agents under fixed impulsive time intervals and event-triggered impulsive control
圖4 為事件觸發(fā)控制下智能體的脈沖時(shí)間序列,數(shù)值為0 表明沒(méi)有脈沖,數(shù)值1、2、3、4 則分別代表跟隨者智能體x1、x2、x3、x4的脈沖次數(shù)。可以看出,事件觸發(fā)脈沖控制能夠根據(jù)智能體的運(yùn)行情況,有效地調(diào)節(jié)脈沖時(shí)間間隔,從而合理地調(diào)節(jié)脈沖次數(shù),更快地達(dá)到一致性。

圖4 事件觸發(fā)脈沖控制下跟隨者智能體的脈沖間隔Fig.4 Impulsive intervals of follower agents under event-triggered impulsive control
圖5 則分別給出了4 個(gè)智能體在網(wǎng)絡(luò)攻擊概率為0.1 時(shí)遭受網(wǎng)絡(luò)攻擊的次數(shù),其中數(shù)值為1 代表智能體遭受到攻擊,數(shù)值為0 則智能體未遭受到攻擊。從圖5 可以看出,遭受攻擊的次數(shù)符合攻擊概率0.1。

圖5 智能體遭受攻擊的次數(shù)Fig.5 Number of attacks on agents
例2:不同于例1 中的網(wǎng)絡(luò)圖中存在以領(lǐng)導(dǎo)者為根節(jié)點(diǎn)的有向生成樹(shù),例2 的拓?fù)鋱D則不包含以領(lǐng)導(dǎo)者為根節(jié)點(diǎn)的有向生成樹(shù),其節(jié)點(diǎn)數(shù)和網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖6 所示,圖中數(shù)字0 代表領(lǐng)導(dǎo)者智能體,數(shù)字1~4 代表跟隨者智能體,對(duì)應(yīng)的拉普拉斯矩陣為:

例2 中相關(guān)的矩陣和參數(shù)與例1 中的設(shè)置相同,僅在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)上作出改變。由圖6 可以看出領(lǐng)導(dǎo)者與跟隨者2有牽引關(guān)系,可以表示為D=diag{0,3,0,0}。圖7 給出了智能體狀態(tài)的一維分量和二維分量,由圖中可以看出當(dāng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)不存在以領(lǐng)導(dǎo)者為根節(jié)點(diǎn)的有向生成樹(shù)時(shí),即不滿足文中假設(shè)1 時(shí),智能體狀態(tài)沒(méi)有達(dá)到均方有界一致。

圖6 例2的多智能體的網(wǎng)絡(luò)拓?fù)鋱DFig.6 Multi-agent network topological graph of example 2

圖7 例2中xi(i=0,1,…,4)在事件觸發(fā)脈沖控制下的狀態(tài)Fig.7 States of agents xi(i=0,1,…,4) under event-triggered impulsive control in example 2
本文研究了欺騙攻擊下多智能體系統(tǒng)的安全一致性問(wèn)題,結(jié)合脈沖控制和事件觸發(fā)控制,通過(guò)線性矩陣不等式設(shè)置的一致性參數(shù),利用圖論和李雅普諾夫穩(wěn)定性理論,推導(dǎo)出了多智能體系統(tǒng)一致性誤差系統(tǒng)的均方有界收斂條件,并給出了數(shù)值仿真的結(jié)果。相較于單一的脈沖控制,脈沖控制和事件觸發(fā)控制相結(jié)合能夠加快一致性速度,靈活地調(diào)整脈沖時(shí)間。然而不足的是,本文并沒(méi)有考慮時(shí)延等實(shí)際因素,進(jìn)一步的研究將關(guān)注帶有時(shí)滯的多智能體系統(tǒng)均方有界一致性問(wèn)題。