李 文,萬曉冬,周文文
(南京航空航天大學(xué) 自動化學(xué)院,南京 211106)
面對復(fù)雜的戰(zhàn)場環(huán)境,單架無人機的感知、決策、攻擊能力受到一定的束縛,無法滿足現(xiàn)代戰(zhàn)爭的需求[1-2],多無人機協(xié)同作戰(zhàn)成為近年來無人機控制領(lǐng)域的研究熱點。針對不同的作戰(zhàn)任務(wù),無人機群體需要選擇合適的隊形并保持隊形,因此研究無人機群體在復(fù)雜環(huán)境下的編隊及避障愈加必要。
目前比較成熟的編隊算法有:領(lǐng)航跟隨者法[3]、虛擬結(jié)構(gòu)法[4-5]、基于行為法[6]。領(lǐng)航跟隨者法簡化了各無人機間的通信協(xié)作問題,便于形成期望的編隊隊形,但該方法太依賴領(lǐng)航者,一旦領(lǐng)航者發(fā)生故障會導(dǎo)致編隊系統(tǒng)癱瘓而無法完成作戰(zhàn)任務(wù)。虛擬結(jié)構(gòu)法將無人機編隊隊形看作是一個剛體的虛擬結(jié)構(gòu),每架無人機是虛擬結(jié)構(gòu)上相對位置固定的一點,編隊運動時,無人機只需跟隨固定點運動,優(yōu)點是方便整體描述無人機編隊的行為,可以進行隊形反饋,缺點是編隊無法建立數(shù)學(xué)模型,很難進行數(shù)學(xué)分析。基于行為法本質(zhì)上是一種分布式控制方法,不受無人機群體規(guī)模的影響,但它的缺點在于無法顯式地定義群體行為,難以在數(shù)學(xué)上定量描述編隊特性。為了克服各個編隊方法的缺陷,近年來學(xué)術(shù)界將基于行為法和Leader-Follower法相結(jié)合,提出了一種新的混合編隊技術(shù)[7],簡稱LFB混合編隊,但通過該方法很難為每架無人機配置合適的行為控制參數(shù)。因此本文將自適應(yīng)粒子群算法[8]融入到LFB混合編隊技術(shù)中,提出了一種基于自適應(yīng)粒子群算法的混合編隊技術(shù),簡稱LFBAPSO技術(shù),通過優(yōu)化各無人機的行為參數(shù),進行了大量的仿真研究,仿真結(jié)果驗證了該方法的有效性和可行性。
在無人機群體編隊過程中,通常需要確定一架領(lǐng)航無人機,每架無人機根據(jù)領(lǐng)航無人機的坐標(biāo)計算出自身在編隊中的位置,使編隊系統(tǒng)在整體上形成期望的幾何隊形。在編隊執(zhí)行任務(wù)的過程中,各架無人機始終保持期望的隊形跟隨虛擬領(lǐng)航無人機飛行,當(dāng)無人機檢測到障礙物時,無人機群能夠快速切換到合適的隊形,通過障礙區(qū)后各架無人機通過調(diào)整各自的位置重新保持隊形前進,最終到達目的地。文中將綜合各架無人機及目標(biāo)點的位置選取合適的參考點作為虛擬領(lǐng)航無人機,以四架無人機構(gòu)建菱形編隊為例,將菱形幾何中心作為參考點,令p(t)=[ll(t),θl(t),φl(t)]為虛擬領(lǐng)航無人機的幾何構(gòu)型向量,其中l(wèi)l(t)=(xl(t),yl(t),zl(t))T為三維空間位置,θl(t)和φl(t)為虛擬領(lǐng)航航線的航向值。則構(gòu)建無人機Ui的隊形幾何構(gòu)型量為:

(1)

圖1 無人機編隊俯視圖

圖2 無人機編隊側(cè)視圖
根據(jù)圖1和圖2可得編隊隊形幾何構(gòu)型矩陣如:
(2)
編隊內(nèi)任意無人機的三維空間位置可由式(1)中的值代入式(2)求得。考慮所有無人機飛行高度相同,因此取θ1為0。
為了達到良好的編隊效果,無人機在跟隨虛擬領(lǐng)航無人機飛行過程中要保持特定的相對位置,同時無人機的飛行速度矢量要與領(lǐng)航無人機一致。要求無人機編隊系統(tǒng)在復(fù)雜的戰(zhàn)場環(huán)境中能夠?qū)崿F(xiàn):
1)無人機群體盡量保持期望的編隊隊形從起始點到達目標(biāo)點。
2)無人機群體在能夠依據(jù)任務(wù)需求和當(dāng)前環(huán)境切換到合適的隊形。
3)在執(zhí)行任務(wù)過程中,編隊系統(tǒng)具有避障功能。
4)無人機編隊內(nèi)部具有避碰功能,避免內(nèi)部無人機之間發(fā)生碰撞。
文中為虛擬領(lǐng)航無人機設(shè)計了奔向目標(biāo)和躲避障礙物的行為,針對跟隨無人機設(shè)計了隊形保持、避障、避碰行為[9]。將這些行為進行加權(quán)合成作為無人機的飛行向量。
1.2.1 奔向目標(biāo)行為

(3)
1.2.2 保持隊形行為
跟隨無人機基于虛擬領(lǐng)航無人機在第t時刻的位置信息,計算出自己的期望隊形位置(xfg,yfg,zfg),將該位置作為跟隨無人機的目標(biāo)點,保持隊形行為的輸出方向矢量為:
(4)
1.2.3 躲避靜態(tài)障礙物行為
躲避靜態(tài)障礙物行為是指無人機根據(jù)探測到的實時環(huán)境信息,決定如何飛行才能避開障礙物,文中引入了逃逸角[10]的概念,讓無人機檢測到障礙物后旋轉(zhuǎn)一定的角度避開障礙物,該行為的輸出矢量如下式所示:
(5)
其中:[xd,yd,zd]T為無人機飛行速度的方向,θ為無人機為了躲避障礙物需要改變的航向角,±表示無人機向右轉(zhuǎn)或向左轉(zhuǎn)。
用半徑分別為r和robs的圓模擬無人機和障礙物,則無人機Ui的速度v與障礙物幾何中心連線lo夾角為β,如圖3所示,則:
θ=φ-β,取lo=2robs=2r求得θ為45°。

圖3 無人機避障示意圖
1.2.4 避免與其他無人機碰撞行為
在執(zhí)行任務(wù)過程中無人機不僅要躲避靜態(tài)障礙物還要避免與其他無人機發(fā)生碰撞,因此為跟隨無人機設(shè)計了避碰行為,其輸出矢量為:
(6)
由于無人機避碰與避障原理類似,且無人機大小均相同,因此取θ為45°,當(dāng)無人機左轉(zhuǎn)時θ取負(fù),右轉(zhuǎn)取正。
無人機編隊的輸出行為就是對基本行為的加權(quán)合成,則跟隨無人機的最終輸出行為矢量為:
Vf=λ1vkf+λ2vao+λ3vau
(7)
虛擬領(lǐng)航無人機的最終輸出行為矢量為:
Vl=λ4vmtg+λ5vao
(8)
其中:λ1~λ5分別為無人機的行為權(quán)重控制參數(shù),將分別用經(jīng)驗法、基本粒子群算法和自適應(yīng)粒子群算法對無人機編隊進行仿真實驗,確定最佳的行為權(quán)重控制參數(shù)。
所有的粒子在搜索空間中以一定的速度飛行,并通過當(dāng)前搜索到的最優(yōu)值來尋找全局最優(yōu)值[11]。假設(shè)T維空間中每個粒子的坐標(biāo)位置可以表示為xi=(xi1,xi2…,xiT),用vi=(vi1,vi2,…,viT)表示粒子在每次迭代中的移動距離,pi=(pi1,pi2,…,piT)表示個體最優(yōu)位置。設(shè)f(x)為最優(yōu)化目標(biāo)函數(shù),粒子i的當(dāng)前經(jīng)過的最優(yōu)位置如式(9)所示:
(9)
設(shè)種群中所有粒子所搜索到的最優(yōu)位置為pg(t),如下所示:
Pg(t)∈{P0(t),P1(t),…,PN(t)}
f(Pg(t))=min{f(Pi(t)),f(P2(t)),…,f(PN(t))}
(10)
在T維空間中粒子i的速度和位置根據(jù)式(11)~(13)進行更新:
vid(t+1)=ωvid(t)+c1r1(pid(t)-xid(t))+
c2r2(pgd(t)-xid(t))
(11)
(12)
xid(t+1)=xid(t)+viT(t)
(13)
式(11)中,ω為慣性權(quán)重,r1,r2為隨機增量,c1為個體學(xué)習(xí)因子,c2為種群學(xué)習(xí)因子;式(12)限制了粒子速度的范圍。
基本粒子群算法中慣性權(quán)重和學(xué)習(xí)因子無法隨著搜索過程改變,因此算法本身具有局限性且容易陷入局部最優(yōu),算法的收斂速度難以把握。
文中提出的自適應(yīng)粒子群算法(APSO)可以使粒子在迭代過程中慣性權(quán)重ω依據(jù)適應(yīng)度的值進行調(diào)整,如式(14)所示:
(14)
式中,f為當(dāng)前的適應(yīng)度值,favg為平均適應(yīng)度值,fmin為最小適應(yīng)度值,ωmax取0.9,ωmin取0.4.
將學(xué)習(xí)因子設(shè)置為c1=c2=1.494[12]. 迭代次數(shù)為50,粒子群數(shù)目為100,粒子飛行速度范圍為[-1,1],粒子的范圍(要優(yōu)化的行為權(quán)重參數(shù))為[0,10]。
根據(jù)式(7)和式(8)可知,對于一個具有N架無人機的編隊,需要進行優(yōu)化的參數(shù)為N*3-1,定義一個1*(N*3)的矩陣,其中如果不考慮高度,可以將第三個值設(shè)為0。
定義適應(yīng)度函數(shù)為:
fitness=w1D+w2F+w3C1+w4C2+w5S
(15)
其中:D表示編隊無人機在執(zhí)行任務(wù)過程中所行進的路徑之和,F(xiàn)表示編隊無人機的隊形偏差值,C1,C2分別為編隊無人機與環(huán)境障礙物、其他無人機發(fā)生碰撞的次數(shù);S為領(lǐng)航無人機的時間步數(shù)(以200 ms)為一個step,文中取ω1=1,ω2=2,ω3=15,ω4=15,ω5=4。
假設(shè)每架無人機都知道各自的目標(biāo)位置并可以識別障礙,仿真選取4個無人機分別為UAV1,UAV2,UAV3,UAV4,一個虛擬領(lǐng)航無人機為V_LU,仿真選取無人機UAV1,UAV2,UAV3,UAV4保持菱形幾何形狀(每架無人機的位置誤差在2 m范圍內(nèi)),從起始位置無碰地到達同一目的地,最終以縱隊降落,記錄無人機從起始位置到形成編隊隊形的情況。實驗中假設(shè)無人機具備3個基本條件:每架無人機都知道自己的最終目的地;每個無人機都具備辨別靜態(tài)障礙物和其他無人機的功能;無人機不知道靜態(tài)障礙物和其他無人機的位置信息,但是可以通過自身傳感器檢測到。仿真中設(shè)無人機的感知范圍為1.5 m,無人機的避障的旋轉(zhuǎn)角度為45°,無人機與靜態(tài)障礙物之間的距離為1 m時開始避障,采用經(jīng)驗法、基本粒子群算法和自適應(yīng)粒子群算法分別對無人機編隊進行仿真實驗,給出了仿真實驗結(jié)果,對仿真實驗結(jié)果進行了分析比較,確定最佳的行為參數(shù)。
基于MAPSO方法[13]和多次實驗得到的結(jié)果,文中選定虛擬領(lǐng)航無人機的行為參數(shù)分別為λ4=2.000,λ5=1.000,四架跟隨無人機的行為參數(shù)保持一致,λ1=1.000,λ2=5.000,λ3=3.000。將選定的無人機行為參數(shù)作為經(jīng)驗法的輸入?yún)?shù),依此作為參照標(biāo)準(zhǔn),與基本粒子群算法和自適應(yīng)粒子群算法得到的實驗結(jié)果進行對比分析。

表1 基于BPSO算法得出的無人機行為權(quán)重

表2 基于APSO算法得出的無人機行為權(quán)重
表1和表2分別給出了基本粒子群算法和自適應(yīng)粒子群算法優(yōu)化后得到的最優(yōu)個體的無人機的行為權(quán)重,表明自適應(yīng)粒子群算法和基本粒子群算法可以求出每架無人機的最優(yōu)行為權(quán)重參數(shù),這兩種算法求出的行為權(quán)重參數(shù)相比于經(jīng)驗法得到的行為權(quán)重參數(shù)更加精確且具有針對性。表3給出了3種方法下的無人機編隊的飛行數(shù)據(jù)。

表3 3種優(yōu)化方法的無人機編隊飛行數(shù)據(jù)
通過對比分析表3給出的編隊參數(shù)值,可以驗證文中提出的基于自適應(yīng)粒子群算法的無人機混合編隊技術(shù)不僅縮短了飛行路徑長度,并且減少了碰撞次數(shù),在避障、避碰方面的效果更加顯著,同時節(jié)省了編隊時間,使各項指標(biāo)都有所改善,編隊準(zhǔn)確率(綜合隊形誤差與速度誤差)達到了93.54%。
圖4為基于自適應(yīng)粒子群算法的混合編隊技術(shù)得到的無人機編隊的飛行速度矢量圖,在18秒時速度曲線匯合與一處,表明無人機編隊的速度達到了一致。

圖4 編隊的飛行速度矢量
圖5和圖6為無人機編隊飛行速度誤差隨時間變化狀態(tài)圖,表明在編隊隊形形成的過程中無人機編隊的速度誤差逐漸趨向于0,驗證了算法的有效性。

圖5 編隊飛行速度在x軸方向上的誤差
圖7為無人機群的初始狀態(tài)圖,仿真環(huán)境為50 m*50 m的密布靜態(tài)障礙物的平面環(huán)境,無人機的起始位置分別為(2,36)、 (6,27)、(10,15)、(11,25),障礙物位置任意,目標(biāo)位置為(45,31)。圖中白色區(qū)域為可飛行區(qū)域,灰色區(qū)域表示無人機,黑色區(qū)域為障礙區(qū),亮灰色區(qū)域表示編隊最終目的地。

圖7 無人機群初始狀態(tài)
圖8為無人機編隊躲避靜態(tài)障礙物圖,無人機編隊檢測到前方為狹窄障礙區(qū)域時切換為直線形進行避障。

圖8 無人機編隊避障
圖9為無人機編隊切換菱形隊形圖,表明無人機編隊在避障結(jié)束后切換為菱形飛行,直至到達目的地。

圖9 編隊切換菱形隊形
圖10為編隊結(jié)束狀態(tài)圖,表明當(dāng)編隊無人機檢測到即將到達目的地時無人機群體切換成直線形,所有無人機到達目的地后依次降落。

圖10 編隊結(jié)束狀態(tài)
仿真實驗結(jié)果表明,無人機群體可以從初始位置到達目標(biāo)位置形成菱形,并在后繼執(zhí)行任務(wù)中很好地保持了隊形,當(dāng)無人機檢測到障礙時編隊隊形變換成直線形,繞過障礙后編隊又恢復(fù)菱形繼續(xù)朝目標(biāo)前進,最終到達目的地,編隊切換為直線形依次降落。上述實驗仿真結(jié)果證明了無人機混合編隊在遇到障礙避障的反應(yīng)能力和編隊的快速變換能力,可應(yīng)用于多無人機戰(zhàn)場環(huán)境中。
文中將自適應(yīng)粒子群算法應(yīng)用到基于行為法和虛擬領(lǐng)航者法相結(jié)合的混合編隊技術(shù)中,分別為虛擬領(lǐng)航無人機和跟隨無人機設(shè)計了基本行為并通過自適應(yīng)粒子群算法優(yōu)化各架無人機的行為參數(shù),使無人機編隊具有良好的編隊效果。上述實驗仿真結(jié)果充分驗證了文中提出的基于自適應(yīng)粒子群算法的無人機混合編隊技術(shù)的可行性。