岳 源,屈高敏
(中國民航飛行學院, 四川 廣漢 618300; 西安航空學院, 西安 710077)
隨著無人機載荷能力和智能水平的進步,多無人機協同執行任務成為可能[1-4]。執行多目標偵察任務是多無人機協同應用的一個重要方向。多目標偵察任務要求無人機集群在分配目標時不重不漏且偵察價值最大。因此,多無人機在執行偵察任務中如何進行多目標的分配決策是當前無人機協同的主要課題。
文獻[5]根據無人機攜帶傳感器的偵察分辨率和目標出現時間窗約束建立了分配模型。文獻[6]建立了以總飛行路程和技術數量為指標異構無人機的協同分配模型。文獻[7]研究給定一組具有不同偵察載荷能力的UAV對任務場景中的多個任務區進行信息偵察。文獻[8]研究了集中式協同體系下多無人機在任務執行階段之前的偵察目標分配方法。文獻[9]研究了基于時間約束的異構類型的任務處理增加了多無人機任務分配問題復雜度。文獻[10]提出了利用信息確定性指標對偵察收益的大小進行衡量,并提出了一種基于時間窗機制的多無人機任務分配方法。但是這些文獻沒有深入分析影響無人機偵察能力的因素,并沒有將這些因素對目標分配的影響考慮進去,特別是缺乏對無人機數據鏈容量、雷達探測能力、無人機智能水平的綜合考慮。因此,本文在考慮上述因素基礎上建立了針對分布式協同體系下的多無人機多目標分配策略,并采用改進分配方法的粒子群算法對模型進行求解。
多無人機通過信息交互實現了集群協同。無人機集群根據控制決策機制的不同,主要分為集中式體系、分布式體系兩種協同體系[11-13]。
如圖1所示,集中式體系依賴于唯一的中央控制節點,一般由性能優異的無人機或地面控制站承擔。中央控制節點控制著集群通信中樞,擁有集群的決策權。這種體系復雜性低,但面對突發情況響應慢,執行復雜任務效能低。特別是,承擔中央控制節點的無人機故障或損毀時,整個無人機集群完成任務的質量就會極大降低。
如圖2所示,分布式協同體系依賴于無人機集群自身智能水平,通過數據鏈進行實現控制決策。這種體系具有很高的智能水平,可以充分發揮各無人機自治水平,但對通信容量和無人機智能水平要求較高。分布式多無人機協同體系中,各無人機平臺性減弱(即無人機載荷能力、飛行速度等能力的要求降低),節點性增強(即無人機智能能力、數據鏈容量、傳感器能力等能力要求提高)。以執行偵察任務為例:U1無人機因受損不能完成任務時,可以通過數據鏈將實時情況共享到無人機集群,由系統內其他無人機申請完成任務,從而提高了任務完成質量。協同工作示意圖如圖3。
在這個工作流程下,無人機需要擁有足夠通信容量來進行大量的數據交互,需要足夠的智能水平能夠根據信息自主決策。就偵察任務而言,無人機傳感器性能影響著任務完成的質量。同時,為了提高任務完成效率,無人機的航程也會是重要考慮因素。因此,無人機相對目標的路程、無人機探測傳感器性能、無人機通信容量、無人機智能水平是影響分布式多無人機協同偵察任務完成質量的重要因素。
分布式多無人機協同執行偵察任務,假設有N架無人機組成集群,設為集合U={U1,U2,…,UN},對?Ui∈U,〈PosU,B,S,N,v,h,I,D,Pf,Pm〉為無人機屬性,PosU為無人機二維坐標位置,RU為無人機的通信容量,IU為無人機的智能水平,v為無人機巡航速度,h為無人機巡航高度,AU為無人機的雷達能力。目標集合T={T1,T2,…,TM},M為目標數量,對?Tj∈T,二元組〈PosT,VT〉為目標屬性,PosT為目標二維坐標位置,VT為目標價值。無人機集群通過數據鏈共享集群各無人機信息及相應目標信息,使得集群對目標偵察優勢最大。
目標分配的本質在于立足現有資源且資源配置盡可能地最優[13]。因此,應根據不同無人機的相對優勢來進行任務分配。具體到偵察任務而言,分布式無人機協同體系一方面需要無人機攜帶的雷達載荷性能優異,另一方面依賴無人機具有較好的數據交流能力,以實現無人機集群對目標信息的掌握,因此進行對無人機目標分配時主要考慮無人機相對目標的路程優勢、容量優勢、雷達優勢、智能優勢。
2.2.1路程優勢
進行任務分配時首先考慮的是無人機與目標的初始位置。為了使得分配結果最優,盡量把距離目標近的無人機分配給目標。由于集群里無人機處于不同的位置,距離不同目標的路程也不一樣,那么無人機i相對與目標j的路程優勢可描述為:
(1)
式(1)中:Lij指無人機i對目標j的路程優勢,其值越大意味優勢越大;Sij是指無人機i到目標j的距離;∑Sij是指無人機i到所有目標的距離之和。
2.2.2通信容量優勢
容量優勢是指當前無人機能夠傳輸多大的數據容量。能夠傳輸的數據容量越大,目標信息就越容易被反饋。多輸入多輸出技術以其大容量、高質量傳輸性能優勢成為無線通信領域的一項重要技術。
根據文獻[15]知,數據鏈的通信容量與帶寬、天線的信噪比有關,由香龍公式可得無人機的通信容量公式為:
Cij=B·log2(1+S/N)
(2)
式(2)中:Cij表示無人機i對目標j的通信容量優勢;B表示帶寬;S表示無人機i傳感器信號平均功率;N表示目標j背景噪聲功率。
這里對通信容量優勢進行歸一化處理,將通信容量轉化到[0,1]區間,轉換方法如下(下文方法相同):
(3)
2.2.3雷達優勢
雷達優勢是指當前無人機相對其他無人機雷達探測能力的優勢。當前主流無人機主要搭載合成孔徑雷達(SAR),本文以SAR為研究對象建模,需要考慮無人機相對于目標的角度優勢、距離優勢、探測優勢等。
如圖4所示,無人機沿著OA方向飛行,為保證偵察效果最佳,無人機做高度為h,速度為v勻速定高飛行。無人機瞬時探測靶面長度為r,無人機與目標的俯仰角為α,SAR視場角為β時,則:
(4)
單位時間中無人機對目標的角度優勢為Pa
Pa=r/v
(5)
SAR探測能力隨距離的增大而減小,設雷達最大探測距離為D,目標距離雷達的距離為d,則對目標的距離優勢為Pd
Pd= e-d/DZ
(6)
無人機在執行偵察時一方面取決自身的偵察能力,另一方面取決于目標的偽裝程度。無人機在偵察區域中偵察到目標的能力,它可以用發現目標概率Pf、目標的偽裝度Pm這兩個參數表示,則對目標的探測優勢為Pw
Pw=Pf·(1-Pm)
(7)
綜合上述三方面的優勢函數,對Pa、Pd、Pw計算結果進行歸一化處理,使各分項數值處于[0,1]之間,即可得偵察優勢函數為:
(8)
式(8)中,δ1+δ2+δ3=1。考慮到雷達的探測優勢主要來源于距離優勢,設定δ1=δ3=0.2,δ2=0.6。
2.2.4智能優勢
無人機智能水平參考美國空軍研究實驗室的智能等級定義[16],若無人機i智能水平處于8級,那么取無人機的智能水平Ini為0.8。無人機的智能優勢即與無人機自身智能水平有關還和目標復雜度有關。可得智能優勢函數為:
Iij=Ini·coj
(9)
2.2.5無人機集群目標優勢函數
對上述優勢函數的計算結果進行歸一化處理,綜上可知無人機集群任務目標函數為:
X=ω1L+ω2SA+ω3I
(10)
式(10)中:X指量化的無人機偵察優勢;L指某無人機對某目標的距離優勢;R指某無人機完成偵察任務的通信容量優勢;A指某無人機的雷達優勢(考慮到無人機的雷達偵察數據需要通過數據鏈來傳遞,數據鏈的通信容量決定著無人機的雷達優勢是否可以發揮出來,因此要將這兩個因素綜合考慮);I指某無人機的智能優勢,無人機智能水平越高越容易識別目標信息;ω1、ω2、ω3為分項優勢的權重(其中ω1+ω2+ω3=1,由于本模型中各分項優勢重要程度接近,故設定ω1=ω2=0.35,ω3=0.3)。
定義矩陣Xij為無人機集群對目標的偵察優勢矩陣,xij表示集群第i架無人機對第j個空中目標的偵察優勢指數。
(11)
定義矩陣Yj為目標的價值矩陣,yj表示第j個目標的價值指數。
(12)
綜上,無人機集群對目標分配模型如下:
(13)
式(13)中,J為無人機集群對目標的偵察價值,每架無人機要么不參與分配,要么最多分配一個目標;一個目標最多分配一個無人機。
為了研究智能體的群體行動,人們借鑒了動物社會的群體動力學,粒子群算法通過模擬飛鳥覓食的行為來實現。通過對飛鳥位置和速度的更新來找到最優解,一般描述為:
Vij(t+1)=ωVij(t)+c1r1j(t)[yij(t)-xij(t)]+
(14)
xi(t+1)=xt(t)+vi(t+1)
(15)
式(14)中:Vij(t)指粒子i在t時刻第j維上的慣性速度;xij(t)粒子i在t時刻第j維上的維度;c1、c2為常數,分別為認知速度和社會速度的學習因子;r1j(t)、r2j(t)為[0,1]之間隨機數。
任務分配的求解問題中,變量的取值是離散的,所以解決非連續的優化問題要利用離散粒子群算法(DPSO算法)進行優化。在優化過程中必須進行變量的離散化:一方面需要將粒子的位置離散化,另一方面也要將更新速度離散化。粒子在選擇新位置的時候,并不是在全定義域內進行選擇。粒子移動的位置表示該粒子對于任務分配的結果,目標的數目也是微粒的維數,粒子的更新速度為無人機和目標之間的任務配對的變化情況[17-18]。文獻[19]就運用交換子和交換序列實現了粒子群算法向離散空間的映射。文獻[20-21]運用結果取整的方法,實現了位置和速度的離散化。
DPSO算法流程如圖5所示。具體流程如下:
步驟1:初始化設置微粒群的規模,慣性權值,加速系數,最大允許迭代次數,生成隨機的初始無人機和目標的任務配對,并計算目標評價函數的適應的值。
步驟2:就初始粒子適應度值,尋找出個體最優值、群體最優值。
步驟3:根據公式計算各微粒新的速度,并對各微粒新的速度進行限幅處理。
步驟4:根據公式計算各微粒新的位置,并對各微粒新的位置進行限幅處理。
步驟5:對每個微粒,比較其當前適應值和其個體經歷過的最好適應度值,若當前適應值更優,則令當前適應值為其個體歷史最好的適應度值,并保存當前位置為其個體歷史最好位置。
步驟6:比較群體所有微粒的當前適應度值和全局歷史最好的適應度值,若某微粒的當前適應度值更優,則令該微粒的當前適應值為全局歷史最好適應度值,并保存該微粒的當前位置為全局歷史最好位置。
步驟7:若滿足停止條件,則搜索停止,輸出搜索結果;否則,返回步驟3繼續搜索。
假定飛行前任務裝訂為:8架無人機對8個目標進行偵察,設置粒子群種群數量為50,速度范圍為[-1,1],位置范圍為[1,8],迭代次數設定[19-21]為200,目標位置參數、無人機初始參數、無人機載荷參數分別如表1、表2、表3所示。分配結果仿真如圖6所示。
通過仿真試驗,可得適應度值為2.832 9。在該適應度值下,無人機集群對目標的分配策略是U1T3,U2T1,U3T2,U4T6,U5T5,U6T7,U7T8,U8T4。

表1 目標參數

表2 無人機基本參數

表3 無人機載荷參數
從仿真試驗可以看出,離散粒子群算法在第80次迭代附近找到了最優分配方案,說明算法收斂速度比較快,能夠有效地解決多約束條件下的多無人機協同任務分配問題,且目標的分配結果滿足了諸多約束規則。
本文針對分布式多無人機協同體系進行了分析,研究了影響該體系的路程、通信容量、雷達能力、智能水平四個主要因素,并在此基礎上建立任務目標分配模型,貼合分布式多無人機協同的實際。針對離散粒子群算法變量不連續的問題,在考慮到執行偵察任務的基礎上,提出了改進分配方法,使得分配方案有更好的實際意義,并取得了良好的收斂性。
參考文獻:
[1]United States Air Force RPA vector:Vision and Enabling Concepts 2013—2038[R].Headquarters USA Air Force,17 Feb,2014.
[2]A future vision for remotely piloted aircraft:Leveraging interoperability and networked operations[R].Headquarters USA Air Force,21 Jun,2013.
[3]TIRPAK J A.Aperture:pilotless futures; modular airplanes strategic agility invisible jammers[J].Air Force Magazine, 2014(5):10-12.
[4]張洋,譚健美,朱家強.美國空軍未來25年無人機系統路線圖解析[J].飛航導彈,2015(1):54-57.
[5]孫健,劉慧霞,席慶彪.基于改進粒子群算法的多UAV協同偵察任務規劃[J].現代電子技術,2012,35(7):12-15,18.
[6]蘇菲,陳巖,沈林成.基于蟻群算法的無人機協同多任務分配[J].航空學報,2008(S1):184-191.
[7]張耀中,謝松巖,張蕾,張建東.異構型多UAV協同偵察最優化任務決策研究[J].西北工業大學學報,2017,35(3):385-392.
[8]鄧啟波.多無人機協同任務規劃技術研究[D].北京:北京理工大學,2014.
[9]林林.基于協同機制的多無人機任務規劃研究[D].北京:北京郵電大學,2013.
[10] 張蕾.多無人機協同偵察任務決策研究[D].西安:西北工業大學,2016.
[11] 黃長強,翁興偉,王勇,等.多無人機協同作戰技術[M].北京:國防工業出版社,2012.
[12] 沈林成,牛軼峰,朱華勇.多無人機自主協同控制理論與方法[M].北京:國防工業出版社,2013.
[13] 曹文靜.多無人機協同體系結構研究[M].北京:國防工業出版社,2017.
[14] GALATI D G,SIMAAN M A.Effectiveness of the nash strategies in competitive multi-team target assignment problems[J].Transactions of Aerospace and Electronic systems,2007, 43(1): 126-134.
[15] 高喜俊,陳自力.多天線結構對無人機MIMO信道容量的影響[J].航空學報,2015,36(10):3401-3410.
[16] 陳宗基,魏金鐘,王英勛,周銳.無人機自主控制等級及其系統結構研究[J].航空學報,2011,32(6):1075-1083.
[17] ANDRIES P.ENGELBRECHT.計算群體智能基礎[M].譚營,譯.北京:清華大學出版社,2009.
[18] 高飛.MATLAB智能算法超級學習手冊[M].北京:人民郵電出版社,2014.
[19] 李煒,張偉.基于粒子群算法的多無人機任務分配方法[J].控制與決策,2010(9):1359-1363,1368.
[20] 尹高揚,周紹磊,莫駿超,等.基于多目標粒子群優化的無人機協同多任務分配[J].計算機與現代化,2016(8):7-11.
[21] 王強,張安,宋志蛟.UAV協同任務分配的改進DPSO算法仿真研究[J].系統仿真學報,2014(5):1149-1155.