傅裕松,黃長強(qiáng),軒永波,翁興偉
(空軍工程大學(xué)工程學(xué)院,西安 710038)
面向日趨復(fù)雜的現(xiàn)代戰(zhàn)場環(huán)境和戰(zhàn)術(shù)任務(wù),單架無人作戰(zhàn)飛機(jī)(UCAV)幾乎無法完成指定的作戰(zhàn)任務(wù)。隨著UCAV各項(xiàng)關(guān)鍵技術(shù)的迅速發(fā)展[1-2],UCAV群協(xié)同作戰(zhàn)將是未來空戰(zhàn)的一種必然趨勢(shì)。而有人機(jī)-無人機(jī)群協(xié)同作戰(zhàn)能充分發(fā)揮有人機(jī)和無人機(jī)各自的優(yōu)勢(shì),并且今后較長一段時(shí)期將是有人機(jī)與無人機(jī)共存的時(shí)代。本文建立了集中式體系結(jié)構(gòu)下,有人機(jī)-無人機(jī)群協(xié)同空戰(zhàn)的多目標(biāo)分配模型,根據(jù)空戰(zhàn)態(tài)勢(shì)提出了3種效率指標(biāo),分別建立了目標(biāo)函數(shù),并運(yùn)用離散粒子群算法(Particle Swarm Optimization,PSO)進(jìn)行了數(shù)值仿真研究。
設(shè)空戰(zhàn)雙方為我方有人機(jī)-無人機(jī)群和敵方有人機(jī)-無人機(jī)群。有人機(jī)-無人機(jī)群在迅速多變的戰(zhàn)場上需要一個(gè)反應(yīng)快且準(zhǔn)的協(xié)同戰(zhàn)術(shù)決策系統(tǒng)作出正確果斷的決策。就目前的狀況來說,多目標(biāo)分配還必須依賴于軍事運(yùn)籌學(xué)中的一些定量關(guān)系,即必須確定一個(gè)效率指標(biāo),計(jì)算機(jī)程序的運(yùn)行依據(jù)就是找出使效率指標(biāo)為最優(yōu)的分配方案。多目標(biāo)分配的效率指標(biāo)是根據(jù)消滅敵人保存自己的戰(zhàn)術(shù)總原則來確定的。常用的有兩種:
1)使我方的生存概率為最大,或使我方被毀傷的概率為最小(保存自己);
2)我方對(duì)目標(biāo)的毀傷概率為最大,或我方對(duì)目標(biāo)整體毀傷的期望值為最大(消滅敵人)。
以上兩種效率指標(biāo)如果單獨(dú)分別使用,顯然不合適,對(duì)兩者加權(quán)聯(lián)合使用也難以找到最優(yōu)方案。本文基于有人機(jī)-無人機(jī)群協(xié)同作戰(zhàn)的特點(diǎn),提出由有人機(jī)根據(jù)戰(zhàn)場態(tài)勢(shì)的不同,分別選擇3種效率指標(biāo):
1)當(dāng)我方處于較大優(yōu)勢(shì)時(shí),我方應(yīng)最大限度地殺傷敵方;
2)當(dāng)我方處于明顯劣勢(shì)時(shí),我方應(yīng)最大限度地保存自己,使得生存概率最大;
3)當(dāng)敵我雙方處于均勢(shì)時(shí),選用各UCAV攻擊目標(biāo)的收益與被目標(biāo)攻擊的可能損失的比值之和的最大值為效率指標(biāo)。
根據(jù)有人機(jī)-無人機(jī)群協(xié)同空戰(zhàn)特點(diǎn),結(jié)合模型的效率指標(biāo)的建立條件,提出了建立有人機(jī)-無人機(jī)群協(xié)同空戰(zhàn)多目標(biāo)分配模型要用到的一些基本假設(shè)。
假設(shè)1 空中雙方的威脅目標(biāo)是對(duì)方有人機(jī)-無人機(jī)群中的無人機(jī)。
假設(shè)2 雙方有人機(jī)所處的位置遠(yuǎn)離對(duì)方威脅且能夠與無人機(jī)之間通信并控制無人機(jī),各UCAV之間有明顯距離,使得各UCAV對(duì)各個(gè)目標(biāo)的優(yōu)勢(shì)函數(shù)值(由速度、距離、目標(biāo)角所得)不為定值。
假設(shè)3 我方有人機(jī)-無人機(jī)群中,各架UCAV是同種機(jī)型,攜帶同樣的武器。
假設(shè)4 我方UCAV群所攜帶的武器為導(dǎo)彈,每架UCAV單獨(dú)迎擊一個(gè)目標(biāo)。
作戰(zhàn)體系結(jié)構(gòu)采用集中式體系結(jié)構(gòu),如圖1所示,集中式體系結(jié)構(gòu)相對(duì)于分布式體系結(jié)構(gòu),對(duì)UCAV的智能化程度要求相對(duì)較低。有人機(jī)接受各UCAV傳來的戰(zhàn)場信息,結(jié)合我方軍用衛(wèi)星、雷達(dá)、地面站等提供的相關(guān)信息,對(duì)戰(zhàn)場態(tài)勢(shì)進(jìn)行評(píng)估,選擇效率指標(biāo),進(jìn)行目標(biāo)分配決策,分別給我方各UCAV分配一個(gè)目標(biāo),再由UCAV對(duì)目標(biāo)進(jìn)行攻擊。

圖1 有人機(jī)-無人機(jī)群協(xié)同作戰(zhàn)體集中式體系結(jié)構(gòu)Fig.1 The centralized architecture of MAV-UAV group coordinated operation
用層次分析法[3-4]建立如圖2所示的目標(biāo)威脅系數(shù)模型,準(zhǔn)則層中只考慮目標(biāo)機(jī)動(dòng)能力、火控性能、武器攻擊能力及目標(biāo)的戰(zhàn)術(shù)重要性,把這些都當(dāng)作目標(biāo)的固有屬性,而把目標(biāo)對(duì)我機(jī)的角度優(yōu)勢(shì)、距離優(yōu)勢(shì)等屬性當(dāng)作動(dòng)態(tài)屬性,把動(dòng)態(tài)屬性歸入2.4節(jié)中的優(yōu)勢(shì)函數(shù)模型進(jìn)行分析。這樣把兩種屬性分開研究,可以簡化2.5節(jié)中目標(biāo)分配代價(jià)函數(shù)的計(jì)算。由目標(biāo)威脅系數(shù)層次結(jié)構(gòu)模型得出目標(biāo)威脅系數(shù)矩陣C:C=[c1,c2,…,cm],1≤j≤m。
cj表示由層次分析法得出的目標(biāo)j的威脅系數(shù)。

圖2 目標(biāo)威脅系數(shù)層次結(jié)構(gòu)模型Fig.2 Hierarchical structure of threat coefficient
文獻(xiàn)[5]中,采用距離優(yōu)勢(shì)Sd、角度優(yōu)勢(shì)Sa和速度優(yōu)勢(shì)Sv綜合得到載機(jī)相對(duì)目標(biāo)的優(yōu)勢(shì)函數(shù)為STF。

式中,a1、a2、a3為權(quán)系數(shù),a1+a2+a3=1。由于在層次分析法結(jié)構(gòu)的準(zhǔn)則層中已經(jīng)考慮了目標(biāo)的機(jī)動(dòng)能力和目標(biāo)的武器攻擊能力,因此這里不再考慮速度優(yōu)勢(shì)Sv,而將優(yōu)勢(shì)函數(shù)式(1)簡化為

式中,Sys表示簡化后的優(yōu)勢(shì)函數(shù),文中取a1=a2=0.5,a3=0。
定義1 定義矩陣Ywf為我方機(jī)群中對(duì)空中目標(biāo)群的優(yōu)勢(shì)矩陣表示我方有人機(jī)-無人機(jī)群中的第i架UCAV對(duì)第j個(gè)空中目標(biāo)的優(yōu)勢(shì)函數(shù)。
定義2 定義矩陣Ydf為空中目標(biāo)群對(duì)我方機(jī)群的優(yōu)勢(shì)矩陣表示第j個(gè)空中目標(biāo)對(duì)我方有人機(jī)-無人機(jī)群中的第i架UCAV的優(yōu)勢(shì)函數(shù)。

定義3 定義矩陣Bwf為我方機(jī)群對(duì)空中目標(biāo)群的收益矩陣,bij表示我方有人機(jī)-無人機(jī)群中的第i架UCAV對(duì)第j個(gè)空中目標(biāo)攻擊所可能獲得的收益,其中:1≤i≤n;1≤j≤m。
定義4 定義矩陣Swf為我方機(jī)群對(duì)空中目標(biāo)群的損失矩陣,sij表示我方有人機(jī)-無人機(jī)群中的第i架UCAV攻擊第j個(gè)空中目標(biāo)而受到j(luò)目標(biāo)的還擊,我方可能受到的損失為

式中:1≤i≤n;1≤j≤m。
由以上定義可得

則第i架UCAV攻擊第j個(gè)空中目標(biāo)可能的收益與風(fēng)險(xiǎn)的比值為,將(7)、(8)兩式帶入,得到

其中:zij表示第i架UCAV攻擊第j架敵機(jī)的收益風(fēng)險(xiǎn)值;k為大于1的實(shí)數(shù)。由zij構(gòu)造收益風(fēng)險(xiǎn)矩陣Zsy為

效率指標(biāo)的選擇:有人機(jī)-無人機(jī)群攻擊敵方空中的目標(biāo)群時(shí)總是希望獲益最大的同時(shí)損失最小,由于空戰(zhàn)對(duì)方也具有攻擊能力,因此不可能同時(shí)達(dá)到這兩個(gè)目的。本文設(shè)想針對(duì)空戰(zhàn)態(tài)勢(shì)的不同,選擇不同的效率指標(biāo)。

其中:1≤nj≤n,且nj兩兩互不相等。

其中:1≤mi≤m,且mi兩兩互不相等。
3)當(dāng)有人機(jī)-無人機(jī)群中的UCAV數(shù)目與空中目標(biāo)數(shù)目接近時(shí),根據(jù)有人機(jī)的判斷決策,優(yōu)先考慮效率指標(biāo)時(shí),

有人機(jī)-無人機(jī)群協(xié)同空戰(zhàn)時(shí),對(duì)于以上3種效率指標(biāo)的選擇,作者認(rèn)為一般可以按照以上情況選擇。實(shí)戰(zhàn)中,根據(jù)戰(zhàn)場態(tài)勢(shì)和戰(zhàn)術(shù)要求,有人機(jī)也可以不受作者假定的約束條件的限制,靈活采用以上3種代價(jià)函數(shù)。
本節(jié)分別對(duì)2.5節(jié)中的3種代價(jià)函數(shù)運(yùn)用離散粒子群算法[6-8]進(jìn)行數(shù)值仿真研究。離散粒子群算法的具體步驟[8]如下:
1)初始化,設(shè)置個(gè)體經(jīng)驗(yàn)保留概率α、全局經(jīng)驗(yàn)保留概率β、最大迭代次數(shù)NCmax、微粒數(shù)m,初始化最優(yōu)值gb和目標(biāo)分配序列,構(gòu)造初始微粒群;
2)根據(jù)微粒群序列,帶入目標(biāo)函數(shù),得出各微粒對(duì)應(yīng)的目標(biāo)值,將最優(yōu)值賦值給gb;
3)以(1-β)的概率選擇微粒群中的微粒子,對(duì)選中的微粒對(duì)應(yīng)的序列以(1-α)的概率進(jìn)行變異,構(gòu)造出新的粒子群;
4)重復(fù)步驟2)、3),到達(dá)迭代次數(shù)時(shí)終止。
假定12架UCAV攻擊8個(gè)目標(biāo),目標(biāo)的歸一化威脅系數(shù)為:C1=[0.2844,0.0865,0.0945,0.1365,0.0244,0.2040,0.0052,0.1646]。優(yōu)勢(shì)函數(shù)值如表1所示。

表1 12架UCAV對(duì)8個(gè)目標(biāo)的優(yōu)勢(shì)函數(shù)值Table 1 The advantage function value of 12 UCAVs to 8 targets
表1中值是服從高斯分布的隨機(jī)數(shù),以下仿真算例的優(yōu)勢(shì)函數(shù)值也如此得到。由式(5)、式(7)得出無人機(jī)的收益矩陣B,將B擴(kuò)展成12×12矩陣,9~12列賦值為0,將問題轉(zhuǎn)化為12架UCAV分配12個(gè)目標(biāo)的TSP(旅行商)問題,當(dāng)UCAV分配的目標(biāo)序列為9~12中的值時(shí),表示該UCAV沒有分配目標(biāo)。運(yùn)用離散PSO(粒子群)算法,個(gè)體經(jīng)驗(yàn)保留概率取0.25,全局經(jīng)驗(yàn)保留概率0.4,微粒數(shù)取50,最大迭代次數(shù)150次。根據(jù)式(12),仿真結(jié)果如圖3和表2所示。
由擴(kuò)展矩陣所得UCAV依次對(duì)應(yīng)目標(biāo)的序列為5,1,8,6,4,10,7,11,9,12,3,2。對(duì)陣目標(biāo)序列為 9 ~12的UCAV沒有分配目標(biāo)。

圖3 12架UCAV分配8個(gè)目標(biāo)最大收益方案Fig.3 Maximum benefit scheme for 12 UCAVs against 8 targets

表2 12架UCAV分配8個(gè)目標(biāo)Table 2 Allocation of 8 targets to 12 UCAVs
假定12個(gè)目標(biāo)對(duì)陣8架UCAV,目標(biāo)的歸一化威脅系數(shù)為 C2=[0.0956,0.0010,0.1074,0.0806,0.0345,0.0659,0.0917,0.0107,0.1220,0.3169,0.0720,0.0016]。根據(jù)式(4)、式(8)、式(13),帶入給定的威脅系數(shù)和表3優(yōu)勢(shì)函數(shù)值,運(yùn)用離散PSO算法,算法參數(shù)與算例(1)相同,仿真結(jié)果如圖4和表4所示。

表3 12個(gè)目標(biāo)對(duì)8架UCAV的優(yōu)勢(shì)函數(shù)值Table 3 The advantages function value of 8 UCAVs to 12 targets

表4 12個(gè)目標(biāo)分配給8架UCAVTable 4 Allocation of 12 targets to 8 UCAVs

圖4 8架對(duì)12個(gè)目標(biāo)最小損失分配方案Fig.4 The minimum loss allocation scheme of 8 UCAVs to 12 targets
第1~12個(gè)目標(biāo)對(duì)應(yīng)的UCAV分別是6,8,4,12,7,2,9,1,10,11,5,3。目標(biāo)序列對(duì)應(yīng)第 9 ~12 架UCAV時(shí)表示該目標(biāo)沒有分配給UCAV。
假設(shè)10架UCAV攻擊10個(gè)目標(biāo),收益風(fēng)險(xiǎn)比值見表5。目標(biāo)的歸一化威脅系數(shù)為 C4=[0.1382,0.0085,0.1675,0.0735,0.0008,0.0418,0.1931,0.2820,0.0791,0.0156]。
根據(jù)式(9)~式(11)求收益風(fēng)險(xiǎn)矩陣Zsy,式(10)中k值取4,求得Zsy的值如表6所示。根據(jù)式(14)以及Zsy的值,運(yùn)用離散PSO算法,算法參數(shù)與算例(1)相同,得出仿真結(jié)果如圖5、表7所示。

圖5 10架UCAV分配10個(gè)目標(biāo)方案Fig.5 The program of allocating 10 targets to 10 UCAVs

表5 10架UCAV對(duì)10個(gè)目標(biāo)的收益風(fēng)險(xiǎn)比值dijTable 5 The benefit-revenue risk ratio dijof 10 UCAVs to 10 targets

表6 無人機(jī)對(duì)目標(biāo)的收益損失值z(mì)ijTable 6 The income benefit-loss value zijof UAV to the target

表7 10架UCAV分配10個(gè)目標(biāo)的對(duì)應(yīng)序列Table 7 The corresponding sequence of 10 UCAVs allocated of 10 targets
由數(shù)值仿真結(jié)果可以看出,采用本文給出的效率指標(biāo)建立的目標(biāo)函數(shù),運(yùn)用離散PSO算法,算法在迭代次數(shù)不到40次時(shí),即可獲得最優(yōu)解,而所有微粒在迭代過程中的平均值也在迭代進(jìn)行到第50次前收斂,最大收益值為7.4190。
本文對(duì)基于集中式體系結(jié)構(gòu)下的有人機(jī)-無人機(jī)群協(xié)同空戰(zhàn)多目標(biāo)分配問題進(jìn)行了研究。文中把目標(biāo)威脅分為固有屬性和動(dòng)態(tài)屬性兩部分,分別建立了層次結(jié)構(gòu)模型和優(yōu)勢(shì)函數(shù)模型;根據(jù)空戰(zhàn)態(tài)勢(shì)的不同,提出了3種效率指標(biāo),建立了相應(yīng)的代價(jià)函數(shù);針對(duì)3種代價(jià)函數(shù),運(yùn)用離散粒子群算法進(jìn)行了數(shù)值仿真研究,仿真結(jié)果表明所用的算法具有很好的收斂性,適合解算文中所建立的有人機(jī)-無人機(jī)群協(xié)同空戰(zhàn)多目標(biāo)分配模型。
[1]US Office of the Secretary of Defense.Unmanned aircraft system roadmap 2005-2030[R].A572734,2005.
[2]王海斌,葛雪雁,宋玉珍.無人機(jī)的發(fā)展趨勢(shì)與技術(shù)預(yù)測[J].飛航導(dǎo)彈,2009(11):46-52.
[3]廖洪祥,羅繼勛,王邑.預(yù)警機(jī)指揮多編隊(duì)作戰(zhàn)中的威脅評(píng)估算法研究[J].電光與控制,2008,15(10):55-57,88.
[4]高貴虎,丁紅巖,滕志偉.層次分析法在對(duì)潛多目標(biāo)威脅度評(píng)估中的應(yīng)用[J].指揮控制與仿真,2008,30(5):37-39.
[5]肖冰松,方洋旺,許蘊(yùn)山,等.編隊(duì)內(nèi)協(xié)同超視距空戰(zhàn)目標(biāo)分配模型研究[J].系統(tǒng)工程與電子技術(shù),2010,32(7):1476-1479.
[6]國博,王社偉,陶軍.基于改進(jìn)粒子群算法的多無人機(jī)任務(wù)分配研究[J].計(jì)算機(jī)仿真,2009,26(7):62-64,153.
[7]葉文,朱愛紅,潘長鵬,等.多UCAV協(xié)同目標(biāo)分配算法研究[J].系統(tǒng)工程與電子技術(shù),2010,32(1):104-108.
[8]紀(jì)震,廖惠連,吳青華.粒子群算法機(jī)應(yīng)用[M].北京:科學(xué)出版社,2009.