劉 振,徐學文,劉 勇
(海軍航空大學 岸防兵學院,山東 煙臺 264001)
空戰決策問題本質上是一個目標分配問題,其目的在于將目標合理地分配給攻擊飛機,使得機群的整體效能最大。當前有眾多的研究者利用各種的智能優化算法求解目標分配問題,進化算法在尋優的簡便性、通用性以及全局尋優性上的優勢,使得其應用廣泛,例如文獻[1-2]就分別利用遺傳算法和文化基因算法等優化方法進行求解,也逐步提出一些改進類型的進化算法應用于目標分配問題,例如文獻[3-4]分別利用精英改選機制粒子群算法和啟發式粒子群算法求解空戰決策問題。現在的作戰環境逐步趨向于分布式網絡化,因此諸多文獻都采用了分布式的求解方法,文獻[5]利用協同拍賣求解目標分配問題。合同網也逐步應用到目標和任務的分配中[6],基本思想都是利用合同網機制中的拍賣合同、競標合同以及交換和置換合同等方法處理靜態和動態的分配問題。
當前已經提出了諸多方法用于求解空戰決策和目標分配問題,隨著網絡化作戰環境的逐步建立和完善,多作戰平臺在戰場環境下能夠實現態勢的共享。因此,當某架飛機發射導彈后,若該機失去制導能力或者需要做機動規避的情形下,如何使得另一架飛機有效地實現對導彈的協同制導是一個需要解決的問題。當前較多文獻關注多機協同制導下的制導律設計[7],關于協同制導下的目標分配和任務分配研究的相對較少,文獻[8]較早關注到了該問題,并提出了協同制導決策方法,文獻[9-10]進一步拓展推廣了制導優勢模型,以此為基礎建立了考慮協同制導的任務分配模型,所考慮的制導交接因素過多注重于當前空戰態勢因素。
本文針對多機協同制導情況下的決策模型和求解方法進行探討和分析。在本文的分析過程中,將發射導彈的飛機稱為交班平臺,將協同制導的飛機稱為接班平臺。在危險的戰場環境下,交班平臺在發射完導彈后可以進行有效的規避,而制導的任務則可以交給有制導能力的接班平臺,從而避免人員的傷亡,提高整體作戰效能。通過查閱以及分析國內外文獻,本文設計了一種協同制導交接方案,以敵方毀傷最大以及我方損失最小,建立了考慮協同制導下的空戰決策模型,該模型不僅充分考慮態勢優勢,同時也將截獲概率和交接成功概率作為候選制導平臺的重要因素,為提高求解該模型的收斂速度和精度,提出一種分布估計免疫算法(estimation distribution immune algorithm,EDIA)來求解該模型。
雙機或多機協同制導就是在分布式網絡化的作戰條件下,當交班平臺無法有效地對所發射的導彈進行制導時,將空空導彈的中制導權交給制導平臺,協同制導示意圖如圖1所示。
從圖1可以看到,交班平臺在發射完導彈后,由于有其他作戰任務或者本身受損,無法繼續完成所發射導彈的制導任務,因此將中制導任務進行交接,接班平臺可利用中繼制導平臺,如預警機提供的探測信息,完成對導彈的制導任務。
美國于二十世紀七八十年代就開始對協同作戰能力系統進行研究,但在國外公開發表的資料中尚未看到空戰中相關的研究。因此,研究協同制導下的空戰決策問題具有重要的現實意義。本文對這個問題進行了初步探討分析,提出了協同制導下的決策模型和求解方法。
首先進行如下的假設:
①假設1。 交班平臺和接班平臺距離小于接班平臺的最大制導距離,即接班平臺能夠對交班平臺發射的導彈進行有效的制導;
②假設2。 導彈在發射后,直至命中目標,都處于接班平臺的制導范圍內。
文獻[8]將接班平臺優勢函數作為制導交接的依據,但優勢函數最大的接班平臺,并一定能夠有效地對導彈進行制導。因此,本文給出一種多機協同制導情況下接班平臺的選擇方法,在考慮制導優勢外,將導彈導引頭截獲目標概率和交接成功概率也作為接班平臺的選擇依據。
1.1.1 交接制導優勢
交接制導優勢主要由態勢優勢和效能優勢構成。
1)態勢優勢。
空戰態勢優勢可以表示為
TSI=β1Ta+β2Td+β3Tv
(1)
式中:Ta,Td和Tv和分別為角度、距離和速度優勢;β1,β2和β3分別為3種態勢優勢的權重系數,并且β1+β2+β3=1,一般可取0.2,0.4和0.4。
2)空戰效能優勢。
(2)
式中:Ci和Cj分別為交班平臺和候選接班平臺的空對空作戰能力。
在得到空戰態勢優勢和空戰效能優勢后,總的制導優勢為
w=a1TSI+a2TC
(3)
式中:a1和a2通常由專家評估或者根據經驗知識得到,分別為態勢優勢和效能優勢對制導優勢的影響權重系數,本文設定a1=0.6,a2=0.4。
1.1.2 導引頭截獲目標概率
協同制導的目標就是使導彈能夠命中目標,提高整體效能,因此制導交接需要考慮導彈的導引頭截獲目標的概率。只有成功截獲目標,才能實現對目標的有效制導[11]。導引頭截獲目標概率可按下式獲得:
Pm=PdPaPv
(4)
式中:Pm為導引頭對目標的正確截獲概率;Pd,Pa和Pv分別為距離、角度和速度截獲概率。
1.1.3 交接成功概率
在滿足協同制導的前提條件下,除了候選制導平臺自身的優勢以外,還必須考慮交班平臺與接班平臺的交接成功概率,優勢較大的飛機如果不能有效地捕獲導彈,優勢即使再大也是沒有意義的。交接成功概率PH由3個方面的因素構成[12],分別為:導彈落入概率PD、對導彈的發現概率PF以及對導彈的鎖定概率PL。不考慮交班設備的可靠性,交接成功概率為
PH=PDPFPL
(5)
通過上述的分析,接班平臺的選擇概率為
PSE=PmPHw
(6)
在確定了接班平臺以后,針對目前廣泛使用的慣導+指令修正中制導和主動雷達末制導的空空導彈,給出一種協同制導交接方案:
①導彈發射后轉入中制導段,交班平臺對導彈進行穩定跟蹤,同時接收接班平臺傳送的目標信息,經時空一致性轉換后向導彈發送中制導指令;
②交班平臺交接形勢判斷模塊在導彈飛行過程中實時進行判斷計算,當滿足制導交接條件時啟動交接程序。交班平臺向接班平臺發送“開始交接”信號和導彈的飛行空域預測信息;
③接班平臺接收“開始交接”信號和報文,控制機載雷達轉向導彈預測飛行空域,由接班平臺的接力交接控制模塊控制自身機載雷達向導彈發送一次詢問信號,并等待接收應答信號;
④導彈分時接收兩平臺的制導指令,并發送應答信號;
⑤接班平臺交接狀態判斷模塊依據接收的應答信號對交接狀態進行實時判斷,判斷交接成功后,向交班平臺發送“交接成功”信號,交班平臺接收“交接成功”信號,停止向導彈發送指令,隨后接班平臺開始在詢問信號后加入制導信息,以固定的頻率向導彈發送制導信息。
按照協同制導交接方案,交班平臺就可以把導彈的制導權順利地移交給接班平臺。

①每個目標至多分配一枚導彈;
②每枚導彈只能用于攻擊一個目標。
如果此時Ri的機載導彈Mk需要進行協同制導,Ri發射后并不對Mk進行制導。在協同制導的情形下Mk擊毀Bj的概率Tkj并不等于Ri對Bj的威脅Tij,需要考慮制導交接的成功概率,故此時Tkj=PHTij。
則藍方損失的威脅可以表示為
(7)
式中:ω為導彈目標分配方案。
滿足約束條件式(8)和式(9):

(8)

(9)
當第k枚導彈用于攻擊第j個目標時,則Xkj=1。如果在各架飛機掛載的導彈數目都為S時,通過觀察該方程可以看出,當i=1,2,…,M,式(7)中k的取值范圍只能為Ui=[iS(i+1)S-1],式(7)可以表示為
(10)

(11)
(12)
在考慮消除威脅最大的同時,還必須考慮我方受到的威脅最小,因Ri對Bj的威脅為Tij,則Bj對Ri的威脅為Tji,Tji可以看作Bj對Ri的擊毀概率,則紅方受到的總威脅為
(13)
由于飛機一般都攜帶有欺騙設備和干擾設備,從而可以有效地降低其所受到的威脅,軟殺傷武器系統可以等效為欺騙設備,假定Ri等效后的欺騙設備的數量為mi,因此考慮欺騙設備和干擾設備后的總威脅為
(14)
因此總的空戰決策評估函數為
R(ω)=E(ω)-Q(ω)
(15)
協同制導空戰決策問題對求解速度和求解精度有較高的要求,智能優化方法由于其強大的尋優能力以及操作上的方便性,已經被廣泛用于求解該類問題。免疫算法是受生物免疫系統啟示的一種尋優搜索算法,具有良好的學習記憶能力和優良的全局尋優性能,已經被廣泛研究和應用[13-14],本文考慮利用免疫算法求解空戰決策問題。但通過對免疫算法的研究發現,基本免疫算法難免存在尋優效率不高,尋優效果不佳等問題。擴展緊致遺傳算法[15]作為一種進化性能優越的分布估計算法,利用優良解集的概率模型指導進化的方向,通過將染色體基因位劃分為MPM,從而保證優良模式不在進化過程中被破壞。因此為提高免疫算法的求解性能,本文將分布估計的思想融入到免疫算法中,提出分布估計免疫算法(EDIA),基于MPM進行交叉和變異操作,可以有效地提高算法的進化效率,避免算法過早收斂。
1)編碼方法。
編碼方式如圖2所示。
染色體共有M段組成,染色體長度L=MN,染色體中第i(1≤i≤M)部分的第j(1≤j≤N)位為1,則代表第i架紅機能夠用于攻擊第j架藍機。
2)種群初始化方法。
在算法的運行過程中引入啟發式信息,啟發式信息是指在算法的運行開始階段,根據問題的特點、以往的經驗以及實際的資源和環境條件,在算法的初始化階段所構造出的啟發信息,例如當第i架紅方飛機不能用于攻擊第j架藍方飛機時,則可將該染色體相應的位置設為0。在算法的運行過程中,根據問題的實際特點,如果產生不可行解,人工修改染色體中相應的位置,調節算法的搜索范圍和方向。
隨機的初始化種群不便于種群個體進化,且有陷入局部極值的風險,為了使種群能保持較好的多樣性,文獻[16]利用反向學習方法進行種群的初始化,證明能夠有效地提高算法的進化效率,本文利用文獻[16]提出的方法進行種群初始化。
在進化算法中,利用交叉方式可以有效地提高種群多樣性,獲得全局優良解,但交叉方式選擇至關重要,優良的交叉方式可以有效地保證積木塊的累積,因此本文采用文獻[15]提出的基于MPM的交叉。將MPM作為一個整體進行交叉,從而可以有效地保證種群個體基因位之間的鏈接關系,使得優良模式得到保留和進化。同時本文也采用了MPM變異,即按照變異概率Pu,對某一MPM中的基因位進行變異操作。在種群進化過程中,如果整個進化過程中采用統一的變異概率,收斂過程緩慢,不便于優良個體進化,利用自適應變異概率,第i個個體的變異概率設置為
(16)

為保證進化種群的多樣性,避免單一選擇方式導致的進化停滯和陷入局部極值,利用適應度共享增強種群進化的多樣性,對于進化種群中的抗體ai(t)和aj(t),其共享函數可以定義為
(17)
式中:σs為共享半徑,dij為抗體之間的距離,ai(t)的適應度可以表示為
(18)

(19)

利用本文提出的分布估計免疫算法求解協同制導下的決策模型,首先需要初始化進化參數信息,包括種群規模N,循環迭代次數Tmax,依據敵我雙方飛機數目確定的染色體長度L,共享半徑σs,變異概率Pu,其主要流程可概述為:
①步驟1。 依據當前態勢信息和空戰決策模型,初始化進化算法參數信息;
②步驟2。 利用反向學習方法,初始化種群P(t),并根據初始啟發式信息剔除不合理個體;
③步驟3。 對種群P(t)中的染色體分別進行交叉和變異操作,其中交叉和變異均按照MPM方式進行,變異概率按照式(16)設置;
④步驟4。 計算抗體和抗原之間的親和力,依據式(18)進行適應度共享操作,并依據式(19)的選擇概率進行免疫選擇;
⑤步驟5。 判斷是否滿足結束條件,滿足則結束,輸出分配結果,否則轉步驟2。
在標準態勢和隨機態勢下進行仿真分析,其示意圖分別如圖3(a)和圖3(b)所示,標準態勢的數據來自文獻[8],用以對比分析本文采用的制導平臺選擇方法與文獻[8]的區別聯系,隨機態勢用以仿真分析本文提出的空戰決策模型及分布估計免疫算法的正確性。
標準空戰態勢如圖3(a)所示,其中B、C和D3架飛機對攻擊目標T的某枚導彈進行協同制導,得到3架飛機的態勢優勢分別為0.627 7,0.412 0和0.326 0,根據文獻[8],效能優勢都為0.75,因此3架飛機總的制導優勢為0.676 6,0.547 2和0.495 6。依據文獻[8],若單純考慮制導優勢,應該選擇平臺B作為接班平臺,但從實際空戰情況出發,為有效提高作戰效能,確保制導平臺能夠順利截獲目標并完成對導彈的協同制導,除了考慮制導優勢外,還應考慮目標截獲概率和制導交接成功概率。若B,C和D對需要協同制導的導彈進行制導后,雷達截獲概率分別為0.90,0.99和0.99,交接成功概率分別為0.924,0.975和0.988,則按照本文計算得到的制導平臺選擇概率分別為0.522 0,0.528 2和0.484 8,故此時應該選擇平臺C作為制導接班平臺。
由此可以看出,當考慮了雷達截獲概率和交接成功概率后,與單純依靠制導平臺優勢進行選擇發生了沖突。經分析發現,單純考慮制導優勢,并不能綜合考慮制導交接后的空戰效能變化情況,由于平臺B的雷達截獲概率及交接成功概率較低,因此不宜作為接班平臺,平臺C的制導優勢雖然不如平臺B高,但其雷達截獲概率和交接成功概率有優勢,因此應以平臺C為接班平臺。在復雜的戰場環境下,單純依靠制導優勢進行選擇過于片面,依據本文的方法,當考慮了影響制導交接的多個約束條件后,能夠更加全面地刻畫此時交接的情況。
隨機交戰態勢如圖3(b)所示,紅方R飛機數量M=4,每架飛機可以掛載4枚導彈,藍方B飛機數量N=14。紅方R此時的總導彈數目為14,R1,R2,R3和R4掛載的導彈序號分別為1~4,5~8,9~12,13~14。R3由于在前一波次的攻擊中發射了2枚導彈,因此此時只有2枚導彈,并且其制導系統受到損壞,不能對其發射的導彈進行中制導。
在隨機態勢下,R4由于戰術原因需要對其掛載的導彈進行協同制導。依據1.1節提出的方法,最終選擇R3為其接班平臺,R4將第13和14枚導彈的中制導權交給R3,最終計算得到的分配方案為
R1{1,2,3,4}→{B13,B7,B12,B9}R2{5,6,7,8}→{B3,B6,B14,B5}R3{9,10,11,12,13,14}→{B2,B8,B10,B11,B1,B4}
其中左邊括號內為紅機Ri制導的導彈編號,右邊括號內為Ri分配的藍機編號,從最終的分配方案可以看出,R4掛載的第13和14枚導彈被用于攻擊B1和B4。
將采用協同制導后的效能以及不同求解算法獲得的效能進行對比,仿真結果如圖4所示。圖4(a)為采用協同制導前后的效能對比圖,其中橫坐標為迭代次數(t),縱坐標為效能值(f),兩者均無量綱。從中可以看出采用協同制導后的效能值有了明顯提高,這是因為若不采用協同制導,則R3必須退出攻擊,從而造成了資源的浪費和效能的降低。
圖4(b)為在隨機態勢下,分別用遺傳算法(GA)、免疫遺傳算法(IGA)以及分布估計免疫算法(EDIA)協同制導決策問題進行對比,從圖中可以發現,本文提出的算法能有效提高整體作戰效能,并且本文提出的EDIA收斂速度也優于GA和IGA。
本文分析協同制導下的空戰決策方法,給出了協同制導的接班平臺選擇方法和協同制導交接方案設計,建立了協同制導下的空戰決策模型。為提高問題的求解效率,提出利用分布估計免疫算法求解協同制導下的空戰決策問題,對本文提出的方法和模型進行了仿真分析,證明了本文模型和方法的正確性。
對協同制導下的空戰決策問題,現在開展的研究還相對較少,因此在下一步的研究中考慮如何在復雜環境下進行協同制導決策,特別是動態目標的協同制導空戰決策,是進一步研究的方向。
[1] CHEN Jie,XIN Bin,PENG Zhihong,et al. Evolutionary decision-making for the dynamic weapon-target assignment problem[J]. Science China:Series F-information Science,2009,52(11):2006-2018.
[2] 王曉光,章衛國,陳偉. 無人機編隊超視距空戰決策及作戰仿真[J]. 控制與決策,2015,28(2):352-357.
WANG Xiaoguang,ZHANG Weiguo,CHEN Wei. BVR air combat decision making and simulation for UAV formation[J]. Control and Decision,2015,28(2):352-357.(in Chinese)
[3] 王昱,章衛國,傅莉,等. 基于精英改選機制的粒子群算法的空戰納什均衡策略逼近[J]. 控制理論與應用,2015,32(7):857-865.
WANG Yu,ZHANG WeiGuo,FU Li,et al. Nash equilibrium strategies approach for aerial combat based on elite re-election particle swarm optimization[J]. Control Theory and Application,2015,32(7):857-865.(in Chinese)
[4] LUO Delin,YANG Zhong,DUAN Haibin,et al. Heuristic particle swarm optimization algorithm for air combat decision-making on CMTA[J]. Transactions of Nanjing University of Aeronautics & Astronautics,2006,23(1):20-26.
[5] EDALAT N,XIAO Wendong,ROY N,et al. Combinatorial auction-based task allocation in multi-application wireless sensor networks[C]//The 9th International Conference on Embedded and Ubiquitous Computing. Melbourne:IEEE,2011:3622-3627.
[6] 廖沫,陳宗基. 基于多Agent分布協同拍賣的動態目標分配算法[J]. 北京航空航天大學學報,2007,33(2):180-183.
LIAO Mo,CHEN Zongji. Dynamic target assignment method based on multi-agent decentralized cooperative auction[J]. Journal of Beijing University of Aeronautics and Astronautics,2007,33(2):180-183.(in Chinese)
[7] ZHAO Jiang,ZHOU Rui,DONG Zhuoning. Three-dimensional cooperative guidance laws against stationary and maneuvering targets[J]. Chinese Journal of Aeronautics,2015,28(4):1104-1120.
[8] 肖冰松,方洋旺,胡詩國,等. 多機空戰協同制導決策方法[J]. 系統工程與電子技術,2009,31(3):610-612.
XIAO Bingsong,FANG Yangwang,HU Shiguo,et al. Decision methods for cooperative guidance in multi-aircraft air warfare[J]. Systems Engineering and Electronics,2009,31(3):610-612.(in Chinese)
[9] 冉華明,周銳,吳江. 超視距空戰中多機協同制導方法[J]. 北京航空航天大學學報,2014,40(10):1457-1462.
RAN Huaming ZHOU Rui,WU Jiang,et al. Cooperative guidance of multi-aircraft in beyond-visual-range air combat[J]. Journal of Beijing University of Aeronautics and Astronautics,2014,40(10):1457-1462.(in Chinese)
[10] 周德云,楊振,張堃. 多UCAV超視距協同空戰中的交接制導方法[J]. 彈道學報,2017,29(2):1-7.
ZHOU Deyun,YANG Zhen,ZHANG Kun. Method of guidance handover in beyond-visual-range coordinated air-combat for multi-UCAVs[J]. Journal of Ballistics,2017,29(2):1-7.(in Chinese)
[11] 樊會濤. 復合制導空空導彈截獲目標概率研究[J]. 航空學報,2010,31(6):1225-1229.
FAN Huitao. Study on target acquisition probability of air-to-air missiles with combined guidance[J]. Acta Aeronautica et Astronautica Sinica,2010,31(6):1225-1229.(in Chinese)
[12] 劉興堂,周自全,李為民,等. 現代導航、制導與測控技術[M]. 北京:科學出版社,2010:173-176.
LIU Xingtang,ZHOU Ziquan,LI Weimin,et al. Modern navigation,guidance and TT&C[M]. Beijing:Science Press,2010:173-176.(in Chinese)
[13] SIMONE S F. Artificial immune algorithm applied to distribution system reconfiguration with variable demand[J]. Electrical Power and Energy Systems,2016,82:561-568.
[14] SHANG Ronghua,DU Bingqi,MA Hongna,et al. Immune clonal algorithm based on directed evolution for multi-objective capacitated arc routing problem[J]. Applied Soft Computing,2016,49:748-758.
[15] 劉振,胡云安,彭軍. 協同進化擴展緊致量子進化算法[J]. 控制與決策,2014,29(2):320-326.
LIU Zhen,HU Yunan,PENG Jun. Coevolutionary quantum evolutionary algorithm based on extended compact[J]. Control and Decision,2014,29(2):320-326.(in Chinese)
[16] RAHNAMAYAN S,TIZHOOSH H R. A novel population initialization method for accelerating evolutionary algorithms[J]. Computers and Mathematics with Applications,2007,53(10):1605-1614.
[17] CHENG Lijun,DING Yongsheng,HAO Kongrong. An ensemble kernel classifier with immune clonal selection algorithm for automatic discriminant of primary open-angle glaucoma[J]. Neurocomputing,2012,83(15):1-11.