張 磊 朱 琳 顧 頎
(1.海軍指揮學院 南京 210016)(2.海軍潛艇學院 青島 266071)
基于MAS艦艇編隊協同防空作戰決策模型研究*
張 磊1朱 琳2顧 頎1
(1.海軍指揮學院 南京 210016)(2.海軍潛艇學院 青島 266071)
從協作決策的角度重點研究了編隊區域防空和點防御區防空火力的協作決策求解模型。其中區域防空火力的協作采用受制的協作方式,應用了“因需設崗”的協作思想,提出了“角色能力匹配+主客觀綜合賦權+直接命令”的協作機制,并針對權重的不確定性引入了多目標模糊決策理論。點防御區的協作采用自治的協作方式,提出了計劃融合沖突消解的協作機制。最后,通過實例對協作決策模型進行計算分析,驗證了模型的合理性。
協作; 編隊防空; 模糊決策
Class Number TP391.9
現代海戰中,艦艇編隊在遂行海上作戰任務過程中,對空中目標的防御要貫穿始終。對空防御必須實時處理大量信息,并實時做出防御決策,比如編隊指揮員對編隊區域防空導彈的分配、各艦指揮員對本艦近程防空武器的分配等,這些決策任務對指揮員的指揮能力提出很高的要求,需要借助防空作戰軟件來提供輔助決策。而隨著海上作戰環境的日益復雜及通信技術、飛航技術等高科技的不斷發展,如精確制導武器和電子戰手段的廣泛應用,現有的編隊防空決策模型已日益凸顯出靈活性動態性不夠、復雜決策問題處理困難、缺乏協作等問題。因此一個具有智能化的分布式編隊輔助決策模型將是提高編隊防空效能、保障艦艇生命力的重要保證。
多智能體系統(Multi-Agent System,MAS)是當今分布式人工智能研究的熱點,該理論不僅擁有單個Agent本身自主性、社會性等優良特性,而且具有Agent之間相互協調合作解決復雜決策任務的能力。因此,鑒于當前艦艇編隊防空決策模型的局限性和未來海戰防空決策問題的復雜性特點,基于MAS的復雜決策建模理論能為編隊防空決策提供一種新的思路和方法。
區域防空火力分配的決策問題主要指在來襲導彈的航路上分配最適合的區域防空導彈進行抗擊,盡量將來襲導彈攔截在最遠距離上,且抗擊失敗后能有下一波的導彈繼續發射進行抗擊。艦艇編隊區域防空火力分配決策任務的動態協作流程,如圖1所示[1~2]。

圖1 編隊區域防空火協作配決策的流程圖
3.1 協作機制的主要內容
作為實現任務求解的主要方式—協作,其實現過程是很復雜的,協作過程能否順利實現,是動態協作任務求解問題所要重點解決的關鍵問題。為了使協作過程能夠順利地實現,建立相應的協作機制是十分必要也是十分重要的。
協作機制具體包括協作方式、協作策略和協作方法三部分內容[3]。協作方式是指協作主體采用什么樣的協作方案進行協作;協作策略是在協作方案確定的情況下,具體實現的過程,而協作方法是指對協作的每一個具體實現過程所采用的具體方法。
3.2 編隊區域防空火力的協作機制
根據上文對協作機制三個方面的分析和研究,本文設計編隊區域防空的協作機制為:“角色能力匹配+主客觀綜合賦權+指揮艦直接命令”。具體表述如下[4~5]:
指揮艦Agent發布協作任務,下屬Agent艦接收協作任務,通過角色能力匹配判斷是否參與協作,角色能力匹配是指根據空中目標的距離和自身艦空導彈的射程及編隊中的職能角色等進行匹配,匹配規則如下:
Rule1:目標在點防御區內,如果協作時間允許,且空中無其他目標,所有半自治Agent均可參與協作。
Rule2:目標在近程區域防空導彈射程之內、點防御區之外,優先選擇具有區域防空導彈且導彈有剩余的艦艇,即區域防空艦Agent參與競爭。
Rule3:目標在遠程區域防空導彈射程之內、近程區域防空導彈射程之外,優先選擇具有遠程區域防空導彈且導彈有剩余的艦艇,即遠程區域防空艦Agent參與競爭。
Rule4:目標在遠程區域防空導彈射程外,可優先選擇具有遠程區域防空導彈且導彈有剩余的艦艇,即遠程區域防空艦Agent參與競爭。
Rule5:如果導彈的射擊禁危區內有我友鄰艦,不參與對該目標的協作。
Rule6:因自身狀態原因,如無閑置防空通道或導彈剩余為零等情況而無能力參與協作,向指揮艦返回協作失敗的信息。
Rule7:指揮艦根據以上原則也需要進行參與協作競爭。
Rule8:多目標下,對威脅程度高的目標優先分配防空火力通道。
根據匹配,形成協作群體Region(),協作群體內各艦修改規劃,并上報相關信息:抗擊方案(單發或雙發等)、導彈的射程、完成抗擊的總時間,抗擊方案的毀傷概率及抗擊所需的武器資源情況等,以上信息構成了參與競爭時的性能指標。本文根據對空防御又快又準地擊毀空中目標為原則,主要選擇競爭的性能指標有實戰能力值Cap、完成抗擊的時間T、抗擊方案的殺傷概率P。
有了性能指標,下一步就需要確定相應的權重,并按照具體算法計算協作群體內每個半自治防空Agent的競爭優勢,由具有最大競爭優勢的Agent來執行抗擊。由于各個權重具有不確定性,需要融入指揮員的知識經驗、期望等偏好信息,因此,偏好信息的獲得是解決該問題的關鍵。
指揮艦直接命令源于編隊指揮艦的權威性,在防空作戰中,指揮艦處于核心地位,能全面掌握海面和空中動態,因此指揮艦可以直接命令下屬防空艦執行抗擊任務,即該下屬艦直接獲得最大競爭優勢。指揮艦直接命令的優勢在于增加了人的因素,符合了當前編隊作戰的實際情況,在處理部分問題時,減少協作需要的時間,減少了資源的消耗。
現代海戰場中,對海上艦艇編隊的攻擊往往呈現多方向、多批次,因此,在單目標防御的研究基礎上,對多目標下的協作決策也作了初步研究。首先作如下定義:
艦艇編隊集合A={ag1,ag2,…,agm},即有m艘艦艇組成;
空中目標集合G={G1,G2,…,Gn},G是動態變化的;
威脅系數rj(j=1,2,…,n),rj≥0,威脅判斷模型可以采用如下算法[6]:rj=W·T(其中W為編隊各艦的權重向量,T為各目標對各艦的攻擊概率矩陣,通過雷達情報分析可以得到);
每艘艦艇可有防空火力通道數fi(i=1,2,…,m),fi≥0,當fi=0時,表明無閑置防空通道,即不參與區域防空協作;
各艦剩余導彈數Mi(i=1,2,…,m),Mi≥0,當Mi=0時該艦不參與區域防空的協作。
參考單目標時編隊區域防空火力的協作流程,多目標下編隊區域防空火力分配決策的協作流程如圖2所示。

圖2 多目標下編隊區域防空火力分配決策的協作流程
4.1 模糊多目標決策模型
所謂多目標決策是指在具有相互沖突、不可公度的多個目標情況下進行決策。模糊集理論是解決含有模糊不確定因素的復雜決策問題的有效工具。模糊集理論與多目標決策的有機結合就是模糊多目標決策[7~8]。
訓練數據集中有19種特征,其中特征7-13、15-17的值在測試數據集中被隱藏,特征14(Correct First Attempt)為需要預測的分類特征。因此,在訓練過程中也排除了特征7-13和特征15-17。我們將剩下的8種非類別特征分為三類,一是與學生相關的特征,即特征2;二是與題目相關的特征,即特征3-6;第三類是與知識點相關的特證,即特征18和19。在對數據樣本進行距離度量過程中采用協同過濾算法,把學生當做主體,即協同過濾算法中的客戶,將題目和知識點看作與客戶相關的項目。
多目標決策過程如下:對于一個由n個決策方案xj(j=1,2,…,n)所組成方案集和m個目標fi(i=1,2,…,m)組成目標集的多目標決策問題,得到決策矩陣F=(fij)m*n。通常情況下,多個目標之間相互沖突,不可公度。同時,在決策過程中,含有決策者的知識經驗、判斷等模糊經驗。為此,需要確定方案xj關于目標fi的優屬度μi(xj),簡記為μij。目標相對優屬度的確定方法很多,常見的有效益型,成本型,固定型,區間型。確定了μij后,則可用多目標決策模糊最優解的若干求解方法進行建模求解。然而,使用這些方法的前提條件是事先知道目標集f的權重向量ωi=(ω1,ω2,…,ωm)T。所以權重的確定就成為解決多目標決策問題的關鍵所在。
4.2 隸屬度線性加權規劃方法
隸屬度線形加權規劃方法是解決偏好信息不完全確知的一種模糊多目標決策方法[9~10],可以假定前P個目標權重是待定的,而后(m-P)各權重是已經給定的,其中0≤P≤m,即
(1)
記
?=(ω1,ω2,…,ωp)T
設決策矩陣F及其目標相對優屬度矩陣μ已給定,于是可得方案xj∈X的目標相對優屬度線性加權平均綜合值為

(2)
顯然,對于給定的權重向量ω,ρj(?)越大則xj越優。因此,可以建立下式的多目標決策模型為
由于每個方案都是非劣的,所以它們之間不存在任何優劣關系,具有相同的重要性,于是可將上述多目標決策問題等權重集結為等價的單目標非線性規劃,可求解得
(3)
將式(3)和式(1)代入式(2)可得到各個方案的目標相對優屬度線性加權平均綜合值,并按其從大到小的順序即得方案集X的優劣排序。
顯然,當p=m即偏好信息完全不確知時,有d=1。若偏好信息完全確知即ω已知時,直接利用式(2)便可做出決策。由此可見,隸屬度線性加權規劃方法同樣適用于偏好信息完全不確知和完全確知這兩種極端情況的多目標決策問題。
5.1 情況設定
艦艇編隊編成為D1、D2、D3、D4四艘驅護艦,隊形為菱形隊,D3,D4居兩側。假定本文實例中編隊各艦的防空實戰能力評價如表1所示,另外表中軍事價值權重通常是根據編隊各艦在編隊中的地位和實際價值由編隊指揮員來設定。

表1 編隊各艦實戰能力值及軍事價值權重


圖3 編隊對空防御態勢圖
在執行任務航渡時,敵向我編隊共發射三枚反艦導彈,現假設三枚空中目標的屬性如表2所示。

表2 空中目標群屬性
5.2 實例計算
通過計算,可以得到艦艇編隊防空火力的協作抗擊流程,如表3所示。限于篇幅,計算過程中假設目標f2、f3為一次攔截成功,目標f1為二次攔截成功。另外,考慮到目標到編隊各艦的相對距離雖然不同,但是對的協作及決策的影響較小,因此為便于計算,在計算過程中將編隊看作是一個整體,只計算目標至編隊的距離,分別用D1,D2,D3表示,不分別計算目標至各艦的相對距離。
1) 威脅度排序
根據表2中的目標屬性應用灰色關聯度分析,得出三個空中目標的威脅排序如下:f1?f2?f3。空中目標狀態發生變化,需要對威脅度進行重新排序。
2) 協作群體的形成及演化
指揮艦根據態勢發布任務,根據目標距離、威脅程度和艦艇火力通道數對四個目標形成初始的三個動態競爭組Regionf1(),Regionf2(),Regionf3(),隨態勢變化可以重新演化編組。
5.3 實例分析結論
以三枚超音速反艦導彈從三個方向向我編隊進攻為防空態勢,模型根據威脅排序和各艦的防空通道數,形成三個動態競爭組,每個競爭組在抗擊過程中根據態勢的改變而動態演化,直到目標被摧毀或進入點防御區,體現了模型對態勢變化的動態適應性。其中對目標的第一次抗擊采用直接反應模式,保證了艦空導彈在最遠距離上攔截目標的要求,體現了半自治Agent的自主性和對應急問題的處理,減少了決策的時間。另外,在模型中還有編隊指揮艦人工干預直接命令一個環節,雖然在實例中沒有表現出來,但是也符合目前編隊的作戰指揮特點,體現了半自治防空Agent的受制性。

表3 多目標下編隊防空協作流程
[1] 施帆,繆旭東,闞玉斌.基于模糊理論和多Agent協作的編隊對空防御研究[J].海軍大連艦艇學院學報(增刊),2008:52-56.
[2] 董建軍,鐘志通.艦空導彈編隊反導攔截決策模型[J].現代防御技術,2001,29(4):20-31.
[3] 賈利民,劉剛,秦勇.基于智能Agent的動態協作任務求解[M].北京:科學出版社,2007:5-10.
[4] Wooldridge M. J, Jennings N. R. Intelligent Agents: theory and practice[J]. KnowledgeEngineering Reviews,1995,10(2):115-152.
[5] Yen, J., Yin, J., Ioerger, T.R., et al. Collaborative agents for Simulating Teamwork[C]//Proceedings of the Seventeenth International Joint Conference on Artificial Intelligence(IJCAI-OI):1135-1142.
[6] 毛昭軍,等.基于多Agent系統的艦艇編隊防空輔助決策系統[J].系統工程與電子技術,2006,28(11):1704-1708.
[7] 李登峰.模糊多目標多人決策與對策[M].北京:國防工業大學出版社,2003:105-120.
[8] 拓明文.模糊多屬性Agent多決策系統及其在企業融資中的應用[D].上海:東華大學,2006:36-42.
[9] 肖勝,尹迪,包磊.一種基于MAS的水面艦艇CGF系統行為模型[J].艦船電子工程,2007,27(3):114-116.
[10] Miller, M., Yin, J., Volz, R.A., et al. Training teams with collaborative agents[C]//Proceedings of the Fifth International Conference on Intelligent Tutoring Systems,2000:63-72.
Model of Decision-making Research Based on MAS in Fleet Collaborative Anti-air Warfare
ZHANG Lei1ZHU Lin2GU Qi1
(1. Naval Command College, Nanjing 210016)(2. Naval Submarine Acadamy, Qingdao 266071)
The collaborative model is studied on formation area-defence and point-defence. The restricted collaborative fashion is adopted in the collaboration of area-defence in which a new idea of collaboration is put forward. Then an arithmetic of "role matching&subjective and objective weight enacting&direct command" is adoped in the collaborative mechanism in which the theory of fuzzy multiobjective decision-making is applied to solve the problem of uncertainty weight. In the point-defence, the automony collaborative fashion is adopted and a collaborative mechanism of plan merging is put forward. Finally, instances are given to analyze the collaborative flow of decision-making on formation air-defence, which are validated rationality.
collaboration, formation air-defence, fuzzy decision-making
2013年8月9日,
2013年9月29日
軍隊國防預研項目(編號:51306060401)資助。
張磊,男,博士,研究方向:海軍合同戰斗效能分析。朱琳,男,博士研究生,講師,研究方向:海軍潛艇戰術。顧頎,男,博士,教授,研究方向:海軍合同戰術。
TP391.9
10.3969/j.issn1672-9730.2014.02.006