宋貴寶,強裕功,劉 鐵,劉鎮毓
(海軍航空大學 岸防兵學院,山東 煙臺 264001)
武器目標分配問題(weapon-target assignment,WTA),有時也被稱為導彈分配問題(MAP)[1],是軍事運籌學領域中一個經典的約束組合優化問題,最初由Manne引入作戰研究領域,尋求分配可用的武器攔截來襲導彈,以最小化導彈摧毀受保護資產的概率。WTA問題的目標是將有限的防御武器分配給來襲目標,以最大化防御效能,是戰場決策需要解決的重要問題[2]。武器目標分配問題是軍事指揮與控制(C2)自動化的關鍵問題之一,被認為是控制科學的一個挑戰,已經證明是NP完全問題[6]。目前WTA已經廣泛應用于防空、對地突襲等多個研究領域,為提高多武器平臺火力協同攻擊的整體作戰效果提供了一種優化方案。
武器目標分配問題的研究分為兩類:靜態武器目標分配(SWTA)和動態武器目標分配(DWTA)[3]。在SWTA問題中,所有武器都在單一階段與目標交戰,并且問題的所有參數都是已知的,SWTA問題的目標是找到一個靜態防御階段的最優分配方案。相反,DWTA問題考慮戰場的動態變化,是一個多階段問題,當前階段的交戰結果影響著后續階段的分配方案,DWTA問題的目標是找到整個防御過程的全局最優解。直觀上可將DWTA問題看作若干SWTA問題的集合,但需注意SWTA問題的解僅能保證當前階段的最優性,若干SWTA問題解的集合并不一定是整個防御過程的最優解。DWTA是一個多階段決策問題,在目標分配過程中需要考慮戰場態勢的不斷變化。DWTA問題的常用射擊策略為“觀察-射擊-觀察”[2],如圖1所示。

圖1 “觀察-射擊-觀察”射擊策略框圖
在觀察階段,決策者根據戰場態勢確定可用的攻擊武器以及所需攻擊的目標,在射擊階段,根據計算的武器目標分配方案對目標進行攻擊。射擊、觀察交替進行構成了整個動態打擊過程。武器目標分配問題的復雜性使得現有研究主要針對SWTA問題,信息獲取技術、智能優化算法等的發展使得解決更加貼近實戰的DWTA問題成為可能。
基于“射擊-觀察-射擊”策略,動態武器目標分配問題的決策過程如圖2所示[2,9]:

圖2 DWTA問題決策過程框圖
目前對動態武器目標分配問題的研究主要集中于問題模型和求解算法。
DWTA模型以SWTA模型為基礎,在處理過程中引入對隨機事件的處理,主要內容有[3]:
1) 模型假設。在實際戰場中存在多種不確定或無法準確測定的因素,構建模型時要進行合理的假設,突出主要的研究內容。
2) 目標函數的選擇。DWTA問題的目標函數主要有基于突防目標和基于防御資產2種類型[4]。在基于目標的問題中,其任務是最小化突防目標威脅值;在基于資產的問題中,任務是最大化幸存資產的預期價值。
3) 約束條件的選取。在DWTA問題的決策過程中需要考慮武器性能、射擊策略、裝備彈藥數量、作戰可行性等約束條件[11]。
相比靜態WTA問題,動態武器目標分配需要動態識別目標并確定可用的武器,所使用的算法必須具有良好的實時性,以及時進行目標分配決策。DWTA問題具有隨機性、非線性、大規模等特性,這使得采用精確算法對這一問題進行求解較為困難,目前的研究大部分采用隨機算法。應用于DWTA問題求解的隨機算法主要有遺傳算法、蜂群算法以及文化基因算法等。
要研究DWTA問題,首先必須了解SWTA問題。SWTA是指為了獲得最優或滿意的作戰計劃,在一定時間內將防御武器分配給即將到來的目標(進攻性武器)。在SWTA模型中,沒有考慮武器和目標的時間屬性,DWTA能夠相對真實地反映作戰環境的變化,能夠根據戰場形勢變化進行決策,從而達到總體最優的作戰效果。DWTA問題需要考慮攔截適宜性,為此文獻[10]引入了下面的基本概念:
1) 目標時間窗(time window of target,TWT):防御武器能夠對目標進行射擊的時間段,即目標暴露于防御武器射擊范圍內的時間,記為tb。
2) 武器時間窗(time window of weapon,TWW):防御武器發現目標到命中目標所需的最短時間,包括武器系統的響應時間及武器命中目標所需飛行時間(或導引時間),記為tr。
3) 武器-目標時間窗(time window of weapon-target,TWWT):防御武器開始向目標射擊的時間窗口,記為trb。只有在這一時間窗口組織射擊,目標才有可能被集中。
根據以上定義可得trb=tb-tr,且有要能夠對目標進行射擊必須滿足TWW 在動態武器目標分配問題中存在全局決策和執行決策2種不同的決策。根據“射擊-觀察-射擊”策略,DWTA問題可劃分為若干防御階段,全局決策是指從當前防御階段到最后防御階段的決策,包含若干子決策;執行決策是指當前階段的決策。執行決策實施后,根據具體的毀傷效果再次做出全局決策,全局決策和執行決策不斷循環,直至毀傷所有目標或彈藥耗盡[11]。根據上述分析,在每一防御階段,決策者從全局角度考慮問題,但實際上實施的是當前階段的決策,因此,DWTA問題與SWTA問題的建模思路相同,但考慮的角度不同。下文介紹幾種WTA問題的常用模型: 1) 基于防御資產的WTA模型 基于防御資產的WTA模型強調對自有資產特別是重要資產的保護、強調WTA的最終目標和本質,采用來襲目標對防御資產的殺傷概率建立模型,不需要進行目標威脅評估,通常以防御資產損失最小或幸存資產價值最大為優化目標,現有研究多數采用這類模型。文獻[10]建立了以防御資產損失最小為優化目標的WTA簡化模型,僅考慮同一武器能同時射擊一個目標的約束條件,這一模型相對簡單和基礎,許多WTA問題的模型都可以由這一模型推導出。文獻[11]建立了以幸存防御資產價值最大為優化目標的多階段DWTA模型,將武器同時射擊多目標能力、每一階段單一武器消耗量、武器總量、攔截適宜性判斷結果作為約束條件,文獻[13]使用了相同的模型,這一模型考慮的約束較為全面,更加貼近戰場實際,但模型較為復雜,計算時間成本較高。文獻[4]建立了基于資產的多目標靜態WTA模型,以最大化幸存資產價值、最小化武器消耗為優化目標,給出了各種武器消耗情況下的Pareto最優解,實際決策時決策者根據防御要求、防御成本選擇合適的武器目標分配方案。 2) 基于突防目標威脅最小的WTA模型 基于突防目標威脅最小的WTA模型屬于基于目標的模型,通常以最小化突防目標威脅值為優化目標,模型的構建依賴于目標威脅評估結果。文獻[1]建立了以各階段突防目標威脅均最小為優化目標的多階段動態WTA模型,這一模型考慮整個作戰過程,將DWTA問題看作若干SWTA問題的組合,但是這一模型在“射擊-觀察-射擊”的“觀察”階段只考慮了執行決策針對當前階段的作戰效果,沒有考慮執行決策對整個作戰全局的影響。文獻[14]建立了以突防目標威脅最小為優化目標的WTA模型,模型簡單、易于理解,但僅考慮了各武器數量約束,通常用作其他改進模型的初始模型,不難看出這一模型考慮的某一階段的分配問題,屬于靜態WTA模型。文獻[5]建立了與文獻[14]相似的模型,但文獻[5]將分配給各目標的最小武器數作為約束條件考慮在內,防止分配方案未對目標進行及時的攔截,并給出了這一非線性模型的線性簡化形式。文獻[16]在考慮攔截適宜性的基礎上求解“武器平臺-目標”分配問題,建立了動態WTA模型,文獻[15]將武器平臺和制導平臺進行攔截組合,在考慮實時目標威脅度、目標突防概率的基礎上構建了一體化的“武器平臺-制導平臺-目標”動態WTA模型,將制導平臺納入分配范圍更加切合實際,但問題求解會變得更加復雜。 3) 基于最大化目標毀傷的WTA模型 基于最大化目標毀傷和突防目標威脅最小的WTA模型均是針對目標而言的,但存在一定的區別: ① 突防目標威脅的WTA模型中目標權重側重于目標對防御資產的攻擊能力,模型考慮的是目標未被毀傷的概率。 ② 最大化目標毀傷的WTA模型中目標權重側重于目標在攻擊過程中發揮的作用,模型考慮的是殺傷目標概率 文獻[17]針對“武器-目標”分配問題,首先建立了以最大化目標毀傷為優化目標的分配模型,然后采用罰函數法將約束優化問題轉化為無約束優化問題,避免了求解過程中解的可行性判斷,但這一模型沒有考慮目標的攔截適宜性。文獻[18]考慮“發射節點-制導節點-目標”三者的優化匹配問題,根據求得的武器對目標的殺傷概率以及各目標的威脅度,建立了以敵方損失最大為優化目標的WTA模型,所建立的模型考慮了武器對目標進行攔截的時間、空間適宜性,并指出了各種隨機事件對目標分配的影響,但計算復雜度較高,對信息的實時、準確獲取要求較高。文獻[19]指出動態武器目標分配的依據主要是各火力單元情況、作戰意圖和任務、目標情況、地形等,在此基礎上建立了與文獻[17]似的模型,但是文獻[19]采用矩陣形式對模型進行表征。文獻[20]建立了以成功攔截所有來襲目標的概率最大化為優化目標的防空導彈目標分配模型,這一模型較簡單,沒有考慮不同目標的威脅程度不同,很可能為了最大化殺傷概率而沒有首先對威脅度較大的目標實施攔截。 4) 其他模型 WTA問題的常用模型如上文式(1)-(3)所述,除此之外,一些研究人員基于WTA問題的特點從其他角度建立了WTA模型:文獻[21]建立了以資源消耗最小、我方作戰資源損耗最小、敵方剩余價值最小為優化目標的打擊決策模型,將問題轉化為多目標決策問題;文獻[22-23]中區域防空協同中段制導算法的求解思路應用于WTA問題中,引入最早攔截幾何、安全裕度的概念,通過幾何分析給出了相應的計算公式,建立了以安全裕度最大為優化目標的目標分配模型。 精確算法是一種確定性的算法,具有精確、易懂的優點,求得的解具有可重復性。現有研究表明WTA問題具有如下性質:1) 屬于NP完全問題,利用枚舉法求解問題能力有限。2) 隨機性,武器、目標交戰屬于隨機事件。3)非線性,通常構建的目標函數均為非線性形式。 WTA問題的復雜性使得利用精確算法求解難度較大,一般對問題進行近似處理轉化為易于求解的形式,然后采用精確算法求得原問題的近似最優解,目前采用精確算法求解WTA問題的研究較少。文獻[5]首先以目標的總期望生存值最大為優化目標建立相應的模型,采用矩陣的形式表示模型,然后根據全單位模矩陣(TUM)的相關性質,指出分配模型的非線性整數規劃與相應線性整數規劃的關系,最后使用可行下降法求得問題的近似最優解,算法邏輯清晰、易懂,但采用的近似算法實際上是用函數的一階泰勒展開式進行近似計算,可能會使所求結果誤差較大。針對DWTA問題,文獻[6]采用基于分布式協同拍賣思想的算法進行求解,所設計的算法具有Anytime特性,考慮了資源約束、時間約束和空間約束,但文獻[7]指出這種精確算法同樣只能求解小規模的WTA問題,在求解大規模問題時性能較差。 隨機算法引入隨機變量進行求解,搜索具有不確定性,相比精確算法,所得結果可能不是最優的且不可復現,但隨機算法一般采用計算機計算,能夠處理大規模的分配問題,決策者只需給出合適的初始參數和優化參數便可以得到滿意解,求解速度較快,符合戰場決策的快速性要求。目前應用于WTA問題的隨機算法主要有: 1) 遺傳算法 遺傳算法是一類借鑒生物界的進化規律演化而來的隨機搜索算法,其主要特點是直接對結構對象進行操作,不存在求導數和函數連續性的限定,具有內在的隱并行性和更好的全局尋優能力[25]。關于遺傳算法的研究起步較早,相關研究也較為成熟,將遺傳算法與相關優化操作結合解決WTA問題能夠得到較為滿意的分配方案。文獻[26]將非線性整數約束的WTA問題轉化為線性整數問題,提出采用以啟發式算法進行初始種群優生的遺傳算法對問題進行求解,這種啟發式遺傳算法相較一般遺傳算法在處理大規模問題時優勢明顯,但是這一算法并未考慮對目標毀傷、新目標出現等隨機事件的處理且沒有將武器攔截目標的時間、空間適宜性考慮在內。文獻[15]考慮了攔截適宜性的影響,針對傳統遺傳無法兼顧收斂精度和求解速度、實時性差的問題,提出了一種新型混合緊致遺傳算法(HCGA)對WTA問題進行求解,在保留CGA算法基本特性的基礎上,進一步改善了算法性能。文獻[17]同時考慮了攔截適宜性判斷和對隨機事件的處理,采用基于遺傳算法的Anytime算法求解WTA問題,anytime算法所產生的解的質量隨計算時間增加而增加,在任意時刻中斷時,都能輸出到目前為止找到的最優可行解[1],這一算法考慮較充分、所求結果的戰場參考價值較大,但對敵我信息獲取的實時性、精確性要求較高。 2) 蜂群算法 人工蜂群算法具有優化性能好、控制參數少、實現簡單的優點[25]。文獻[27]采用人工蜂群算法求解WTA問題,通過比較蜂群算法與幾種元啟發式算法解決給定實例的性能,驗證了人工蜂群算法解決WTA問題的有效性和高效性。文獻[2]采用改進的人工蜂群算法求解WTA問題,提出以排序選擇和精英引導策略提高算法的搜索效率,針對隨機生成的初始解質量較低的問題,采用基于規則的啟發式方法進行種群初始化,這一改進的人工蜂群算法相較一般蜂群算法較為復雜、但求解問題性能得到了較大改善。 3) 文化基因算法 文化基因(Memetic)算法是一種基于種群的全局搜索和基于個體的局部啟發式搜索的結合體,能夠用于求解多種問題的滿意解,特別是在求解多極值問題中效果很好,該算法實質上是一種框架,采用不同的全局算法和局部算法構成不同的文化基因算法[25]。文獻[12]首先引入決策的虛擬表示以促進可行決策的生成,在此基礎上給出了將虛擬表示轉化為實際決策的構造方法,最后給出了基于貪婪局部搜索和最陡峭局部搜索的2種文化基因算法,通過比較指出基于貪婪局部搜索的文化基因算法能夠產生更好的DWTA決策,但文獻中并未給出對可能出現的隨機事件的處理方法。文獻[29]提出了一種融合自適應遺傳算法(AGA)和變鄰域搜索算法(VNSA)的文化基因算法,算法克服了現有大部分啟發式算法過早收斂的缺點,能夠得到較好的分配方案,但在處理大規模WTA場景時,所采用的鄰域構造方法使得求解較為復雜、效率較低。 4) 其他算法 除了以上幾種常用的求解算法外,文獻[11]采用禁忌搜索算法(TS)求解基于資產的DWTA問題,算法采用貪婪構造啟發式方法進行初始化,提出了2種種群多樣化策略。文獻[23]將離散粒子群算法(DPSO)與進化博弈論(EGT)相結合用于處理DWTA問題,與傳統的基于多階段的WTA算法不同,提出的算法考慮的是連續的時間域。文獻[6]提出了一種基于差分進化算法的武器目標分配算法,將動態武器目標分配離散為靜態武器目標分配問題處理,采用隨機鄰域變異策略平衡差分進化算法全局探索和局部開發能力。文獻[30-31]采用博弈論的方法求解目標分配問題,建立了動態博弈的數學模型,這種求解方法在分配方案求解時將攻防雙方考慮在內,所得結果更加合理,但對信息的及時、準確獲取要求較高,求解較為復雜。 綜合考慮研究現狀及未來作戰需求,武器目標分配未來的發展方向為: 1) 考慮武器平臺制導能力限制。 現有研究大多針對的是“武器平臺-目標”分配問題,實際作戰中,武器平臺能否對目標進行打擊還受到制導能力的限制,超出武器平臺制導能力的分配方案是不可行的,在制訂分配方案時要將武器平臺的制導能力限制考慮在內。 2) 考慮目標機動對分配方案的影響。 在攔截適宜性判斷時,目前的研究假設目標的速度及方向恒定,實際作戰時,為了提高生存能力及突防能力,目標會采用佯攻、機動的進攻方式,考慮這種情況的WTA問題更加復雜但更貼合戰場實際。 3) 考慮軟殺傷武器的應用。 文獻[32-33]指出硬武器與軟武器相結合是對空防御常用的作戰方式,近年來箔條、電子對抗等軟殺傷武器發展迅速,具有經濟、快速等優點,現有研究考慮的都是對硬殺傷武器的分配,針對軟殺傷武器及軟硬殺傷武器組合的武器目標分配研究較少。在分配方案求解時考慮軟殺傷武器及軟硬武器的組合使用是提高作戰效能的重要途徑。 武器目標分配是戰場指揮決策需要解決的重要問題,在決策過程中要始終將戰場態勢的動態變化考慮在內,充分利用己方資源,達到滿意的作戰效果。3.2 DWTA問題模型
4 DWTA問題求解算法
4.1 精確算法
4.2 隨機算法
5 DWTA問題發展方向
6 結論