李 京, 楊根源
(1.海軍航空工程學院,山東 煙臺 264001; 2.海軍信息化專家委員會,北京 100073)
目標選擇問題,是空襲作戰的關鍵問題,直接關系到戰役乃至戰略企圖的實現,而空襲作戰任務的完成,則是通過摧毀被空襲方以重點目標為關節點所構建的目標體系才被最終反映出來。選擇空襲目標的過程是一項復雜、動態、基于效果的系統控制工程。而現代戰爭中戰場目標多、類型復雜、重要程度不一,準確地選擇空襲目標,對指揮員進行敵情判斷、兵力部署、定下決心具有重要意義[1]。
本文提出了基于決策樹的空襲目標數據挖掘方法,即在建立空襲目標選擇指標體系的基礎上,利用決策樹方法對具體的目標數據進行挖掘,進而提取空襲目標選擇依據。
參考美軍目標選擇程序和方法的研究[2],空襲目標可分為:1)奪取制空權目標系統,主要包括防空雷達系統、空軍基地、地對空導彈陣地、防空指揮控制系統、高炮陣地、油料倉庫等目標;2)奪取制信息權目標系統,主要包括通信樞紐、通信站、指揮自動化系統、計算機網絡中心、電子干擾機及機場、雷達設備、航空航天偵察地面站等;3)戰略攻擊目標系統,由各級指揮機構、電信機構、情報收集機構、武器和燃料油生產基地、電力設施、港口、機場以及武器研究、生產、使用單位等目標組成;4)空中遮斷目標系統,主要包括陸路、海上、空中交通樞紐和驛站等,如公路、鐵路的橋梁、隧道,鐵路樞紐站、軍用和民用機場、運輸工具和修理廠、港口碼頭等;5)空中近距離支援目標系統,主要的攻擊目標是敵方的指揮機構和指揮系統、地面部隊和武器裝備、火炮陣地等。
在分析了目標的分類之后,準確評定各種不同類型目標的價值是進行目標選擇的基礎。通過參照目標選擇的相關原則,經過詳細分析,空襲目標價值的影響因素主要包括:目標固有價值、目標與作戰意圖及作戰任務的一致性、目標的威脅程度、目標的社會影響,以及目標的易修復性,其具體含義如表1所示。

表1 目標價值影響因素Table 1 Indexes affecting target value
Netica軟件工具由Norsys Software公司開發,是目前應用比較成熟的分析軟件,在醫療、故障診斷等民用領域有著廣泛的應用,其核心算法是基于貝葉斯置信網絡、決策網絡以及影響診斷。除了自身功能完備外,其最主要的特點就是提供API接口,利用編程工具,可以將其嵌入相關的軍事決策系統中,為軍事輔助決策提供強有力的支持。本文將利用它產生符合目標選擇原則的仿真數據。
Netica軟件具有根據所建立的模型,隨機產生案例這一功能,可以通過它獲得需要的樣本數據。
1)對數據進行概化處理,把數據概化到更高層次。針對數據本身的特點,將目標固有價值、威脅程度、社會影響概化為(高,中,低),任務一致性概化為(吻合,不吻合),目標易修復性概化為(容易,不容易,無法修復)。
2)通過對實際空襲案例進行分析,發現當某一目標被確定為打擊目標時,其自身固有價值、社會影響程度為高的概率比較大,而其威脅程度和易修復性偏低的概率比較大;而且一般情況下都是與整體作戰任務相一致。因此,利用Netica軟件構造出反映這一原則的貝葉斯網絡模型,如圖1所示。
圖1中攻擊目標為父節點,其他5個指標為子節點。以固有價值為例(如表2所示),其條件概率表顯示,當目標被選定時,其固有價值為“高”的概率為60.811%,為“中”的概率為 35.135%,為“低”的概率為 4.054%。
3)根據建立的貝葉斯網絡模型隨機產生60個案例樣本。這些案例樣本的特點是在總體上服從所構建的目標選擇原則,并存在一定的隨機性。60個案例樣本如表3所示。

圖1 基于Netica的目標選擇模型Fig.1 Target selection model based on Netica

表2 固有價值節點條件概率表Table 2 CPT of inherent value dot

表3 目標選擇訓練樣本集Table 3 Sample set for target selection training

續表
[7-8],本文采用ID3算法構造決策樹。
ID3[9]是Quinlan提出的一個著名決策樹生成方法,其流程如下:
1)決策樹中每一個非葉節點對應著一個非類別屬性,樹枝代表這個屬性的值,一個葉節點代表從樹根到葉節點之間的路徑對應的記錄所屬的類別屬性值;
2)每一個非葉節點都將與屬性中最大信息量的非類別屬性相關聯;
3)采用信息增益來選擇能夠最好地將樣本分類的屬性。
該算法使用信息增益來選擇能夠最好地將樣本分類的屬性,即選擇具有最高信息增益的屬性作為當前節點的測試屬性(即最好的分裂屬性)。信息增益的計算方法如下。
設S是s個數據樣本的集合,假定類標號屬性具有m個不同值,定義m個不同類Ci(i=1,2,…,m),設si是類Ci的樣本數,對一個給定的樣本分類所需的期望信息為

式中,pi為任意樣本屬于Ci的概率。
設屬性 A 具有 v個不同值{a1,a2,…,av},則可用屬性 A 將S 劃分為v個子集{S1,S2,…,Sv},其中,Sj包含S中所有在A上具有值為aj的樣本,若A選作測試屬性,則這些子集對應于由包含集合S的節點生長出來的分支。設sij是子集Sj中類Ci的樣本數,根據由A劃分成子集的熵(entropy)為


由此,在A上分支將獲得的信息增益為

考慮到獲得樣本數量的有限性,一般把采集到的樣本分成兩份,一份進行訓練,剩下的部分則用作測試。但是,在有些情況下用作訓練的樣本缺乏代表性。比如,某些特殊類的樣本可能不在訓練樣本中,這樣訓練出來的分類器很難準確運行。因此,本文利用10折交叉確認法[10](10-fold cross-validation)將 60 個樣本數據平均分成10個部分,每一份用作測試,剩余的進行樣本訓練,這個過程一共重復10次,最終每一部分樣本都有機會進行測試。
根據式(1)~式(4)的信息增益方法,在weka平臺上進行仿真,最終形成的決策樹如圖2所示。圖中,葉節點值為null的情況,說明在訓練樣本集中這種情況未出現過。
仿真結果正確的分類個數為54,正確率為90%;錯誤的分類個數為6,錯誤率為10%。詳細結果如混淆矩陣(Confusion Matrix)所示。


該矩陣說明當案例目標沒有被選為攻擊目標時,決策樹模型判斷正確的案例數為31個,錯誤的為3個;當目標被選為攻擊目標時,決策樹模型判斷正確的案例數為23個,錯誤的為3個。仿真結果表明,由表1樣本集訓練出來的決策樹模型的性能令人滿意。

圖2 對應樣本集的決策樹Fig.2 Decision tree corresponding to the sample set
生成決策樹后,從決策樹的根節點到任何一個葉節點之間所形成的一條路徑就構成一條分類規則,該規則可用IF-THEN形式表示,最后可獲得如下14條規則:
1)IF任務一致性=“吻合”AND固有價值=“低”THEN攻擊目標=“否”;
2)IF任務一致性=“吻合”AND固有價值=“中”AND威脅度=“高”THEN攻擊目標=“否”;
3)IF任務一致性=“吻合”AND固有價值=“中”AND威脅度=“中”THEN攻擊目標=“是”;
4)IF任務一致性=“吻合”AND固有價值=“中”AND威脅度=“低”THEN攻擊目標=“是”;
5)IF任務一致性=“吻合”AND固有價值=“高”AND威脅度=“低”THEN攻擊目標=“是”;
6)IF任務一致性=“吻合”AND固有價值=“高”AND威脅度=“中”THEN攻擊目標=“是”;
7)IF任務一致性=“吻合”AND固有價值=“高”AND威脅度=“高”AND社會影響=“高”THEN攻擊目標=“是”;
8)IF任務一致性=“吻合”AND固有價值=“高”AND威脅度=“高”AND社會影響=“低”THEN攻擊目標=“否”;
9)IF任務一致性=“不吻合”AND易修復性=“容易”THEN攻擊目標=“否”;
10)IF任務一致性=“不吻合”AND易修復性=“不容易”THEN攻擊目標=“否”;
11)IF任務一致性=“不吻合”AND易修復性=“無法”AND固有價值=“低”THEN攻擊目標=“否”;
12)IF任務一致性=“不吻合”AND易修復性=“無法”AND固有價值=“高”THEN攻擊目標=“是”;
13)IF任務一致性=“不吻合”AND易修復性=“無法”AND固有價值 =“中”AND威脅度 =“中”THEN攻擊目標=“否”;
14)IF任務一致性=“不吻合”AND易修復性=“無法”AND固有價值 =“中”AND威脅度 =“低”THEN攻擊目標=“是”。
對14條規則做進一步分析,得到以下結論。
1)對潛在的打擊目標最終能否成為空襲目標,首先要考慮該目標是否與當前我方的作戰目的一致。在科索沃戰爭中,北約根據“五環”目標理論,選擇能重創敵人戰斗力或戰爭潛力的目標,對塞族戰略目標進行打擊,最終取得了在巴爾干的勝利。
2)目標的固有價值是其能否成為空襲目標的重要指標,因此,要詳細地掌握空襲目標的結構和作用機理,準確判斷其在敵作戰體系中的地位。如海灣戰爭中,多國部隊就將伊拉克化學工廠、化學武器庫及核設施等對己方威脅最大,同時也是能力價值最大的目標作為首先突擊的目標。
3)針對空中打擊的特點,空襲目標的對空防御能力是航空兵及導彈部隊能否順利完成任務的一個重要制約因素。如果對方的防空能力過于強大,在某些情況下,盡管摧毀目標對作戰進程有很大的推動作用,但是,考慮到所付出的代價,有可能用其他手段達到目的。海灣戰爭中,美軍為避免戰損,在突擊防護嚴密的巴格達時,只允許F-117隱身戰斗機進行突擊,另外,所選目標從空中搜索識別的難度不能超過機載設備和人員的能力。
4)信息作戰已成為現代戰爭的主角,而信息戰所涉及的范圍非常廣泛,包含物理域、信息域、認知域和社會域。決策者在選擇空襲目標時,要充分考慮打擊所帶來的更為廣泛的影響。比如在第二次世界大戰中同盟國與軸心國之間的戰略轟炸,雙方都力圖通過大規模的轟炸摧毀對方抵抗的意志,縮短戰爭進程。但是,由于缺乏對雙方民眾的了解,轟炸雖然導致了大量的人員傷亡,但是雙方民眾的斗志并未瓦解,某種程度上反而更加堅定了戰斗的決心。
5)目標的易修復性有時容易被人忽略,但如果目標容易被修復,則空襲的代價與獲得的效果將不成比例。朝鮮戰爭美軍發動的“絞殺戰”中,1951年11月至12月對平壤以北三角鐵路的轟炸最為嚴重,但是志愿軍搶修鐵路的能力連美國空軍也無可奈何地表示嘆服。
6)規則12)~14)可以這樣解釋,當目標與當前階段作戰任務并不一致時,仍將其列為打擊目標,是因為從戰爭全局來看,打擊該目標對于贏得勝利,達到作戰目的有一定的幫助,盡管有可能目標并不符合局部某一階段的作戰目的。美軍對于未進入打擊目標清單的目標并不是立即將其刪除,而是將這類目標分別歸納為暫不打擊、限制打擊和非打擊目標清單等,保持對目標的持續監視,待到時機成熟將付諸行動[2]。
利用決策樹對空襲目標進行分析,有別于以往的目標選擇方法。它將空襲目標選擇看作是一種數據挖掘,并可以直接建立隱含的規則和知識。仿真結果顯示,該決策樹模型的分類合理、準確度高,可為我指揮人員提供一種輔助決策的新思路。
參考文獻
[1] 李偉,晉華,譚斌.模糊綜合評判的空襲目標選擇[J].武器裝備自動化,2008,27(9):25-28.
[2] 隋鑫,毛學良,趙春三.美軍目標選擇程序和方法的研究[J].科技創新導報,2009(18):239.
[3] 劉欣,羅小明.基于綜合集成賦權法的導彈攻擊目標價值分析[J].指揮控制與仿真,2008,30(2):35-38.
[4] 魯華,周德云.貝葉斯網絡的對地多目標攻擊決策[J].火力與指揮控制,2008,33(7):54-58.
[5] 劉學軍.典型目標的選擇和突擊武器的選用[J].飛航導彈,2000(12):32-37.
[6] 曹衛東,丁建立,劉玉潔.基于貝葉斯網絡的航班離港延誤預警分析[J].計算機應用研究,2008,25(11):3388-3390.
[7] 唐志武,薛青,劉朔.基于決策樹的裝甲兵登陸突擊仿真試驗數據挖掘[J].裝甲兵工程學院學報,2008,22(1):6-9.
[8] 胡濤.文本分類在軍事數據分發中的應用[D].重慶:重慶大學,2005:15.
[9] MITCHELL T M.Machine learning[M].NY:McGraw-Hill Science/Engineering/Math,1997:64-75.
[10] WITTEN I H,FRANK E.Data mining[M].San Francisco:Morgan Kaufman Publishers,2005:149-151.