姬正一,陳陽,沈培志,韓先平,齊鴻坤
(1.中國人民解放軍92941部隊,遼寧 葫蘆島 125000;2.中國人民解放軍92493部隊,遼寧 葫蘆島 125000;3.海軍航空大學,山東 煙臺 264001)
反艦導彈是打擊海上目標的主戰武器裝備,是決定海上作戰任務成敗的關鍵因素,科學評估反艦導彈武器系統的作戰效能,將對指揮決策起著至關重要的作用[1-2]。反艦導彈武器系統作戰效能評估經典方法(以下簡稱為經典方法)是采取結構化的方式構建模型,例如層次分析法、模糊綜合評價法、集對-指數分析法等[3],通過科學劃分能力層級、專家打分等方式建立一套完整的能力指標體系,能夠較為合理地評價反艦導彈武器系統作戰效能。
在實際應用中,經典方法同時存在一些弊端,在能力分層、權重設計與歸一化評分等方面都需要依靠主觀經驗確定,并且在處理實戰環境下的大數據、非結構化樣本時,計算復雜度和時間成本較高[4]。
伴隨大數據時代來臨,數據資源的獲取變得更加容易,基于先驗信息的機器學習方法在軍事領域的應用將成為一種趨勢[5]。本文以數據為驅動,通過效能評估指標體系構建特征工程,結合經典方法建立隨機森林和梯隊提升回歸樹2種決策樹集成的機器學習效能評估模型,并將2種方法分別與經典方法進行了對比,以檢驗決策樹集成方法在反艦導彈作戰效能評估中的應用效果。
隨著信息化技術快速發展,反艦導彈武器系統組成越發復雜,效能評估涉及諸多因素,尤其在實戰環境下,要將導彈系統自身戰技性能與復雜戰場環境等影響綜合考慮[6],對作戰效能評估方法提出了較高要求。為綜合評估武器系統效能,美國工業界武器系統效能咨詢委員會提出了ADC(availability dependability capacity)通用評估模型[7],它把系統效能指標表示為武器系統可用度、任務可信度和系統能力的函數,即系統效能E是有效度向量A、可信度矩陣D和能力矩陣C的乘積,表達式為
E=ADC.
(1)
ADC評估主要考慮的是武器系統自身性能要素的影響,而現代戰爭中任何裝備的使用都離不開作戰環境。實踐表明,反艦導彈武器系統信息化程度越高,作戰環境對其作戰效能的影響就會越大[8]。因此,要使評估更加具備現實意義,必須對實戰環境加以考慮,為衡量反艦導彈武器系統復雜戰場環境的適應能力,增加了戰場環境影響因子H,改進后的ADC模型[9]為
E=ADCH.
(2)
在充分考慮反艦導彈武器系統性、客觀性、獨立性、層次性以及一致性的基礎上,按照定性、定量相結合的原則分析構建反艦導彈武器系統作戰效能評價指標體系。
(1)反艦導彈武器系統有效度A由系統的維修率和故障率組成。
(2)可信度D由系統的飛行控制可靠性、發射可靠性和命中毀傷可靠性組成。
(3)作戰能力C:第1層指標由反艦導彈的突防能力、選擇捕捉能力、命中能力和毀傷能力組成;第2層指標中的捕捉能力由雷達覆蓋能力、雷達制導方式和雷達截獲能力組成,第2層指標中的突防能力由隱身性能和飛行性能組成,第2層指標中的命中能力由命中密集度和命中準確度組成,第2層指標中的毀傷能力由導彈戰斗部性能和引信性能組成。
(4)戰場環境適應能力H:第1層指標包括電磁環境和自然環境適應能力;第2層指標中的電磁環境適應能力包括抗敵電磁干擾、抗戰場自然電磁干擾和裝備系統間電磁兼容能力,第2層指標中的自然環境適應能力包括海洋水文環境(海浪、能見度)和海洋氣象環境(風、溫度、氣壓)。
該指標體系中故障率、維修率、發射可靠性、飛行控制可靠性等19個能力指標將作為后續2種決策樹集成模型的19個數據特征,改進ADC評估模型求出的反艦導彈作戰效能E將作為模型的數據標記值。評價指標體系如圖1所示。
1.2.1 有效度A
當武器系統在任意時間工作時,有效度A表示系統在開始執行任務時所處狀態的指標。由于反艦導彈武器系統由火控系統和導彈系統組成,單一系統的初始狀態一般情況下可分為正常工作和故障維修2種狀態,對于反艦導彈武器系統可以有4種狀態,其有效向量A為
A=(a1,a2,a3,a4),
(3)
式中:a1為導彈系統和火控系統均正常工作的概率;a2為導彈系統正常工作、火控系統故障的概率;a3為導彈系統故障、火控系統正常工作的概率;a4為導彈系統和火控系統均故障的概率。對于單一系統或平臺來說,處于正常工作狀態的概率為
(4)
式中:MTBF為平均故障間隔時間;MTTR為平均故障修復時間;λ為故障率;μ為修復率。
1.2.2 可信度矩陣D
可信度D是對系統在開始執行任務處于某一狀態而結束時處于另一狀態的系統狀態轉移性指標表述,反映了系統可靠性的好壞。按照評估指標體系,可信度取決于發射可靠性、飛行控制可靠性和命中毀傷可靠性3個指標,由于反艦導彈武器系統自身不可修復,若在開始執行任務時各系統發生故障,則整個任務過程中不會正常工作[10]。假設執行任務時反艦導彈武器系統的故障率服從指數定律,則發射系統可靠性Rm、飛行控制系統可靠性Rk、命中毀傷系統可靠性Rs分別為
(5)
式中:λm,λk,λs分別為發射系統、飛行控制系統和命中毀傷系統執行任務時故障率;Tm,Tk,Ts分別為發射系統、飛行控制系統和命中毀傷系統執行任務的持續時間。
考慮到飛行控制系統和命中毀傷系統均為彈上系統,為使可信度矩陣計算較為便捷,使彈上系統可靠性Rh表示為
Rh=RkRs.
(6)
由此可得可信度矩陣為

(7)
1.2.3 作戰能力矩陣C
表示系統完成規定任務能力的指標。在圖1中對反艦導彈作戰能力進行系統分析,劃出選捕、突防、命中、毀傷4個能力指標以及雷達覆蓋能力、制導體制等9個子能力指標,計算時先分別找出與9個子能力指標對應的裝備性能參數,然后采取指數分析法進行計算,反艦導彈武器系統作戰能力C可表示為

圖1 反艦導彈武器系統作戰效能評估指標體系Fig.1 Operational effectiveness evaluation index system of anti-ship missile weapon system
(8)
式中:C1,C2,C3,C4分別表示選捕、突防、命中和毀傷能力;DR為末制導雷達作用距離,反映子能力指標中的雷達覆蓋能力;AR為末制導雷達航向跟蹤范圍,S為末制導雷達距離跟蹤范圍,反映雷達截獲目標能力;ε為有無復合制導體制影響因子,反映雷達制導體制影響因素;I為RCS反射面積,反映導彈隱身能力;H為最大巡航高度;L為最大有效射程;M為巡航速度,反映導彈飛行性能;P為單發命中概率,反映導彈命中準確率;Q為自控終點散布誤差,反映導彈命中密集度;Y為引信靈敏度,反映引信性能;G為戰斗部質量,反映戰斗部性能;w1,w2,…,w11為指標權重。利用層次分析法(analytic hierarchy process,AHP)進行指標權重分配,然后采用集對分析法對指標體系進行處理,即通過構造理想矩陣的指標向量方式形成聯系矩陣,再與所得的權重系數進行線性疊加,即可求出能力矩陣C。
1.2.4 戰場環境適應能力矩陣H
考慮到戰場環境影響因素的復雜性、動態性,為了較為客觀反映反艦導彈的戰場環境適應能力,采取以下步驟計算:
(1)指標量化:由于抗敵電磁干擾、抗戰場自然電磁干擾、裝備系統間電磁兼容能力以及海洋水文環境和氣象環境適應能力5個子指標既有定量數據又有定性描述,故依據軍事用戶給出的性能參數一些常用范圍值,廣泛征詢專家意見,采取專家打分、歸一化處理的方法得出具體的量化值,且這些值范圍在0到1之間。
(2)確定權重系數:按照AHP法分別計算一級指標和二級指標對應的權重系數。首先采取1-9標度法構造判斷矩陣;其次通過一致性檢驗判斷矩陣是否協調一致避免相互矛盾;利用方根法求出判斷矩陣的特征值與特征向量,得出相應的權值[9]。
(3)用線性加權和法確定戰場環境適應因子H:
(9)
式中:μi,μij分別為一級指標和二級指標的權重系數;Fij為5個子指標的專家打分值;m為一級指標數量;ni為第i類一級指標中二級指標數量。
在分別得出有效度A、可信度D、作戰能力C和戰場環境適應能力H后,按照式(2)計算得到的系統綜合效能值作為決策樹集成模型數據樣本的標記值,每個標記值和相應的19個特征值構成了一條完整數據。
決策樹集成是機器學習領域有監督學習的一類重要算法,它以決策樹為基礎構建基本分類器,集成無數個基本分類器開展分類和預測任務[11]。本文用到的2種決策樹集成方法分別是隨機森林算法和梯隊提升回歸樹算法,隨機森林中決策樹為隨機構建,預測結果取決于投票眾數;梯度提升樹中決策樹為層層遞進,預測結果取決于最后一顆樹。
作為基本分類器,決策樹本身就是一種學習預測模型,從一層層if/else問題中進行學習并得到結論,根據信息增益或基尼系數的大小來決定先分類哪一個特征[12]。本文策略是從根節點到葉節點采用遞歸的方法,構建信息熵下降最快的樹,信息熵可以用來度量每一個節點上的信息量與不確定性,它的大小通常與事件發生的概率相反,公式為
(10)
式中:P(xi)為某事件發生的概率。針對多個變量時,常用聯合熵來表征一個節點上的信息量與不確定度,計算公式為
(11)
通常情況下,聯合熵會大于每一個單獨的信息熵,小于所有獨立的信息熵之和,并且聯合熵與某個變量的信息熵的差稱之為條件熵,公式為

(12)
信息熵的差值用信息增益(Gain)來表示,能夠影響決策樹的選擇,向下分裂時優先選擇信息增益大的,信息增益的計算公式為
Gain=Hb-Ha?t,
(13)
式中:Hb為分裂前信息熵;Ha為分裂后信息熵;?t為加權平均數。
決策樹算法運行效率高,對數據適應性強,不需要特征歸一化處理,但會出現過擬合,且泛化能力較弱,因此在實際應用中往往使用集成的方法有效解決上述問題。
隨機森林(random forest,RF)算法是多顆隨機決策樹的集合,利用每棵樹對特征和樣本采樣的差異性,有效降低過擬合,提升整體泛化能力[13]。該算法建立反艦導彈作戰效能評估模型的主要步驟如下(圖2):

圖2 隨機森林算法結構Fig.2 Algorithm structure of random forest
(1)運用連續變量離散化或缺失數據插值等處理手段,對反艦導彈數據集進行預處理,再將數據集分為訓練集和測試集。
(2)假設訓練集中包含有N個樣本(反艦導彈的N種狀態),T種分類屬性(每種狀態下的T個特征),采用Bootstrap抽樣方法得到新的樣本集。
(3)在設定的T種特征中,隨機抽取t(t≤T)種特征,使用某種決策樹最優特征標準,選擇最優分類節點。
(4)對步驟(3)重復進行K次,生成K棵決策樹。
(5)對這K棵決策樹的預測結果采取投票機制,根據投票結果決定最終的效能預測數據。投票機制的函數模型如下:
(14)
式中:hi(x)表示第i棵決策樹的預測值;Y表示目標變量(分類標簽或預測值);arg max表示找出能夠使函數取到最大值的自變量。
隨機森林將多個弱分類器組合使用,得到一個分類性能更好的強分類器,經過訓練后相比較于決策樹分類器模型泛化能力更強,故在反艦導彈作戰效能評估中首選了隨機森林算法模型。同時每棵決策樹是獨立同分布的,便于并行化處理數據,且不需要數據集標準化歸一化處理,效率較高[14]。
梯度提升回歸樹(gradient boosting regression tree,GBRT)是基于誤差函數的一種優化算法,通過集成弱分類器來生成一種強分類器。首次計算由基本模型完成,而下次計算是為了減小上次模型的殘差(residua),在殘差梯度(gradient)方向新建立一個新的模型,通過持續調整優化弱分類器權重,逐漸減小損失函數,到達閾值后形成一個強分類器[15]。該算法建立反艦導彈作戰效能評估模型的主要步驟如下(圖3):

圖3 梯度提升回歸樹算法結構Fig.3 Algorithm structure of gradient boosting regression tree
(1)假設損失函數為L(y,f(x)),每一棵回歸樹的葉節點數為J,其輸入空間分割為J個不相交區域R1m,R2m,…Rjm,對每一個區域估計一個常量值bjm。回歸樹用公式表示為
(15)
(16)
(17)
(3)對弱分類器進行迭代,迭代次數為m(m=1,2,…,M),樣本為i(i=1,2,…,T),計算第m輪第i個樣本值的殘差(即第m-1輪損失函數的負梯度),計算公式為
(18)
(4)使用(xi,rmj)來擬合一棵新的即第m棵樹gm(x),其對應的葉節點區域為Rjm,j=1,2,…,J,J為葉節點個數,并計算梯度下降的步長,計算公式為
(19)
(5)更新強分類器,每一輪損失函數的計算都是與yj比較,故需加上本輪的,計算公式為
(20)
(6)得到強分類器,并計算輸出數據,數據計算公式為
(21)
梯度提升決策樹能夠靈活處理各種類型的數據,包括連續和離散值,用較少的訓練時間能得到預測準確率較高的模型。但由于弱分類器之間存在依賴關系,難以并行開展訓練。
擬定反艦導彈武器系統的火控子系統平均故障間隔為1 500~2 100 h之間,平均修理時間為40~50 h之間,導彈子系統平均故障間隔時間為2 000~3 000 h之間,平均修理時間為80~100 h之間,執行任務時間為10~25 min之間,有復合末制導體制的反艦導彈ε=1,無復合末制導體制的ε=0.5~0.9。不同狀態的反艦導彈戰術技術性能指標如表1所示,戰場環境適應因子如表2所示。為提供足夠的訓練和測試數據,本文共收集了240種不同狀態的反艦導彈性能數據。

表1 反艦導彈武器系統戰術技術性能指標Table 1 Tactical and technical performance index of anti-ship missile weapon system

表2 反艦導彈武器系統戰場環境適應因子Table 2 Battlefield environment adaptive factors of anti-ship missile weapon system
對每一種狀態的反艦導彈分別求出有效度A、可信度D、作戰能力C和戰場環境適應能力H后,按照公式(2)計算得到的系統綜合效能值E。
不同狀態的反艦導彈有效度A分別為
A1=(0.952 26,0.021 76,0.025 39,0.000 5),A2=(0.941 24,0.028 23,0.029 63,0.000 8),…
A240=(0.942 1,0.021 19,0.035 88,0.000 8)
可信度D分別為

作戰能力C分別為
C1=2.236 38,C2=1.829 9,…
C240=0.955 45,
戰場環境適應能力H分別為
H1=0.832 679,H2=0.800 567,…
H240=0.820 023.
經計算得系統綜合效能值E分別為
E1=0.529 8,E2=0.789 9,…,E240=0.270 1。系統的綜合效能E將作為數據集的標簽值。
隨機森林評估模型選擇以信息熵作為分類標準,以R2分數作為評定標準,為獲取最優模型,需要調參選擇最優參數,用K折交叉驗證(K-fold cross validation)方法測試模型的泛化能力,用網格搜索(grid search)算法循環遍歷候選參數并以交叉驗證結果作為指標得到最優參數。樹最大深度和決策樹數量是隨機森林模型中較為重要的2個參數,通過搜索,決策樹數量為200,最大深度為40,2個參數的尋優平均分數熱圖如圖4所示。

圖4 RF模型決策樹個數和最大深度平均分數熱圖Fig.4 Number of decision trees and maximum depth average fractional heatmap of RF model
其他參數取值范圍由反艦導彈數據集樣本條件初定,采取隨機搜索尋找最優取值,隨機森林模型參數的范圍及優選取值如表3所示。

表3 隨機森林模型參數選擇Table 3 Parameter selection of RF model
仿真結果表明,與改進ADC評估模型求出的反艦導彈作戰效能E相比較,隨機森林算法在測試集中評估預測性能較好,輸入特征值后,模型的預測準確率為92%。兩者對比如圖5所示,其中紅線為改進ADC評估模型求出的反艦導彈作戰效能標簽值,綠線為隨機森林模型預測值。

圖5 隨機森林模型預測結果與反艦導彈作戰效能對比圖Fig.5 Comparison of prediction results of RF model and combat effectiveness of anti-ship missile
梯度提升回歸樹模型將Huber損失函數作為模型殘差處理方法以降低樣本殘差損失,同時為了評估模型優劣,用平均絕對百分誤差(MAPE)為評價指標,計算公式為
(22)
式中:ttrue,i為反艦導彈i狀態下的作戰效能標簽值;tpredict,i為梯度提升回歸模型預測值。
模型有2個關鍵參數:學習率和樹的深度。通常情況下,隨著樹的棵數和樹的深度的增加,模型能夠減小訓練誤差,但是如果兩者數太大,將會導致其泛化能力迅速減弱,模型也會出現過擬合現象導致預測性能降低。因此,通過優化模型的學習率和樹的深度將預測誤差降到最低。以MAPE為評價指標(數值越小表示預測準確率越好),學習率和樹的深度2個參數的尋優平均分數熱圖如圖6所示。

圖6 GBRT模型學習率和樹的最大深度平均分數熱圖Fig.6 Learning rate and maximum depth average fractional heatmap of GBRT model
通過隨機搜索尋找最優取值,隨機森林模型參數的范圍及優選取值如表4所示。

表4 梯度提升回歸樹模型參數選擇Table 4 Parameter selection of GBRT model
仿真結果表明,與改進ADC評估模型求出的反艦導彈作戰效能E相比較,在輸入特征值后,梯度提升回歸樹模型對測試集的預測準確率為97%。兩者對比如圖7所示,其中紅線為改進ADC評估模型求出的反艦導彈作戰效能標簽值,綠線為梯度提升回歸樹的模型預測值。

圖7 梯度提升回歸樹模型預測結果與 反艦導彈作戰效能對比圖Fig.7 Comparison of prediction results of GBRT model and combat effectiveness of anti-ship missile
本文針對實戰化條件下反艦導彈武器系統作戰效能評估特點,在作戰效能評估指標體系基礎上建立了隨機森林和梯度提升回歸樹2種決策樹集成模型。采用240組數據樣本對該模型進行了仿真測試,通過與改進ADC評估模型的對比分析,決策樹集成方法的評估預測準確率分別達到了92%和97%,證明了2種方法在反艦導彈作戰效能評估研究上的可行性,并且實施過程簡單高效,較大程度規避主觀經驗,容易推廣到其他武器系統效能評估中,具有一定的應用價值。