霍士偉 田八林 郭圣明 唐宇波
(1.國防大學研究生院 北京 100091)(2.國防科技大學信息通信學院 西安 710106)(3.國防大學聯(lián)合作戰(zhàn)學院 北京 100091)
戰(zhàn)場態(tài)勢評估是作戰(zhàn)指揮活動的核心環(huán)節(jié),是有效實施作戰(zhàn)指揮決策的前提和依據(jù)[1]。隨著大量的預(yù)警探測設(shè)備、傳感器的廣泛應(yīng)用,獲取的大量戰(zhàn)場態(tài)勢數(shù)據(jù)已經(jīng)遠遠超出了指揮員的分析和處理能力。而信息化作戰(zhàn)的快節(jié)奏又對態(tài)勢評估的時效性和準確性提出了更高要求[2]。因此,必須要通過智能化的手段來輔助指揮員完成態(tài)勢評估。智能化戰(zhàn)場態(tài)勢評估是實現(xiàn)智能化作戰(zhàn)指揮的基礎(chǔ)和關(guān)鍵。智能態(tài)勢評估即可以有效提高指揮員評估態(tài)勢的速度,又可以彌補指揮員主觀判斷的局限,增強態(tài)勢評估的準確性[3]。
隨著機器學習的快速發(fā)展和在軍事領(lǐng)域的廣泛應(yīng)用,以及戰(zhàn)場數(shù)據(jù)獲取能力的提高,基于機器學習的數(shù)據(jù)驅(qū)動的戰(zhàn)場態(tài)勢評估成為目前研究的熱點。目前,基于機器學習的戰(zhàn)場態(tài)勢評估主要集中于常規(guī)機器學習算法在具體戰(zhàn)場態(tài)勢評估場景下的應(yīng)用研究,如利用神經(jīng)網(wǎng)絡(luò)、支持向量機、深度學習等機器學習方法用于目標威脅評估、目標意圖識別等具體應(yīng)用場景[4~7]。由于戰(zhàn)場環(huán)境和作戰(zhàn)領(lǐng)域的特殊性,在利用常規(guī)機器學習方法進行戰(zhàn)場態(tài)勢評估時還存在一些問題亟待解決。誤分代價不平衡問題是基于機器學習的戰(zhàn)場態(tài)勢評估中的一個關(guān)鍵問題。誤分代價不平衡問題是指不同類別的分類錯誤會造成不同的誤分類代價[8]。戰(zhàn)場態(tài)勢評估具有明顯的誤分代價不平衡特點,如果將我方劣勢的態(tài)勢誤分為我方優(yōu)勢的態(tài)勢,那么會由于后續(xù)采用的應(yīng)對措施不當而對作戰(zhàn)進程造成嚴重影響,甚至導(dǎo)致作戰(zhàn)失敗,這時的誤分代價是很高的。反之,如果是我方優(yōu)勢的態(tài)勢誤分為我方劣勢態(tài)勢,會因為采取了過高的應(yīng)用措施,而造成一定的作戰(zhàn)資源浪費,但一般不會對作戰(zhàn)進程造成嚴重影響。因此,將劣勢態(tài)勢誤分為優(yōu)勢態(tài)勢的代價要遠遠高于將優(yōu)勢態(tài)勢誤分為劣勢態(tài)勢的代價。但是,常規(guī)的機器學習分類方法以提高分類器總體分類準確率為目標,假定不同類別的誤分代價是相同的。當常規(guī)的機器學習方法應(yīng)用于具有誤分代價不平衡的戰(zhàn)場態(tài)勢評估問題中,很容易造成誤分代價高的樣本錯分,而對作戰(zhàn)進程造成嚴重影響。
針對代價誤分不平衡問題,研究者提出了代價敏感機器學習方法。代價敏感學習考慮不同類別樣本的誤分代價,重點關(guān)注錯分代價較高類別的樣本,以分類錯誤總代價最小為目標[9]。代價敏感學習方法主要包括代價敏感直接學習和代價敏感集成學習兩類[9]。代價敏感直接學習是對常規(guī)機器學習算法內(nèi)部進行改進,如對算法損失函數(shù)進行改進,引入誤分代價敏感因子,使常規(guī)算法具有代價敏感特性。代價敏感集成學習通過利用集成學習的方法對常規(guī)分類模型進行組合,在集成學習算法的樣本權(quán)重更新過程中引入誤分類代價,使常規(guī)分類模型具有代價敏感特性。代價敏感集成學習方法不需要對常規(guī)分類模型內(nèi)部進行改進,是一種簡單且適應(yīng)性強的代價敏感機器學習方法。針對戰(zhàn)場態(tài)勢評估過程中存在的誤分代價不平衡問題,本文以代價敏感集成學習方法為模型整體訓練框架,以適用于非線性建模的BP神經(jīng)網(wǎng)絡(luò)模型為基礎(chǔ)分類器,提出了基于代價敏感集成學習的戰(zhàn)場態(tài)勢評估模型,為解決誤分代價不平衡條件下的智能戰(zhàn)場態(tài)勢評估問題提供了思路。通過實驗,驗證了該模型在戰(zhàn)場態(tài)勢評估誤分代價不平衡條件下的可行性和有效性。
本文結(jié)合代價敏感集成學習和BP神經(jīng)網(wǎng)絡(luò)設(shè)計了戰(zhàn)場態(tài)勢評估模型,如圖1所示。由于戰(zhàn)場態(tài)勢評估各個因素之間相互影響,呈現(xiàn)出復(fù)雜的非線性關(guān)系,模型以具有良好非線性建模能力的BP神經(jīng)網(wǎng)絡(luò)作為基分類器。針對戰(zhàn)場態(tài)勢評估過程中誤分代價不平衡的問題,通過代價敏感集成學習方法對BP神經(jīng)網(wǎng)絡(luò)模型進行集成訓練,使模型具有代價敏感特性。
基于代價敏感集成學習的戰(zhàn)場態(tài)勢評估基本流程如下。
1)將戰(zhàn)場態(tài)勢樣本數(shù)據(jù)和誤分代價矩陣作為模型輸入,利用誤分代價矩陣計算初始樣本權(quán)重,得到帶權(quán)重訓練樣本集;
2)利用帶權(quán)重訓練樣本集對BP神經(jīng)網(wǎng)絡(luò)模型進行訓練,得到弱分類模型;
3)對弱分類模型進行測試,計算弱分類模型分類誤差,結(jié)合分類誤差和誤分代價矩陣,更新樣本權(quán)重,得到新的帶權(quán)重訓練集,利用新的訓練集對BP神經(jīng)網(wǎng)絡(luò)模型進行重新訓練;
4)重復(fù)上述訓練模型、模型測試、計算分類誤差、更新樣本權(quán)重的過程,直到得到滿足要求數(shù)量的弱分類模型;
5)根據(jù)分類器集成策略,將所有弱分類模型組合為強分類器。
在基于代價敏感集成學習的戰(zhàn)場態(tài)勢評估模型中,基分類器是模型的關(guān)鍵,其性能的好壞直接關(guān)系著整個模型的性能,本文選擇BP神經(jīng)網(wǎng)絡(luò)來構(gòu)造戰(zhàn)場態(tài)勢分類模型。
BP神經(jīng)網(wǎng)絡(luò)是一種單向傳播的多層前向神經(jīng)網(wǎng)絡(luò),包括輸入層、隱含層和輸出層三個層級。輸入層接收輸入特征向量,隱含層負責對輸入的特征向量進行非線性變換映射,輸出層輸出分類結(jié)果,其中隱含層根據(jù)需要可以有多層。BP神經(jīng)網(wǎng)絡(luò)是由多個簡單的神經(jīng)元組合而成的學習模型,BP神經(jīng)網(wǎng)絡(luò)通過模擬人腦的思維模式和組織形式建立,通過數(shù)據(jù)樣本訓練調(diào)節(jié)網(wǎng)絡(luò)結(jié)構(gòu)和節(jié)點之間的權(quán)重,實現(xiàn)對非線性關(guān)系的建模,具有很好的自學習能力。由于戰(zhàn)場態(tài)勢評估各個因素之間相互影響,呈現(xiàn)出復(fù)雜的非線性關(guān)系,而BP神經(jīng)網(wǎng)絡(luò)具有強大的非線性建模能力,因此選擇采用BP神經(jīng)網(wǎng)絡(luò)來建立戰(zhàn)場態(tài)勢評估分類模型。
本文采用經(jīng)典的三層前向BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。模型輸入為獲取的戰(zhàn)場態(tài)勢特征向量,如敵我兵力對比、敵我武器火力對比等。數(shù)據(jù)輸入層結(jié)點數(shù)為戰(zhàn)場態(tài)勢特征數(shù),本文所用的戰(zhàn)場態(tài)勢特征為7維向量,因此輸入層節(jié)點數(shù)為7。模型輸出為戰(zhàn)場態(tài)勢評估等級,本文中將戰(zhàn)場態(tài)勢評估等級設(shè)置為5個級別:絕對優(yōu)勢、優(yōu)勢、均勢、劣勢、絕對劣勢,因此網(wǎng)絡(luò)輸出層結(jié)點數(shù)為5。為了適應(yīng)神經(jīng)網(wǎng)絡(luò)的輸出特點,樣本輸出標簽采用one-hot編碼方式,例如將代表絕對優(yōu)勢評估等級的類別標簽1編碼為(10000),將代表優(yōu)勢評估等級的類別標簽2編碼為(01000)。隱含層結(jié)點數(shù)采用式經(jīng)驗式(1)確定。

圖1 基于代價敏感集成學習的戰(zhàn)場態(tài)勢評估模型框架

其中n為輸入層節(jié)點數(shù),m為輸出層節(jié)點數(shù),n1為隱含層節(jié)點數(shù),a∈[1,10]。通過訓練數(shù)據(jù)和驗證數(shù)據(jù)反復(fù)驗證,最終確定隱含層節(jié)點數(shù)為10。BP神經(jīng)網(wǎng)絡(luò)完整網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

圖2 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
本文采用的AdaCost代價敏感集成學習算法用于對BP神經(jīng)網(wǎng)絡(luò)進行集成訓練,使常規(guī)的BP神經(jīng)網(wǎng)絡(luò)模型具有代價敏感特性,從而適用戰(zhàn)場態(tài)勢評估中的誤分代價不平衡特點。
AdaCost代價敏感集成學習算法是從AdaBoost集成學習算法發(fā)展而來。AdaBoost算法是一種常用的Boosting模式的集成學習算法[10]。基本思想是為原始數(shù)據(jù)集中的每個樣本賦予一個初始權(quán)重,首先在原始數(shù)據(jù)集上訓練基分類器。然后根據(jù)基分類器的分類結(jié)果對樣本權(quán)重進行更新,使得錯誤分類樣本在后續(xù)的訓練時可以得到更多的關(guān)注。最后,組合多個分類器的分類結(jié)果就是所有弱分類器分類結(jié)果的投票組合。
常規(guī)的AdaBoost算法不具有代價敏感特性,研究者通過對AdaBoost算法進行改進,提出了具有代價敏感特性的 AdaCost算法[11]。AdaCost將樣本誤分代價引入到樣本權(quán)重更新公式中,使被錯誤分類且誤分代價高的樣本權(quán)重得到較快提升,從而在后續(xù)訓練中得到更多關(guān)注。AdaCost算法具體過程如下。
輸入:
數(shù)據(jù)集S={(x1,c1,y1),(x2,c2,y2),…,(xn,cn,yn)},其中xi為數(shù)據(jù)集輸入特征向量,yi為樣本標簽,ci為樣本誤分代價,迭代次數(shù)T;弱分類器。
輸出:組合分類器
算法步驟:
1)將數(shù)據(jù)集S中的樣本權(quán)值初始化為

2)對于t=1,2,…,T根據(jù)初始樣本權(quán)重在數(shù)據(jù)集S上訓練弱分類器ht(x),計算分類器ht(x)的錯誤率εt:

如εt>0.5,則開始下一輪循環(huán),否則按照以下方式計算更新樣本權(quán)重:

其中Zt是規(guī)范化因子,βi為代價調(diào)整函數(shù)

3)輸出組合分類器:

在上述AdaCost算法中,代價調(diào)整函數(shù)βi=β(sign(f(xi)hi(xi)),ci)中的 sign(f(xi)hi(xi))用于判斷弱分類器ht(x)對樣本xi的分類是否正確。當分類正確時代價調(diào)整函數(shù)為β+,分類錯誤時代價調(diào)整函數(shù)為β-。代價調(diào)整函數(shù)在不同的應(yīng)用場景下一般不同,通常根據(jù)經(jīng)驗或多次實驗來確定。本文采用文獻[12]給出的代價調(diào)整函數(shù)計算方式:
AdaCost算法主要用于二分類情形下。而本文中的戰(zhàn)場態(tài)勢評估是一種多分類情況,因此在應(yīng)用AdaCost算法對本文的BP神經(jīng)網(wǎng)絡(luò)戰(zhàn)場態(tài)勢評估模型進行集成時,需要對樣本權(quán)重更新方式進行調(diào)整。調(diào)整后的樣本權(quán)重更新方式如下。
1)如果弱分類器ht(x)對樣本xi分類正確,即h(xi)=yi,則按如下方式更新樣本權(quán)重:

2)如果弱分類器ht(x)對樣本xi分類錯誤,即h(xi)≠yi,則按如下方式更新樣本權(quán)重:

其中Zt、βi的計算方式仍然同原AdaCost算法一樣。
本節(jié)利用文獻[13]提供的戰(zhàn)場態(tài)勢評估數(shù)據(jù)對第2節(jié)中的評估模型進行實驗驗證。實驗硬件環(huán)境為Intel i3-4030U CPU,主頻1.9GHz,內(nèi)存4G,編程環(huán)境為Matlab2018a。
實驗數(shù)據(jù)共包括200條戰(zhàn)場態(tài)勢評估數(shù)據(jù),輸入變量包括敵我兵力數(shù)量對比、敵我防御能力對比、敵我攻擊能力對比等7維特征,戰(zhàn)場態(tài)勢評估等級為樣本標簽,戰(zhàn)場態(tài)勢評估等級包括絕對優(yōu)勢、優(yōu)勢、均勢、劣勢、絕對劣勢5個等級。為了適應(yīng)評估模型的要求,針對實驗數(shù)據(jù)中的5種戰(zhàn)場態(tài)勢等級(絕對優(yōu)勢、優(yōu)勢、均勢、劣勢、絕對劣勢),分別設(shè)置對應(yīng)的5類標簽值(1、2、3、4、5)。部分實驗數(shù)據(jù)如表1所示。在200個樣本中,隨機選取其中150個樣本作為訓練樣本,50個樣本作為測試樣本。

表1 部分實驗數(shù)據(jù)
為了對所提模型性能進行比較分析,設(shè)置以下條件下的對比實驗:1)單獨的BP基神經(jīng)網(wǎng)絡(luò)模型;2)利用本文提出的基于代價敏感集成學習的戰(zhàn)場態(tài)勢評估模型,其中分類器集成數(shù)量設(shè)置為10。
另外,通過設(shè)置不同誤分類代價矩陣,在不同實驗條件下比較模型的性能。在實際應(yīng)用中,誤分類代價矩陣一般根據(jù)經(jīng)驗由專家給出。在本實驗的戰(zhàn)場態(tài)勢評估場景下,誤分類代價矩陣設(shè)置應(yīng)該遵循以下原則:正確分類情況下代價為0;將劣勢等級戰(zhàn)場態(tài)勢誤分為優(yōu)勢等級的代價要高于將優(yōu)勢等級誤分為劣勢的代價,例如將類別1誤分為類別2的代價要高于將類別2誤分為類別1的代價。根據(jù)上述原則,實驗中設(shè)置以下兩種誤分代價矩陣,如表2、表3所示。

表2 誤分代價矩陣1

表3 誤分代價矩陣2
在不同的誤分類代價實驗條件下進行了實驗驗證,在模型性能比較時,除了考慮模型分類準確率外,還考慮了模型總誤分代價,實驗結(jié)果如表4所示。由表中結(jié)果可以看出,在三種條件下,本文結(jié)合BP神經(jīng)網(wǎng)絡(luò)和AdaCost代價敏感集成學習提出的戰(zhàn)場態(tài)勢評估模型,相對于單獨的BP神經(jīng)網(wǎng)絡(luò)模型來說,在評估準確率和誤分總代價方面都有一定的優(yōu)勢。實驗表明,通過代價敏感集成學習方法,可以提高常規(guī)機器學習模型的準確率,同時實現(xiàn)模型誤分代價最小化,從而更好地適應(yīng)戰(zhàn)場態(tài)勢評估誤分代價不平衡的特點。

表4 實驗結(jié)果
為解決誤分代價不平衡條件下基于機器學習的戰(zhàn)場態(tài)勢評估誤分代價較大的問題,結(jié)合代價敏感集成學習和BP神經(jīng)網(wǎng)絡(luò)模型提出了基于代價敏感集成學習的戰(zhàn)場態(tài)勢評估模型,設(shè)計了基于Ada-Cost的代價敏感集成學習算法。實驗表示,在誤分代價不平衡條件下,本文結(jié)合BP神經(jīng)網(wǎng)絡(luò)和Ada-Cost代價敏感集成學習算法提出的戰(zhàn)場態(tài)勢評估模型,相對于單獨的BP神經(jīng)網(wǎng)絡(luò)模型來說,在評估準確率和誤分總代價方面都有一定的優(yōu)勢。為誤分代價不平衡條件下的戰(zhàn)場態(tài)勢評估提供了新的解決思路。