霍士偉 郭圣明 唐宇波
(1.國防大學 北京 100091)(2.國防科技大學信息通信學院 西安 710106)
隨著人工智能技術的快速發展和在軍事領域的廣泛運用,作戰指揮方式由傳統的以指揮員決策向人機協同的智能作戰指揮方式轉變。其中,智能化戰場態勢評估是實現智能化作戰指揮的基礎和關鍵,是科學完成兵力優化、火力分配等指揮決策的前提[1]。
目前智能戰場態勢評估方法主要有基于知識推理的評估方法和基于機器學習的評估方法。其中基于知識推理的評估方法主要包括基于模板匹配的方法[2]、案例推理的方法[3]、D-S 證據理論方法[4]、模糊邏輯方法[5]等?;谥R推理的方法能夠較好地處理戰場態勢評估中信息的不確定性,但是普遍存在難以構建完備的知識庫問題,對具有高度非線性、涌現性的復雜戰場態勢難以有效評估,原因在于這類評估方法的知識表示大多是基于人的經驗,推理過程有太多主觀因素,無法從戰場全局實現戰場態勢的自主表示和推理[6]。以神經網絡[7]、支持向量機[8]為代表的機器學習評估方法能夠直接從大量戰場態勢數據中學習規律,實現對復雜戰場態勢的表示和認知,避免了構建知識庫的復雜過程,同時避免了人的主觀因素影響。目前,基于機器學習的智能戰場態勢評估成為當前作戰指揮決策領域的研究熱點,并取得了大量成果。但是,基于機器學習的評估方法需要大量標記樣本數據來進行模型訓練,而在戰場環境下,要獲得充足的滿足模型訓練要求的帶標簽樣本數據是比較困難的。相對而言,我們能夠獲得較多的無標記數據,但是為這些數據添加標簽則需要花費大量的人力和時間。在這種情況下,直接將傳統機器學習方法用于戰場態勢評估,會造成評估準確性不高。因此,研究如何利用無標簽樣本來輔助機器學習模型訓練對基于機器學習的戰場態勢評估具有重要意義。
半監督學習是一種可有效利用無標簽樣本來輔助機器學習模型訓練的方法,可有效提高標記樣本不足條件下模型的精度和泛化性能[9]。其中自訓練半監督學習是一種簡單且適應性強的半監督學習方法[10]。本文以自訓練半監督學習方法為模型整體訓練框架,以適用于小樣本條件下分類的支持向量機模型為基礎分類器,提出了基于自訓練半監督學習的戰場態勢評估模型,為解決標記樣本不足條件下的智能戰場態勢評估問題提供了思路。通過實驗,驗證了該模型在戰場態勢評估標記樣本不足條件下的可行性和有效性。
自訓練半監督學習是一種簡單且適應性強的半監督學習方法[10]。自訓練半監督學習方法首先利用現有的少量有標簽樣本進行監督式學習,然后將學習得到的分類模型對無標簽樣本進行分類預測,也就是為無標簽樣本添加偽標簽,然后根據一定的偽標簽選擇策略選擇偽標簽準確率較高的數據加入訓練集重新訓練分類模型。迭代上述過程,直到算法達到預定條件。自訓練方法實現簡單,適應性強,可廣泛用于各種領域標記樣本不足的分類和預測場景。
本文結合自訓練半監督學習和支持向量機分類模型設計了戰場態勢評估模型,如圖1所示。模型以小樣本條件下表現較好的支持向量機模型作為基分類器,以適用戰場態勢評估中的初始標記樣本較少的特點。針對戰場態勢評估過程中存在大量無標簽樣本和少量帶標簽樣本的情況,通過自訓練的半監督學習方法利用無標簽樣本來對支持向量機模型進行輔助訓練來提高模型的準確性和泛化性能。

圖1 基于自訓練半監督學習的戰場態勢評估思路
基于半監督學習的戰場態勢評估基本流程如下。
1)對原始戰場態勢數據進行預處理,區分為有標簽樣本和無標簽樣本;
2)利用數據集中的有標簽樣本作為訓練集對支持向量機模型進行訓練,得到初始評估模型;
3)利用訓練得到的初始評估模型對的無標簽樣本進行評估,評估結果作為樣本偽標簽,根據一定的偽標簽樣本選擇策略,從偽標簽樣本中選擇樣本標注準確率高的樣本加入訓練集,利用新訓練集對支持向量機模型進行重新訓練;
4)重復上述訓練模型、對無標簽樣本添加偽標簽、選擇偽標簽樣本重新訓練模型的過程,直到模型達到所需要求。
在基于半監督學習的戰場態勢評估模型中,基學習器性能的好壞直接關系著整個模型的性能。由于戰場態勢評估中初始帶標簽樣本數據較少,而支持向量機模型可以很好地適用小樣本數據集的分類問題,因此本文選擇支持向量機模型作為基分類器。
支持向量機是一種基于統計學習理論的機器學習方法,它基于結構風險最小化原則對數據進行分類,將原始數據通過核函數映射到高維空間中,然后采用線性超平面對數據進行分類,解決了低維數據空間中線性不可分的問題[11]。常用的核函數有常用的核函數主要有線性核函數、多項式核函數、高斯核函數、Sigmoid核函數。
SVM分類的建模和求解主要過程如下:對于樣本集 D={(x1,y1),(x2,y2),…,(xm,ym)},y∈{-1,1},對于線性可分問題,可以通過線性方程劃分超平面:wtx+b=0,樣本中任意點到超平面距離為


在應用支持向量機進行戰場態勢評估時,需要選取適當的核函數。核函數選擇一般通過實驗比較的方法選擇分類效果最好的核函數。本文通過實驗比較選擇線性核函數作為核函數。線性核函數是樣本特征在原始空間的內積,參數少,且執行速度快。
對于自訓練半監督學習來說,偽標記樣本選擇策略是模型性能好壞的關鍵。偽標記樣本選擇策略的目的是將無標簽樣本中被正確標記可能性較高的樣本選擇出來加入有標簽樣本中構成新的訓練集,這樣才能夠進一步提高模型的精度和泛化性能。如果將錯誤標記的偽標簽樣本加入新的訓練集,則可能造成模型性能的下降。本文采用基于馬氏距離的偽標記樣本選擇策略[12]。偽標記樣本選擇策略的主要過程如下。

結合上述基于支持向量機的戰場態勢分類模型和基于馬氏距離的偽標簽樣本選擇策略,本節設計了基于自訓練半監督學習的戰場態勢評估算法,算法步驟如下。

本節利用文獻[13]提供的戰場態勢評估數據對第3節中的評估模型進行實驗驗證。實驗硬件環境為Intel i3-4030U CPU,主頻1.9GHz,內存4G,編程環境為Matlab2018a,并包括支持向量機算法的libsvm工具包。
實驗數據共包括200條戰場態勢評估數據,輸入變量包括敵我兵力數量對比、敵我防御能力對比、敵我攻擊能力對比等7維特征,戰場態勢評估等級為樣本標簽,戰場態勢評估等級包括絕對優勢、優勢、均勢、劣勢、絕對劣勢5個等級。為了適應評估模型的要求,針對實驗數據中的5種戰場態勢等級(絕對優勢、優勢、均勢、劣勢、絕對劣勢),分別設置對應的5類標簽值(1、2、3、4、5)。部分實驗數據如表1所示。

表1 部分實驗數據
原始驗數據集為有標簽的樣本集,為了支持本文的半監督學習方法實驗驗證。從全部樣本中抽取x個樣本作為有標簽訓練樣本,抽取t個樣本作為測試樣本,抽取w個樣本為無標簽訓練樣本。為了對所提模型性能進行比較分析,設置以下條件下的對比實驗:1)單獨的支持向量機評估模型使用有標簽樣本進行訓練;2)利用本文提出的自訓練半監督學習的評估模型同時使用有標簽樣本和無標簽樣本進行訓練。另外,通過設置不同的實驗條件(實驗條件包括有標簽樣本數x、無標簽樣本數w和偽標簽樣本選擇閾值θ),在不同實驗條件下比較模型的性能。
針對不同實驗條件進行了實驗驗證,實驗結果如表2所示。由表中結果可以看出,在三種條件下,本文提出的基于半監督學習的戰場態勢評估模型同時利用有標簽和無標簽樣本進行訓練,相對于只采用有標簽樣本的支持向量機模型來說,在評估準確率方面都有一定的提高。實驗表明,在具有大量無標簽樣本和少量有標簽樣本條件下,通過自訓練無監督學習方法通過利用無標簽樣本進行輔助訓練,可以提高模型的準確率和泛化性能。

表2 實驗結果
在基于自訓練無監督學習的空中目標威脅評估算法中,樣本選擇閾值θ是一個重要參數。為了探討其取值規律,本節進一步通過實驗對其進行分析。在x=40,t=48,w=88固定不變條件下,對θ分別取1~30進行對比實驗,結果如表3所示。由表中結果可以看出,當θ取值為17~22時,模型評估準確率最高,為79%;當取值過大或過小時,模型的準確率都會下降。其中原因在于,當樣本選擇閾值θ過大時,會將過多的判斷錯誤的偽標簽數據加入新的訓練集,而這些判斷錯誤的偽標簽樣本會造成模型準確率的下降。當樣本選擇閾值θ過小時,能夠加入新訓練集的偽標簽樣本數量較少,同樣無法有效提高模型的準確率。因此,在實際應用中,要通過反復實驗來確定合適的樣本選擇閾值取值范圍。

表3 樣本選擇閾值分析實驗結果
為解決標記樣本不足條件下基于機器學習的戰場態勢評估準確率和泛化性能低的問題,結合自訓練半監督學習和支持向量機模型提出了基于自訓練半監督學習的戰場態勢評估模型,設計了基于馬氏距離的偽標記樣本選擇策略。實驗表示,在標記樣本不足條件下,本文提出的模型同時利用有標簽和無標簽樣本進行訓練,相對于只采用有標簽樣本的支持向量機模1型來說,在評估準確率方面都有較大的提高。為標記樣本不足條件下的戰場態勢評估提供了新的解決思路。