陳錦陽,郝文寧,靳大尉,陳 剛,余曉晗
(1.陸軍工程大學,南京 210000;2.解放軍77606 部隊,拉薩 850000)
兵棋是運用規則、數據和程序描述實際或假定的態勢,對敵對雙方或多方的軍事行動進行模擬的統稱[1],是典型的非完全信息博弈。由于進入不通視地域、超出我方算子觀察能力、進入隱蔽地形等原因,陸戰場戰術級兵棋中部分存活的敵方算子處于不可觀察狀態。對抗態勢是指對抗各方通過實力對比、調配和行動等形成的狀態和趨勢[2]。本文研究的兵棋對抗態勢預測即基于已觀察狀態預測不可觀察狀態和趨勢,為下一步任務規劃、路徑規劃等環節縮小搜索空間,增加決策的預期收益。
兵棋對抗態勢預測中常需要考慮眾多分類特征,分類特征進行獨熱編碼后,特征向量稀疏高維,難以捕捉稀疏高維特征向量中具有預測價值的不同特征域間高階交叉作用。以往需要專家經驗人工設置有意義的特征交叉。近年來,出現了一系列自動學習捕捉特征交叉的模型,如FM[3]、Wide&Deep[4]、Deep & Cross[5]、DeepFM[6]、Autoint[7]等。Transformer 利用注意力機制在破解長距離依賴問題、發現重要特征方面取得了重大進展[8],有潛力發掘兵棋態勢特征。
本文主要研究相關特征交叉技術在兵棋對抗態勢預測中的應用,提出基于陸戰場戰術級兵棋注意力模型——LBTWAM(land battlefield tactical wargaming attention model)的兵棋不可觀察算子實時位置預測方法。以兵棋不可觀察算子實時位置預測這一子問題為例,探討注意力機制在兵棋對抗態勢預測中的應用。通過對輸出層和特征的調整,模型也能夠解決兵棋態勢預測中的其他問題。……