王成飛,董亞卓,蘇千葉,張祥林
(中國人民解放軍91977部隊,北京 100000)
作戰體系仿真技術是軍事仿真領域的重要研究方向之一,在作戰方案推演、作戰模擬訓練、武器裝備體系論證等多個軍事領域都有應用。美軍是作戰體系仿真技術的先驅者,建有一大批成熟的作戰體系仿真系統,如聯合作戰模擬系統(Joint Warfare System,JWARS/JAS)、戰區級聯合作戰模擬系統(Joint Theater Level Simulation,JTLS)、海軍仿真系統(Navy Simulation System,NSS)、聯合建模與仿真系統(Joint Modeling and Simulation System,JMASS)等,覆蓋戰區、軍種、作戰方向、海上編隊、單平臺等多個作戰域,涉及聯合戰場多層級指揮、復雜通信網絡、多域協同戰術戰法等諸多模型算法,架構十分復雜。作戰體系仿真技術主要包括離散事件仿真引擎、并行計算、多分辨率建模、組合化建模、戰場行為建模等。其中,自主的戰場對抗行為建模一直是體系仿真的研究熱點和焦點,吸引大量研究人員孜孜不倦的創新和探索。
近幾年,隨著人工智能技術突飛猛進的發展,采用機器學習技術開展戰場行為建模的方法成為前沿熱點,事實也證明,這是一條十分可行的途徑,例如,在美軍聯合作戰模擬系統(JWARS/JAS)中實現了利用深度強化學習來構建戰場智能體模型。國內組織了各類兵棋比賽,極大促進了智能行為建模的發展,但目前還處于探索階段,特別是在海上方向,缺少成熟的網絡模型、算法框架等。
本文從典型的戰場行為建模方法分析入手研究,對規則推理和機器學習兩種行為建模技術進行研究,并給出了相應的模型算法。
戰場行為決策建模主要指戰場上的決策單元能夠根據實時態勢自動生成動作指令,本質上是模擬了一個具備指揮功能的決策實體,類似于指揮官、艦長模型。……