安 靖 司光亞 周 杰 韓 旭
1. 國防大學研究生院 北京 100091 2.國防大學聯合勤務學院 北京 100858 3.國防大學聯合作戰學院 北京 100091
隨著戰爭復雜性的不斷加劇,模擬仿真系統已被廣泛應用于作戰理論創新、作戰方案設計優化、作戰能力評估,以及各類演習演訓和裝備采辦活動中[1-2]. 作為初始化并驅動模擬仿真系統運行的基礎支撐,仿真想定的質量直接影響系統運行效率和仿真結果的真實可信[3]. 由于仿真系統存在仿真層級(平臺級、聚合級)、仿真模式(人在回路、人不在回路)、仿真模型等差異,對仿真想定的需求、可驅動運行的想定腳本的要求等并不完全一致. 因此,仿真想定的開發,普遍存在專業性強、定制要求高、遷移性差的問題. 針對這一系列問題,提出了一種基于知識圖譜的仿真想定智能生成方法. 該方法通過多源仿真模型的實體鏈接,構建支撐仿真想定生成的知識圖譜,提升仿真系統模型的重用性[4];研究適用于仿真模型匹配的實體對齊算法,提高數據匹配度[5]. 方法中待解決的核心關鍵技術包括:1)仿真想定的形式化描述. 與軍事想定不同,仿真想定用以驅動仿真系統運行,應表示為結構化、形式化的想定數據,并確保其能被仿真系統識別、理解和使用;2)知識圖譜的構建. 為支撐仿真想定的映射匹配,知識圖譜構建過程中,要按照仿真想定的要素需求,搭建知識圖譜框架,并有效鏈接主流仿真系統模型實體;3)實體對齊算法的選擇. 在不同的仿真推演系統中,相同實體可能對應不同仿真模型,或擁有不同模型屬性,需要選擇有效的實體對齊算法,提高仿真想定與知識圖譜的匹配速度和精度.
仿真想定是在軍事想定的基礎上,面向模擬仿真系統,根據仿真實驗的目的、邊界條件、實驗模式、仿真系統需求等,對初始戰場態勢,交戰各方作戰力量、武器裝備、作戰行動、交戰規則、仿真規則等進行的設定. 作為仿真實驗的基礎,仿真想定為仿真系統的初始化、驅動和運行提供所需的各類數據集合和腳本,包括仿真實體、任務模型、規則模型等結構化、形式化的仿真想定數據,記為多維歐氏空間(實體、任務、規則),形式化描述如下:
知識圖譜作為一種符號化的知識特征表達方式,能夠精準表示實體及特征之間的相關性[6]. 其構建流程是:在確定領域核心概念集的基礎上,通過本體的概念建模、關系建模、屬性建模,建立核心概念層次結構和關系,完成知識圖譜框架構建;基于該框架,對現有的主流仿真系統等模型庫進行實體鏈接,提升仿真模型重用性,完成知識特征的組合表達[7].
作戰領域的頂層概念較多,包括作戰力量、武器裝備、作戰行動、戰場環境等,需要根據知識圖譜的構建目標選擇領域核心概念集. 本文知識圖譜的構建目標是支撐仿真想定數據映射匹配,因此,選定的核心概念集為想定的實體(包括作戰力量和武器裝備)、任務、規則. 根據《軍語》《軍事百科》、作戰條令條例等,明確核心概念的準確定義,進行層次關系結構確定(部分層次結構關系描述如表1所示),并對本體的底層屬性進行定義,完成本體的概念建模、關系建模、屬性建模,構建知識圖譜的基本框架.
1)作戰力量本體知識結構
對于作戰力量,本體知識結構如圖1 所示,包括作戰力量、軍種、部隊類型、屬性4 層,本體間相互關系主要包括isA、hasEquipment、hasTask,含義如表1 所示.

表1 本體層次關系表(部分)Table 1 Ontology relationship table(partial)

圖1 作戰力量本體關系結構圖Fig.1 Ontology relationship structure of combat force
2)武器裝備本體知識結構
對于武器裝備,本體知識結構可以根據實際需要進行逐層分解. 例如,對于本文待驗證實例“立體投送”. 武器裝備本體知識結構可以分為5 層,本體間相互關系主要包括isA、isSynonyms、hasEquipment. 第1 層為武器裝備本體;第2 層包括作戰平臺、投送平臺、輔助平臺3 個本體(isA);第3 層有31 個本體,包括登陸艇、氣墊船、掃雷艦、半潛船、殲擊機、運輸機、直升機、雷達站等概念本體;第4 層具有2 030 個本體,包括具體型號的武器裝備平臺(is-Synonyms);第5 層屬性,即為上層本體的各類實際參數,取自飛行器、艦船等各類知識庫. 如,飛行器類包括最大飛行速度、最小飛行速度、飛行高度、最大載荷、武器掛載(hasEquipment)、載人數等多維性能指標.
3)作戰任務本體知識結構
對于作戰任務,本體知識結構分為任務、行動、行動屬性3 層,本體間相互關系主要包括hasPart、is-PartOF、isOperatedBy、hasTask、sameOperator. 第1層為任務,是具有明確作戰意圖的軍事行動,是由若干個行動組成(hasPart)的本體概念. 根據任務的粒度,可表示為組合模型(記為CM)或原子模型(記為MM),組合模型由原子模型組成(MM,isPartOF,CM).第2 層為行動,是任務實施過程中的步驟,不可再細分的本體概念,是原子模型. 第3 層為行動屬性,根據仿真想定的形式化描述,主要包括:行動執行實體(MM,isOperatedBy,OPA)、行動發起條件、起始時刻、起始位置、行動起始狀態、結束時刻、結束位置、行動結束狀態、行動區域、行動路線、行動目標、行動持續時間、預期效果等. 為了更加完善表現本體關系,可進一步基于推理對本體關系(如hasTask、sameOperator 等)進行補充完善,推理表如表2 所示.

表2 作戰任務本體知識關系推理表Table 2 Ontology knowledge relationship reasoning table of combat tasks
現有的實體鏈接方法主要分為3 類:局部特征鏈接方法,全局特征鏈接方法,混合特征鏈接方法. 本文采用全局特征鏈接方法,對主流仿真系統開放模型庫等多源仿真模型數據進行整合.
全局特征鏈接方法基于強化學習全局特征抽取網絡和用于相似性計算的神經網絡. 由于篇幅受限,此處不再描述兩個網絡的訓練過程,重點對網絡的框架及應用進行闡述. 實體鏈接的基本思路如下:
1)通過基于強化學習的全局特征抽取網絡框架,從待鏈接實體/指征項(entity/mention)的全局信息(記為S={x1,x2,…,xn})中抽取特征,框架描述如下:
狀態空間wi:由當前特征和已選擇的特征組成,對實體/指征項的第i 個特征xi進行選擇時,將狀態表示為一個連續的特征向量F(wi)={xi,wi-1,s}. 其中,xi表示當前特征的向量;wi-1表示所選特征集合的向量;s 表示待鏈接實體/指稱項的向量.
動作決策yi:yi∈{0,1},0 表示當前特征對實體鏈接的精度沒有提升,1 表示有提升. 通過策略函數πΘ(wi,yi)確定yi.
獎勵函數r:是當前所選特征是否能夠提高實體鏈接精度的評價,定義為r(wi|S)=Δs. 其中,Δs 表示實體關系混合特征與實體特征在分類器內特征權重的差值.
策略函數πΘ(wi,yi):
其中,F(wi)是特征向量,σ(·)是含有超參數Θ={W,b}的sigmoid 激活函數.
2)獲得待鏈接實體/指稱項特征之后,將它們與候選實體特征在隱藏層中進行級聯,輸入到雙層神經網絡,利用sigmoid 激活函數,獲取實體/指稱項m和候選實體特征e 之間的相似性得分sim(m,e).
該神經網絡的損失函數采用交叉熵誤差:
其中,s 是計算得到的相似度得分sim(m,e),t 表示實體是否為真.
3)通過加權計算得到各實體對<待鏈接實體/指稱項,候選實體>的排序得分. 計算公式為
其中,sim(m,e)表示相似度得分,p(e|m)表示先驗概率,α 和β 分別表示相似度和先驗概率的權重系數,α+β=1.
4)根據r(m,e)對每一個候選實體進行排序,完成實體/指稱項的鏈接.
考慮到名特征[8-10]和結構特征[11-12]能夠分別從語義和結構兩方面對實體進行刻畫,本文基于上章構建知識圖譜,采用兩種特征相結合的實體對齊方法[13],將仿真想定中的實體分別匹配為已鏈接在知識圖譜中的相似度最高的仿真模型.
兩實體e1G1和e2G2之間的距離記為D(e1,e2),計算公式:
其中,Ds(e1,e2)表示實體名特征向量;Dn(e1,e2)表示實體結構特征向量;α 是調整兩種特征權重的超參數. 顯然,該距離決定了兩個實體之間的匹配程度,值越小,則實體匹配度越高.
兩種特征向量的計算方法分別如下:
1)實體名特征向量Ds(e1,e2)
采用平均詞向量(averaged word embedding)表示[14-15].
詞向量集合記為Vi={viw1,viw2,…,viwn}. 其中,viwk={xik1,xik2,…,xikk}詞向量,表示詞映射到空間向量的維度. 構造向量矩陣式(5)計算向量均值.
將計算得到的知識圖譜實體e1G1的中心詞向量VVi和想定實體e2G2特征詞集合的每個詞向量vtj,代入下述公式計算余弦相似度:
2)實體結構特征Dn(e1,e2)
由圖卷積神經網絡(graph convolutional network,GCN)捕捉實體鄰接結構信息的生成[16].
將實體結構特征詞轉換為底層向量s={x1,x2,…,xn},隨后在編碼層使用Bi-LSTM 提取文本序列特征,輸入特征向量xt與上一時刻狀態ht-1共同生成狀態ht,形成GCN 的輸入h. 計算公式如下:
其中,i、f、o 分別為輸入門、輸出門和遺忘門;b 為偏置項;W 為參數矩陣.和分別為前向LSTM 和反向LSTM 輸出結果;⊕表示向量級聯,de為單向LTSM網絡維度.
基于圖結構GCN 編碼層利用Bi-LSTM 生成分詞特征向量,將每個節點的鄰域內的相關信息編碼為一個新的特征表示向量. hil-1表示輸入向量,hil表示在l 層節點i 輸出向量,圖卷積計算公式如下:
直接使用上式會出現節點級差過大現象,因此,通過對鄰接矩陣進行歸一化解決問題,改進式子為:
最后,利用LTSM 結構對編碼層基于圖結構的編碼輸出進行解碼,采用單向LSTM 將圖結構的特征表示轉換成序列結構的特征向量. 解碼過程如下:
解碼層輸入:從編碼層獲得實體結構特征分詞xi的上下文表示向量ht,前一神經元特征向量生成表示為Tt-1,前一神經元值c2t-1,解碼層前一隱層向量h2t-1,最終輸出向量Tt表示為:
其中,i、f、o 分別為輸入門、遺忘門、輸出門;b 是偏執項;W 為參數矩陣. Tt形成T,即實體結構特征向量Dn(e1,e2).
采用XML DOM 技術,生成仿真想定運行腳本.具體流程包括:
1)依據仿真推演平臺的想定標準模板構建XML 仿真腳本的對象節點.
3)重復1)、2)直至所有節點插入數據,生成能夠驅動推演的仿真想定運行腳本.
以某作戰樣式“立體投送”行動為背景,生成仿真想定,驗證能否驅動仿真系統按照預定行動時序運行(行動時序設計略).
1)對想定數據進行形式化描述,如表3 所示.

表3 仿真想定形式化描述Table 3 Formalization description of simulation scenarios
2)基于已構建的知識圖譜,采用名稱特征與結構特征相結合的實體對齊算法,對仿真想定進行實例化,映射為仿真系統可執行的仿真想定運行腳本.部分匹配結果如表4 所示.

表4 仿真想定實例化匹配結果Table 4 Matching results of examples of simulation scenarios
3)將生成的仿真想定腳本導入仿真系統,驅動“人不在環”的仿真推演,推演過程如表5 所示.

表5 仿真推演過程示例Table 5 Examples of simulation deduction process
通過仿真系統運行結果可以看出,本文所生成的仿真想定能夠按照預定的行動時序,驅動仿真系統推演.
本文設計并實現了一種基于知識圖譜的仿真想定智能化生成方法. 基于強化學習全局特征抽取網絡和用于相似性計算的神經網絡,實現了主流仿真系統現有模型的實體鏈接,構建了知識圖譜. 采用名稱特征和結構特征相結合的實體對齊算法,實現仿真想定實體的精確匹配,生成仿真想定. 采用該方法生成“立體投送”行動推演仿真想定,并驅動仿真系統運行. 實驗結果顯示,仿真推演過程與預定行動構想實際相符,方法有效.