(中國人民解放軍91550部隊 大連 116023)
近年來,人工智能技術迅速發展,不僅影響和改變著人們的生產生活方式,也催生了智能無人集群作戰、有人/無人協同作戰、認知網電戰、“算法戰爭”等新作戰樣式[1]。這些新作戰樣式對面向仿真推演的軍用仿真系統建設提出了新挑戰:作為一種典型復雜系統,仿真推演中存在大量關于直覺、經驗、想象、靈感等無法用形式化方法表示的特性,僅依賴傳統基于相似性原理及形式化知識的仿真建模方法,難以構建反映復雜系統特征的模型;同時態勢要素的多樣性、作戰對抗性、對手的隱蔽性和欺騙性等也會導致不確定性。因此,加強面向仿真推演的不確定性仿真建模研究具有重要意義和應用前景[2]。不確定性包含內部不確定性和外部不確定性,既包括系統內部知識與信息的不確定性建模推理;也包括對系統外部和對手(如多智能體系統,非完全信息博弈等)的不確定性建模推理[3]。
隨著人工智能2.0的提出與發展[4],認知智能在感知智能的基礎上獲得了快速進步[5],在此基礎上文獻[6]提出了認知仿真的概念和內涵,探討了經驗直覺捕捉對復雜系統建模的重要意義。人工智能技術的進步推動了認知不確定性仿真建模的發展,相對于傳統的仿真建模方法,認知不確定性仿真建模在建模原理、規則、工具、“生態”等方面發生了全面遷移和改變[7],如它研究多源異構數據的統一表示和直覺、經驗、想象、靈感等的形式化方法;它研究因果推理而不僅僅是相關性,增加大數據建模和深度學習的可解釋性[8];它研究知識圖譜和圖神經網絡等,增加了建模方法的語義表達[9];它研究集知識學習、數據驅動和經驗學習于一體的智能學習與仿真模型等。上述研究可能引起一個新理論框架替代舊理論框架,進一步完善理解世界的概念和互動方式,因此,我們基于研究成果和仿真推演需求,擬探討面向仿真推演的認知不確定性仿真建模范式,豐富基于機器學習的仿真建模新方法。
近來,AlphaGo及其演進型號AlphaGo Zero、AlphaGo Star等通過深度強化學習等人工智能技術實現自學習、捕捉經驗、發現創新等能力,揭示了一種不確定性仿真建模的可能。DeepMind還將深度強化學習用于刀塔、“星際爭霸II”等游戲的模擬對抗中,取得了超過人類高級玩家的水平[10]。不論AlphaGo、AlphaGo Star還是“深綠”,其邁向智能化的基礎都是知識,將人類的領域知識、隱性經驗和高質量數據應用于深度強化學習,能夠從稀疏的、有噪聲的和延遲的獎勵信號中去學習,并提高學習效率,降低學習難度,成為基于機器學習的不確定性仿真建模方法研究的熱點[11]。因此,需要以機器學習理論為基礎,構建認知不確定性仿真建模范式,研究面向仿真推演的自主智能化與認知不確定性建模仿真新方法,形成包括因果推理機器學習算法、不確定性認知、元數據結構等具有認知推理功能的仿真建模方法,提升復雜環境態勢認知的智能化水平。
本文針對態勢感知與理解中的不確定性復雜多樣、自主智能化不足的問題,提出構建面向仿真推演的認知不確定性仿真建模范式,對范式的含義進行了界定,梳理了范式的5個特征:遵循科學原理、態勢要素和知識的表示方式、不確定性認知模型、不確定性推理機制、范式的影響,歸納了構建范式的核心研究內容。該范式及其關鍵技術的深入研究能增強態勢智能認知的準確性和軍事指揮決策的精準性。
科學研究的范式是指在一段時間內為科學家集團所共同接受的科學信念,是一組假說、理論、準則和方法的總和,用于指導現實科學研究[12]。近年來,隨著大數據、人工智能、物聯網、5G等技術的快速發展,科學研究的“第四范式”被提出,即從以數學模型計算為中心的方式,轉變為對海量數據處理為中心的方式。這波人工智能技術興起的推動技術——深度學習,也是通過“數據+算法+算力”的組合實現了“大力出奇跡”[13]。它開辟了機器學習和智能科學研究的新途徑,通過大數據挖掘、基于多源數據認知分析,促進了認知科學、仿真建模等發展,擴展了智能化應用,徹底改變人們生活、生產及戰爭模式[14]。
所有這些也促進了軍事仿真建模的發展,為解決面向仿真推演的態勢智能認知中的不確定性仿真建模難題(如態勢要素多樣導致難以統一知識化;因果關系挖掘難;直覺、經驗等難以形式化等)提供了機會。因此,我們構建認知不確定性仿真建模范式,具體定義為:1)基于整體論和機器學習理論,通過統一的數據格式:元數據結構,綜合視覺、聽覺、文字等多種媒體的語義,構建融合賽博—物理—人類(cyber-physics-human,CPH)三元空間的統一態勢要素表示形式,捕獲人類經驗、直覺、想象、靈感等非形式化知識,與形式化知識一起,構建能夠反映復雜系統特征的認知模型;2)基于認知智能,幫助機器跨越模態理解數據,學習到最接近人腦認知的“一般表達”,主動了解事物發展的背后規律和因果關系,通過密集計算與密集數據的集成,實現復雜系統因果規律的發現,數據密集方法從整體上分階段發現涌現性、演化機制下的結果,計算密集方法在部分時段或部分區域(空間)上滿足相似性研究的需要;3)同時融合深度神經網絡的注意力、記憶、強化學習等認知機制,將人類先驗與知識巧妙引入數據驅動計算框架,模擬人的思維模式和常識認知,通過有機協調知識引導下的演繹、數據驅動中的歸納、經驗學習內的規劃等方法,最終實現面向軍事系統仿真推演的自主智能化與認知不確定性仿真建模。面向仿真推演的認知不確定性仿真建模范式示意如圖1所示。
認知不確定性仿真建模范式將對態勢認知理念和仿真建模研究方式產生革命性影響,引發仿真推演技術的變革,并逐步形成理論、方法、技術的完整研究體系,最終提升復雜環境態勢認知的準確性和軍事指揮決策的精準性,“加快軍事智能化發展,提高基于網絡信息體系的聯合作戰能力、全域作戰能力”。

圖1 面向仿真推演的認知不確定性仿真建模范式示意圖
面向仿真推演的認知不確定性仿真建模范式有以下特征。
認知不確定性仿真建模范式基于整體論和機器學習理論,一是仿真推演系統不可分解,其整體性質不具備局部可加性,必須進行整體性建模;二是大數據的統計學理論,態勢智能認知包括態勢感知、理解與預測、決策,貫穿著四個過程的核心技術便是大數據,而統計學則是理解、分析大數據的基礎;三是機器學習理論,無論是以計算機邏輯為基礎的搜索、比對、排序、溯源等算法,或是分析數據之間是否具有共性結構等的聚類、分類、回歸等算法,還是深度學習算法都是機器學習理論的重要組成部分;四是因果推理等理論,態勢認知的關鍵在于推理算法,仿真推演等“高風險”領域,往往需要知曉算法所給出結果的依據,因此因果推理依然很重要,還有對經驗、直覺、想象、靈感等的建模,需要經驗直覺和理性推理的融合建模理念;五是認知智能,它將從認知心理學、腦科學及人類社會歷史中汲取靈感,并結合擴領域知識圖譜、因果推理、持續學習等技術,建立穩定獲取和表達知識的有效機制,讓知識能夠被機器理解和運用,實現從感知智能到認知智能的關鍵突破。
面向仿真推演的認知不確定性仿真建模范式將數據驅動和知識引導相結合,將知識的向量表示與符號表示相結合,將推理模型與深度學習相結合,經過一段時期的發展與研究,將逐步形成理論、方法、技術的完整研究體系。
態勢主要由敵我等交戰方的使命任務及其約束條件、能力、意圖及作戰相關的環境等組成。隨著人工智能技術的迅速發展,催生了新的作戰樣式,作戰態勢的敵情、我情、戰場環境等要素變得更加復雜,態勢數據有結構化、半結構化、非結構化等形式,再加上經驗、直覺、想象、靈感等形式化比較困難的要素,導致不同模態的數據難以統一表示。
為了增強推理及捕捉經驗、直覺等能力,將數據驅動和知識引導相結合,通過統一的數據格式:元數據結構,構建融合賽博—物理—人類三元空間的統一態勢要素表示形式,捕獲人類經驗、直覺、想象、靈感等非形式化知識,與形式化知識一起,構建基于元數據結構的領域知識圖譜,實現指揮決策規則、非結構化數據、多模態知識等的聯合表示,并進行融合規則與圖神經網絡的知識圖譜推理。
隨著網絡空間(cyberspace)、物理世界、人類社會組成的人機物三元世界CPH的深度融合,三元世界CPH成為新型計算模型,任何物體之間的智能交互均成為計算形態,人和設備作為智能部件存在于萬物互聯的計算系統中。同時知識圖譜以結構化的形式描述客觀世界中概念、實體及其關系,將多元異構的信息表達成更接近人類認知世界形式,提供了一種更好的組織、管理和理解海量信息的能力[14]。
傳統的不確定性認知方法包括貝葉斯網絡、模糊認知圖、影響圖、D-S證據理論、動態因果圖等,而AlphaGo利用策略網絡模擬了人類在思維廣度上的直覺估計能力,找到了一種捕捉圍棋高手經驗,即“棋感直覺”的方法。認知不確定性仿真建模借鑒AlphaGo的思路,在深度學習中引入注意力機制和記憶結構,可有效利用當前數據以外的數據和知識,克服了僅依賴于輸入數據進行驅動學習的不足;序列學習機制和深度強化學習也能為戰場態勢認知模擬提供很好的思路。因此,基于多注意力卷積神經網絡、時序增強的知識記憶網絡和情節性元強化學習等模擬人的注意力、記憶、強化學習等機制,捕獲人類經驗、直覺、想象、靈感等非形式化知識,構建不確定性認知模型實現對具有多樣性、復雜性與不確定性的指揮員思維模式、常識、推理過程等的模擬。
態勢智能認知的高度復雜性和不確定性,需要多種方法混合使用,如AlphaGo就采用策略網絡、快速走子、估值網絡、蒙特卡洛樹搜索等技術,是蒙特卡洛樹搜索、深度學習、強化學習的融合。認知不確定性仿真建模還融合了知識圖譜和知識推理、因果推理等,需要“多管齊下”。
態勢認知的關鍵在于推理算法,傳統的推理方法依托知識庫和推理機進行符號規則推理,雖然研究了貝葉斯網絡、D-S證據推理和模糊推理等方法,但對不確定性的應對能力仍然不足。大數據技術的發展一度用相關性替代因果性,但軍事指揮與決策等“高風險”領域,要求數據驅動決策的推理機制應由數據相關性向因果關系轉變,讓機器同人一樣具備小樣本數據學習能力,因此,需要加強基于因果推理機器學習算法的不確定性仿真建模方法。
同時記憶、注意力、強化學習等驅動的推理機制能模擬人腦的認知機理,捕獲人類經驗、直覺、想象、靈感等非形式化知識,能夠實現對指揮員思維模式、常識、推理過程等的模擬,更好地邁向認知智能和類人常識的范式轉換。基于知識的推理機制中,知識的表示形式決定了推理機制,因此知識表示方法很重要。基于元數據結構的仿真建模技術在構建領域知識圖譜的基礎上,采用圖神經網絡進行知識推理,將知識的向量表示與符號表示相融合,進一步增強知識的推理能力。
為了應對仿真推演中的不確定性,認知不確定性仿真建模范式從以數學模型計算為中心轉變為以海量數據處理為中心,再轉變為數據驅動、知識引導、經驗學習等相結合,知識的向量表示與符號表示相融合的賽博—物理—人類三元空間計算模型,仿真建模范式發生從“量變”到“質變”的根本性轉變,對仿真建模方法、態勢認知、軍事指揮決策、指揮信息系統建設等產生深遠影響。
認知不確定性仿真建模范式將催生由結構相似性轉變為規律相似性、經驗直覺和理性推理相融合等仿真建模方法與理念,成為一種新的科研范式。同時會推動態勢智能認知技術的發展,仿真建模態勢的各種不確定性,形式化建模指揮員的經驗、直覺、想象、靈感等并經自動推理得出認知結果,破解復雜多變、信息多源戰場環境的信息過載問題,降低指揮員的認知負荷;同時突破指揮員主觀認知的局限,彌補不足,更正錯誤,以自主智能、人機融合的方式增強指揮員的認知能力,輔助指揮員獲得更快、更全、更準、更深的戰場態勢認知[5]。認知不確定性仿真建模范式指導下的指揮信息系統建設可以引入平行仿真的理念[16],將仿真推演系統嵌入進指揮信息系統,根據歷史、現實的真實數據,采用實時仿真推演得到“未來”的結果,幫助指揮員進行戰場態勢的提前預測和處理。
構建認知不確定性仿真建模范式,需要進行基于機器學習的不確定性仿真建模新方法研究,包括因果推理機器學習算法、不確定性認知、元數據結構等具有認知推理功能的仿真建模方法,具體相關技術如下。
因果推理是一種強有力的建模工具,可用于解釋性分析,其可能幫助機器學習尤其深度學習算法做出可解釋的預測。
因果推理機器學習算法主要研究包括:1)從觀察數據中發現事物間的因果結構和定量推斷,需要研究基于因果發掘的仿真建模方法,直接從態勢要素和數據中提取因果知識來幫助理解和預測;2)針對戰場態勢實時、動態變化的特點,研究基于立體動態不確定因果圖的仿真建模方法,在動態不確定因果圖(Dynamic Uncertain Causality Graph,DUCG)的基礎上擴展其時序因果表達和推理方法;3)針對小數據集條件下的不確定性仿真建模問題,研究基于記憶單元和深度生成模型的貝葉斯網絡,即深度學習貝葉斯網絡。
基于不確定性認知的仿真建模方法主要解決仿真推演中存在大量關于直覺、經驗、想象、靈感等無法用形式化方法表示的問題,借鑒機器學習理論中的注意力、記憶、強化學習等機制,針對將注意力機制和Long-Short Term Memory(LSTM)等序列性輸入網絡相結合的網絡模型訓練時間長、且無法對態勢要素進行平行化輸入等問題,提出一種基于多注意力卷積神經網絡的特定思維模式仿真建模方法;提出基于時序增強的知識記憶網絡的仿真建模方法,設計時序增強知識記憶網絡,同時利用經典戰例和指揮員經驗積累等構成的知識庫提高對態勢理解的準確性;提出基于情節性元強化學習的仿真建模方法,融合情節性深度強化學習和元強化學習,協同加快強化學習速度。
基于元數據結構的不確定性仿真建模方法主要通過建立元數據結構和元數據結構逐層實例化,實現形式化數據與經驗、直覺、想象、靈感等形式化比較困難要素的統一表示?;谠獢祿Y構,將半結構化數據、非結構化數據等加工轉化為有序、可用、標準的結構化知識,設計知識計算引擎,構建面向仿真推演的領域知識圖譜,從而具備知識深度計算能力和認知推理功能,加速態勢認知過程。仿真推演中的態勢認知需要嚴格按照一定的規則,即基于規則組成的知識庫,而領域知識圖譜可以從態勢要素中挖掘新知識,因此提出融合規則與圖神經網絡的知識圖譜推理方法。
本文在分析態勢感知與理解中的不確定性表現形式、自主智能化不足的基礎上,構建了認知不確定性仿真建模新范式,給出了認知不確定性仿真建模范式的定義,梳理了認知不確定性仿真建模范式的五個特征,歸納了構建范式需要進行的基于機器學習的不確定性仿真建模新方法的研究內容,包括因果推理機器學習算法、不確定性認知、元數據結構等具有認知推理功能的仿真建模方法。該范式能解決態勢智能認知模擬中的多模態知識聯合表示與推理、不確定性認知、因果推理等核心問題,提升復雜環境態勢感知與理解的準確性,為軍事指揮決策的精準性提供基礎性支撐。