趙曉輝,姚佩陽,張 鵬
(1.空軍工程大學電訊工程學院,西安 710077;2.空軍工程大學工程學院,西安 710038)
戰(zhàn)場態(tài)勢估計是把來自多傳感器和信息源的數(shù)據(jù)和信息加以聯(lián)合、相關和組合,以獲得精確的位置估計和身份估計,以及對戰(zhàn)場情況和威脅及其重要程度進行實時的完整評價。由于戰(zhàn)場信息復雜多變,具有高度的不確定性、不完備性,因此態(tài)勢估計必須能對這種不確定性進行有效推理,并能對敵方下一步行動做出預測。
貝葉斯網(wǎng)絡(Bayesian Network,BN)是一種進行不確定性推理和數(shù)據(jù)分析的有效工具,在戰(zhàn)場態(tài)勢估計中已經(jīng)得到一定應用[1-2]。但是該方法未考慮連續(xù)時間因素,系統(tǒng)參數(shù)不能得到及時調整,有可能出現(xiàn)對未來態(tài)勢的錯誤預測。而動態(tài)貝葉斯網(wǎng)絡(Dynamic Bayesian Network,DBN)將BN擴展到對時間演化的過程進行表示,能夠根據(jù)多個時刻的觀測值對系統(tǒng)的各個時刻或某一時刻的狀態(tài)進行估計和預測。
本文將DBN應用于戰(zhàn)場態(tài)勢估計,構建了包含連續(xù)變量的模型,并提出以卡爾曼濾波圖模型法對連續(xù)隱狀態(tài)DBN進行推理預測,有效解決了DBN的推理問題。通過實驗仿真,證明了此方法的正確性。
所謂的BN是指基于概率分析、圖論的一種不確定性知識的表達和推理的模型。從直觀上講BN表現(xiàn)為一個賦值的復雜因果關系網(wǎng)絡圖,網(wǎng)絡中的每一個節(jié)點表示一個變量,即一個事件,各變量之間的弧表示事件發(fā)生的直接因果關系。一個BN可以看成一個二元組 B=〈G,P〉,其中:網(wǎng)絡結構 G,G=〈X,A〉是一個有向無環(huán)圖(DAG),其節(jié)點為隨機變量 X={X1,X2,…,Xn},n≥1,A是弧的集合。網(wǎng)絡參數(shù)P,P中的每一個元素代表節(jié)點Xi的條件概率密度,由概率的鏈規(guī)則得:

BN在態(tài)勢估計上的應用已經(jīng)有很多文獻進行了研究[4],下面以戰(zhàn)爭中一個簡單場景為例,對BN的結構建模、參數(shù)學習和概率推理分別進行介紹。
假設我方直升機超低空飛行突襲敵方重要設施,欲對突襲的成功率進行估計。軍事專家分析出影響成功率的態(tài)勢因素為敵方部隊組成、我方直升機情況、天氣狀況,詳細包括:
1)環(huán)境因素,天氣TQ(好、中、差);
2)敵方部隊因素,攻擊力GJ(強、弱)、偵察能力ZC(強、弱),電子干擾強度DG(強、弱),它們受敵方部隊組成DZ和天氣TQ影響;
3)我方部隊因素,駕駛員技術等級JS(特級、一級)、抗干擾設備等級KG(一級、二級),其中KG與DG決定雙方干擾的結果GR(干擾成功、干擾失敗)。
根據(jù)態(tài)勢因素之間的因果關系確定BN的結構[5],建立BN模型如圖1所示。圖1中圓形代表態(tài)勢因素節(jié)點,其中 CG 為目標節(jié)點,DZ、TQ、KG、JS為輸入節(jié)點,ZC、GJ、DG、GR 為過渡節(jié)點;有向線段代表節(jié)點間的因果關聯(lián)。

圖1 貝葉斯網(wǎng)絡模型Fig.1 Bayesian network model
確定各節(jié)點概率參數(shù),方法主要有領域專家經(jīng)驗法、歷史數(shù)據(jù)學習法,以及兩者相結合的知識和數(shù)據(jù)融合法。經(jīng)驗法是指依靠領域專家,對節(jié)點直接給出影響概率分布,這種方法簡單但是誤差較大。學習法指利用大量觀測數(shù)據(jù),對節(jié)點概率進行估計,該方法較復雜但是在數(shù)據(jù)量大的情況下準確性高。融合法是指先用經(jīng)驗法進行估計,然后再用學習法提高精確度,其中領域專家的置信權值設定是關鍵。
為戰(zhàn)場態(tài)勢估計建立BN的主要目的就是利用觀測數(shù)據(jù)對目標節(jié)點進行概率推理,將結果用于戰(zhàn)場輔助決策。BN推理算法可分為精確算法(包括全局聯(lián)合推理、圖規(guī)約法、團樹傳播法、組合優(yōu)化方法等)和近似算法(基于搜索的方法、仿真方法、變換方法、參數(shù)近似方法等)。使用BayesiaLab4.4工具自帶的SPI算法對圖1所示BN中成功率CG進行概率推理,推理結果:采用領域專家經(jīng)驗法自定義概率分布后進行的推理,得到CG=65.31%;在經(jīng)驗法基礎上采用歷史數(shù)據(jù)學習法對1000組數(shù)據(jù)學習后進行的推理,得到CG=78.33%;已知當前時刻所有輸入節(jié)點取值情況下進行概率推理[6],得到 CG=81.56%。
由于BN未考慮時間因素,無法對變量節(jié)點進行解釋,如圖1中TQ和DZ都是隨著時間而變化的節(jié)點。而戰(zhàn)場態(tài)勢估計中的數(shù)據(jù)往往是時間序列數(shù)據(jù),若能對其進行分析,不僅可以預測未來時間目標節(jié)點的概率取值,而且能對最大概率進行最優(yōu)求解。這對戰(zhàn)場態(tài)勢估計的應用是非常重要的。
在現(xiàn)代化戰(zhàn)爭中,戰(zhàn)場態(tài)勢瞬息萬變,隨著時間因素的引入,在不同時刻的狀態(tài)所形成的數(shù)據(jù),反映了所代表的變量的發(fā)展變化規(guī)律。要分析這種變化規(guī)律就必須建立相適應的動態(tài)模型。DBN將BN擴展到對時間演化的過程,反映變量的發(fā)展變化規(guī)律,可以用來解釋動態(tài)的數(shù)據(jù)并對未來態(tài)勢進行分析和預測。
為使DBN能夠對復雜系統(tǒng)進行研究并建立相應的模型,首先需要做一些假設,即引入Markov假設和轉移概率時不變假設。Markov假設是指每一時刻的狀態(tài)變量集合只與前一個時刻狀態(tài)變量的取值有關。轉移概率時不變假設是指在一個有限的時間內(nèi)條件概率變化過程對所有t是一致平穩(wěn)的,不隨時間的變化而變化。
DBN可定義為〈B0,B→〉,其中 B0表示最開始的BN,B→表示有兩個以上時間片段的BN組成的圖形。若用P(Xt|Xt-1)表示已知任一變量前一個時刻狀態(tài)時,當前狀態(tài)發(fā)生的概率表示第i個變量t時刻取值,Pa()表示其父節(jié)點;N表示變量數(shù)。DBN中任一節(jié)點的聯(lián)合分布概率為

圖1所示BN模型中,敵方部隊組成DZ和天氣TQ是不斷變化的,為了能表示出這種變化,并能對未來的場景進行預測,將BN沿時間軸變化構建DBN,圖2為DBN模型示意圖。

圖2 動態(tài)貝葉斯網(wǎng)絡模型Fig.2 Dynamic Bayesian network model
圖2分為左右兩部分。左半部為BN的結構,與圖1類似;右半部中,Y表示變化的觀測量,包括DZ和TQ兩個變量節(jié)點;Q表示受Y影響的隱變量,包括ZC、GJ、DG、GR 4個與Y相關的過渡變量;A為目標變量,即成功率CG。
DBN對應的場景與BN相同,態(tài)勢因素的確定方法也相同。但是DBN的結構需要表達出時間相關性,為了能夠利用數(shù)據(jù)D中的時間信息,通過借鑒戰(zhàn)爭領域豐富的模型知識,將BN與卡爾曼濾波圖模型(Kalman Filter Models,KFM)或隱馬爾可夫模型(Hidden Markov Models,HMM)相結合,沿時間軸變化來構建DBN。其難點在于如何確定觀測量Y與隱變量Q的相關性。
和BN相比,DBN的結構發(fā)生變換,其條件概率分布不可能像BN那樣直接獲得。首先要對數(shù)據(jù)D進行數(shù)據(jù)分析,得到BN的概率分布P,然后再根據(jù)D的時間序列獲取觀測量、隱變量相互關系,構建關系模型并學習得到影響參數(shù)r。最后將P與r代入DBN結構中,生成與時間t相關的條件概率分布函數(shù)。
利用DBN模型可以很好地表達隨時間變化成功率CG的變化情況,可以根據(jù)大量觀測數(shù)據(jù)推理變量可能取到的最大的值,對未來態(tài)勢進行推測。它不僅具有靜態(tài)BN的優(yōu)勢,如易于理解,建模快捷等,而且可以處理動態(tài)問題,大大擴展了使用范圍。
對DBN進行推理,最容易理解的方法是將DBN展開成為BN,然后從時間的起點開始逐個片段地推算。但是在時間長片段多的情況下,該網(wǎng)絡模型將會非常巨大,推算起來非常困難。文獻[8]提出了用HMM模型解決DBN推理,然而圖2中天氣因素TQ為連續(xù)型隨機變量,因此考慮用KFM進行推理。
對于隱變量連續(xù)的KFM,可以應用經(jīng)典的LDS濾波或光滑算法進行學習和推理。對于所有隨機變量的條件概率分布(Conditional Probability Distribution,CPD)都服從線性高斯分布的DBN,可以把它轉化成KFM,用前向返回算法(Front Back,F(xiàn)B)對某一節(jié)點進行推理。用(xt|t,Vt|t)來分別定義P(Xt|y1:t)的均值和協(xié)方差,則前向算法可表示為

隨后計算預計的誤差及預測協(xié)方差矩陣、增益矩陣:

利用得到的數(shù)據(jù)更新估計數(shù)值的期望與協(xié)方差矩陣:

在光滑的基礎上,較準確地估計出xt后,應用預測公式:xt+H|t=A(t,t+H)xt|t,可預測 xt+H的值,A(t,t+H)為t時刻到t+H時刻系統(tǒng)的轉移矩陣。
為了驗證圖2所示DBN模型的正確性與有效性,采用Matlab7.0及貝葉斯網(wǎng)絡工具BNT進行仿真驗證。首先應用mk_KFM()函數(shù)建立與DBN對應的KFM網(wǎng)絡,采用經(jīng)典的LDS推理方式利用BayesiaLab生成的1000組數(shù)據(jù)進行學習,將各節(jié)點概率分布引入,最后應用FB算法對CG從時間上進行推理,得到20組CG的預測概率取值。推理結果和實際數(shù)據(jù)的誤差比較見圖3,其中橫坐標為預測時間,縱坐標為平均相對誤差。

圖3 不同時間片斷的預測概率誤差Fig.3 Prediction probability errors of different time fragments
由圖3可知,在預測的初期誤差較小,而后期誤差逐漸增大,這是因為在預測時沒有對新樣本進行更新,得到的結果必然會隨時間推移而出現(xiàn)大的偏移。因此采用KFM算法對DBN模型的推理預測可用于短時推理,通過仿真實驗,說明了采用KFM算法的有效性,在DBN推理研究中具有很好的推廣性。
本文針對戰(zhàn)場態(tài)勢估計中大量數(shù)據(jù)隨時間變化的特點,通過構建動態(tài)貝葉斯網(wǎng)絡模型,解決了變量節(jié)點的表達問題,分析了概率參數(shù)與推理的過程,并利用卡爾曼濾波模型法對推理進行仿真實驗。仿真實驗結果表明了所建立模型的有效性。在實際應用中根據(jù)變量的特性以及實時性的要求,可采用更快速的Boyen-Koller算法或者HMM算法。對于戰(zhàn)場因素動態(tài)變化的問題,在研究軍事問題中會經(jīng)常遇到。動態(tài)貝葉斯網(wǎng)給出了建模和解決這類問題的數(shù)學方法,可以實時動態(tài)地處理影響分析和決策的種種因素,對指揮員的作戰(zhàn)決策具有極大的參考價值。
[1]冀俊忠,劉椿年.貝葉斯網(wǎng)模型的學習、推理和應用[J].計算機工程與應用,2003(5):24-27.
[2]王三民,王寶樹.貝葉斯網(wǎng)絡在戰(zhàn)術態(tài)勢評估中的應用[J].系統(tǒng)工程與電子技術,2004(11):84-87,143.
[3]張連文,郭海鵬.貝葉斯網(wǎng)引論[M].北京:科學出版社,2006:34-35.
[4]IVANSSON J.Situation assessment in a stochastic environment using Bayesian network[D].Sweden:Linkoping University,2002.
[5]蘇暢,宋亞兵,王力軍,等.考慮天氣因素的飛機作戰(zhàn)效能對數(shù)模型[J].電光與控制,2008,15(1):26-30.
[6]李偉生,王寶樹.用于態(tài)勢評估中因果推理的貝葉斯網(wǎng)絡[J].計算機科學,2002(11):50-52.
[7]PEARL J.Probabilistic reasoning in intelligent systems:networks of plausible inference[M].San Francisco:Morgan Kaufmann,1988.
[8]樊紅東,胡昌華,丁力.基于貝葉斯動態(tài)模型的某器件性能預測[J].電光與控制,2006,13(1):70-72.
[9]肖秦琨,高蒿.動態(tài)貝葉斯網(wǎng)絡推理學習理論及應用[M].北京:國防工業(yè)出版社,2007,28-31.
[10]肖秦琨,高曉光.動態(tài)貝葉斯網(wǎng)絡的無人機炮火校射[J]. 火力與指揮控制,2006,31(11):38-41.
[11]唐吉祥,沈云山.卡爾曼濾波器在炮位偵察雷達中的應用[J].電光與控制,2004,11(1):48-49.