王明陽 劉旭旭 李裕霖 李溯琪* 王佰錄
①(西南電子技術研究所 成都 610036)
②(重慶大學微電子與通信工程學院 重慶 400044)
在諸多的軍事和民用領域都存在對手目標蓄意入侵我方重要區域從事惡意傷害活動的場景。典型例子包括計算機網絡黑客入侵[1]、銀行系統遭到惡意攻擊以及軍事戰場敵我對抗[2]等。針對此類場景,依據場景中部署的傳感器采集測量數據,評估和預測對手目標的一系列行動對我方資產造成的潛在傷害和損失[3,4]具有重要意義,評估資產的預期損傷,可有效地輔助我方下一步行動規劃,提升重要資產和要害部位的生存率[5,6]。針對傷害或影響評估問題,國內外學者已開展相關研究,在不同場景下構建了多個期望傷害模型,白俄羅斯Tuzlukov[7]提出了風險轉移模型,新西蘭Bolderheij等人[8]提出運營風險模型,以及瑞典Johansson[9]則提出生存價值模型。然而,一方面,這些模型主要是離線評估的方法,難以實現對手目標動態變化過程中期望傷害的動態評估和預測,因此不適用于瞬息萬變的博弈對抗場景。另外,還有一些學者,在軍事戰場場景下,針對優化我方資源配置問題,研究了武器庫與攻擊目標的最優匹配方法[9]。
近年來,英國利物浦大學Narykov等人[10]提出了對手風險(Adversarial Risk,AR)的概念,其定義是一組從事惡意傷害活動的對手目標對我方重要資產造成的期望傷害。相對于常見的傷害模型[8,11,12],Narykov提出的對手風險模型更加完備,主要考慮了殺傷力無限和殺傷力有限兩種情形。實際中,入侵的對手目標可造成的傷害具有不確定性。這種不確定性的一方面來源于成功打擊與否的隨機性,相應的打擊概率受到目標與資產的幾何位置關系、目標自身的殺傷范圍、殺傷力等因素影響。另一方面,入侵的對手目標從遠方來襲的過程中,目標數量、運動狀態(位置、速度、加速度等)時變未知[13],也是導致潛在傷害具有不確定性的重要原因。然而,對手風險模型僅建模了給定運動狀態的多目標對于某高價值資產造成的期望傷害。因此,要實現目標動態變化過程中潛在傷害的在線評估,一種可行的方法是借助多目標跟蹤器,先對多目標狀態后驗分布進行實時估計。
隨機集統計理論(Finite Set Statistics,FISST)[14]的研究始于1994年。與傳統向量統計理論不同,隨機集理論將量測強不確定性和目標維度未知時變特性建模在點過程理論框架下,為多目標跟蹤問題提供了統一最優貝葉斯濾波框架。隨機集形式的多目標后驗分布可同時描述目標數量、各目標狀態的隨機性以及目標間的統計相關性,特別適合于評估統計對手風險。借助隨機集多目標跟蹤器,迭代地計算每個時刻的多目標后驗分布,進一步結合對手風險模型,即可對統計對手風險進行在線評估。針對任意隨機集分布,文獻[10]推導了對手風險的最優均方誤差估計(及其方差)的表達式,但是涉及關于點過程強度函數和二階統計矩的積分,無法直接實現。因此,結合Poisson點過程,文獻[10]進一步給出了對手風險的最優均方誤差估計(及其方差)的計算公式,并基于概率假設密度 (Probability Hypotheses Density,PHD) 跟蹤器實現了對手風險的在線評估。
現有基于隨機集理論的多目標跟蹤算法主要分為兩類,一類是非標簽隨機集跟蹤器,包括伯努利(Bernoulli)跟蹤器[15]、PHD[16]/基數均衡化概率假設密度(Cardinality Balanced Probability Hypotheses Density,CPHD)跟蹤器[17]、多伯努利(Multi-Bernoulli,MB)跟蹤器[18,19]等;另一類是標簽隨機集跟蹤器,如廣義標簽多伯努利(Generalized Labeled Multi-Bernoulli,GLMB)跟蹤器[20-22],標簽多伯努利(LMB) 跟蹤器[23-30]等。與PHD濾波器相比,LMB跟蹤器的優勢體現在兩個方面:(1)LMB跟蹤器具備區別目標身份和建立目標航跡能力;(2)LMB跟蹤器跟蹤性能逼近最優貝葉斯跟蹤器的閉合解GLMB跟蹤器,尤其在低檢測概率和高雜波率場景下,性能遠優于PHD濾波器。
因此,本文在隨機集理論框架下基于LMB跟蹤器研究對手風險在線評估問題,主要貢獻如下:
(1) 基于對手風險加性模型和乘性模型,分別推導了LMB分布的統計對手風險最小均方誤差估計表達式。結合LMB跟蹤器,提出了一種基于LMB跟蹤器的統計對手風險在線評估方法。
(2) 對手風險最小均方誤差估計涉及非線性函數的積分,因此沒有閉合解。針對該問題,本文結合混合高斯近似和重要性抽樣近似方法,提出一種對手風險最小均方誤差估計的數值計算方法。
最后,模擬一組對手目標惡意入侵重要區域的場景,基于場景中監視雷達數據,驗證了提出的對手風險評估方法的性能優勢。
對手風險[10,12]是指一組從事惡意傷害活動的對手目標對我方重要資產造成的期望傷害。對手風險大小可以由目標打擊概率和目標殺傷力共同描述。以軍事敵我對抗為例,目標的殺傷力一般指入侵的對手目標對于我方武器裝備平臺、重要港口城市、油田等重要資產的破壞程度。目標打擊概率一般指對手目標成功打擊我方重要資產的概率。
2.1節與2.2節根據對手目標殺傷力差異,建模了多目標對手風險加性模型、乘性模型;2.3節基于對手目標打擊能力和打擊意圖,從兩個維度精細化建立目標打擊概率模型。
假設場景中存在n ∈N 個對手目標,其動力學狀態由序列x1:n ∈Xn表示。依據對手目標對于資產的殺傷力強弱,可將多目標打擊資產的方式劃分成兩類:(1)傷害疊加型;(2)一發擊穿型。相應地,本節構建了兩種類型的多目標對手風險模型。
假設一組對手目標x1:n對我方資產A進行打擊,其中,資產A的價值總值記為VA,目標xi對我方資產A的傷害值為dA(xi),i=1,2,...,n。若多對手目標x1:n對資產A造成的傷害即目標殺傷力較弱,不足以直接消滅我方資產,那么多個對手目標對資產造成的傷害可呈現疊加的形式,即資產受到總期望傷害為多目標期望傷害之和:
式(1)被稱為加性對手風險模型[31-33],用符號來表示,簡稱模型。
與2.1節類似,假設一組對手目標x1:n對我方資產進行打擊,其中,目標i對我方資產A的傷害值為dA(xi),i=1,2,...,n。若目標xi對資產A造成傷害為?dA(xi)≥VA,?i=1,2,...,n即目標打擊傷害能力較強,可以理解為對手目標能夠一發擊穿我方目標,則多目標中任意目標擊中資產均可視為成功打擊。相應地,多目標成功打擊資產的概率可表示為[34]
因此,資產受到的總期望傷害可由式(3)計算:
觀察式(1)和式(3),無論是加性模型還是乘性模型,成功打擊概率τA(xi)都是對手風險的核心參數。本文主要考慮對手目標的典型特征包括打擊能力和打擊意圖[35,36],其中將打擊能力建模為對手目標與我方資產的距離函數,而打擊意圖則與對手目標的打擊角度具有強相關性。具體而言,建立打擊概率的模型如下:
其中,cA(x):X→[0,1]表征對手目標打擊能力,主要由入侵的對手目標與資產的幾何位置關系決定,因此構建如下模型[37-39]:
其中,br表示對手目標潛在打擊范圍,r(x,xA):X×X→R+表示對手目標位置x與資產A位置xA之間的距離;iA:X→[0,1]表征目標的打擊意圖,主要由目標的速度方向決定,因此構建如下模型[40]:
其中,θ:X×X→[0,π]表示目標的打擊角度,即目標速度方向和目標與資產連線的夾角,如圖1所示,bθ為角度靈敏度參數。此外,建模目標打擊概率還可考慮目標的速度、高度等更多維度信息[41,42]。

圖1 對手目標打擊我方資產場景示意圖Fig.1 A schematic diagram of the scenario where the opponent’s targets attack own assets
基于LMB (Labeled Multi-Bernoulli)跟蹤器的對手風險動態評估是根據場景中多個對手目標的實時觀測數據,借助LMB跟蹤器,序貫地對場景中任意位置(尤其是重要資產位置)的對手風險進行在線評估。
3.1 節構建了隨機點過程下的統計對手風險模型,并基于最小均方誤差原則在線評估對手風險;3.2節基于多目標對手風險模型,依據隨機有限集(Random Finite Set,RFS) 多目標后驗分布特征,推導對手風險分布最小均方誤差估計的表達式,并提出基于重要性抽樣的數值計算方法。
在實際場景中,對手目標狀態動態變化,且目標個數時變未知,因此多入侵目標的對手風險存在強不確定性,難以直接計算。基于有限集統計理論,可把數量和動力學狀態未知時變的多目標建模為RFS(或隨機點過程)的形式,同時為多目標跟蹤問題提供了統一最優貝葉斯濾波框架。本節通過RFS建模多對手目標狀態,構建基于RFS的統計對手風險模型,然后在最小均方誤差準則下計算對手風險的最優估計。
首先,構造隨機點過程Φ的統計對手風險如下:
其中,°表示函數合成運算算子,X={x1,x2,...,xn}表示多目標狀態集合,n表示目標個數(隨機變量)。
從數學上講,統計對手風險RΦ(X)∈R 是隨機點過程Φ的隨機變量函數。若Φ的概率分布已知,則可利用概率論數學工具,分析RΦ(X)的統計特性。具體而言,RΦ(X)的一階統計矩可表示為
其中,vΦ(x) 表示隨機過程Φ的強度函數[14]。
其中,GΦ[·] 表示隨機過程Φ的概率生成泛函(Probability-Generating Functionals,p.g.fl.s)[14]。
在LMB跟蹤器框架下,每時刻多目標后驗分布是LMB分布的形式。結合加性模型和乘性模型,本節在式(9)和式(10)的基礎上進一步推導LMB分布下對手風險最小均方誤差估計的表達式。
3.2.1 加性模型
其中
將式(13)代入式(9)得
利用式(12),LMB分布的對手風險最小均方誤差估計可進一步化簡為式(11),定理得證。
3.2.2 乘性模型
定理2:給定k時刻LMB后驗分布π(·|Z)=其中r(?)和p(?)(·|Z)由式(A-11)和式(A-12)給出。基于對手風險模型(式(3)),k時刻對手風險最小均方誤差估計為
定理2證明:根據文獻[10],對手風險模型下,對于隨機過程Φ,其對應的對手風險最小均方誤差可表示為
由文獻[14]可知,k時刻LMB后驗分布的p.g.fl.s.可表示為
將式(17)代入式(16),可得
進一步地,將LMB跟蹤器后驗參數r(?)和p(?)(x)的表達式(式(A-11)、式(A-12))代入式(18),式(15)得證。
3.2.3 對手風險估計的數值計算方法
混合高斯近似方法是LMB濾波器最常見的實現方式[23]。本節基于混合高斯實現,進一步研究了對手風險估計的數值計算方法。假設LMB后驗分布中參數p(θ)(·)是混合高斯的形式,即
(1) 加性模型
回顧2.3節中打擊概率模型τA(x)(如式(4)所示),顯然cA(x)和iA(x)均為非線性函數,因此泛函F(θ)[dAτA]無解析解。為此,本文提出一種基于重要性抽樣的數值計算方法。具體計算方法如下:
對于任意高斯分量j=1,2,...,J,進行NP的抽樣,即
利用所獲得的NP個樣本近似計算F(θ)[dAτA],可得
最后,將式(22)代入式(11)可得
(2) 乘性模型
然后將式(25)代入式(15),可得
圖2給出了基于LMB跟蹤器的對手風險評估算法的整體流程。如圖2所示,提出的算法主要包含LMB跟蹤器模塊和對手風險評估模塊,其中LMB跟蹤器模塊主要包含航跡預測和航跡更新;對手風險評估模塊主要包含打擊概率計算和對手風險的最小均方誤差估計。

圖2 對手風險評估算法整體流程圖Fig.2 Overall flow chart of adversarial risk assessment algorithm
與基于PHD跟蹤器的對手風險評估算法[10]相比,尤其在強雜波探測環境/低檢測概率等復雜場景下,基于LMB跟蹤器的對手風險評估結果更加準確且魯棒性更強。
本節模擬敵方目標突防攻擊我方雷達陣地的場景,設計仿真實驗,對基于LMB跟蹤器的對手風險(AR)評估算法(簡稱LMB-AR算法)進行性能評估。算法性能評估以基于PHD跟蹤器的對手風險評估算法(簡稱PHD-AR算法)作為性能標桿。
考慮低空監視雷達工作場景,觀測總時間360 s。雷達坐標監視區域范圍[-35,35]×[0,100]×[0,7]km,數據周期T=1 s。場景包含5個運動目標,運動軌跡如圖3所示,各目標參數由表1給出。

表1 不同目標的出生時刻和死亡時刻Tab.1 The birth and death moments of different targets

圖3 雷達監視場景-3D視圖多目標真實運動軌跡Fig.3 Radar surveillance scene-3D view multi-target real movement trajectory
資產位置設置如下:資產S1位置(x1,y1,z1)=(-28050,0,0)m,資產S2位置(x2,y2,z2)=(9500,5500,45)m,資產S3位置 (x3,y3,z3)=(23900,3000,35)m。目標傷害值假設恒定,即dA=100,潛在打擊范圍br=15000 m,角度靈敏參數bθ=50°。
單目標狀態轉移模型假設為線性高斯模型,
其中,轉移矩陣F和過程噪聲強度協方差矩陣Q分別為
其中,
0n和 0m×n分別表示n×n維度和m×n維度的零矩陣;σν=5 m/s2表示過程噪聲標準差。
考慮雷達量測zk=[r φ φ]T,其中r,φ,φ分別表示目標位置的徑向距離、方位角、俯仰角,則單目標似然函數為非線性高斯模型:
其中,量測函數H(·)和量測噪聲協方差矩陣R分別為
這里σr=30 m,σφ=0.5°,σφ=0.5°分別表示斜距、方位角和俯仰角的標準差;arctan(·)表示反正切函數。目標繼續生存概率PS=0.98,每個目標的檢測概率為PD,雜波分布是參數為λc的泊松過程。
PHD和LMB濾波器均采用混合高斯(GM)實現方法。各算法GM實現的參數選擇如下:伯努利分量的截斷門限為γt=10-4;GM實現的高斯分量截斷門限與合并門限分別為γp=10-5和γm=4;高斯分量的最大個數限制為Nmax=10。對手風險評估的數值近似方法中,粒子數NP取10。
采用RMSE進行對手風險估計誤差評估,所有統計性能結果均是100次蒙特卡羅(Monte Carlo,MC)實驗的平均結果。真實對手風險計算方法為:將真實目標狀態分別代入式(1)和式(3)得到真實的對手風險R,利用評估算法計算第n次實驗的對手風險估計值則對手風險的RMSE計算如下
其中,N表示總實驗次數。

圖4 雜波率 λc=25,檢測概率 PD=0.8下,資產1的PHD-AR算法和LMB-AR算法的對手風險估計值隨時間變化的曲線Fig.4 Curves of the counterparty risk estimates of asset 1’s PHD-AR algorithm and LMB-AR algorithm changing over time under the clutter rate λc=25 and detection probabilityPD=0.8

圖5 LMB-AR算法的全場景對手風險估計熱力圖Fig.5 Heat map of full-scenario opponent risk estimation of LMB-AR algorithm
圖4(a),圖4(b)表明,加性模型下目標對手風險呈疊加型,乘性模型下目標的對手風險峰值與資產的價值相當,驗證了算法的有效性。且與PHD-AR評估算法相比,本文所提出的LMB-AR評估算法,更加接近真實的對手風險評估結果。PHD-AR評估算法結果與真實結果的偏差隨時間推移而增大。開始階段,目標距離資產較遠,對手風險小,差異不明顯。目標靠近時,對資產威脅增大,對手風險增加,差異變得顯著。而文本所提出的LMB-AR評估算法并未出現上述情況,在對手風險較大階段,LMBAR評估算法仍能得到較好的評估結果。此外,從圖4(a),圖4(b)中可以看出,在某些時刻,PHDAR算法輸出的對手風險評估結果急劇下降,評估結果出現跳變,該結果是由PHD跟蹤器漏跟造成的。另一方面,LMB-AR評估算法輸出結果在整個時間段內連續穩定且緊跟真實的對手風險評估結果。
圖5(a),圖5(b)表明LMB-AR算法在實時估計全場景的對手風險時同樣有效,可以實時反映戰場態勢,具有重要意義。
實驗1:相同雜波率,不同檢測概率下算法性能比對。

表2 雜波率 λc=25,不同檢測概率下,加性模型PHD-AR算法和LMB-AR算法資產1對手風險估值的平均RMSE比較Tab.2 Comparison of average RMSE of asset 1 counterparty risk valuation of additive model PHD-AR algorithm and LMBAR algorithm under fixed clutter rate λc=25 and different detection probabilities

表3 雜波率 λc=25,不同檢測概率下,乘性模型PHD-AR算法和LMB-AR算法資產1對手風險估值的平均RMSE比較Tab.3 Comparison of average RMSE of asset 1 counterparty risk valuation of multiplicative model PHD-AR algorithm and LMB-AR algorithm under fixed clutter rate λc=25 and different detection probabilities

圖6 固定雜波率 λc=25,不同檢測概率下,資產1的PHD-AR和LMB-AR的對手風險估計RMSE隨時間變化的曲線Fig.6 Curve of counterparty risk estimate RMSE of asset 1’s PHD-AR and LMB-AR changing over time under fixed clutter rate λc=25 and different detection probabilities
實驗2:相同檢測概率,不同雜波率下算法性能比對。

表4 檢測概率 PD=0.90,不同雜波率下,加性模型PHD-AR算法和LMB-AR算法資產1對手風險估值的平均RMSE比較Tab.4 Comparison of average RMSE of asset 1 counterparty risk valuation of additive model PHD-AR algorithm and LMB-AR algorithm under detection probabilityPD=0.90 and different clutter rates

表5 檢測概率 PD=0.90,不同雜波率下,乘性模型PHD-AR算法和LMB-AR算法資產1對手風險估值的平均RMSE比較Tab.5 Comparison of average RMSE of asset 1 counterparty risk valuation of multiplicative model PHD-AR algorithm and LMB-AR algorithm under detection probability PD=0.90 and different clutter rates

圖7 檢測概率 PD=0.90,不同雜波率下,資產1的PHD-AR和LMB-AR的對手風險估計RMSE隨時間變化的曲線Fig.7 Curve of the counterparty risk estimate RMSE of asset 1’s PHD-AR and LMB-AR changing over time under detection probability PD=0.90 and different clutter rates
結果分析:LMB-AR算法相較于PHD-AR算法無論是單次實驗結果或是平均RMSE結果均有較大的性能提升。該得益主要源于兩個方面:
(1) LMB分布的自由度更高,統計風險模型更準確。PHD-AR算法中,多目標狀態的統計特性是由Poisson過程描述的,假設目標數目服從Poisson分布且多目標獨立同分布,假設較局限。而LMB-AR算法中,多目標狀態后驗服從LMB分布,目標數量分布的自由度更高,且放松了多目標獨立分布的假設。
(2) LMB濾波器性能更優。相比于PHD濾波器,多目標狀態估計更加準確,因此相應地,統計對手風險作為多目標狀態的隨機變量函數,其統計矩(最小均方誤差估計)更加準確。
在諸多軍事和民用領域都涉及對手目標試圖入侵我方重要區域從事惡意傷害活動的場景,而評估入侵目標對我方重要資產的期望傷害具有重要的實際意義。本文在隨機集理論框架下基于標簽多伯努利(LMB)跟蹤器研究對手風險在線評估方法。首先,在LMB跟蹤器的框架下,基于加性傷害模型和乘性傷害模型,分別推導了統計對手風險最小均方誤差(Minimum Mean Squared Error,MMSE)估計的表達式。其次,針對所涉及的非線性函數積分問題,結合混合高斯近似和抽樣近似方法,提出統計對手風險最小均方誤差估計的數值計算方法;最后,將統計對手風險評估方法與LMB跟蹤器的迭代過程有機結合,可實現入侵多目標對我方重要資產期望損失的動態在線評估。模擬多個具有殺傷能力的目標攻擊雷達陣地的場景,利用雷達獲取的實時點跡量測數據,驗證了提出算法的有效性和性能優勢。
附錄 LMB跟蹤器
LMB跟蹤器是一種具有較高跟蹤質量的隨機集跟蹤器,其跟蹤性能逼近最優貝葉斯跟蹤器的閉合解GLMB跟蹤器,尤其在低檢測概率和高雜波率場景下,性能遠優于PHD跟蹤器等其他隨機集濾波器。
(1) 標簽隨機集和LMB分布
令 X 和 L分別表示目標狀態空間和(離散)標簽空間。X表示定義在增廣空間 X×L上的隨機有限集。令L:X×L→L 表示投影L((x,?))=?,則L(X)={L(x),x ∈X}表示多目標狀態X的標簽集合。若X與其標簽集合L(X) 具有相同的基數,即|L(X)|=|X|,則稱X為標簽隨機集。約束條件|L(X)|=|X|保證了標簽隨機集中各目標身份的唯一性。
LMB隨機集是一種典型的標簽隨機集,服從如下分布:
其中,
Δ(X)?δ|X|(|L(X)|)表示互異標簽指示器;為多目標指數符號;r(?)表示目標?的存在概率;p(·,?) 表示目標?存在條件下的概率密度;1Y(X)為指示函數,其定義如下:
則LMB分布可由LMB參數集合完全表征。
(2) LMB跟蹤器迭代遞歸方程
LMB跟蹤器在性能上逼近最優貝葉斯跟蹤器的閉合解GLMB跟蹤器,同時在計算復雜度上遠小于GLMB跟蹤器。LMB跟蹤器中,假設多目標后驗密度服從LMB分布,通過貝葉斯預測和貝葉斯更新兩個步驟,對每個時刻多目標后驗分布進行迭代計算。LMB跟蹤器的迭代遞歸方程具體描述如下:
(a) 預測方程:假定k-1時刻多目標后驗密度為LMB分布,其參數集為π=k時刻新生目標同樣服從LMB分布,其參數集為則k時刻多目標預測概率密度函數為
其中
這里L+L∪B;pS(·,?)表 示k時刻目標?的存活概率;f(x|·,?)表示目標?的狀態轉移函數。
(b) 更新方程:假定k時刻多目標預測密度函數為式(A-5)所示的LMB分布,傳感器接收到量測集合Z,則多目標后驗密度可近似為一階矩匹配的LMB分布,其參數化表征為? ∈L+},其中
其中,pD(x,?) 表示目標?的檢測概率;定義θ:L →{0:|Z|}{0,1,...,|Z|}為目標航跡-量測的關聯映射;ΘI+表示標簽集合I+與量測Z的關聯映射空間,包含所有關聯假設θ。
利益沖突所有作者均聲明不存在利益沖突
Conflict of InterestsThe authors declare that there is no conflict of interests