徐瑞陽,馮新喜,孔云波,鹿傳國
(1.空軍工程大學信息與導航學院,陜西西安710077;2.95806部隊,北京100086)
目標跟蹤是傳感器系統的一項重要功能,當使用多只傳感器對目標進行跟蹤時,由于傳感器的能量有限,不能時刻使用所有的傳感器進行觀測和跟蹤,需要根據不同的情況調用傳感器資源,同時,傳感器與目標的分配管理也是一個至關重要的問題。
Nash M[1]提出使用線性規劃確定傳感器對目標的分配,使用卡爾曼濾波器中的誤差協方差矩陣的跡作為目標函數中的代價系數;Bier SG 和 Rothman P L[2,3]使用布爾矩陣定義了一種以傳感器能力和有效性為準的傳感器與目標配對方法。童俊和單甘霖[4]提出了一種基于目標跟蹤精度Cramér-Rao下限的多傳感器跟蹤資源協同分配方法。楊小軍和馬祥[5]提出了一種基于條件后驗克拉美—羅下界(CPCRLB)的傳感器網絡節點管理方法?;谀繕诵盘枏姸?RSS)推導了目標狀態估計均方誤差的CPCRLB。利用粒子濾波器逼近目標狀態并估計CPCRLB,實現傳感器節點在線選擇。
本文在上述研究工作的基礎上,首先推導了粒子濾波下無源傳感器后驗CPCRLB的計算公式,然后以目標跟蹤后驗CPCRLB的相反數作為選擇的適應值進行遺傳迭代,同時計算目標的區分度增量,通過合理分配傳感器資源降低整個跟蹤過程中的能耗。
假定有m只傳感器和n個目標,進行傳感器管理就是通過分配矩陣將傳感器分配給不同的目標,分配矩陣中的元素為0或1,行數為傳感器數量,列數為目標數量


其中,0為該傳感器u這一時刻的量測不分配給目標ν,1為傳感器u這一時刻的量測分配給目標ν。
以 C={C1,C2,…,C2m×n-1}來表示傳感器的分配方案,其中,Ci為不同的傳感器分配矩陣,假設每個傳感器最多可以跟蹤ki(i=1,2,…,n)個目標,設定某種度量方法P(x)作為代價的衡量,所以,傳感器管理的模型為

約束條件為

對一個二維目標進行跟蹤,目標的狀態方程和量測方程分別為

其中,wk為零均值高斯白噪聲,vk為量測噪聲并獨立于狀態噪聲wk。
根據文獻[5]可得,在k+1時刻對目標狀態估計的條件下界滿足

其中,L-1(xk+1|z1∶k)為 CPCRLB。
文獻[6]提出了一種直接計算CPCRLB的計算方法

目標跟蹤的量測方程為非線性方程

其中,θk=是在無源傳感器下,傳感器對目標的量測,(ak,bk),(a0,b0)分別為目標位置預測與傳感器的橫縱坐標。
在加性高斯量測噪聲假設下,量測數據的對數似然度為

初始迭代條件為

在式(4)和式(8)確定的狀態方程和量測方程下,計算CPCRLB所需的式(8)~式(10)中的數學期望為

對非線性量測模型,B22,bk通常沒有解析表達式。為計算B22,bk,假設目標狀態服從一階Markov過程,采用重要性重采樣粒子濾波器進行濾波,重要性函數選為通常使用的狀態轉移函數,此時權值可由似然函數獲得,在重采樣后,目標的概率密度函數可近似為

由式(11)~式(14)可得,基于無源量測數據的條件FIM可以迭代逼近計算如下

矩陣B22,bk的元素如下

當目標之間的距離過近時,需要依據目標之間的區分度制定傳感器資源分配策略。根據文獻[8],假設k時刻獲得的量測為zk,在第k次觀測后,目標的區分度由下式計算獲得

其中,p(xk|zk)為k時刻獲得第k次觀測后的后驗概率密度函數,第k次觀測之后所得的期望區分度增量為

在觀測方程為非線性時,需要用采樣粒子對結果進行近似,近似后的結果為

當E[D|zk]小于某個門限值時,就需要調用更多的傳感器資源對目標進行更精確的跟蹤。
計算采用矩陣遺傳算法作為優化算法,計算每次跟蹤的條件后驗CPCRLB的相反數作為適應值,并計算每一時刻的目標區分度增量。算法的具體過程如下:
1)隨機產生初始的分配矩陣種群,設定交叉和變異概率,設定區分度增量門限值;
2)用初始種群中的個體對目標進行跟蹤,計算CPCRLB的相反數作為適應值進行選擇,規定分配矩陣中如果有任意一列為全0(該目標沒有被跟蹤),則適應值為無窮;
3)進行交叉和變異;
4)計算目標的區分度增量;
5)當區分度增量小于設定的門限時,增加傳感器的數目;
6)反復進行步驟(1)~(5),根據不同的情況確定不同的傳感器分配矩陣對傳感器進行分配。
設定仿真環境為使用5只傳感器對目標進行跟蹤,傳感器為無源傳感器,初始目標為3個,運行傳感器數為2只,之后又出現2個目標,目標間距變小。濾波算法采用粒子濾波算法,關聯算法采用最近鄰算法,選擇算子采用輪盤賭算子,種群數量為7個,交叉和變異概率分別設置為pc=0.2,pm=0.3,進行50次蒙特—卡洛仿真。目標航跡和跟蹤效果如圖1、圖2所示。

圖1 目標航跡圖Fig 1 Target trajectories

圖2 跟蹤效果圖Fig 2 Tracking effect diagram
圖1 中從(1,20),(4,30),(6,40)m 起始的三個目標為初始目標;圖2中觀測站1,2為最初使用的傳感器,觀測站3,4,5為新目標出現后新調用的傳感器,從圖2中可以看出:當新出現目標使得目標間距減小時,該算法通過增加傳感器數量保證了目標之間的區分和對目標的跟蹤。
目標跟蹤過程中的區分度增量變化如圖3所示。
圖3中由于傳感器數目帶來的跟蹤精度影響,目標區分度增量在跟蹤初始階段波動比較大,在20 s時刻新目標出現,目標間距減小導致區分度增量減少,調用更多傳感器進行跟蹤后,區分度增量逐步增大,并趨于穩定。

圖3 跟蹤過程中區分度增量變化情況Fig 3 Change of discrimination gain during tracking process
整個跟蹤過程中傳感器能量消耗如圖4所示。

圖4 不同算法跟蹤過程能量消耗對比Fig 4 Contrast of energy consumption of tracking process of different algorithms
圖4顯示了引入區分度增量的傳感器管理算法和一般傳感器管理算法在跟蹤過程中能量消耗對比情況,假設傳感器在工作時每秒耗能5 W,初始跟蹤時只使用了2只傳感器對目標進行跟蹤,新目標出現后才調用了其他傳感器,整個過程中能量消耗950 W,相比于使用全部傳感器進行跟蹤消耗的1250 W減少了300 W。
跟蹤過程中7個個體的適應值變化情況如圖5所示。

圖5 跟蹤過程中個體適應值變化情況Fig 5 Change of individual fitness value during tracking process
本文基于區分度增量和條件后驗CPCRLB提出了一種傳感器資源分配算法,這種算法以CPCRLB的相反數作為遺傳算法的適應值,同時引入目標區分度增量作為判斷目標區分度的標準,相比于用固定數量傳感器跟蹤目標降低了整個傳感器系統的能耗。接下來需要深入研究對異類傳感器進行管理和將目標的優先級與算法結合起來。
[1]Nash M.Optimal allocation of tracking resource[C]∥Proceedings of the IEEE Conference on Decision and Control,1977:1177-1180.
[2]Rothman P L,Bier S G.Eva1uation of sensor management systems[C]∥Proceedings of the NAECON,1989:1747-1752.
[3]Bier SG,Rothman P L,Manske R A.Intelligent sensor management for beyond visual range air-to-air combat[C]∥Proceedings of the NAE2CON,1988:264-269.
[4]童 俊,單甘霖.基于Cramér-Rao下限的多傳感器跟蹤資源協同分配[J].宇航學報,2012,33(9):1314-1321.
[5]楊小軍,馬 祥,宋青松,等.基于條件后驗克拉美—羅下界的目標跟蹤傳感器管理[J].控制理論與應用,2013,30(5):543-548.
[6]Zuo L,Niu R,Varshney P K.Conditional posterior Cramer-Rao lower bounds for nonlinear sequential Bayesian estimation[J].IEEE Transactions on Signal Processing,2011,59(1):1-14.
[7]Zheng Y,Ozdemir O,Niu R,et al.New conditional posterior Cramér-Rao lower bounds for nonlinear sequential Bayesian estimation[J].IEEE Transactions on Signal Processing,2012,60(10):5549-5556.
[8]Cai Chenghui,Ferrari Silvia.Comparison of information-theoretic objective functions for decision support in sensor systems[C]∥Proc of the American Control Conference,2007:3559-3564.
[9]李 秉,王鳳山.區域防空多傳感器管理體系結構與功能模塊研究[J].傳感器與微系統,2009,28(3):117-120.
[10]張應華,周 林,劉先省.基于測量方差時變的傳感器管理算法[J].傳感器與微系統,2007,26(3):68-72.