程佳林,張貞凱
(1.江蘇科技大學 電子與信息學院,江蘇 鎮江 212003; 2.華中科技大學 電子信息與通信學院,湖北 武漢 430074)
目前,利用有限的傳感器資源在跟蹤性能與系統資源之間實現系統整體性能最優[1],是傳感器資源管理技術重要的研究方向。在目標跟蹤領域和控制領域中,卡爾曼濾波(KF)是處理多傳感器數據融合問題最常用的方法,但是在實際工程應用中存在融合過程運算量較大的問題。機動策略自適應目標跟蹤算法,可以利用機動策略轉移矩陣來改善不可避免的驟增的估計誤差[2]。信息濾波[3,4](IF)融合理論已基本完善,擴展卡爾曼濾波作為一種經典的非線性濾波算法在非線性系統中被廣泛使用。基于擴展卡爾曼濾波的非線性集中式融合算法及分布式融合算法[5,6]能夠有效處理應用于非線性系統。利用擴展信息濾波器進行信息融合不僅解決了非線性系統的濾波問題,而且能夠有效降低融合過程中運算量。
傳感器選擇是在利用有限的傳感器資源的基礎上滿足對目標跟蹤以及掃描空間的需求,從而獲取目標各具體特性的最優值,并對傳感器資源進行優化分配[7],達到跟蹤性能與系統資源之間的平衡。其中,基于信息論以及集與協方差控制等傳感器選擇方法能夠自適應選擇傳感器,提高跟蹤精度[8,9]。為了保持跟蹤精度及時效性的同時,控制系統資源消耗,采用基于任務控制的傳感器管理方案獲取目標威脅度[10],在此基礎之上利用改進的效能函數[11],對傳感器進行自適應選擇,實現對傳感器資源的調度。不過這些方法會面臨組網中傳感器數量增加時傳統傳感器選擇方法計算量過大的問題。因此,本文考慮在線比較期望信息增益與各傳感器當前信息增益,每次選取信息增益與期望信息增益最接近的傳感器。最后計算傳感器組合的信息增益進行融合,達到對傳感器進行選擇的目的。
1.1.1 信號模型
在k時刻,雷達對目標所發射的波形信號為

(1)
其中,pk為雷達在當前時刻對目標的發射功率,Sk(t)表示發射信號的復包絡。
因此,雷達系統接收信號的基帶形式如下

(2)
式中:hk為復數代表目標的RCS;τk是目標回波時延;αk為衰減因子,它與發射天線的增益,接收天線孔徑和雙向路徑損耗有關。
1.1.2 目標狀態模型
考慮如下離散時間非線性動態系統,目標的運動方程為
Xk=f(Xk-1)+wk
(3)

1.1.3 量測模型
目標的量測方程為
Zk=h(Xk)+vk
(4)
其中
h(Xk)=(Rk,θk)T
(5)
此處,Zk∈Rnx為觀測向量,h:Rnx→Rnz為量測矩陣為可微函數。nx、nz分別為系統狀態的維數和觀測維數。vk是均值為零并且互獨立的白色高斯過程噪聲向量,協方差陣為非負定陣R。Rk可以通過時延信號τk求出,表示雷達和目標之間的徑向距離
(6)
(xm,ym)表示雷達坐標;θk為目標方位
(7)
vs=[v1,v2]T為量測噪聲向量。
非線性系統中,擴展卡爾曼濾波遞推計算公式如下
(8)
(9)
(10)
Pk+1|k+1=[I-Kk+1Hk+1]Pk+1|k
(11)
(12)
其中,Hk為雅克比矩陣,Fk為線性化狀態矩陣
(13)
(14)
(15)
(16)
將式(15)、式(16)式帶入擴展卡爾曼濾波可得擴展信息濾波方程,其信息狀態向量和信息矩陣的預測如下
(17)
(18)
信息狀態向量和信息矩陣的估計如下
(19)
Yk+1|k+1=Yk+1|k+Ik
(20)
其中,狀態貢獻i(k)和信息矩陣I(k)的定義如下
(21)
(22)

多傳感器融合的主要思路是利用多個低維傳感器的觀測向量擴展成單個高維觀測向量,在此基礎上來對其進行濾波得到多傳感器融合的狀態估計,考慮由N個傳感器節點組成的跟蹤系統
h(x)=[h1(x),h2(x),…,hN(x)]
(23)
Zk=[Z1,k,Z2,k,…,ZN,k]
(24)
vk=[v1,k,v2,k,…,vN,k]
(25)
h(x)、Zk和vk分別為觀測矩陣、觀測向量和觀測誤差。由上述條件可知
E[vk]=0
(26)
Rk=diag{R1,k,R2,k,…,RN,k}
(27)

由式(19)得融合中心信息狀態向量估計
(28)
由式(18)得融合中心信息矩陣估計
(29)
則擴展卡爾曼信息濾波狀態更新方程即為
(30)
狀態估計協方差為
Pk+1|k+1=(Yk+1|k+1)-1
(31)
傳統的傳感器選擇算法是通過期望協方差確定與其最符合的傳感器分配組合對目標進行跟蹤濾波。假設傳感器系統中有N個傳感器,那么傳感器組合方式則有2N-1個,這樣當組網中的傳感器數量增加時,全遍歷步長則會爆炸式增長。本章提出一種傳感器選擇算法,基于信息增益的思想,每次都將選取信息增益與期望信息增益最接近的傳感器組成傳感器組合,并將傳感器組合的信息增益在擴展信息濾波的融合中心進行融合得到濾波結果。
由式(29)可以得信息矩陣的更新遞推表達式,即協方差更新表達式;因此通過式(22)可以計算出各個傳感器的對目標進行觀測時的信息增益

(32)
通過設定的期望協方差矩陣,結合上述協方差更新表達式可知,滿足跟蹤精度要求Pd(k|k)的期望信息增益為
(33)
利用矩陣度量計算目標函數f(Ji,Jd),本文矩陣度量采用絕對值求跡,具體定義如下

(34)
即計算trace(Ji(k|k)-Jd(k)),根據協方差思想,若目標函數f(Ji,Jd)≥0,則表示第i個傳感器可作為傳感器組合的候選傳感器,根據目標函數選取與期望信息增益最接近的傳感器組合。
得到當前傳感器組合后,利用Eif估計目標位置并融合。根據傳感器組合中各傳感器的觀測值進行濾波,在擴展信息濾波器中融合中心進行信息融合。與傳統傳感器管理方法待選傳感器組合數2N-1相比,本文方法中待選的傳感器組合數為N,降低了傳感器組合數量。
在多傳感器系統中,基于擴展信息濾波的傳感器選擇算法的具體步驟如下:
步驟1 系統初始化設置,即設定目標的初始狀態變量及期望協方差矩陣。
步驟2 計算各傳感器的信息增益,并求解目標函數f(Ji,Jd)。
步驟3 根據目標函數每次選取與期望信息增益最接近的信息增益組成傳感器組合,直到滿足跟蹤精度要求即Pd(k)-Ps(k|k)對角線上最小值大于零。
步驟4 利用Eif估計目標位置并融合。獲得步驟3所選擇的傳感器的觀測值進行濾波,由式(28)、式(29)得到擴展信息濾波器中融合中心的融合結果,輸出目標跟蹤位置。
步驟5 跳轉至步驟2,進行下一時刻的傳感器選擇,直至跟蹤結束。
仿真的主要目的是驗證本文提出的基于擴展信息濾波的跟蹤傳感器選擇算法(TSSA)的有效性,并分別和文獻[12]中的多傳感器加權融合算法(MWFA)及只選擇3個性能最優的傳感器直接融合進行對比。
仿真場景是由6個傳感器構成的傳感器系統對一個目標進行觀測,每個傳感器將給出目標在x,y兩個坐標上的位置信息,量測噪聲參數見表1。

表1 傳感器各方向上的量測噪聲標準差
仿真時目標采用CA模型,x,y方向的加速度都受到均值為零的高斯白噪聲擾動,并且每個時刻都相互間獨立。采樣周期為1 s,目標運動持續時間為100 s。仿真中期望協方差設置為兩斷,轉換時刻為51 s,特征值分別為diag([0.4,0.15,0.4,0.4,0.3,0.4])、diag([0.9,0.3,0.6,0.5,0.5,0.6])。目標的初始狀態x0=[10 50 5 10 2 4]T。
圖1是跟蹤軌跡曲線,圖2是傳感器系統對目標進行跟蹤時的各傳感器選擇情況與掃描次數的關系,其中的點表示該時刻傳感器的被選擇;從圖中不難看出,前50 s所設期望協方差特征值較小即跟蹤要求較高,S1、S2、S3這3個高精度傳感器使用率較高,過了第51次掃描之后期望協方差水平降低,總體的傳感器使用率也隨之下降。因此,本文提出的傳感器選擇算法可以根據期望協方差水平的變化自適應選擇跟蹤傳感器。

圖1 目標跟蹤軌跡

圖2 傳感器選擇結果
圖3、圖4、圖5分別是50次Montente Carlo仿真的位置、速度以及加速度的RMSE變化曲線。

圖3 位置跟蹤均方根誤差比較

圖4 速度均方根誤差比較

圖5 加速度均方根誤差比較
在目標跟蹤過程中當前時刻k時的均方根誤差(RMSE)表達式如下
由圖3、圖4及圖5的RMSE曲線可以看出,利用擴展信息濾波算法對傳感器信息進行融合,是解決非線性目標跟蹤的有效方法。文獻[12]的方法是考慮全局狀態估計的多傳感器加權融合方法,并未對傳感器進行選擇。因此,當多傳感器系統中存在性能較差的傳感器時,會產生較大的量測誤差,性能過差的傳感器參與融合時反而會降低跟蹤精度。通過比較可以看出,本文提出的基于擴展信息濾波的多傳感器跟蹤算法的跟蹤精度與3個性能最優的傳感器直接融合的跟蹤精度基本一致,驗證了傳感器選擇算法的有效性。
在實際跟蹤及控制領域,非線性狀態模型和觀測模型比較常見。擴展信息濾波在非線性系統中具有很好的跟蹤性能,并且融合中心計算量也相對較小。當傳感器系統對目標進行跟蹤時,在滿足跟蹤精度的要求下,需要最大化降低傳感器資源的使用,本文提出的傳感器選擇算法在有效降低傳感器使用數量的同時保證了跟蹤精度,實現了對傳感器資源的管理。