汪高武
(中船重工第七一六研究所,江蘇 連云港 222006)
傳感器多目標信息探測是通過對傳感器系統進行優化分配和工作模式設定,以使系統盡可能多地獲得環境中存在的目標的信息。傳感器多目標信息探測的實質是一個優化問題。早期的優化對象是運動學中的數據,但是這種優化算法僅考慮了目標運動的因素,而沒有考慮傳感器探測和識別等因素。例如,利用卡爾曼濾波估計目標的未來位置,通過目標位置的方差控制傳感器的采樣頻率就屬于這類優化算法。這類算法很難控制傳感器工作模式(探測、跟蹤和識別)的轉換,并且難以實現對一組傳感器同時進行優化分配。后來的優化對象綜合考慮了動力學中的數據和傳感器工作模式等因素。為綜合考慮多個因素,實現傳感器多目標信息探測的優化,許多專家提出了信息論的方法。本文利用信息增量進行傳感器多目標信息探測,提出了基于信息增量的傳感器多目標信息探測算法。
1948年,香濃將熱力學的熵引入到信息論,因此信息熵(Information entropy)又被稱為香濃熵(Shannon entropy)。信息論中,熵被用來衡量一個隨機變量出現的期望值。它代表被接受之前信號傳輸過程中損失的信息量。信息熵也稱信源熵、平均自信息量。一個值域為{x1,…,xn}的隨機變量X的熵H 定義為[1-2]

其中:E 代表了期望的函數;I(X)是X 的信息量(又稱為信息本體),I(X)本身是個隨機變量。如果p 代表了X 的概率分布,則離散信源的信息熵公式可以表示為

如果p 代表了X 的概率密度函數,則連續信源的信息熵公式可以表示為

其中,b 是對數所使用的底,如上所述,通常是2、自然常數e或10。信息熵并不是負熵,它描述信源的不確定性,而不是不確定性的減少。信息熵大表示信源的不確定程度較大。
潛艇聲探測傳感器每隔一定時間對環境進行采樣,這將增強作戰系統對環境的認識,即減少目標信號的不確定性。信息論中,信息熵是信號不確定性的度量。潛艇聲探測傳感器采樣前后信息不確定性減少的數量用信息增量描述[3-5]

其中:(x-)為先驗概率;(x+)為后驗概率。
為了說明信息增量在傳感器多目標信息探測中的應用,首先考慮單個探測單元,并假設該探測單元內最多只能存在1 個目標。
用~s 表示單元的真實狀態,~s =1 表示單元中沒有目標,~s=2,…,S 表示單元中存在1 個目標類型。在先驗信息的基礎上,一個單元處于狀態s 的概率由先驗分布Q(s)給出。設P(s)是后驗概率,表示基于某些量測,單元處于狀態s 的估計概率。當P=Q 時,先驗分布得出了最少的信息。由下面的概率表示了完備的信息:

假設對象集O 是一個無限集,其中每個元素下標取自于有限集s=0,…,S。從集合O 中隨機抽取了n 個對象。先驗概率Q[s]=qs給出了抽取一個由下標s 標識的對象的概率(Q 可以統一取qs=1/S)。隨機抽取n 個對象,對象s 出現了ns次的概率由多項分布描述:


其中o(n)函數隨n 次線性增長。
式(4)的意義:當分布P 很小,則I 擴大,并且相對于先驗信息,后驗信息P 具更大的信息量,在探測/分類問題中,后驗估計與先驗概率相差很懸殊的那些單元包含了大量的信息,相反,后驗估計與先驗概率相近的那些單元包含了少量的信息。對于目標信息探測來講,從那些后驗估計與先驗概率接近的單元中只能獲得相對較少的信息;對于那些具有較低識別值的單元,其后驗信息P 具有大量的信息,所以期望的信息增量是最大的。
信息增量的大小可以反映一次探測所獲得的目標信息的多少。為了計算多目標探測問題的信息增量,首先對探測環境建模:
將探測環境劃分為C 個離散的單元c =1,…,C,每個單元的狀態取自集合s=0,1,…,S,其中s=0 代表單元中不存在目標,s=1,2,…,S 代表單元中存在的目標類型,每個單元至多存在1 個目標。由1 個傳感器探測這些環境單元,可以導引這個傳感器使其探測任何一個環境單元,該傳感器1 次只能監視1 個環境單元。對1 個單元探測完畢,傳感器可以對同一單元或者任何其他單元進行探測。當傳感器對一個單元進行探測時,該傳感器會輸出1 個離散的測量向量或測量集合z。這些觀測輸出是獨立同分布的隨機事件。單元c處于狀態s 的條件下輸出z 的條件概率Pc[z|s]已知,c 處于狀態s 的先驗概率Pc[s]已知。
綜上所述,多目標探測問題就是基于一組觀測集合,確定每個單元所處的狀態。單元c 的第k 次觀測輸出為zk(k=1,2,…,K),設ZK=(z1,…,zK)。總共觀測了K 次,在K 次觀測后,基于這些觀測推算單元c 處于狀態s 的后驗概率為Pc[s|ZK]。對于每一個單元c,多目標探測的目標是通過選擇s 獲得最大的Pc[s|ZK]。
多目標信息探測問題就是為傳感器確定最優的環境單元探測序列,使信息增量獲得最大值。根據任一環境單元的探測可以獲得信息增量I,通過計算當前環境單元狀態的概率計算I??刂苽鞲衅髅看芜x擇使I 最大的那個環境單元進行探測。這個過程將耗費大量的計算,因為算法包括了根據每一次觀測c 推算出的所有Pc[s|ZK]的累加。但是,我們評價ΔD 的計算是良性的,因為通過Pc[s|ZK-1]和Pc[zK|s]可以遞歸地計算Pc[s|ZK],從Pc[s|ZK]可以計算I,過程如下:
對于每個單元,使用貝葉斯公式計算K 次觀測的條件下單元處于狀態s 的概率。觀測ZK的總概率是

因為集合ZK的數據是獨立同分布的,所有

當前環境單元所處的狀態的概率為

分母的累加形式中,t 描述了環境單元的狀態。
K 次觀測后,使用當前的P[s|ZK]計算信息熵:

傳感器每次采樣,都需要重新解算式(11)。但是,若式(10)可以用遞歸的方法計算,那么式(11)也可以用遞歸的方法計算,可以大大減少計算量。

將式(12)代入式(10)得

注意到對1 個單元進行K -1 次觀測后,由于狀態s 互斥且完備,所以第K 次觀測的概率密度計算公式為

對單元c 進行探測、識別的信息增量為

基于識別的傳感器管理策略就是選擇使I 最大的單元c。其中K 是當前對單元c 的觀測次數,對于不同的單元觀測次數一般不同。
首先,研究Bernouli 探測問題,單次觀測的檢測概率pd=0.8,單次觀測的誤警率pfa=0.5。觀測系統中期望的目標數量為1。系統先驗目標分布是一致的,所以每個單元中包含目標的概率為q=1/C。對于這樣的問題,單元狀態S=2,相對的概率和分布就容易評估。例如,如果一個單元包含目標的概率為pt,則使用式(10)計算信息熵

設對于一個包含目標的單元來講檢測出目標存在,這種情況的平均后驗概率用式(12)計算是一個不包含目標的單元被檢測出目標存在的平均后驗概率。在導向查找的識別和導向查找(C=100 個單元、這些單元的狀態取幾次試驗的平均結果的情況下進行的直接查找)之間進行比較。在導向查找的情況下,系統中的每個單元被連續地采樣,并且對每個單元采用的次數相同。50 次試驗、每個單元進行10次采樣的結果:對于導向查找的識別對于導向查找比較上述2 個結果,使用識別-導向查找的概率估計的準確性潛在的提高了。
其次,使用閾值數據在白噪聲背景下的高斯目標檢測問題是較復雜的問題。當無目標出現時,期望的信號強度是N0;當目標出現時,期望的信號強度是S0+N0。對于這個問題優化的信號采用檢測器是一個遵從Neyman-Person 閾值測試的諾斯過濾器。過濾器的輸出λ 被閾值限制以產生一次量測的z,λ=1 代表閾值通過,λ≠1 代表閾值沒通過。使用多次量測Zk,使用式(12)估計目標出現或未出現的概率。當沒有目標出現時,λ 的方差為σ2=2S0/N0,分布為

當目標出現時,λ 的分布為


一次采樣的誤警率為

對于每一次單元采樣,利用傳感器對目標進行探測必須解決2 個問題:選擇哪一個環境單元進行探測?閾值τ 為多大?可以選擇τ 使每一次采樣期望的信息增量I 最大。圖1顯示了信噪比是0 dB 時,目標位于某單元的估計概率pt取不同值時,I 隨閾值τ 的變化。當pt=0.5 時,期望的信息增量最大,此時最優的閾值是τ*=/2。當pt≠0.5 時,最優閾值也不是/2。作為pt的函數,信息增量用于優化每個單元的閾值。但是,注意到,隨著pt遠離0.5,τ -獨立性降低通過使用固定的閾值。

圖1 信息增量隨單元狀態的變化曲線
本文提出了利用傳感器進行多目標信息探測的一種方法,介紹了信息熵的概念和信息增量的計算方法。通過仿真實驗說明了算法的正確性與實用性。
[1]吳湘淇.信號、系統與信號處理[M].北京:電子工業出版社,1999:263-276.
[2]田寶玉.信息論基礎[M].北京:人民郵電出版社,2008.
[3]Keith K.Discrimination gain to optimize detection and classification.[J]. IEEE Transactions on SMC,1997,27(1):112-116.
[4]Stan M,Keith K.Comparison of sensor management strategies for detection and classification[M].[S. l.]:International Symposium on Sensor Fusion,1996:128-137.
[5]劉先省,周林,杜曉玉.基于目標權重和信息增量的傳感器管理方法[J].電子學報,2005,33(9):1684-1687.
[6]李琪,郭娜,劉先省,等.基于Unscented 粒子濾波的傳感器管理算法[J].火力與指揮控制,2011(6):77-80.