牛彪 魏永強
摘 要 在大多數目標跟蹤情景中,傳感器可以被控制,以執行各種可能對測量的質量和信息內容產生重大影響的動作。這些動作也會影響跟蹤系統的估計性能。通常,這些行為可能包括更改傳感器平臺的位置,方向或運動,從而影響傳感器檢測,跟蹤和識別場景中物體的能力。這些控制決策是由人工干預或某種確定性控制策略驅動的,這種策略不能保證最優性。本文我們選擇柯西-施瓦茲散度作為控制目標函數。
關鍵詞 隨機有限集 多傳感器管理 柯西-施瓦茲散度
中圖分類號:Q945.3 文獻標識碼:A
1背景:多目標傳感器控制
通常這種類型的控制問題可以表述為一個部分可觀察的馬爾可夫決策過程(POMDP),在POMDP中,多目標動力學被建模為馬爾科夫過程,但僅限于此多目標狀態的后驗概率密度函數(pdf)是已知的(以過去的測量為條件),并且真實的基礎狀態是未知。每當需要做出決定時,目標都是找到最大化該反饋函數的控制行為。
另一方面,基于信息的優化,它努力量化從執行控制行動獲得的整體信息,因此它不會遭受競爭目標的問題。雖然信息理論控制可能不會導致針對任何特定任務的最佳決策,但是跨多個任務目標的整體效益很可能是優越的。一般 ,R閚yi分歧已經被提出用于單目標和多目標的傳感器管理跟蹤問題。在這樣的問題中,最佳控制行為就是預期的分歧或計算先驗和后驗目標密度之間的信息增益并將其用作選擇的依據。而KL和R閚yi分歧基于技術的技術已被證明是有用的,但其主要限制是其顯著的計算成本。特別是,除了某些特殊情況外,這些差異不能通過分析計算,因此需要昂貴的近似值,通常基于蒙特卡洛(MC)方法。由Fisher信息矩陣的概念激發的其他控制算法也已被提出,例如,在諸如傳感器波形選擇和軌跡規劃。另一種信息散度測量是Cauchy-Schwarz(CS)散度。
在本文中,我們考慮通過標記隨機有限集(RFS)進行多目標跟蹤的傳感器控制問題。尤其是,我們使用稱為廣義標記多伯努利(GLMB)濾波器的跟蹤算法,其中的結果不能直接應用。本文的關鍵創新是Cauchy-Schwarz的解析表達式兩個GLMB密度之間的分歧,用于構建基于POMDP的傳感器的反饋函數控制方案。
我們在此描述。在多目標跟蹤中,我們將多目標狀態表示為每個時刻k的單個目標狀態的有限集合。多物體狀態X k X和多物體觀測Z k Z被建模為隨機有限集合,FISST是一個基于與點過程理論相一致的集成/密度概念與RFS一起工作的框架。多對象后驗密度可以使用貝葉斯遞歸來計算。
2傳感器管理
問題仍然是,當我們希望執行控制行動時,我們并不知道采取該行動會產生后驗概率密度。由于真正的信息分歧不可用,所以使用信息分歧的預期值與可能的所有未來測量有關,更精確地說,讓我們從定義下面的符號開始:
(1) k是時間為k的多對象GLMB后驗概率密度。
(2) Ck是在時間k的允許控制動作的集合。
(3) H是計算反饋的地平線長度。
(4) (1:k+ H)是從時間k到k + H的多目標GLMB預測。
(5)如果在時間k執行控制動作c∈Ck,則Zk + 1:k + H(c)是從時間k + 1直到k + H時刻之間的測量集合的集合。
(6)最佳控制行為通過最大化反饋函數Rk + H的期望值這里給出一組允許行為:
Copt = arg maxc∈Ck E [Rk+H (c)]
反饋函數由預測和后驗多目標密度之間的某種形式的信息散度Dcs給出。
3 Cauchy-Schwarz(CS)散度
最常用的信息獲取措施是Kullback-Leibler分歧,更一般地說,是R閚yi分歧。在本節中,我們證明Cauchy-Schwarz散度有一個更適合封閉形式的數學解決方案,并且特別地,在單個目標密度是高斯混合的情況下,可以獲得GLMB密度的封閉形式。
3.1基于RFS的柯西-施瓦茨分歧
為了確定基于RFS的Cauchy-Schwarz(CS)散度,我們需要求助于Lebesque積分。基于RFS的概率密度可以由給出的參考測量u來定義,度量 類似于狀態空間X上的Lebesgue度量(事實上,當狀態空間X有界時,它是單位強度為u = 1K的泊松點過程的非標準化分布)。
此外,它表明,對于參考量度的這種選擇,函數f的Lebesgue積分:F(X)→R,使用Lebesque積分我們可以定義內積:這種內環增益和規范的形式是明確的,因為密度f和g以及參考度量 都是無法計算的。令 和 表示各個點過程的FISST密度。 FISST密度與Radon-Nikodym導數之間的關系,相應的概率密度(相對于參考測量 ),Cauchy-Schwarz散度可以用如下集合積分來表示,
4結論
本文對多目標跟蹤階段中的傳感器管理問題進行了重點研究,建立了基于柯西施瓦茨距離最大化的傳感器管理調度模型,所提模型能夠有效解決目標識別階段的多傳感器管理問題,獲得了較好的識別結果,提高了多傳感器識別系統的整體性能。
參考文獻
[1] CHHEIAS,M.&A.PAPANDREOU-SUPPAP-POLA.Sensor; resource allocation for tracking using out-er approximation[J].IEEE Signal Processing Letters,2007,14(03) :213-216.