延 淼,王宏艷
(航天工程大學 航天信息學院,北京 101416)
紅外探測技術憑借其無源被動的探測優勢,具有較強的抗輻射、抗干擾和反隱身特性,對于發展精確制導武器與反導體系作戰具有重要意義。傳統的檢測后跟蹤(Detect-Before-Track,DBT)技術先預處理濾除背景雜波和噪聲,再進行單幀門限檢測,雖然思路簡單,執行率高,但是在低信噪比(SNR)條件下,若降低門限,后續將產生眾多虛假軌跡。因此如何提高對微弱點目標的檢測能力是一個亟待解決的問題。近年來,檢測前跟蹤(Track-Before-Detect,TBD)技術成為點目標檢測與跟蹤領域的研究熱點[1-3]。
相對于DBT的應用局限性,TBD直接輸入未做低門限處理的傳感器原始數據,先搜索目標所有可能的運動軌跡,完成幀間能量累加,然后利用相關檢測算法計算所有備選目標點的速度、位置等信息,得出軌跡的后驗概率,最后設定相應的檢測門限判決剔除虛假軌跡完成目標檢測。算法流程如圖1所示。

圖1 TBD處理流程框圖
TBD檢測決策處于整個處理鏈的最后一個環節,在此之前所有的信息都被使用且隨時間累積完成,充分挖掘了數據中的有效信息,避免了單幀檢測中的恒虛警率(CFAR)損失[4],提高了點目標的檢測和跟蹤性能。
假設xk-1表示k-1時刻的目標運動狀態向量,目標運動常采用如式(1)所示的勻速或勻加速運動模型,其中F為目標狀態轉移矩陣,vk-1為隨機過程噪聲。
xk=Fxk-1+vk-1
(1)

(2)
TBD技術關鍵在于利用1~K時刻的觀測數據Z1∶k={Zk|k=1,2,…,K},對目標存在與否進行判斷;若目標存在,估計并輸出目標狀態。文獻[5]給出了一種單目標TBD數學描述,如式(3)所示,其中X1∶K∈Rnx為目標在第K幀的狀態,nx為單目標狀態維數,VDT檢測門限或錯誤的報警概率。
(3)
利用貝葉斯準則,聯合后驗概率密度可表示為
(4)
下面將介紹5種常用TBD方法,并評述其研究現狀,最后探討TBD在理論和實踐中有待深入解決的問題。
1962年,Paul Hough提出一種形狀匹配技術,即為Hough變換。后來美國學者D.G.Falconer博士采用Hough變換解決了在二維平面中做直線運動的點目標軌跡提取與狀態參數的跟蹤識別問題。W.E.Snyder等將其進一步推廣,解決了每個像元目標的檢測跟蹤與識別問題。文獻[6]對Hough變換作如下定義:
f(ρ,θ)=R(F)=
?DF(x,y)δ(ρ=xcosθ-ysinθ)dxdy
(5)
F(x,y)是定義在X-Y平面上的廣義函數。沿著直線ρ=xcosθ+ysinθ對F(x,y)進行積分,在變換空間中運用適當的累加運算,使正弦曲線族的交點處形成一個峰,峰值則對應于X-Y平面上的一條直線。
Hough變換無需任何目標的先驗知識,對噪聲干擾具有較強的容錯率,適用于多目標追蹤場合,受到國內外學者的廣泛關注[7]。然而在強噪聲或復雜背景條件下,紅外圖像受目標和背景的熱輻射影響,并不全是由上述簡單的直線組成,甚至出現部分遮擋。傳統Hough變換后的圖像由單個點映射成多個曲面,需要大量的存儲空間和計算量,有時邊緣也不光滑閉合,出現“虛峰”和“漏檢”現象,給實際應用帶來嚴重影響。因此大量的改進算法出現。王曉涓等[8]通過對圖像邊緣水平和垂直兩個方向的梯度進行非均勻量化確定最佳閾值,從正、負、水平3個方向檢測濾波器,解決了紅外圖像在強噪聲下交叉邊緣檢測存在偽像的問題。由于對圖像邊緣水平和垂直方向量化需要建立大量累加器數組,后續需要尋找累加器數組的局部閾值確定像素,因此伴隨累加器數組的增多,存儲空間和運算時間也會急劇增長。安博文等[9]將Ostu閾值分割獲取海天邊緣信息與Hough變換檢測目標相結合,對非背景的特征點進行隨機采樣,雖然能夠在一定程度上使目標點和噪聲點數量同步減少,以保證算法實時性,但是仍有可能出現對特征點進行重復采樣的現象,使算法效率降低。吳夢怡等[10]根據目標的形狀特點和布局情況,選擇合適的邊界曲線方程從而檢測并分割出目標。實驗證明該方法檢測結果準確但仍存在部分邊緣缺失的情況。翟永立等[11]針對星空背景下GEO(地球靜止軌道)目標提出一種快速檢測算法。實驗結果表明,與傳統Hough對比,算法所用時間減小50%,但也僅適用于成像背景稀疏、目標運動緩慢的情況。
1983年,美國工程院院士Reed等在三維序列圖像中應用匹配濾波器理論,提出了三維匹配濾波器。其原理是:設計一組濾波器與目標所有可能的運動軌跡一一對應,尋找輸出信噪比最大的濾波器,其對應的運動狀態即為真實目標的運動狀態。1990年,Reed又提出了三維匹配濾波方法的簡化方法:迭代運動目標檢測算法(Recursive-Moving-Target-Indication,RMTI)算法[12],通過對前后各幀圖像在二維傅立葉變換域進行遞推加權疊加,使多幀目標能量得到相干累加,從而減少計算量,節省存儲空間,具有良好的SNR增益。隨后,Porat等[13]也對三維匹配濾波做了詳盡說明,在Reed的基礎上提出了一種基于頻域方向濾波器的算法,用于檢測地面運動目標,遠遠降低了時域中的算法復雜度。
速度和方向是三維匹配濾波器的關鍵,若濾波器先驗信息與目標實際不匹配將造成算法性能嚴重下降。文獻[14]指出速度濾波器組的概念,按照目標運動速度不同,劃分出相應的速度空間進行分類檢測。該算法需要設計多組濾波器,計算量隨之大大增加。針對上述問題,文獻[15]在二維頻域設置濾波器來壓縮目標方位向速度參數,減少了存儲空間。Matt Ward[16]實現了速度選擇器,降低了遍歷搜索的壓力。侯旺等采用分塊策略劃分速度域計算目標運動速度[17],解決了基本RMTI算法在檢測實時性方面的困難,極大地減少了計算量。若點目標在兩個圖像塊之間,分塊策略對其在速度域上的能量也會造成一定程度的損失。以上方法仍只能檢測勻速直線運動目標,不適用于非線性運動目標。綜上所述,三維匹配濾波器是一種在同等輸入信噪比時輸出信噪比最大的線性濾波器。但這種方法屬于遍歷搜索,需要大量的匹配濾波器,對硬件結構要求較高。
1985年美國的Barniv將動態規劃思想首次引入TBD技術中。該算法將多幀能量積累劃分為若干個階段,逐個遞推求解每一階段使值函數最大的目標運動狀態序列,通過門限判決有效檢測點目標[18]。因此,值函數的構建和選取,直接影響算法的檢測跟蹤性能。
1987年Barniv根據貝葉斯理論,利用概率密度函數優化構建值函數并詳細分析了算法的檢測性能。實驗表明該方法在對目標能量積累時存在能量擴散效應。文獻[19]指出Arnold于1993年將該算法應用于非起伏型目標并進行了改進;幾年后Tonissen等在假設的高斯條件下,將該算法應用于起伏模型,并分析了其檢測和跟蹤性能[20]。這兩類構建值函數的方法成為DP-TBD的主要研究方向,前者利用目標幅值的先驗信息,將似然函數作為值函數,改善了在非高斯條件下算法的檢測和跟蹤性能,但受限于幅值先驗信息是否可獲取;后者利用當前幀目標幅值的測量值構造值函數,易于實現,但在過低信噪比時(如SNR<3 dB)虛假航跡率上升導致跟蹤性能很差。強勇等[21]在上述兩類算法的基礎上,提出了統一的值函數遞推公式。郭云飛等[22]基于相鄰幀的幅值關聯信息,而非幅值本身,提出一種新的值函數構建方法,該算法依賴于目標幅值在相鄰幀間連續平穩波動,僅適用于作勻速直線運動或弱機動的目標。
上述文獻都是通過構造合適的值函數提高檢測性能。此外,通過對原始數據預處理也可以改善檢測跟蹤性能。2013—2017年,Grossi等針對DP-TBD算法復雜度做了大量的研究[23-25],文獻[23]提出一種兩階段檢測算法,先通過預處理提取特征明顯的候選狀態,再通過閾值進行幅值積累和航跡估計。該算法不需要將觀測空間離散化,運行效率較高。文獻[24]在預處理中引入似然比率閾值,能有效減少后續算法中候選狀態數目,從而減少后續DP-TBD計算量。文獻[25]使用ad hoc動態規劃算法以可接受的復雜性證明其在減少海雜波方面的有效性。張沛男等[26]在預處理階段采用基于Hebb規則的神經網絡(NN)對原始測量數據進行聚類分析,按照分類情況相應縮放幅值后,采用DP-TBD方法進行幅值積累。與文獻[23-24]算法相比,NN的聚類分析過程耗時較多,需要將研究重點落到如何減少算法的運行時間。
1991年,Blostein和Huang提出了一種稱為多階假設檢驗的TBD算法,并首次引入了樹的結構表示目標運動軌跡。假設背景像素點是互不相關的高斯白噪聲隨機變量,1≤i≤k-1階截斷序貫假設檢驗(TSPRT)的判斷規則是:
(6)
第k階的判斷規則是:
(7)
其中:ai、bi是序貫概率比檢驗(SPRT)的門限,τ是具有固定采樣假設檢驗的門限。
該算法基本不產生冗余信息,可以同時檢測多個目標。為了減少漏警,建立多個候選軌跡起始點可能導致后面的樹杈成指數級增多,嚴重影響算法性能。后續發展的基于目標運動狀態模型的多重多階假設檢驗(MMHTT)[27],利用SPRT算法在檢測到第K幀時,就判斷目標存在與否的狀態,雖然避免了出現檢測幀數大于算法執行幀數的問題,但是可能會受到SPRT在其停止時間上缺乏上限的影響,特別是在指定錯誤的情況下。崔常嵬等[28]提出一種逆推法,把某一像素點作為目標終點反向搜索,解決了由于初始點多而出現的組合爆炸問題,但是在實時系統中,必須對圖像來一幀處理一幀,對硬件平臺有一定要求。劉翔等[29]在傳統MHT算法中,對可疑目標點引入多光譜信息,在形成的搜索樹中進行多光譜統計判決。由于該算法(采用的光譜角模型)基于參數化模型,可能相較于實際模型信息不準確,在模型建立上存在誤差。
粒子濾波又稱為序貫蒙特卡羅(SMC),最早出現于20世紀50年代,并于20世紀70年代首次解決非線性濾波問題[30]。當時使用的是一種序貫重要性采樣算法(SIS),存在嚴重的樣本權值退化[31]問題。直到1993年Gordon等在提出自舉濾波(BF)算法時引入重采樣技術才得到有效解決。

(8)

當粒子數量趨于無窮時可以逼近服從任意概率分布的系統狀態,達到貝葉斯估計最優解。根據以上分析,基本粒子濾波算法步驟為
第1步:重要性采樣

第2步:更新權值
(9)
計算歸一化權重:
(10)
第3步:重采樣
計算有效粒子數:
(11)
第4步:估計目標狀態
(12)
方差估計:
(13)
第5步:k=k+1,返回第2步。
粒子濾波作為一種新型濾波算法在非高斯非線性環境中有著良好的表現。盡管重采樣可以有效降低退化現象,然而經過若干次迭代后,高權值粒子會被多次選取從而失去粒子多樣性,出現樣本(粒子)匱乏現象;此外算法的計算量會隨著粒子數量增加呈指數級增長[32],算法實時性大打折扣。因此,后續研究仍然有較大的改善空間。Chong Y等[33]提出一種基于顏色特征和邊緣特征自適應融合的粒子濾波跟蹤算法用于背景干擾下的紅外目標跟蹤,克服了環境突變對跟蹤穩定性的影響但沒有有效抑制粒子退化問題。汪鴻翔等[34]采用簡單的兩層前饋卷積網絡通過分層濾波器卷積來抽取目標的高位抽象特征。該方法在低分辨率場景下具有較好的跟蹤效果,但快速運動和目標暫時消失等場景下魯棒性較差。王海梅等[35]提出了一種基于目標灰度與運動特征的PF算法,在粒子濾波框架下,利用空間信息的灰度模型和灰度信息的運動模型,融合成一個聯合觀測模型。相較于傳統的PF算法,該算法雖然計算效率有所降低,但在跟蹤的準確性和魯棒性方面大有提高。
Hough變換、三維匹配濾波器、動態規劃、多級假設檢驗和粒子濾波是典型的TBD算法,代表了TBD的發展歷程。表1列舉了目標類別、噪聲環境、目標運動、軌跡確認準則以及算法的優缺點。

表1 TBD算法
從表1可以看出,在高斯噪聲條件下,這些方法均可檢測出作勻速直線運動的目標。Hough變換對隨機噪聲魯棒性高,多級假設檢驗利用軌跡特征無需固定采樣長度,三維匹配濾波器是檢測已知速度目標的最優線性濾波器,動態規劃和粒子濾波可以處理機動運動目標,避免了三維匹配濾波器速度失配情況。但是,由于需要考慮時間和空間信息的相關性,上述算法均能造成大量的計算量和存儲量,處理也相對復雜。相較于其他4種算法,粒子濾波由于不需要對系統作任何先驗性假設,直接進行離散采樣估計,當粒子數量足夠大時,能夠無限逼近目標狀態的真實概率密度,在處理復雜的非線性、非高斯系統的狀態估計問題更具優勢。
隨著研究的不斷深入,檢測與跟蹤之間的界限越來越不明顯。當目標弱到難以在預檢測中提供有效的信息時,TBD算法在檢測之前采用跟蹤思想,直接基于對目標原始數據的軌跡估計,以達到小目標沿軌跡累積的效果,提高了檢測性能,是一種優效的選擇。此外,隨著智能科學和信息技術的發展,粒子濾波由于在低信噪比下非線性非高斯系統中有較好的性能,將是未來紅外點目標跟蹤領域的發展方向。當前TBD技術尚不成熟,往往在優化解決一種問題的同時會降低其他性能,如何在復雜場景下同步提升算法的魯棒性、精度和實時性依然是未來的研究方向。可以預見,未來紅外點目標檢測跟蹤技術的研究和發展趨勢:
1)多特征、算法融合,或同時融合兩種以上算法理論可以有效解決復雜背景下目標遮擋、跟蹤困難的問題,成為檢測前跟蹤技術的主要研究方向之一。
2)在利用多傳感器、多譜段觀測數據的互補性并去除冗余性的基礎上,發展對自適應光譜成像器的研發[36],可以實時調整光譜通道數量,并且跟隨威脅場景匹配相對應的識別功能,實現點目標的預警偵察、精準瞄準和戰場監視。
3)應用機器學習、深度學習理論有助于在復雜多變背景下構建更魯棒的目標模型,也需要大量的訓練樣本,如何在考慮目標表征能力和算法實時性基礎上,構建更合適的深度網絡結構是一個值得研究的方向。
4)硬件開發向高性能、低成本、小型化的方向演化,不僅僅可以滿足軍事戰爭的需要,同時也可以服務于民用需求[37]。如設計小型結構的硬件系統可以增強系統在復雜環境應用的適應性和便捷性,同時細化模塊功能從而不斷提高系統的可靠性和可維修性。