基于決策融合和模型更新的紅外目標跟蹤方法

2021-11-19 08:17:36李佳文

計算機仿真 2021年10期

李佳文，李建，彭程，楊杰

(1.上海交通大學圖像處理與模式識別研究所，上海 200240；2.上海航天控制技術研究所，上海 200240；3.中國航天科技集團公司紅外探測技術研發中心，上海 200240)

1 引言

如今復雜的現代化戰爭環境中，只有及時發現目標，實現有效跟蹤，才能實現精確打擊。相較普通目標圖像而言，紅外目標圖像反映的是目標表面的溫度分布。通常情況下，相比于普通目標而言，紅外目標信噪比低、對比度低且目標紋理較為模糊[1-2]，在低信噪比低對比度的條件下，目標極易被周圍噪聲淹沒從而跟蹤失敗。同時，實戰環境具有復雜多變、不可預測的特性，當目標的紋理特征不清晰時，實戰中可能存在的干擾源降低目標跟蹤系統的跟蹤性能，這也是目前的目標檢測跟蹤技術所關注和解決的重要問題。可以說，紅外目標跟蹤技術是提升現代化軍事實力的重要一環。

2 目標跟蹤介紹

目標跟蹤是計算機視覺領域中的一個重要方向。它主要針對視頻中的圖像序列，其任務是通過第一幀中所給的真實目標信息構建模型，在之后所有幀的圖像中準確估計目標的位置。目標跟蹤技術在交通監控、導彈制導、自動駕駛等領域均有廣泛應用。在軍用方面[3]，現階段主要對紅外圖像中的目標進行跟蹤，與民用領域中所采用的可見光圖像有著一定區別，跟蹤難度也更大。

自上個世紀70年代起，人們陸續提出了一系列經典的跟蹤算法。常用的跟蹤算法可以分為TBD算法和DBT算法兩類。DBT(Detect-Before-Track)算法是先通過目標的像素強度檢測目標，然后根據連續的圖像序列得到目標軌跡；TBD(Track-Before-Detect)算法先進行掃描，將結果存儲起來，然后對假設軌跡上的點做相關分析，最終得到目標軌跡[4]。DBT算法中比較典型的算法如Irani等人[5]利用像素小鄰域上灰度差的加權平均度量目標的運動，得到目標的運動軌跡；2002年Markandev等人[6]利用光流法檢測跟蹤運動目標；2003年Wang 等人[7]提出的基于數字形態學的紅外目標檢測跟蹤算法，利用形態膨脹運算累加同一目標在不同幀中的能量。TBD算法主要應用于低信噪比的背景，有利用方向加權的動態規劃算法的檢測跟蹤技術[8]，也有通過計算幀間的高階相關性，在圖像中檢測出目標軌跡的方法[9]。近幾年，基于多示例學習的跟蹤方法[10]和香港理工大學的Wang等人[11]提出的基于深度學習的跟蹤方法和也是目標跟蹤領域研究的熱點。

兩類跟蹤算法相比，TBD算法在計算中同時考慮了時間信息與空間信息的關系，計算量相較于DBT算法要大。但是DBT算法是通過將假設軌跡與已經存在的軌跡做相關分析，由此確定是否為目標，會有較高的誤檢率。通常在低信噪比的條件下，TBD算法性能優于DBT算法。本文所提出的紅外目標跟蹤框架屬于TBD算法。

3 本文算法主要原理

本文所提出的算法流程如圖1所示。其主要并行構建兩種表觀模型來描述紅外圖像目標。圖中左側支路主要處理輪廓紋理信息流，右側支路利用到了紅外圖像的能量分布信息流，而后通過動態決策融合機制來定位目標在當前幀的位置。最后，為了使算法適應目標的快速移動、形態模糊和外界遮擋等情況，利用自適應的模型更新策略來對兩種模型進行更新，避免將錯誤的目標信息更新至模型，進而減少累計的偏移誤差，有利于在之后長時間的跟蹤過程中準確識別和跟蹤目標。

圖1 本文算法流程圖

3.1 基于多模型表達的動態決策融合機制

首先在輪廓紋理模型方面，對于第t幀的圖像Xt，本文算法主要訓練一個濾波器Ht使得兩者進行相關操作后輸出的響應圖與期望響應圖盡可能接近，即最小化下式的損失函數

(1)

其中，符號?代表相關操作，Y＇代表期望響應圖，一般為高斯分布。另外，λ為正則化參數，用來防止模型過擬合。

由表示定理[12]，可以將上述最小化問題轉換到對偶空間，轉變為求解對偶變量αt，利用快速傅里葉變換求得解析解，即

(2)

其中，F和F-1分別代表離散傅里葉變換及其反變換操作，<·>代表求取內積操作。φ為一映射函數，主要將低維特征空間中的特征向量映射到高維特征空間，從而在高維特征空間中找到一個更恰當的超平面進行分類判別。利用該方法的好處是無需知道映射函數的具體表達式，而通過確定該核函數即可以直接求取高維特征空間中特征向量的內積結果，避免了求解核函數的復雜過程。

基于上述訓練好的濾波器模型以及提取的目標表觀模型，在新的第t+1幀圖像中，濾波器響應圖Yt+1可以在頻域中通過式(3)計算得到

Yt+1=F-1(F(αt)⊙F(〈φ(Xt)，φ(Xt′)〉))

(3)

其中，⊙代表矩陣元素點乘操作，Xt＇代表目標特征模板，其中存放了目標在時空序列中的表觀模型信息。

(4)

而后通過圖像積分，可以得到當前幀的能量響應圖Et。

在之后的融合階段，本文針對紅外目標跟蹤引入一種動態決策融合機制[14-15]。其主要利用平均峰值相關能量[16](Average Peak-to-Correlation Energy，APCE)來衡量響應圖的起伏波動程度。對于響應圖，其APCE值的計算方式為

(5)

從其計算方式可以看出，如果相關濾波器所獲得的響應圖單峰特性較好，即其峰值區域較為高聳而旁瓣區域較為平緩，此時計算所得的平均峰值相關能量值就會較大；反之，如果響應圖起伏波動較大，則上式的分母項較大，因而其平均峰值相關能量值就會較小，由此可以實時并且動態地衡量每一幀紅外視頻圖像的相關濾波結果的置信度。

(6)

3.2 自適應模型更新策略

通常而言，紅外目標所包含的信息量不如彩色圖像中那么豐富，因而在每一幀的跟蹤結果之后，對目標表觀模型的更新就尤為重要。一旦模型中累計的錯誤信息偏多，在之后的跟蹤過程中算法就很容易丟失目標。

本文所提出的目標跟蹤算法利用到自適應模型更新策略，針對當前幀的目標進行衡量，根據目標是否被遮擋的置信度，自適應地更新模型。具體而言，算法基于當前幀的濾波器響應圖的APCE值衰減率，利用sigmoid函數來計算一個更新因子ηt，將當前幀的目標信息通過線性插值的方式更新至本文算法模型中，即

αt=(1-ηt)αt-1+ηtαt′

(7)

Xt′=(1-ηt)Xt-1+ηtXt′

(8)

(9)

(10)

由此，如果當前幀的目標被遮擋，所計算得到的更新因子就會較小，模型保存的更多的仍是正確的信息，進而從本質上避免了訓練樣本集被污染，有利于算法在之后的每幀中更準確地跟蹤紅外目標。

4 實驗結果及分析

本文所提出的目標跟蹤算法采用了與KCF算法相同的特征提取方法，即利用方向梯度直方圖特征，各梯度區塊為4×4像素大小，區塊中均勻提取9個方向的梯度，所獲得的特征圖維數為31維。

本文算法主要針對紅外視頻圖像，因此選取了VOT-TIR2015公開紅外數據集[17]中的部分視頻序列進行實驗。圖2、圖3、圖4和圖5分別展示了傳統的KCF算法與本文所提出的目標跟蹤算法，在birds、jacket、depthwise_crossing和crowd四個視頻序列上的跟蹤結果。圖中上一行是KCF算法的結果，下一行是本文所提出的目標跟蹤算法的實驗結果，圖中左上角的數字代表當前圖片的幀數。可以看出在圖2中，KCF算法在出現鳥群干擾后會逐漸跟偏，并在目標人物突然躲閃時跟丟，而本文所提出的算法可以在快速運動的情況下較好地跟蹤到目標。此外，由于傳統的KCF算法只利用到了輪廓紋理特征進行建模，一旦當紅外圖像中的目標的輪廓信息很少或者目標很淡的時候，如圖3和圖4所示，KCF算法在數幀過后便逐漸脫離跟蹤，不能很好地跟上目標，而本文提出的算法利用到了多模型動態決策融合機制，因而可以利用紅外目標的能量分布信息與背景進行區分，有著更好的跟蹤效果和更強的魯棒性。在圖5的場景中，待跟蹤的目標位于人群中，跟蹤過程中不斷有旁人路過干擾，KCF在路人第一次干擾時就跟丟，轉而跟蹤了錯誤的目標，而本文算法一直跟蹤到了正確的目標，顯示了對外界環境的良好抗干擾性。

圖2 KCF算法和本文算法在birds數據集實驗結果比較

圖3 KCF算法和本文算法在jacket數據集實驗結果比較

圖4 KCF算法和本文算法在depthwise_crossing數據集上結果比較

圖5 KCF算法和本文算法在crowd數據集上結果比較

5 結束語

本文針對紅外圖像中的目標跟蹤問題，提出了一種基于動態決策融合和自適應模型更新的紅外目標跟蹤方法。該方法對相關濾波器輸出響應圖的單峰特性進行定量的衡量，自適應地求取多模型決策融合因子以及模型更新系數，使得算法可以充分利用各表達模型在不同情況下的優勢，同時有效地避免錯誤信息更新至跟蹤模型中，提升了跟蹤結果的準確率。最后在公開紅外數據集上進行了實驗，并與傳統的目標跟蹤方法進行對比，有效地證明了本文所提出跟蹤算法在紅外目標快速移動、形態模糊和外界遮擋等情況下的有效性與魯棒性。