劉 樂 劉 勇 趙子倫 李 旭 劉天旭
(北京航天計量測試技術研究所,北京100076)
在計算機視覺領域內,目標跟蹤是一個備受關注的研究熱點。目標跟蹤是根據已知目標的特征和坐標,來預測后續視頻幀中目標所在位置。近些年來,隨著人工智能的突飛猛進以及計算機硬件設施的不斷完善,目標跟蹤技術取得了長足進步,無論是在國防軍事還是民用安全領域都有了廣泛應用,包括車輛跟蹤、智能監控、智能交互以及無人機偵察、精準制導等。
基于相關濾波的跟蹤算法是目標跟蹤領域內應用范圍廣、算法性能高的一類算法,其原理是基于已知目標特征信息,設計出一個對目標響應高,背景響應弱的濾波器,利用濾波器搜索出候選區域中響應最大的位置即為目標。2010年Bolme 等人了提出一種誤差最小平方和濾波器(Minimum Output Sum of Squared Error filter,MOSSE),通過對每幀圖像構建相關濾波器,并在頻域進行相關濾波,實現了目標的實時跟蹤。在此框架基礎上,后續出現了許多針對尺度、核、邊界效應等多方面的改進算法,極大地拓展了相關濾波的應用范圍。
f
=w
x
,找到合適的權重系數,使訓練樣本和對應的回歸值之間的誤差最小化。另外,回歸函數對輸入摻雜的噪聲極其敏感,使得輸出結果方差較大,為了解決這個問題,在回歸函數的基礎上增加懲罰項λ
來限制參數w
的增長,即,
φ
(x
),可以將低維非線性不可分的問題映射至高維空間,從而轉化為線性求解,映射后表達式為
ω
代入到公式(1)中,將ω
的優化問題轉化為對α
的求解問題,利用頻域中循環矩陣的性質可以得到

在檢測過程中,同樣是通過傅里葉變換和核空間矩陣來計算樣本的回歸值,勢必減少了流程的運算量;另外,KCF 使用的是性能較好的高斯核,其表達式為:

σ
——高斯核函數參數;F
——逆傅里葉變換矩陣。KCF 是相關濾波跟蹤算法中綜合性能較高的一種跟蹤算法,其利用循環位移的思想生成大量訓練樣本,增強了分類器的泛化能力;為了提升算法的跟蹤速度,在訓練和跟蹤過程中,將復雜的運算過程變換至頻域,進行乘積運算,極大地降低了運算量;另外,算法使用多通道的HOG 特征替代單一的灰度特征,有效地提升了跟蹤器性能。如圖1所示,為KCF 的工作框架,首先根據第一幀圖像中目標的特征初始化相關濾波器模型,之后利用該模板搜索后續幀序列圖像中響應最大的位置,即為該幀圖像的目標位置;同時利用每幀圖像的目標位置對濾波器模型參數進行更新。
式中:σ—應力(Pa);Dε—彈性矩陣;ε—應變;γ—泊松比;E—彈性模量(Pa);α—熱膨脹系數(1/K)。

圖1 基于核相關濾波目標跟蹤算法框架Fig.1 Tracking algorithm framework based on correlation filter
KCF 是一種判別式跟蹤算法,這類方法將跟蹤問題轉換為分類問題。因此,如何訓練出一個可靠的分類器是該算法的關鍵。為了適應目標和場景的輕微變化,KCF 在跟蹤過程中根據每一幀的目標位置對濾波模板進行更新,提升了算法的抗干擾能力。其濾波模板更新采用的策略是線性疊加,具體表現形式為:

F
——第t
幀跟蹤模板;F
——第t
-1 幀的跟蹤模板;μ
——學習率。這種簡單的模板線性融合機制忽略了不同時期濾波模板對跟蹤模板的影響程度,當學習率過大,在出現目標丟失、遮擋以及圖像模糊等情況時,模型會累積學習背景信息,導致模型向背景漂移,無法再次跟蹤到目標;當學習率過小時,模型的更新程度過慢難以滿足目標變化速度,使得濾波模型判別能力降低。
因此,本文提出了一種增量式多模板的更新方法,即融合了分別基于當前幀、前一幀和歷史幀中置信度最高的跟蹤結果所建立的跟蹤模板。置信度越高代表該幀中目標特征越明顯,未被遮擋或未受到光照等因素的影響,以此為基礎建立的模板性能也更好。因此在模板更新中引入歷史幀中置信度最高的濾波模板能夠有效減小對模板的污染。為了更準確地衡量跟蹤結果的可靠性,引入APCE
(average peak-to-correlation energy)來判斷跟蹤是否穩定,其表達式為:
F
——響應矩陣的最大值;F
——響應矩陣的最小值;F
表示響應矩陣中第w
列第h
行的元素值。圖2 是目標丟失和準確跟蹤兩種情況下的特征響應圖,紅色框為目標實際坐標,綠色框為算法預測結果。可以看出APCE
能夠準確地反映出算法跟蹤結果的可靠程度,當目標被準確跟蹤時,APCE
值較大且響應矩陣具有尖銳的響應峰;當目標丟失時,APCE
快速下降,響應矩陣出現多個平滑波峰。
圖2 目標跟蹤響應矩陣Fig.2 Target tracking response matrix
增量式多模板融合策略在模板更新過程中引入歷史置信度最大的濾波模板,以降低各種干擾對模板帶來的負面影響,表現形式為:

μ
——置信度最大跟蹤模板的學習率;F
——歷史幀中置信度最大的濾波模板。這種增量式多模板更新策略最大程度地保留了模板的歷史信息,確保目標特征信息來源的多樣性,提升了算法的泛化性能;另外基于高置信度跟蹤結果所建立的濾波模板可靠性較高,能夠減小因引入背景信息給模板帶來的污染,克服模板漂移。良好的尺度估計是確保目標跟蹤算法穩定跟蹤的一個重要因素,KCF 將目標的跟蹤尺度設為固定值,沒有為尺度變化的目標建立自適應的模型,因此當目標的尺度發生變化時,算法難以自適應地改變跟蹤框的大小。當目標尺度增大時,固定尺寸的跟蹤框難以包含整個目標,從而無法提取目標全部的特征信息,極易造成跟蹤失敗;當目標尺度減小時,跟蹤框內包含了背景信息,可能導致算法過擬合。因此為了減小因目標尺度變化所帶來的干擾,本文提出了一種尺度自適應估計的方法。
假設初始目標尺度為M
×N
,在經過尺度因子S
={S
,S
,…,S
}加權后,可以得到跟蹤窗口大小為m
×n

Z
=(Z
,Z
,…,Z
),在樣本經過相關濾波后,可以計算出各個樣本的輸出響應值:
z
——第i
個樣本;K
——樣本z
與模板x 之間的相關性,α
——濾波器。其中最大的特征響應值所對應的尺度即為當前幀目標的最佳尺度因子,為了獲得更加穩定的自適應尺度,使用高斯分布函數對目標尺度進行優化,將最大輸出響應定義為:
g
(z
)——尺度因子S
對應的輸出響應;P
(S
)——選取尺度因子S
時高斯分布的可能性。由此可以得到最大后驗概率下的最佳尺度因子為
由此可以得到最佳尺度窗口:

通過預先設定的尺度因子在目標附近生成多個樣本,計算每個樣本與濾波模板的響應,響應越大則表示當前尺度下的樣本包含的目標信息越多,由此可以得到一個最適合當前幀的目標跟蹤框。
試驗選擇公開數據集OTB50 作為測試用例,該數據集包括了遮擋、光照變化以及快速運動等多種場景。試驗將增量式多模板融合策略和尺度自適應估計逐步疊加至KCF,以驗證該兩種抗干擾設計的有效性。為了更好地衡量本文基于KCF 抗干擾設計的性能,采取準確率、精度以及FPS 作為試驗定量的評價指標。精度是指預測目標位置與真實目標位置的歐式距離小于某個閾值的幀數占總幀數的百分比,歐式距離表達式為

如表1所示,為標準KCF 和抗干擾KCF 的性能對比,從表1 中的指標對比可以看出,增量式模板融合策略和尺度自適應估計均對KCF 跟蹤結果有所提升。在20 像素的閾值下,抗干擾KCF 跟蹤精度為0.826,相比KCF 提高了12.3%;而在0.5的重疊率閾值下,抗干擾KCF 的準確率為0.809,相比標準KCF 提升13.4%。由此可以說明,本文的兩種抗干擾設計能夠處理目標遮擋以及目標尺度變化,實現穩定準確的跟蹤。

表1 增量式多模板融合策略性能對比Tab.1 Performance comparison of incremental multi template fusion strategy
為了更加直觀的展示本文算法在抗干擾方面的優良性能,選取了存在遮擋、尺度變化以及未有干擾的三組圖像序列進行對比說明,如圖3所示,為標準KCF 以及抗干擾設計后的跟蹤效果,紅色框為抗干擾KCF 跟蹤結果,綠色框為標準KCF 跟蹤結果。圖3(a)是目標未受到任何干擾時,兩種算法跟蹤效果相差不大;而在圖3(b)(c)目標受到光照干擾和遮擋影響時,原有的KCF 很難在干擾中穩定跟蹤或者在干擾消失后出現目標丟失的問題;而抗干擾KCF 能在光照和目標被遮擋時穩定捕捉到目標;圖3(d)為目標尺度變化時的跟蹤效果,可以看出當目標尺度發生變化時,KCF 固定大小的跟蹤框中逐漸出現大量背景信息,不斷疊加至濾波模板,最終導致目標丟失。因此本文提出的基于KCF 的抗干擾方法能夠應對目標遮擋、光照變化以及目標尺度變化的狀況。

圖3 不同場景下跟蹤效果Fig.3 Tracking effect under different scenarios
本文基于KCF 進行抗干擾目標跟蹤算法的研究。KCF 在模板更新時采用線性融合的方式,遇到目標遮擋或光照等因素干擾時,極易引起模板的漂移,對此,本文提出增量式多模板融合的策略,減小背景信息給濾波模板帶來的污染,提升算法的魯棒性;另外,KCF 采用固定大小的跟蹤框,難以應對目標尺度變化的情況,本文進行尺度自適應設計以增強算法的抗干擾性。最后通過試驗驗證,與標準KCF 相比,本文提出的抗干擾KCF 在遇到干擾時擁有較強的魯棒性。