王國剛, 劉一博, 吳 艷
(山西大學 物理電子工程學院, 山西 太原 030006)
視覺跟蹤是估計圖像序列中目標的運動軌跡, 在視頻監控、 智能交通檢測、 醫學圖像分析、 行為識別等領域得到了廣泛應用. 然而, 視覺跟蹤在實際應用中仍面臨諸多挑戰, 如遮擋、 光照變化、 目標姿態變化、 尺度變化、 低分辨率、 面內旋轉等[1-2]. 早期經典跟蹤算法很難處理這些難題, 無法滿足工業需求. 隨著技術的發展, 出現了以跟蹤學習檢測(Tracking-Learning-Detection, TLD)[3]、 自適應結構局部稀疏外觀模型(Visual Tracking Via Adaptive Structural Local Sparse Appearance Model, ASLA)[4]和結構化輸出(Structured output tracking with kernels, Struck)[5]為代表的諸多跟蹤算法, 在跟蹤性能方面超越了經典算法.
近年來, 對視覺跟蹤算法的研究主要體現在深度學習和相關濾波兩個方面. 基于深度學習的視覺跟蹤算法, 利用神經網絡提取目標特征, 在大規模數據集上訓練跟蹤模型, 能夠實現精準跟蹤. 但該類算法計算復雜, 無法實現實時跟蹤. 因此, 兼備跟蹤實時性和精度的相關濾波算法倍受青睞[6-16].
2010年, Bolme等[17]首次將相關濾波的概念引入跟蹤領域, 提出最小輸出平方誤差總和(Minimum Output Sum of Square Error, MOSSE)算法. MOSSE算法的核心思想是求圖像中二維信號間的相似性. Henriques等[18]在MOSSE算法的基礎上引入循環矩陣, 使用核技巧將低維不可分的底層樣本信息映射為高維線性可分的特征信息, 提出利用循環結構的核相關濾波(Exploiting the Circulant Structure of tracking-by-detection with Kernels, CSK)算法. 相較于MOSSE算法, CSK算法性能提升顯著. 2015年, Henriques等[19]又引入多通道特征, 使用方向梯度直方圖(Histogram of Oriented Gradient, HOG)特征代替CSK算法中的灰度特征, 提出核相關濾波(Kernelized Correlation Filters, KCF)算法. 由于上述算法在跟蹤……