董 娜 劉 軍
(蘭州理工大學機電工程學院 蘭州 730050)
視頻目標跟蹤[1~2]是計算機視覺領域的研究熱點之一,其在人機交互[3]、車輛導航[4]、智能監控[5]等諸多方面有著廣泛的應用前景。盡管各學者在該學科進行了大量研究,但是在針對復雜環境下的目標跟蹤問題上依然存在很多需要克服的難點,如視頻序列中的光照變化、尺度變化、姿態變化、背景雜波等干擾因素。
粒子濾波算法[6~8]有效地解決了非線性動態系統分析的難題,為目標跟蹤中的非線性與非高斯情況下的跟蹤提供解決辦法。但是傳統的粒子濾波算法也存在一些問題,其中有單個特征描述目標外觀導致跟蹤的魯棒性差的問題和跟蹤粒子的貧化問題。近年來,學者們基于此提出了一些改進算法。部分學者將顏色特征與紋理特征進行融合[9~13],克服了光照和姿態變化等因素的影響。Wang[14]用遺傳算法的交叉變異生成新粒子來改變粒子貧化問題。Zhang[15]在將分塊思想應用到粒子濾波框架下解決遮擋問題。盡管這些算法能夠一定程度上提高目標跟蹤的穩定性,但是在面對復雜環境下的跟蹤問題時存在多種因素的影響,例如光照變化尺度變化、形變等,就會使跟蹤精度大大降低。
因此為了應對上述存在的問題,本文提出了一種多特征自適應融合的粒子濾波目標跟蹤算法。該算法主要包括兩點優勢:1)進行特征融合時,采用動態分層融合方法。該方法首先通過計算每個特征的粒子相似度值的方差來判斷哪個特征為分層的基準特征,進而以該特征的相似度值的大小為基礎將粒子群進行分層,給每層的粒子群賦予不同的權重參數,然后計算每個粒子非基準特征的權重值,最后根據該權重值和分層得到的權重參數來計算雙特征下的融合權重值。2)在生成候選樣本時,利用幀差法檢測出運動目標物體的區域作為輔助候選樣本來充盈粒子的多樣性。實驗表明,本文提出的算法在應對光線變化、尺度變化、形變問題時有較高的穩定性。
為了判斷HOG 特征與顏色特征哪個特征在每幀中具有較好的區分度,本文通過比較兩個特征相似度值的方差值來進行判斷,進而基于擁有較大方差值的那個特征來進行粒子分層。
2.1.1 方差值比較
通過統計方式得到第i 個粒子的HOG 特征向量為pi_HOG,目標樣本的HOG 特征向量為qHOG,第i個粒子與目標樣本之間的Bhattacharyya距離[16]為

同理用式(2)求的粒子顏色特征的方差值Vcolor。
得到每個特征相似度值的方差后,通過比較每個特征相似度值的方差值大小來確定分層特征:

上式(4)中x 代表分層特征。
2.1.2 分層融合策略
假設P1,P2,…,Pn為n 個候選樣本,其對應特征x 的相似度值為d1_x,d2_x,…,dn_x,并且滿足d1_x≥d2_x≥d3_x…≥dn_x,則分層融合策略具體表現為

通過上式看出,我們根據其相似度值的大小將粒子分為好中差三層,然后依次給每層的粒子賦予不同的權重參數。
n個候選樣本對應特征y 的權重值為

兩特征融合后的權重為

通過上式可以看出,本文分層法融合策略采用的優中選優的思想,因此能夠充分利用兩特征的優良信息。
針對單純的粒子濾波算法不能應對消失后重跟和目標尺度變化的問題,本文采用幀差法[17]輔助生成預測粒子,即利用幀差法檢測出運動目標的剪影,然后經過腐蝕膨脹過程得到閉合區域,最后利用外接矩形法得到運動物體的區域。
設F1,F2,…,Fm為檢測得到的m 個運動區域,其對應的相似度值dF1_total,dF2_total,…,dFm_total,通過比較其相似度值選出最大的那個區域加入的粒子群中去,具體表達為

隨著目標的運動和外界環境的光線變化,目標的外觀發生變化,采用一層不變的目標模板會導致跟蹤精度降低。因此,需要采用目標更新的方式來解決該問題。并且模板更新的方式決定目標模板的準確度,過快的更新將會導致目標模板中引入錯誤信息,過慢的更新將會導致目標模板無法匹配目標外觀的變化。
本文采用當前跟蹤目標與目標模板間匹配的Bhattacharyya 系數來確定是否更新模板,具體表現為

當d >β時,對模板進行更新,更新方式為

式中:qt表示第t 幀目標模板,pt表示本幀跟蹤的目標,α 為更新速率因子。本文 β=0.6,α=0.2。
本文算法流程如下:
1)初始化。在視頻初始幀手動選擇要跟蹤的目標的區域,并提取該區域內的HOG 特征向量和HSV空間的顏色特征向量,并在目標周圍利用高斯分布初始化N個粒子{p1,p2,…,pn}。
2)粒子傳播。通過給重采樣得到的粒子集加入高斯噪聲,使其向周圍傳播生成預測粒子{p1,p2,…,pn}。同時利用幀差法檢測運動物體的區域{F1,F2,…,Fm}。
3)權值更新。計算每個預測粒子的各個特征的相似度值,同時計算用幀差法檢測得到的若干個運動區域的對應特征的相似度值,并根據2.1 節描述的多特征融合的方法計算融合權重,然后進行歸一化。
4)重采樣。完成權值更新后得到每個候選樣本的融合權重,根據每個粒子融合權重值大小,采用重要性采樣方法對粒子組進行重采樣。
5)狀態估計。選擇擁有最大權重值的粒子為目標最新狀態。
6)模板更新。當估計出當前幀目標的位置后,根據2.3節介紹的模板更新方式完成模板更新。
為了較好地說明本文算法相較于傳統粒子算法跟蹤精度上的提高,本文將本文算法和傳統粒子算法基于HOG特征和基于HSV顏色特征跟蹤結果進行比較。為了更公平的比較,本文算法和傳統粒子濾波算法都將粒子數設定為100。并且采用相同的實驗環境下進行。其硬件實驗平臺:CPU 為Intel(R)3.4GHz,RAM為4GB,計算機系統為Win7×86bit。 軟件配置為引入開源圖像處理庫OpenCV2.4.9的Visual C++2010。
本實驗通過對兩個視頻的跟蹤結果的分析來說明本文算法的優勢,這兩個視頻分別為Singer1和basketball,其中Singer1 視頻中跟蹤目標為一個白色衣服的女歌手,其存在的主要跟蹤挑戰性因素為:劇烈光線變化和尺度變化;Basketball視頻中跟蹤的目標為穿綠衣服的9 號球員,其存在的主要的跟蹤挑戰因素為部分遮擋、形變和的背景雜波。下面為跟蹤的結果圖。

圖1 Singer1跟蹤效果圖

圖2 Basketball跟蹤效果圖
圖1 展示的是我們跟蹤Singer1 視頻中穿白色長裙的女歌手的跟蹤效果圖,通過該圖可以看到基于顏色特征的粒子濾波算法在第114 幀光線發生劇烈變化時已經完全跟丟,213 幀時由于光線又恢復如初其又重新跟蹤到目標。基于HOG 特征的粒子濾波算法在光線發生變化時雖然沒有跟丟,但是得跟蹤框的尺寸和實物差別慢慢增大,而且在目標實物縮小時,其跟蹤框的尺寸不但沒有縮小,而且持續變大,導致后面跟蹤的誤差很大。本文算法在應對光線變化時能夠穩定跟蹤,同時其跟蹤框的尺度也能隨目標的尺度的變化進行自動調整。圖2展示的我們跟蹤視頻Basketball視頻中穿綠色球服9 號球員的跟蹤效果圖,通過該圖可以看出,基于顏色特征的粒子濾波在472 幀之前雖然存在偏差但是沒有跟丟目標,472 幀時其已經出現偏離跟蹤目標的現象,后面跟蹤則是完全跟丟。基于HOG特行的粒子濾波在第62 幀時,就出現跟蹤偏移,之后幀中則是完全跟丟。本文算法無論目標發生多大的形變,其都能穩定跟蹤目標。
圖3、圖4 中展示的singer1 視頻和Basketball視頻的跟蹤結果評價圖,其橫軸表示視頻幀數,縱軸表示跟蹤的中心偏差,紅色曲線表示本文算法的評價曲線,綠色曲線表示基于HOG 特征的粒子濾波的跟蹤評價曲線,藍色曲線表示基于顏色特征的粒子濾波的跟蹤評價曲線。根據該評價圖也能夠看出本文算法相對傳統粒子濾波算法擁有較高的跟蹤穩定性。

圖3 Singer1跟蹤結果比較圖

圖4 Basketball跟蹤結果比較圖
本文針對傳統粒子濾波算法存在的不足之處,提出了多特征自適應融合的粒子濾波算法。該算法在建立目標外觀模型時采用動態分層融合策略,使得該目標模型更能充分描述目標信息。同時本文還采用幀差法來檢測運動區域來降低粒子的貧化現象。實驗表明,本文算法在應對光照變化、部分遮擋、形變等有著不錯的效果。