胡學剛,劉忠振
(1.重慶郵電大學 計算機科學與技術學院,重慶400065;2.重慶郵電大學 系統理論及其應用研究中心,重慶400065)
運動目標檢測與跟蹤的研究是計算機視覺領域中一個重要的研究領域,廣泛應用于智能交通系統[1-2]、安防監控[3-4]、微生物研究[5-6]和飛行導航[7-8]等許多方面。
復雜的背景和目標不規律的運動通常是造成運動目標檢測與跟蹤困難的主要因素[9]。近年來,不少學者對該問題展開了深入的研究,并提出了一些不錯的檢測與跟蹤方法[10-12]。然而,對運動目標進行檢測與跟蹤結果仍不理想。在目前的方法中,姚鳳會等等首先利用光流法來檢測出運動目標,然后結合卡爾曼濾波預測和顏色特征匹配兩種方法可實現對運動目標的跟蹤[13]。但這種方法容易受到噪聲等的干擾,例如當圖像中背景較復雜或者目標較模糊時,不僅處理速度低,跟蹤效果也不好。Rowe等利用混合高斯模型背景建模法檢測運動目標,并通過卡爾曼濾波,使用運動目標的顏色直方圖和形狀模型進行匹配判斷達到跟蹤的目的[14]。由于該方法的跟蹤參數是固定值,因此不能進行及時有效的更新,使得跟蹤的穩定性較差,進而影響到后續的跟蹤準確性。Blanding等使用極大似然概率數據關聯來跟蹤目標,能夠在可視性較差的情況下完成跟蹤工作[15],但是該方法跟蹤的準確性還有待進一步的提高。Pan等利用粒子濾波進行視頻中運動目標的跟蹤,算法具有很強的穩定性,并且對于單目標的跟蹤效果良好[16-17],但是對于多目標跟蹤的精確性方面效果有些差強人意。
針對運動目標檢測與跟蹤算法較難同時保證準確性和穩定性的問題,本文提出了一種有效的方法。首先在高斯背景建模中,采用了分塊拼接的方式來初始化背景模型,并且利用動態權值完成背景自適應更新,使得背景模型能夠持續有效,再采用背景差分法檢測出運動目標。在目標跟蹤中,將檢測到的運動目標區域和質心位置信息作為Kalman預測的狀態信息,結合其他相關參數完成運動目標的預測跟蹤,并且對觀測噪聲矩陣進行自適應取值,使得跟蹤的穩定性得到加強。
背景差分法是運動目標檢測中使用最廣泛的一種方法。該方法能夠完整的檢測出運動目標,且算法簡單、快速。不過,此種方法的檢測效果與提取的背景質量成正比。因此,背景的生成成為該方法最關鍵的步驟。背景的生成分為兩部分:背景的初始化和背景的更新。一般來說,背景的更新是小范圍的,背景的初始化至關重要。
本文針對背景的初始化,在非相鄰二次幀間差分法的基礎上,采用背景區域拼接的方式,從而得到一個相對理想的初始化背景。然后通過對圖像中每個像素點進行高斯建模,從而完成背景隨時間的更新過程,保證背景的持續有效。由于目標在運動的過程中相鄰幾幀之間經常會發生過多的交集,所以在二次幀差法做輔助進行背景初始化的過程中使用的是非相鄰二次幀差法,如1、6、11幀圖像。
選取閾值T1,通過二次幀差法檢測出第6幀圖像中的運動目標二值圖像,接著利用數學形態學方法對所得圖像進行補充孔洞,然后通過鄰域濾波法對所得二值圖像進行處理從而消除孤立點噪聲,用0.5作為閾值來得到一個處理后的二值圖像。這個二值圖像可以粗略的表示為運動目標所在的位置,為后續工作中的背景提取作鋪墊。
對此時二值圖像中的各個區域進行標志,并且按區域面積從大到小進行排序。選取區域面積大于100的區域,其他的小區域舍棄。對于剩下的區域匹配出一個矩形框,且此矩形框比所在區域的最小矩形框稍大一些,以此來保證運動目標被包含在此矩形框中,且本文中選取1.1作為長和寬放大系數。
對視頻第6幀中選取的矩形區域進行挖空處理,然后使用其他幀中的相對應區域進行背景的拼接。這樣保證靜態背景初始化的良好,從而使得提取的背景在差分中的精確性。
以上便完成了背景的初始化工作,下面將對背景進行高斯建模并完成持續有效的更新。
為了提高算法效率,降低時間復雜度,本文在對背景建模的時候先對視頻圖像序列轉化為灰度圖像,即圖像中每個像素點的值從3維變成1維,以減少后續的計算量。此時,視頻圖像中每個點(x,y)的像素灰度值看作獨立的高斯分布,即

其中μ(x,y)和是σ(x,y)分別是(x,y)位置灰度值的均值和標準差,通過視頻前N幀序列初始化高斯模型,μ(x,y)和方差σ2(x,y)的初始值為

這里Ii(x,y)是第i幀圖像在點(x,y)處的灰度值。因為前面已經通過區域拼接實現了背景模型的初始化,所以高斯模型中的μN(x,y)不作為初始化背景的數據,只作為背景更新的初始數據。在整個算法過程中,高斯模型的主要作用是實現背景更新。
現在來考慮背景模型的更新。首先設置一個控制更新幅度值T2為初始更新閾值,使得圖像分為兩個區域:背景更新區域和非更新區域。注意此處的非更新區域和前景區域不對等,且非更新區域包含前景區域。設1表示該像素點需要進行背景更新,0表示不需要進行背景更新,Ki(x,y)為背景更新區域二值掩模圖。即

且

在背景更新過程中,作為背景學習率的權值α控制著更新的幅度。一般而言,α值經常取為固定常數。為保證更新的自適應性,這里采用動態權值α進行更新,且與高斯分布中的概率ρ相關。根據高斯分布,得出第i幀圖像在點(x,y)處灰度值的概率,即

且背景動態學習率設為α為

通過式(5)-式(7)可以得出,若更新區域像素點概率越小則更新作用越大,否則越小。利用背景差分閾值T3來檢測出背景區域,即

式(4)和式(8)中T2、T3分別是低、高閾值,使得灰度值在兩者之間的像素值不參與背景模型的更新,從而獲得更可靠的背景更新。
Kalman濾波器是一種線性遞歸濾波器,基于系統以前的狀態序列對下一個狀態做最優估計,預測時具有無偏、穩定和最優的特點。Kalman濾波的狀態預測方程定義為
X(k|k-1)=AX(k-1|k-1)+BU(k)(9)式中:X(k|k-1)——通過k-1時刻狀態值來對k狀態的預測值,X(k-1|k-1)——k-1時刻最優估計狀態值,U(k)——k時刻的控制量,A——狀態轉移矩陣。這里,狀態轉移矩陣A為

式中:t——現在狀態與上一狀態間的時間間隔數,且定義相鄰兩幀間的時間間隔為1。
用P(k|k-1)來表示與預測值X(k|k-1)相對應的誤差協方差,即

根據k時刻的測量值和預測值,得出k時刻的最優估計值為

式(12)中H為觀測矩陣,其值可以設為

Kg為卡爾曼濾波增益(Kalman Gain)

式(14)中R為觀測噪聲協方差,且誤差協方差矩陣初始值P(0)可以設為

最后對k時刻與X(k|k)對應的誤差協方差進行更新

在實際的運動目標跟蹤中,因為存在著場景光暗變化等干擾因素,所以運動目標檢測算法的精度不可能恒定不變,即實際的觀測噪聲是不斷變化的,也就是說在Kalman濾波預測過程中,觀測噪聲協方差不是一個固定值。因此,如果在預測過程中依然使用固定的觀測噪聲協方差矩陣R是不合理的,將使得跟蹤效果誤差增加。本文受文獻[18]啟發,為了能夠保證跟蹤效果的更加精確,提出一種觀測噪聲協方差矩陣R自適應的算法。
在本實驗室中,最后所得最優估計信息為運動目標的形心坐標。基本過程為:首先通過檢測來得到目標形心坐標,然后通過Kalman濾波得到形心坐標預測值,最后根據預測所得的預測值和檢測所得的狀態值來獲得最優估計值,從而完成運動目標跟蹤。
由于在運動目標檢測與跟蹤中,可以近似的認為系統噪聲協方差Q是恒定值,那么跟蹤誤差的主要原因便是觀測噪聲協方差R。通過對狀態轉移矩陣A中t值的兩次不同選取,利用兩次Kalman濾波得到目標形心坐標的兩個最優估計值,分別記作X1(k|k)和X2(k|k)。為了判斷當前觀測噪聲協方差R的估計是否精確,設定一對上下門限high和low。如果|X1(k|k)-X2(k|k)|>high,即兩個最優估計值之差大于上門限時,則認為觀測噪聲估計偏高,需要增加觀測值的可靠性,取R=λ1R,其中0<λ1<1;如果|X1(k|k)-X2(k|k)|<low,即兩個最優估計值之差小于下門限時,則認為觀測值的可靠性降低,需要提高觀測噪聲協方差,取R=λ2R,其中λ2>1。其他情況下,當low<|X1(k|k)-X2(k|k)|<high時,則R的值保持不變。即

本文采用靜止攝像頭下的室內人體運動和室外車輛運動視頻圖像進行實驗,其中實驗參數設定為:T1=20,T2=15,T3=40,high=1,low=0.001,λ1=0.5,λ2=1.5。實驗結果如下圖所示。
圖1為室內運動人體的檢測與跟蹤圖。其中(a)和(b)分別為第16幀、25幀經過背景差分后的二值圖像,可以看出目標檢測較為完整且穩定有效;(c)和(d)分別為第16幀、25幀通過Kalman濾波器的目標跟蹤圖,可以看出目標跟蹤較為準確且穩定有效,其中綠色 “+”為目標質心的最優估計位置。圖2為室外運動車輛的檢測與跟蹤圖。其中(a)和(b)分別為第333幀、345幀經過背景差分后的二值圖像,(c)和(d)分別為第333幀、345幀通過Kalman濾波器的目標跟蹤圖,可以看出效果同樣良好。圖1屬于室內非剛體運動,其目標形狀時刻變化且陰影、反射等干擾較大;圖2屬于室外剛體運動,其目標形狀基本不變且光線、樹枝抖動等干擾較大。通過圖像結果可以看出:在這兩種情況下,本文算法具有較好的抗噪聲性能,都能夠完成準確、穩定的檢測和跟蹤。
本文提出了基于高斯模型和卡爾曼預測的檢測與跟蹤算法:利用背景區域拼接和非相鄰幀二次差分來獲得初始背景,加強了背景初始化的準確性;依據每個像素點建立高斯模型,對背景進行持續有效的更新,從而保證目標檢測的持續有效;在目標跟蹤中,引入Kalman預測方法,結合目標檢測獲得一個良好的跟蹤效果。本文算法能夠快速有效地檢測出運動目標,并且在跟蹤方面取得良好的效果。

[1]WANG Wei,YAO Minghai.Intelligent transportation monitoring system based on computer vision[J].Journal of Zhejiang University of Technology,2010,38(5):574-579(in Chinese).[王為,姚明海.基于計算機視覺的智能交通監控系統[J].浙江工業大學學報,2010,38(5):574-579.]
[2]XU Yang,WU Chengdong,CHEN Dongyue.Survey of videobased image traffic automatic incident detection algorithm[J].Application Research of Computers,2011,28(4):1206-1210(in Chinese).[徐楊,吳成東,陳東岳.基于視頻圖像的交通事件自動檢測算法綜述[J].計算機應用研究,2011,28(4):1206-1210.]
[3]TANG Yiping,HE Zuling,JIN Ye,et al.ATM intelligent surveillance based on ODVS[J].Journal of Zhejiang University of Technology,2010,38(1):26-32(in Chinese).[湯一平,何祖靈,金冶,等.基于全方位計算機視覺的ATM機智能監控[J].浙江工業大學學報,2010,38(1):26-32.]
[4]TANG Yiping,HU Feihu.Theft detection based on omni-directional vision sensors[J].Journal of Computer Applications,2010,30(1):36-40(in Chinese).[湯一平,胡飛虎.基于全方位計算機視覺的盜竊事件檢測[J].計算機應用,2010,30(1):36-40.]
[5]GE Yun,ZHANG Dong.Automated methods for particle tracking of the intracellular transport of clathrin-coated pits and vesicles[J].Journal of Southeast University(Natural Science Edition),2009,39(3):464-467(in Chinese).[葛云,章東.活體細胞圖像斑點的自動提取和跟蹤方法[J].東南大學學報:自然科學版,2009,39(3):464-467.]
[6]CHEN Yuan,ZHAO Zhimin,LIU Lei.Automatic tracking and measurement of blood cells motion in microcirculation based on ST image[J].Journal of Southeast University(Natural Science Edition),2011,41(1):72-76(in Chinese).[陳遠,趙志敏,劉磊.基于ST圖的微循環血細胞自動跟蹤與測量技術[J].東南大學學報:自然科學版,2011,41(1):72-76.]
[7]CUI Hao,CHEN Xiaotian,YANG Weiping,et al.Passive tracking of maneuvering target with image aiding[J].Infrared and Laser Engineering,2011,40(8):1594-1600(in Chinese).[崔顥,陳曉天,楊衛平,等.圖像輔助的機動目標被動跟蹤[J].紅外與激光工程,2011,40(8):1594-1600.]
[8]HUANG Changzhuan,WANG Biao,YANG Zhong.Fast pose estimation method for flight vehicles based on computer vision[J].Computer Measurement & Control,2009,17(7):1378-1380(in Chinese).[黃長專,王彪,楊忠.基于計算機視覺的飛行器姿態快速估計方法[J].計算機測量與控制,2009,17(7):1378-1380.]
[9]XIAO Guoqiang,KANG Qin,JIANG Jianmin,et al.Tracking video object based on central macroblocks[J].Chinese Journal of Computers,2011,34(9):1712-1718(in Chinese).[肖國強,康勤,江健民,等.基于中心宏塊的視頻目標跟蹤算法[J].計算機學報,2011,34(9):1712-1718.]
[10]Subudhi B N,Nanda P K,Ghosh A.A change information based fast algorithm for video object detection and tracking[J].IEEE Transactions on Circuits and Systems for Video Technology,2011,21(7):993-1004.
[11]Jazayeri A,Hongyuan Cai,Jiang Yu Zheng.Vehicle detection and tracking in car video based on motion model[J].IEEE Transactions on Intelligent Transportation Systems,2011,12(2):583-595.
[12]ZHENG Kebiao,HUANG Wenqing,ZHANG Zuoli,et al.Occlusion handling in moving object tracking system[J].Computer Engineering and Design,2009,30(11):2816-2818(in Chinese).[鄭可飚,黃文清,張佐理,等.運動目標跟蹤系統的遮擋問題處理[J].計算機工程與設計,2009,30(11):2816-2818.]
[13]Yao Fenghui,Sekmen A,Malkani M J.Multiple moving target detection,tracking,and recognition from a moving observer[C]//New York:Proceedings of the IEEE International Conference on Information and Automation,2008:978-983.
[14]Rowe D,Reid I,Gonzalez J,et al.Unconstrained multiplepeople tracking[C]//Proceedings of the 28th DAGM Symposium.Berlin:Springer,2006:505-514.
[15]Blanding W R,Willett P K,Bar-Shalom Y.Multiple target tracking using maximum likelihood probabilistic data associa-tion[C]//Proceedings of IEEE Aerospace Conference.Big Sky,2007:1-12.
[16]Pan P,Schonfeld D.Dynamic proposal variance and optimal particle allocation in particle filtering for video tracking[J].IEEE Transactions on Circuits and Systems for Video Technology,2008,18(9):1268-1279.
[17]Angelova D,Mihaylova L.Extended object tracking using monte carlo methods[J].IEEE Transactions on Signal Processing,2008,56(2):825-832.
[18]WANG Xianghua,QIN Zheng,YANG Xinyu,et al.Adaptive algorithm for adjusting observation noises based on double-Kalman filter[J].Systems Engineering and Electro-nics,2010,32(2):232-234(in Chinese).[王向華,覃征,楊新宇,等.基于兩次Kalman濾波的觀測噪聲自適應調整算法[J].系統工程與電子技術,2010,32(2):232-234.]