李亞文 趙 杰 張 鑫
(商洛學院電子信息與電氣工程學院 商洛 726000)
隨著多媒體信息的快速發展,由圖像序列構成的視頻流,成為人們處理信息的主要對象[1],利用計算機模擬人類視覺來接收環境信息成為急需實現的技術[2],計算機視覺研究領域的一個核心方向就是目標跟蹤,近幾年由于社會安全問題的突出,視頻監控技術逐漸成為行業內的研究熱點之一[2~3],目前研究的監控視頻中的目標跟蹤算法很多[2~5],主要是針對特定的應用場景,缺少適用性,但目標跟蹤是視頻圖像處理的基礎,所以對視頻序列目標跟蹤算法的研究很重要,也非常具有挑戰性。運動目標跟蹤有很多的應用,視頻監控領域,醫療診斷和生物學研究,基于視頻的人機交互,自動駕駛及機器人領域[5~6]等。
國外對目標跟蹤技術研究的比較早,20世紀中期,GAC公司研發了自動地形識別跟蹤系統ATRAN(Automatic Terrain Recognition and Naviga?tion)[4];在 1997年,美國國防高科技計劃局資助了研究項目 VSAM(Video Surveillance and Monitor?ing),該項目實現的是,對于復雜的重要區域中(如戰場)的人員,通過分布式網狀傳感器進行監視,操作人員只需進行簡單的平臺操作[6];另外美國噴氣動力實驗室開展了5項關于目標檢測跟蹤技術的研究項目。在2000年,DARPA建立了遠程人類識別計劃[7],包括著名的麻省理工大學,加州理工大學,卡內基梅隆大學在內的等15所大學和5個研究中心參與了該項目的研究。國內對目標跟蹤技術的研究相對落后一些。在1995年,華中科技大學研發的多模成像系統,實現了對復雜背景下目標的跟蹤、識別敵方干擾等工作[6],到2002年,對該系統進行了進一步的研究,實現了在復雜背景下對不同角度的目標進行自動檢測和跟蹤[5-6]。南京理工大學開發了“庫區視頻智能監控和跟蹤系統”,該系統采用MeanShift算法的跟蹤思路,對監控范圍內的目標進行跟蹤。2002年~2003年,中國科學院模式識別國家實驗室成功舉辦了每年一次的智能視頻監控會議,推動了國內視頻監控技術的快速發展[7]。
根據最近鄰估計法[8~9],首先需要給定 n 個樣本數據,從這些樣本數據中得到概率密度函數,特選定x為中心,使其不斷的擴大半徑,直到區域中包含至少有k個樣本數據為止(k是關于n的函數),于是得到x處的概率密度估計值。
建立目標的顏色概率密度模[10]:令xi,i=1,…,n表示中心位于o點的模型像素點位置,然后通過離散的m維顏色直方圖來表示目標顏色分布,令表示在點xi處的顏色集合。假設模型的大小是經過規范化處理的,則核半徑r=1。顏色在模型中的概率q可由式(1)計算得到:

其中c是規范化常數:

核函數K(x)是通過數據點到區域質心距離大小來確定點的權值[10~11]。進一步對搜索區域進行表述:令 yi,i=1,…,m表示以y為中心的搜索區域中的像素點位置,并和上面的描述保持一致,顏色u在搜索區域中的概率p可表示為式(3):

其中ch是規范化常數:

最后,通過匹配顏色概率密度來確定跟蹤目標位置[11]。匹配過程使用Bhattacharyya系數 ρ :

ρ的計算數值越大,表明目標與搜索區域顏色概率密度越接近。
具體的MeanShift算法跟蹤原理實現框圖如圖1所示。

圖1 MeanShift算法跟蹤原理
選取錄制的一監控段視頻ymq.avi,大約15s,將視頻轉化為多幀的圖像序列,選取其中的一些圖像幀,將目標全可見圖像圈定跟蹤目標,用醒目的顏色方框標識。對視頻中的運動人物進行跟蹤,在Matlab7.10中進行仿真實現,查看目標跟蹤的結果及運動軌跡。

圖2 基于Mean-shift算法的運動目標跟蹤結果
實驗仿真中對打羽毛的人進行運動目標跟蹤,首先在第4幀中手動確定了一個包含所有目標特征的矩形框,將其內容作為目標模板。然后在后續幀中采用基于Mean-shift目標跟蹤算法對其進行跟蹤。在打羽毛的球過程中,運動員的身體不斷地變化,由圖2中的實驗結果示意圖能夠看出,剛開始還能較好地跟蹤運動形態變換較小的人,但是當運動目標運動速度加快時,目標中心點的定位會有較大的偏差,如圖2中第115幀和第222幀等所示。可見該算法對運動速度較快的目標跟蹤不適用,容易導致目標跟蹤失敗,因此提出了基于Cam?Shift算法進行視頻中的運動目標進行跟蹤。
CamShift算法的主要針對MeanShift算法的缺點,對其改進了兩點[12~13],第一是可以對連續的圖像序列進行目標跟蹤計算,第二是計算得到的目標區域的大小是變化的,使其自適應能力增加了。算法的主要思想[14]是利用目標區域在HSV顏色空間的H分量直方圖作為目標特征進行跟蹤的。先使用目標的顏色直方圖模型把圖像換為顏色概率分布圖,初始化一個搜索窗口的大小和位置,然后根據上一幀得到的結果自適應調整搜索窗口的大小和位置,找到當前圖像中目標的中心位置,之后自動更新窗口的中心、寬度,就能逐漸顯示出每一幀的圖像了。Camshift算法實現流程圖如圖3所示。

圖3 Camshift算法實現流程圖
本次實驗仿真采用一段截取的監控視頻walk.avi,時長是 13s,幀率是 20幀∕s,首先獲得視頻的總幀數,它的幀數是405幀,然后獲取視頻的初始幀,在其上面選取一個搜索窗口,搜索窗口的選擇要和背景顏色區分開來。仿真出來視頻的運動軌跡如圖4所示,隨著時間的延長,那個搜索窗口的質心和大小會自動變化,跟蹤的結果是每10幀顯示一次,圖5~圖9是此次視頻中應用Camshift算法實現對運動目標進行跟蹤的結果。
從圖5~圖9可見隨著監控視頻與目標的距離拉大,能夠通過顏色概率值零階劇和一階矩的計算,自適應的擴大搜索窗口,并對其進行了高效的跟蹤。實驗仿真的結果表明,Camshift算法很好地克服了由于導致當目標顏色與背景顏色相近時出現目標丟失的問題,而且對于運動目標變化較快的物體,也能實現較好的及時跟蹤。

圖4 視頻中跟蹤目標的運動軌跡

圖5 第5幀跟蹤結果

圖6 第60幀跟蹤結果

圖7 第130幀跟蹤結果

圖8 第250幀跟蹤結果

圖9 第360幀跟蹤結果
目標跟蹤是指通過分析視頻序列,在目標檢測的前提下,對提取的目標特征信息進行分析,然后通過選擇一種合適的匹配算法,得到前景目標的有效特征信息,再對這些特征進行匹配,最終確定目標的運動軌跡,實現目標精確定位,得到目標在一系列圖像序列中的聯系信息。在過去的幾十年里,機器人、國防、監控、醫療、娛樂等行業的需求在強力推動著目標跟蹤技術的進步。本文研究了Mean-shift算法對監控視頻中的運動目標進行跟蹤,實驗仿真結果表明,該算法對于視頻中運動目標變化較快的物體容易出現跟蹤丟失,定位不準確等問題,因此本文應用CamShift算法對視頻中的運動目標進行跟蹤,實驗仿真結果表明,CamShift算法能夠快速并高效地對視頻中目標變化較快的物體進行跟蹤,具有很好的魯棒性,相信該算法一定可以在視頻監控領域對于運動目標的跟蹤方面得到廣泛的應用,更好地為人們的社會公共安全方面做出貢獻。