王飛 甘肅政法學院
公安視頻圖像中視頻序列的圖像運動目標所研究的主要目標為:把運動目標連續從視頻序列圖像中提取出來,之后對該運動目標進行跟蹤和識別,最后完成對該行為的描述和理解[1]。目標跟蹤和識別及運動檢測層次比較低,歸屬于圖像處理;而圖像分析和理解處理的層次較高,歸屬于人工智能[2]。公安視頻圖像中視頻圖像的運動研究基礎是數字圖像處理,涉及內容比較廣泛,包括數字模式識別、圖像處理、人工智能、計算機視覺等多個學科和領域。而且,當前所研發的公安視頻圖像中視頻序列圖像運動目標研究方面,系統在高要求魯棒性、實時性的同時,漸漸重視它們的可移植性與通用性[3]。本論文以現有理論、算法和工具為前期基礎,以開放的計算機視覺程序庫OpenCV為工具,重點研發公安視頻圖像中怎樣從序列圖像中跟蹤和檢測運動目標。
處理圖像的時候,計算相鄰兩幀圖像間的差來得到運動區域的幀間差分,使用差值圖像可以很快檢查到鄰接圖像里所有活動目標運動區域,一般來講,使用該方法得到的活動目標要大于實際目標,我們稱該現象為“鬼影”[4]。而且,該方法不能檢測到重疊部分,只能檢測到前后兩幀中物體相對變化的內容,致使檢測的目標出現稱之為“空洞”的情況。三幀差分法的核心思想是再差分相互連接的三幀圖像,改進了兩幀差分,可以有效檢測到處于中間這一幀的運動目標的形狀輪廓[5]。
在設定的圖像序列里,選擇連續的三幀圖像Ii-1(x,y),,Ii(x,y), Ii+1(x,y),依次求出相鄰兩幀圖像的差值。

把求出的差值圖像選擇適合的閾值T進行二值化。

把像素點(x,y)計算得出的二值圖像進行邏輯“與”操作,計算出在這三幀圖像中,中間幀的二值圖像。

算法流程如圖1所示。

混合高斯模型的定義為:

其中K為模型的個數;πk為第k個高斯的權重;p(x/k)是第k個模型的高斯概率密度,它的平均值表示成μk,其方差表示為σk。估計概率密度的目的是為了求得πk、μk與σ k這三個變量的值。在表達式p(x)被求出以后,樣本x屬于各個類的概率就由求和式的各項結果依次代表[6]。
最大似然方法是在做參數估計的時候經常使用的方法。使樣本點在估計的概率密度函數上的概率值最大就是最大似然法的核心思想。因為概率值一般情況下是很小的,在N值很大的情況下連乘的結果也會非常小,浮點數下溢很容易出現[7]。因此我們一般情況下取log,把目標改為:

也就是最大化對數似然函數,完整的表示形式是:

通常情況下,做參數估計的方法是經過對求變量來求導進而求極值,在前面的式里,如果用求導的辦法進行計算,方程組會極復雜,因為log函數中有求和而沒有閉合解。因此論文用EM算法求解:首先,可以通過基于上一步迭代結果或初始化而假設出每個高斯模型的參數,這樣每個高斯模型權可以被估計出來;然后,根據前面估計出的權值,反過來再去確定高斯模型的參數[8]。反復執行前面兩步,當波動很小的時候近似達到極值。下面進行詳細表述:
1. E step
對于第i個樣本xi來說,它由第k個model生成的概率為:

在這里,用上一步迭代而來或由初始值決定的方法,假定高斯模型的參數和已知。
2. M step
得到每個點的ωi(k)后,我們可以這樣考慮:對樣本Xi來說,它的ωi(k)Xi的值是由第K個高斯模型產生的[9]。換句話說,第K個高斯模型產生了ωi(k)Xi(i=1……N)這些數據。這樣在估計第K個高斯模型的參數時,我們就用ωi(k)Xi(i=1……N)這些數據去做參數估計。和前面提到的一樣采用最大似然的方法去估計:

重復上兩步,直到算法收斂。
我們的目標檢測代碼的三個算法全都是利用運動目標在連續幾幀的視頻中的像素點不會一致,從而確定出背景模型,然后再利用每幀跟背景模型相匹配,得出不一樣的像素點則為運動目標[14]。但是每個算法對于背景模型的更新頻率以及如何進行更新則不一樣。

1. 三幀差分法
使用三幀差法,能夠將運動物體的輪廓描出,發現物體內并沒有使用白色填充。我們選擇合適閾值區分背景和前景,可以盡量減少誤差,但是這個算法并不精細,因為對于前景區分的時候,并不像之后的幾種算法勾勒出運動物體的影子。

2. 高斯混合模型
高斯混合模型是一種比較細致的識別模型,能夠使得運動物體并不明顯的影子也被檢測出現。在該模型中,圖像各個像素點的特征用三至五個高斯模型來表達,當獲得新一幀圖像后,混合高斯模型會被更新,用混合高斯模型和當前圖像中的每個像素點進行匹配,成功匹配斷定這個點是背景點,反之是前景點。該模型主要由兩個參數決定,為均值與方差。學習均值與方差的時候,學習機制不同,會對模型的精確性、收斂性與穩定性產生直接影響。論文提取建模的對象是運動目標背景,所以需要實時更新模型中的均值與方差。改進方法,更新均值和方差的時候,使用不同的學習率可以提高模型的學習能力,提高在比較繁忙的背景下,慢且大的運動目標的檢測效果。

三幀差分法和高斯混合模型在公安視頻圖像中運動目標識別技術中的應用,為用戶與視頻內容的交互帶來了新的方式,為發展警務情報、信息系統提供了一種解決方案。過去的視頻操作技術依靠非常耗時的手工實現,而且能夠進行手工操縱的視頻資源非常有限。自動或者交互式的視頻對象提取可以減少人工交互,降低制作代價。這個框架下,三幀差分法和高斯混合模型技術提取出的視頻對象,可以通過編輯、超鏈接、特技或者與計算機生成的對象聯合,重新生成新的更豐富的內容。
在基于視頻對象的視覺信息描述框架下,采用三幀差分法和高斯混合模型技術,視頻編輯的內容會更為豐富。此時視頻編輯工作不僅是裝配鏡頭和場景,還包括利用三幀差分法和高斯混合模型產生新的內容;可以再次利用舊的視頻內容,生成新的視頻;可以通過添加或者刪除場景中的視頻對象,或者與其它對象聯合,生成新的內容。前景和背景是兩個非常重要的元素,背景是最底層,其它層都疊加在背景層上,前景則是放置在背景上的基本元素,用戶可以使用鼠標在背景視頻中操縱視頻對象。參考MPEG-4,定義視頻、音頻、文字、數據分別是具有時域和空域屬性的單個模塊,可以控制它們在場景中的行為和位置。
利用上述研究成果,對采集的道路車輛信息實現實時分析與傳送,建立了一個有關道路交通視頻描述的數據庫,交警部門可以根據需要對描述數據庫進行查詢和檢索,極大提高了道路交通視頻使用的效率,該系統已經取得了初步的成果。
本文硬件平臺為普通筆記本電腦,CPU是主頻1.7GHz的64位四核酷睿i5,內存容量4G,軟件開發平臺為Windows 10、OpenCV以及Visual Studio 2015。安裝下載得到的OpenCV應用程序,需要版本為3.1.0和2.4.9。
論文的研究內容是“公安視頻圖像中運動目標識別研究”,研究設計包括數字圖像處理、公安視頻圖像中運動目標的檢測與跟蹤、基于OpenCV的框架式運動目標分析系統的設計。論文對圖像序列選取并設計合適的算法,通過OpenCV和C++編制程序實現正確的識別序列圖像中的運動目標。采用Intel公司開發的開源圖像處理和計算機視覺函數庫OpenCV作為實驗開發平臺,實現了圖像處理和計算機視覺方面的很多通用算法[15]。由于選擇該工具,論文中公安視頻圖像中的運動目標識別和跟蹤流程因復雜算法所消耗的時間被大大縮短,在此基礎上建立的公安視頻圖像中運動目標識別和跟蹤系統具有較高的實用性。
[1] 盧章平,孔德飛,李小蕾,王軍偉. 背景差分與三幀差分結合的運動目標檢測算法[A]. 算法、設計與應用,2013,21(12): 1671-4598.
[2] 吳曉陽. 基于OpenCV的運動目標檢測與跟蹤[J]. 浙江大學出版社, 2012,05(01):557-585.
[3] 韓軍,熊璋,孫文彥,龔聲蓉. 自動分割及跟蹤視頻運動對象的一種實現方法[J]. 中國圖像圖形學報, 2014, 91(13):377-401.
[4] 賈云得. 機器視覺[M]. 北京:科學出版社, 2015:97-100.
[5] 吳炯,張秀彬. 數字圖像處理中邊緣檢測算法的實現研究[J].微計算機信息,2014,20(5):159-197.
[6] 孫慧,周紅霞,李朝暉. 圖像處理中邊緣檢測技術的研究[J].電腦開發與應用,2012,15(10):7-9.
[7] 段瑞玲,李慶祥,李玉和. 圖像邊緣檢測方法研究綜述[J]. 光學技術,2015,31(3):415-419.
[8] 陳宇云. 灰度圖像的邊緣檢測研究[M]. 西安:電子科技大學,2013,44-62.
[9] 姚敏. 數字圖像處理[M]. 北京:機械工業出版社,2016:78-98.
[10] 徐建華. 圖像處理與分析[M]. 北京:科學出版社,2014:112-132.
[11] 張艷群,孟凡榮. MATLAB在圖像邊緣檢測中的應用[J]. 計算機應用研究,2014,16(3):144-146.
[12] 阮秋琦. 數字圖像處理學[M]. 北京:電子工業出版社,2012:198-204.
[13] 崔屹. 數字圖像處理與技術[M]. 北京:電子工業出版社,2012:35-42.
[14] 俞洪山,王耀南. 一種改進型Canny邊緣檢測算法[J]. 計算機工程與應用,2014,20(2):27-29.
[15] 王娜,李霞. 一種新的改進Canny邊緣檢測算法[J]. 深圳大學學報理工版,2015,22(2):149-153.