陳楠 洪峰 鄒煥新 葛鯤鵬 侯夢琳

摘要:近年來,隨著經(jīng)濟迅猛發(fā)展,社會治安問題日益凸顯,各種場合對安全防范的需求不斷增加,傳統(tǒng)的監(jiān)控模式已經(jīng)遠遠不能滿足現(xiàn)有需求,結合各監(jiān)控場景特點的視頻智能監(jiān)控系統(tǒng)是熱門發(fā)展趨勢。本文在查閱大量參考文獻的基礎上,首先對視頻智能監(jiān)控系統(tǒng)的一般流程進行了概述,然后對智能視頻監(jiān)控系統(tǒng)相應常用技術進行了梳理歸類,最后指出了視頻智能監(jiān)控系統(tǒng)存在的一些實際問題和困難,并對將來視頻智能監(jiān)控系統(tǒng)的發(fā)展趨勢進行了展望。
關鍵詞:智能監(jiān)控系統(tǒng) 背景分析 目標跟蹤 特征提取 特征分析
中圖分類號:TN948.6 文獻標識碼:A 文章編號:1007-9416(2016)07-0012-02
1 引言
隨著社會高速發(fā)展,突發(fā)事件也日益增多,因此人們對安防的要求也越來越高。傳統(tǒng)的監(jiān)控系統(tǒng)通常只具有視頻錄制功能,大部分監(jiān)控任務還是由人工操作來完成,這樣不僅僅費時費力同時漏報、錯報現(xiàn)象還經(jīng)常發(fā)生,這樣給警察及相關安防人員帶來了極大的不便。因此,視頻智能監(jiān)控系統(tǒng)具有廣闊的應用前景,他已成為當今社會迫切需求的一種安放手段。視頻智能監(jiān)控系統(tǒng)是指在幾乎不需人工干預的前提下,運用數(shù)字圖像處理、機器視覺和模式識別等相關技術對監(jiān)控探頭拍攝下的視頻序列進行自動處理分析,進而提取所需信息的一門綜合性技術。
目前,國內(nèi)外許多機構和科研工作者對智能視頻監(jiān)控技術有著很濃厚的興趣,并進行了廣泛研究。在航天工程、軍事國防、司法領域、公共區(qū)域安防和公路交通安全等領域發(fā)揮了明顯的作用。本文在參考大量文獻的基礎上,對智能視頻監(jiān)控系統(tǒng)進行了綜述,文章的具體結構如下:第一部分為引言部分;第二部分給出了智能視頻監(jiān)控系統(tǒng)的主要流程;第三部分結合智能視頻監(jiān)控技術研究發(fā)展現(xiàn)狀,對比較常用的系統(tǒng)相關算法進行了分析;第四部分探討了智能視頻監(jiān)控技術存在的問題同時對下一步的發(fā)展方向進行了展望。
2 視頻智能監(jiān)控系統(tǒng)的一般流程
目前,智能視頻監(jiān)控系統(tǒng)的流程主要包括背景分析、目標跟蹤、特征提取、行為分析四個主要步驟(圖1所示)。
視頻監(jiān)控場景中的異常行為可以歸納為很少發(fā)生的事件,或者是以前未發(fā)生的行為。有許多不同類型的事件可以被描述為異常的,但常見的描述是這些行為偏離場景中出現(xiàn)的大多數(shù)行為。
為了能夠建模異常行為,我們通過對視頻訓練集進行視覺主觀分析開始。我們必須了解發(fā)生異常事件之前、期間及之后視頻序列中發(fā)生了什么。通過測試一些相同類型的事件視頻,我們發(fā)現(xiàn)可以為事件定義一套標準,標準作為閾值。如果符合所有預定義值,則判定相應異常事件發(fā)生。
系統(tǒng)提取場景中相關目標的外觀特征。這些特征的融合包含了足夠的信息可以描述目標進行相應異常事件的特性。
因為能夠預定義一個目標的行為,因此能夠構建一個系統(tǒng),該系統(tǒng)用于提取和分析特征,提取的特征與預定義的標準做比較。每個特征通過閾值與每個準則做比較。對于每個特征,系統(tǒng)返回假定目標發(fā)生異常的幀數(shù)。如果每個特征比較返回相同的幀數(shù),那么特征分析得出相同的結果。在這種情況下,說明每次比較對于目標異常行為的發(fā)生有相同的結果。
在目標異常行為發(fā)生之前、期間及之后,通過描述上述事件含有什么,我們就能夠獲得一套預定義準則。如果特征分析達到這些標,則能夠確定目標異常行為已經(jīng)發(fā)生,并且能夠判定具體是哪一種異常行為。
3 智能視頻監(jiān)控系統(tǒng)相關技術
伴隨著越來越多的智能視頻監(jiān)控系統(tǒng)陸續(xù)投入使用,視頻序列智能化分析進入一個全新時代,計算機技術的發(fā)展使智能檢測技術從傳統(tǒng)的人工判讀邁入了人工智能時代,很多學者投入大量精力研究視頻序列異常行為檢測技術當中,各種檢測方法層出不窮,各有所長。目前,異常行為檢測方法尚無嚴格的區(qū)分,拋開硬件因素和假想的算法,智能視頻監(jiān)控系統(tǒng)的核心技術一般來有背景提取、目標跟蹤、特征提取及特征分析。
3.1 背景提取算法
背景差分法,可說是有效的低水平視覺處理,進而執(zhí)行像運動分析、運動估計和目標跟蹤等高級任務。為此就必須獲得背景信息并隨著時間推移更新的表示,然后與實際輸入進行比較進而確定差異區(qū)域,這種方法必須是自適應的,并且能夠處理光照條件的變化。當場景中存在運動目標時,圖像在某些時間窗口平均是描述靜態(tài)場景的有效途徑,然后進一步描述連續(xù)函數(shù),來更好地表現(xiàn)這種場面的光照。在有限和平穩(wěn)變化的假設下,Christof Ridder等提出卡爾曼濾波器來獲得背景特征,而C.R.Wren考慮了單邊高斯分布的使用。
Jia等提出了新的基于顏色空間模型的閾值法,并將其應用到背景差法中,此模型使用每個像素的顏色失真和亮度失真來檢測變化。顏色失真反應顏色空間中的向量位置,因此它可以有效地處理顏色特征。此外,此閾值法還某種程度地移除了運動的影子,將它應用于背景差法將獲得一個比較完整的前景目標。對于相對復雜的背景,借鑒Canny邊緣檢測算法中滯后閾值的影響并將雙閾值引入背景差法中,它實現(xiàn)了含有復雜背景的視頻的魯棒性檢測,此法和其他多模型的方法相比,測試結果表明了該算法的可行性。
Friedman等的思想是,從時間平均背景圖像中減去當前圖像,只剩下非穩(wěn)定的對象。然而,這只是當前圖像分類的錯誤結果,它不適用于緩慢移動的目標,不能區(qū)分陰影和移動目標。對于緩慢目標,使用一個模型將每個像素分類,該模型是當一個像素屬于不同類別時,通過使用無監(jiān)督技術學習每個像素的混合高斯分類模型,這是EM的改進模板。不同于標準圖像平均方法,這會根據(jù)目標間的可能性自動更新每個類的混合成分,因此能夠完美地解決緩慢移動的物體,這種方法也比閾值法等其他方法更有效地標識和消除陰影。
3.2 目標跟蹤算法
S.Calderara等提出動態(tài)編程技術有效地比較人軌跡的編碼方案,此方案同時考慮了運動的方向和速度。其創(chuàng)新點在于采用動態(tài)編程技術有效地比較軌跡。此技術借用了生物信息學,將軌跡的編碼作為一系列的方向和速度,并以有效的方式成對比較它們。然后,利用動態(tài)編程技術計算訓練階段軌跡對時間的總得分,而后通過k中心聚類算法將最終得分聚類。聚類后,每個類成員可以用于距類中心距離的一維高斯分布建模。最后,使用最大后驗概率準則為具有最大后驗概率的軌跡類分配了新的軌跡。
是一個檢測跟蹤多目標以及監(jiān)測室外活動的實時視覺監(jiān)控系統(tǒng)。它適用于單視灰度視頻圖像或紅外視頻圖像。對人及其部位(頭、手、腳、 軀干)進行形狀分析和跟蹤定位并創(chuàng)建人的外觀模型,以便其可以通過如遮擋等障礙跟蹤到目標,它可以判定前景區(qū)域是否包含多人,還可以將區(qū)域分割成數(shù)個人并跟蹤他們,還可以判定行人是否攜帶物體,從其輪廓分割出物體,并為他們構建外觀模型,以便可以在后續(xù)幀中標識它們。還可以識別人和物體間的行為,如存放物體、交換背包,或移除物體等。
跟蹤圖像序列中的多個運動目標包括運動檢測和分割是一項復雜的任務。圖像運動可能在幀間變化極大,如隨著監(jiān)控探頭振動圖像運動變化較大,由于不能假設時間運動恒常性,這種變化在跟蹤長時間序列的時候非常困難。Michal Irani等提出了使用時空一體化而不用假設運動恒常性的檢測跟蹤方法,將序列中的每一幀與跟蹤目標的動態(tài)內(nèi)部表示圖相比,在基于運動計算之后,通過瞬時整合幀構建此圖像。瞬時整合幀適用于增強某些區(qū)域,在這些區(qū)域中運動被跟蹤,這些效果有助于后續(xù)幀的運動分析,便于繼續(xù)跟蹤相同目標和分割相同跟蹤區(qū)域。
3.3 特征提取方法
特征提取在模式識別、模式分類、數(shù)據(jù)挖掘、 機器學習上一直是一個重要的研究課題,已被許多研究者廣泛研究。大多通用的特征提取方法是使用類間的標準函數(shù)或全局函數(shù)。雖然這些方法在大多數(shù)情況下相對適用,但在多分類問題上卻不是最佳方案。為了解決這一問題,Choi等提出一種優(yōu)化多類別分類問題的特征提取方法,該文章中第一次研究特征空間中多分類問題的分類精度分布,發(fā)現(xiàn)存在很多更好的特征集,這些特征集是傳統(tǒng)的特征提取算法所不能找到的,該文章提出了發(fā)現(xiàn)這種特征的算法。遙感數(shù)據(jù)的實驗結果表明,相比于傳統(tǒng)特征提取算法,該算法有更好的性能。
3.4 特征分析方法
Li等[使用多模特征分析提出了異常行為檢測框架。在這一框架中,先從視頻數(shù)據(jù)中提取多模特征,然后分析這些特征形成多個中級概念,如視頻鏡頭,人臉外觀等。然后采用邏輯回歸分析和貝葉斯置信網(wǎng)絡這兩個方案,將多模特征分析和感興趣視頻行為檢測中提取的信息相融合。作者旨在將這個框架作為一個通用模板用于不同視頻域中的行為檢測。在不同視頻域中的不同測試視頻上進行實驗,結果表明此種方案是可行的。
4 智能視頻監(jiān)控系統(tǒng)發(fā)展前景展望
由于智能視頻監(jiān)控系統(tǒng)的現(xiàn)實需求,異常行為檢測的研究也越來越深入,許多機構和學者等都做了大量的工作。從現(xiàn)有的智能視頻監(jiān)控系統(tǒng)中我們不難看出,在實際應用上還存在一些問題,具體有以下幾個方面:
(1)背景分析作為監(jiān)控系統(tǒng)運行過程中一個非常重要的步驟,他為目標前景提取奠定了基礎,背景分割不好將會導致后續(xù)階段的數(shù)據(jù)特征生成不足。改進現(xiàn)有方法和算法來進行背景差分法為將來繼續(xù)研究更高的相關課題提供技術支持。
(2)加強標記過程來改進目標的跟蹤。就這點來說,想要改善系統(tǒng)必須改善標記過程,使系統(tǒng)能夠在同一時間跟蹤同一場景中的幾個運動目標。此外為了能夠處理場景中的幾個物體,只要目標存在于場景中,每個目標應該給一個靜態(tài)的標記。
(3)系統(tǒng)應能夠處理其他類型的異常行為。這將包括為每個新的事件制定新的標準,并在已存在的系統(tǒng)中完成這些功能。
5 結語
本文從視頻監(jiān)控系統(tǒng)的發(fā)展史入手,而后對智能視頻監(jiān)控系統(tǒng)的一般流程和方法及現(xiàn)有的方法進行了分類總結,對一些常用的、有代表性的方法進行了梳理分類,并對異常行為檢測技術的發(fā)展前景進行了展望,分析了現(xiàn)有檢測方法上存在的問題和困難,同時對下一步的發(fā)展趨勢進行了大膽預測。相信隨著更高智能化分析系統(tǒng)的出現(xiàn),應用需求的不斷增加,技術手段的持續(xù)發(fā)展,智能視頻監(jiān)控系統(tǒng)將會得到更廣泛的應用。