面向智能視頻監控中的運動目標檢測方法研究

2022-12-27 13:14:54張建軍

計算技術與自動化 2022年4期

方勇，張建軍

(國網蘭州供電公司，甘肅蘭州 730050)

隨著監控場景安全性的不斷提高，智能視頻監控受到越來越多的關注。智能視頻監控系統可以較為智能地分析視頻圖像，獲取監控場景中的信息[1]。運動目標檢測是實現智能視頻監控的基礎，其研究具有重要的現實意義。通過參考文獻可知，目前較為常用的有三種方式各有優缺點，背景減除法適用于靜態背景檢測[2]。光流法計算復雜，性能差[3]。幀差法提取輪廓，檢測區域不完整[4]。在此基礎上，提出了一種結合時空馬爾可夫隨機場(Spatial Temporal Markov Random Field，STMRF)模型和高斯混合模型(Gaussian Mixture Model，GMM)的運動目標檢測方法。進行STMRF訓練時利用GMM參數更新算法計算鄰域圖像分割區域的均值和方差，利用時空鄰域標記場設置勢函數。通過仿真驗證了該方法的可行性。

1 STMRF模型

考慮到目標檢測過程中相鄰幀之間的密切關系，建立了STMRF模型。視頻中目標的運動與前后幀的序列圖像高度相關。傳統馬爾可夫隨機場目標分割的一大缺陷是缺乏視頻序列的時間維信息[5]。文中提出的時空馬爾可夫隨機場模型考慮了空間域中相鄰像素之間的相關性，在時域中增加了相鄰幀像素之間的運動相關信息[6]。利用時空二階鄰域系統，定義了像素空間鄰域勢團和時間鄰域勢團。如圖1所示。

圖1 模型求解流程

能量函數擴展為如式(1)所示。

(1)

在式中，Vc(·)為勢函數；ω為像素分類的標記場；c為與M相關的勢群，M是N×N上的鄰域系統；C為M中全部勢團集合。

在勢團c定義中增加了像素點i在時間序列上相鄰幀的二維鄰域勢團。STMRF模型如圖2所示。

圖2 STMRF模型

2 目標檢測

2.1 改進STMRF模型訓練

假設有二維平面圖像S，si為S={s1,s2,…,sM×N}集合中的像素點，數量為M×N，圖像觀測數據為F，為f={f1,f2,…,fM×N}，存在像素點集r={r1,r2,…,rM×N}，像素分類標記場為ω={ωs1,ωs2,…,ωsM×N}，ωs∈{1,2,…,L-1}，類別總數L。

似然函數P(F|ω)符合高斯分布，如式(2)所示[7]。

(2)

在式中，μ和σ分別為高斯函數的均值和標準差。

對其取對數，如式(3)所示[8]。

(3)

(4)

(5)

在式中，It為像素值(當前幀)。

2.2 STMRF標記場更新

因為先驗概率P(ω)與MRF模型匹配，所以MRF等價于Gibbs隨機場，能量函數定義后就可以求出P(ω)[10]。

F為二維平面相對于鄰域系統M的馬爾可夫隨機場，僅當F的聯合分布是M相關勢團的Gibbs分布。二維圖像標記場的計算如式(6)所示[11]。

(6)

在式中，Z為歸一化函數；T是Temperature的簡寫，一般情況下T=1。

2.3 改進STMRF模型目標檢測流程

目標檢測流程如下：

步驟1：讀取圖像并進行參數初始化，包括迭代收斂時間、均值、方差、圖像標記場[12]。

步驟2：劃分訓練區域，對前N幀的μ和σ2進行初始化，使用GMM參數更新方法進行計算。

步驟3：對前N幀標記場的全局能量進行依次計算，如式(7)所示[13]。

(7)

在式中，S為平面點集；F為觀測圖像數據；ω為像素分類的標記場，ωs∈{1,2,…,L-1}，L為類別總數。

判斷該值與當前標記場的差值是否超過設置的閾值。如果Δ≥Ek-Ek-1，則轉至下一步，并將閾值設置為0.01[14]。

步驟4：如果前后標記場的全局能量變化非常大，使用式(8)計算當前幀各像素局部能量[15]。

(8)

對局部能量累積值是否超隨機值進行判斷，如超過，保存當前標記場的值ωs=i。

步驟5：如果前后標記場的全局能量趨于平衡,則算法結束(即Δ

圖3所示為改進STMRF模型的目標檢測流程。

圖3 目標檢測流程

3 仿真結果與分析

3.1 仿真參數

仿真設備為聯想PC，操作系統為Windows 10 64位旗艦版，Intel i52450m CPU，頻率2.5 GHz，內存8GB，算法程序采用Visual Studio平臺的OpenCV庫實現。為了驗證該方法的優越性和有效性，將該方法與高斯混合模型和模糊C-均值聚類(FCM)進行了比較。仿真數據來自KTH、Weizmann視頻數據庫，通過數據庫片段進行測試。仿真主要分析了目標檢測的錯誤率和運行時間。

3.2 結果與分析

圖4 (a)是來自KTH 視頻數據庫的行走視頻片段第180幀、195幀和205幀的截圖。視頻幀高120像素，寬160像素，幀速率為每秒25幀，比特率為861 kbps。對視頻進行文中方法、GMM方法和FCM方法的目標檢測。圖4(b)為GMM方法檢測的運動目標，圖4(c)為FCM方法檢測的運動目標，圖4(d)為文中方法檢測的運動目標。

從圖4可以看出，與GMM方法和FCM方法相比，文中方法的檢測結果更清晰，檢測錯誤率最低。從檢測錯誤率的計算結果來看，該方法比其他方法對目標的檢測更準確，檢測錯誤率約在2%左右，GMM方法的檢測錯誤率在11%左右。FCM方法的檢測錯誤率約在6%左右。表1所示不同方法檢測錯誤率的結果比較。

表1 檢測錯誤率結果對比1

圖4 不同方法目標檢測結果對比1

圖5所示，不同方法目標檢測的運行時間比較結果。從圖5可以看出，文中方法的運行時間最長，與GMM方法的運行時間相差不大，而FCM方法的運行時間最短。這是因為文中方法在時間維度上增加了多幀計算，從而增加了計算時間。

圖5 不同方法目標檢測的運行時間對比1

圖4 (a)為來自Weizmann視頻數據庫行走視頻片段第21幀、28幀和36幀的截圖。視頻幀高144像素，寬180像素，幀速率為每秒25幀，比特率為15552 kbps。對視頻進行文中方法、GMM方法和 FCM 方法的目標檢測。圖5(b)為GMM方法檢測的運動目標，圖5(c)為FCM方法檢測的運動目標，圖5(d)為文中方法檢測的運動目標。

從圖6可以看出，與GMM方法和FCM方法相比，文中方法的檢測結果更清晰，檢測錯誤率最低。從檢測錯誤率的計算結果來看，該方法比其他方法對目標的檢測更準確，檢測錯誤率在2.5%左右，GMM方法檢測錯誤率在9.5%左右，FCM方法檢測錯誤率在6.5%左右。表2所示不同方法檢測錯誤率的結果比較。

圖6 不同方法目標檢測結果對比2

表2 檢測錯誤率結果對比2

圖7所示為不同方法目標檢測運行時間的比較結果。從圖7可以看出，文中方法的運行時間最長，與GMM方法相差不大，FCM方法的運行時間最短。這是因為文中方法在時間維度上增加了多幀計算，從而增加了計算時間。

圖7 不同方法目標檢測的運行時間對比2

從以上實驗結果可以看出，相比于傳統的GMM方法和FCM方法，該方法能夠檢測復雜背景下的運動目標，具有更好的檢測效果和較強的魯棒性。

4 結論

提出了一種時空馬爾可夫隨機場模型和高斯混合模型相結合的運動目標檢測方法。在訓練時空馬爾可夫隨機場模型時，采用高斯混合模型的參數更新算法計算鄰域圖像分割區域的均值和方差，并通過時空鄰域標記場設置勢函數。結果表明，與傳統的GMM和FCM目標檢測方法相比，文中方法能夠檢測復雜背景下的運動目標，檢測效果更好，有較好的魯棒性。受目前實驗室硬件和數據規模的影響，文中方法僅研究目標檢測方法。在此基礎上，后續將對目標跟蹤和行為識別等做進一步研究。