李佩陽,陸華才
(安徽工程大學 電氣傳動與控制安徽普通高校重點實驗室,安徽 蕪湖 241000)
基于計算機視覺的運動目標檢測已經成為社會發展與技術進步的一個重要發展方向,近年來人工智能領域的興起,更加促進計算機視覺朝著工業化方向前進,并且在人們日常生活和工業化生產中得到了廣泛的應用。對于運動目標的檢測技術已然成為熱點研究方向之一,同時也是提升智能化交通和城市治理能力的重要環節。現如今在復雜交通場景實現優良性能的運動目標檢測效果仍然存在一些問題,比如交通背景的復雜性、視頻序列檢測時間長、復雜交通場景下的人和車檢測在不同尺度變化與外姿變化、運動目標檢測過程中的遮擋與重復等。
目前有很多研究學者針對運動目標檢測進行了相關技術研究。徐曉明等[1]針對算法的實時性較差與魯棒性差等問題提出一種Subsense檢測算法,能夠根據外界環境變化調整相應的參數設置,從而提升復雜運動目標的識別能力。湯旻安等[2]針對靜態背景下運動目標“鬼影”問題,提出一種哈希與圖像二維信息熵的改進思路,提升ViBe算法對靜態場景運動目標的檢測與識別能力。但是現有研究中針對視頻幀之間聯系的解決思路較少,缺少對視頻幀之間前景與背景提取問題的深入研究。
本文提出的運動目標檢測算法針對視頻幀進行圖像預處理操作,在視頻幀進行二值化過程中采用改進的最大類間方差(OTSU)算法解決光照亮度不均所帶來的影響問題[3],再根據視頻幀中運動目標區域像素點的變化進一步將運動目標提取出來,根據提取的運動目標輪廓進行標記,從而實現視頻幀上運動目標的檢測[4]。
從高清攝像機拍攝或保存的視頻中提取視頻幀圖像進行處理。首先對視頻幀圖像進行預處理操作[5],在對圖像進行濾波操作完成二值化過程中,通過采用改進的OTSU算法完成圖像前景與背景的閾值輸出,從而解決光照因素的干擾,完成后續二值化操作。其中運動目標檢測算法基礎流程圖如圖1所示。

圖1 運動目標檢測算法流程圖
在對視頻幀進行處理的過程中,需要先進行灰度化,而圖像的灰度化操作在一定程度上對噪聲有一定的抑制效果[6],同時為了去除圖像的椒鹽噪聲,本文采用中值濾波解決椒鹽噪聲的干擾問題。在對圖像進行二值化的過程中,通過OTSU算法計算出一個合適的閾值T,對圖像中的每一個像素點進行閾值操作,按照每個像素的灰度值f(x,y)大小來判斷是否大于或等于T,若是該像素點像素值則被置為255(白色),若不是則被置為0(黑色)。公式如下:

(1)
式中,x,y分別為像素點的橫縱坐標;P(x,y)為二值化處理后的像素值。
OTSU算法核心在于通過一個閾值T將圖像灰度值分成前景和背景部分,該算法主要計算思路及計算公式如下:
①對于圖像I(x,y),用閾值T將圖像分割為前景和背景兩個部分。
②設w0為前景圖像像素點與整個圖像像素點的比值,設u0為前景圖像的平均灰度。
③設w1為背景圖像像素點與整個圖像像素點的比值,設u1為背景圖像的平均灰度。
④設圖像總體平均灰度為u,且設g為類間方差,設圖像大小為M×N,其中對于灰度值小于閾值T的像素個數為N0,大于閾值T的像素個數為N1。
前景比例:
(2)
背景比例:
(3)
像素點總和:
N0+N1=M×N,
(4)
前景與背景的概率和:
w0+w1=1,
(5)
平均灰度值:
u=w0×u0+w1×u1,
(6)
類間方差:
g=w0(u0-u)2+w1(u1-u)2,
(7)
由式(4)~(6)可得:
g=w0×w1(u0-u1)2。
(8)
當閾值T的值變化到類間方差g最大的時候,則該閾值T為OTSU算法計算所得出的最合適的閾值。選取的交通路口部分圖像如圖2所示。采用OTSU算法進行閾值選取時會造成亮度較低的區域信息丟失,從而對實驗結果產生很大的干擾,如圖3所示。由圖3可以看出,圖像本身存在光照亮度不均部分,經過OTSU算法求得的閾值對于非陰影部分處理結果較好,圖像亮度較高的區域信息保留得更加完整,而該算法對亮度較低區域處理結果較差,未能提取亮度較低區域中有效的圖像信息。

圖2 交通路口原圖 圖3 OTSU算法處理結果圖
在處理光照亮度不均的圖像時,可以將整個圖像進行全局閾值,然后通過定義ROI區域重復選擇圖像陰影部分與OTSU算法結合計算,最終可以得到一個算術平均值,將其作為最終陰影區域的閾值輸出,其改進的OTSU算法流程為:對于圖像陰影區域的處理過程主要是先對圖像進行預處理和灰度化,再利用OTSU算法對整個圖像的閾值進行初步的閾值處理,從而得到總體的全局閾值T1;然后利用感興趣區域ROI對圖像陰影部分進行單獨提取處理,將重復提取的結果算數平均值作為該陰影部分的全局閾值T2;最后判斷圖像中像素點是否處于陰影部分來進行相應的閾值計算。
在進行二值化操作之后需要對圖像進行邊緣檢測,本實驗選用的是Canny邊緣檢測技術對運動目標進行邊緣檢測。視頻幀的邊緣檢測過程既要保證檢測的準確性,同時也要保證重要的邊緣信息不能丟失。而Canny算子的優點在于:第一,既保持了原有重要的邊緣部分,同時也不會出現虛假的邊緣部分;第二,在圖像的邊緣檢測部分,其實際邊緣與檢測到的邊緣部分偏差最小;第三,將多處的邊緣響應部分降低為單個邊緣響應部分,這一點很好地解決了邊緣部分的噪聲影響問題。以下用size=5的高斯內核來表明Canny檢測的噪聲消除:
(9)
通過計算梯度的幅值和方向,運用一對卷積陣列:
(10)
(11)
式中,x、y分別為兩個垂直方向。
梯度幅值和方向計算:
(12)
(13)
式中,θ為角度,而梯度方向的角度一般在0°~135°。
Canny算子本身就自帶滯后閾值,滯后閾值包括高閾值和低閾值兩種。當掃描圖像每一點的像素值的時候,大于高閾值的像素點會被保留下來,而低于低閾值的像素點會被去除。如果某一點的像素值介乎于高閾值和低閾值之間,則會進一步判斷該點鄰域是否有大于高閾值的像素點,若有則該點被保留,反之排除該點。其中,運動目標檢測原圖以及Canny邊緣檢測結果圖如圖4、5所示。

圖4 運動目標檢測原圖 圖5 Canny邊緣檢測結果圖

圖6 運動目標輪廓提取流程圖
Canny邊緣檢測的結果可以作為輪廓提取的一個輸入,對于視頻幀而言檢測的目標為運動目標,所以針對這一目的需要將幀與幀之間的關系進行聯系。從整個邊緣檢測效果來看,對于視頻幀的邊緣檢測僅針對圖像中所有物體的邊緣進行提取[7],而運動目標的邊緣包含在里面。只有根據視頻幀之間的關系才能將運動目標準確提取出來,在視頻幀不斷變化的過程中,運動目標所處位置也在不斷變化,這意味著運動目標位置的像素點也在不斷改變[8],根據這一特性對運動目標進行輪廓提取,其具體流程圖如圖6所示。由圖6可知,視頻幀在經過Canny邊緣檢測之后需要對運動目標的輪廓進行邊緣提取,從而進一步在視頻幀中提取出運動目標的位置[9]。通過定義考察幀的總數n,在n幀中對像素點進行判斷是否為背景點。如果不同幀相同位置的像素差值小于設定閾值t,則判斷該位置像素點為背景,反之為運動目標像素點用于后續輪廓提取[10]。最后結合輪廓大小排序,選擇輪廓較大的目標進行框選標記,最終標記出視頻中的運動目標。
本文改進的OTSU算法通過交通圖像來顯示改進效果,以圖2的交通路口原圖進行算法結果對比,其中OTSU算法結果圖如圖3所示,改進OTSU算法結果圖如圖7所示。根據實驗結果對比可知,傳統OTSU算法在處理圖像亮度較低的區域時,會丟失圖像陰影部分信息,不能有效地提取圖像中有用的信息。而改進的OTSU算法在處理圖像與亮度較低區域的過程中,能夠很好地解決信息丟失問題,使得亮度較低部分的圖像信息能夠得到有效地提取[11]。將改進的OTSU算法應用到視頻幀中運動目標的檢測中,能夠有效地解決光照不均等造成的干擾問題。
為了驗證本文算法,不僅僅局限于理論可行性,還兼顧實際操作性,所以要通過實驗進行驗證分析。本次實驗基于硬件設備Intel i5-10200H CPU,在Windows 10操作系統下微軟開發的Visual Studio 2019社區版本以及計算機開源視覺庫Opencv4.1.0版本,在這些實驗基礎上對交通路段的視頻進行相應處理。其中截取了視頻中的圖像結果作為實驗結果,交通路口原圖如圖2所示,圖8~10分別為二值化結果圖、未改進算法結果圖和改進算法結果圖。

圖7 改進OTSU算法結果圖 圖8 二值化結果圖

圖9 未改進算法結果圖 圖10 改進算法結果圖
實驗結果表明,本文提出的算法能夠有效針對運動目標進行檢測,根據運動物體運動速度的快慢可以通過調節合適的參數進行選擇。如果運動目標運動速度較慢,可以選擇更多的總幀數n進行調節,同樣可以更改連續k幀的值對實驗效果進行調節。根據實驗場景和實驗對象調節不同的參數達到檢測的最優效果,經過本文改進后的OTSU算法處理的二值化圖像能夠對運動目標的圖像信息較為完整地提取,避免了由于光照等因素帶來的干擾,在算法運行效率方面也有顯著提高。實驗結果顯示,本文提出的運動目標檢測算法運動目標檢測效果較好,同時避免了檢測框交叉影響檢測結果,能夠將運動目標信息有效地檢測出來。
本文通過運用圖像處理技術對視頻幀進行處理,由改進的OTSU算法解決視頻幀在進行二值化過程中受到光照亮度不均等因素影響的問題,并運用背景消去思路以及視頻幀之間的聯系提取視頻中的運動目標。根據運動目標在視頻幀中位置的不同,從而位置區域像素點發生變化這一原理將運動目標與背景進行分離,再通過輪廓的排序選擇合適較大的輪廓軌跡并在視頻幀中進行框選操作,從而達到運動目標檢測這一目的。實驗結果表明,本文提出的運動目標檢測算法能夠有效提取出視頻中的運動目標,特別是在處理交通視頻過程中,能夠極大地解決光照亮度不均等因素所造成的干擾。在現階段圖像處理技術與算法研究基礎上,本文提出的運動目標檢測算法實用性較強,能夠很好地檢測出視頻中的運動目標,在處理速度上能夠滿足實時性要求,而且有益于后續識別過程,對于運動目標的檢測和識別等相關工作都有著重要的價值。