沈盼盼,樊 豐,伍瑞卿
(電子科技大學(xué),四川 成都 611731)
對視頻序列中運動目標(biāo)的提取是計算機(jī)視覺和視頻分析的基本部分,在視頻監(jiān)控[1]、體育運動分析[2]、人機(jī)交互[3]、輔助臨床醫(yī)療診斷[4]等領(lǐng)域有廣泛的應(yīng)用前景。基于背景差分的運動目標(biāo)檢測是最常用的方法[5],該方法中背景的獲取和更新是關(guān)鍵。近年來,人們對如何構(gòu)建背景進(jìn)行了大量的研究,例如高斯模型的法、中值法、時間平均法等,大多數(shù)都是針對像素建立的。
本文從直接計算背景像素值的角度研究。因為時間平均法容易將前景運動目標(biāo)混入到背景圖像中,導(dǎo)致提取的背景圖像出現(xiàn)混影。自適應(yīng)平滑算法利用通過時間段內(nèi)像素點的不變性建立背景模型,但是如果運動目標(biāo)運動緩慢或者暫時靜止時候會將前景像素值誤判為背景像素值,產(chǎn)生錯誤結(jié)果?;谙袼卦跁r間軸上變化提出的中值法,檢測過程中可能會因光照的變化將噪聲點像素值誤判為背景。針對這些問題,本文根據(jù)運動目標(biāo)像素值的變換比背景的變化快[6]的思想,采用幀間差分法和中值法相結(jié)合構(gòu)造背景模型,并且利用幀差信息對背景實時更新。采用對RGB空間的三通道分離的運動目標(biāo)檢測方法,采用Osto法[7]獲取閾值來提取運動區(qū)域。本文算法在運動目標(biāo)存在的情況下也能建立較完整的背景模型,構(gòu)建的背景可適應(yīng)光照變化和微小物體的抖動,克服了在對目標(biāo)和背景灰度相近的情況下難以提取準(zhǔn)確的目標(biāo)對象的問題,另外,背景更新是針對每個像素點更新,大大減少了運算時間。
首先,利用中值法獲取背景BM;然后,利用相鄰幀間差分的變化獲取背景BS;考慮到光照等影響,中值法難免會將噪聲點誤判為背景,所以最后將得到的BM和BS進(jìn)行加權(quán),得到初始背景模型。圖1為初始背景模型的獲取流程圖。
算法步驟為:
1)從N幀視頻呢序列中獲取n幀圖像,記作(f1,f2,…,fn)。

圖1 背景模型獲取流程圖
4)對n幀圖像進(jìn)行灰度變換,變換后的灰度圖像序列記為 (g1,g2,…,gn)。
5)對n幀灰度圖像(g1,g2,…,gn)進(jìn)行幀間差分,對差分后的每個灰度圖像進(jìn)行二值化,閾值的選取由Otsu 法確定,得到一個二值圖像序列 D2(i,j),D3(i,j),…,Dn(i,j)。
6)在二值圖像序列中,每個像素點的值可看作是由0和1組成的一維數(shù)組,找出其一維數(shù)組中連續(xù)性最長的0 的區(qū)間,例如點 (i,j)的像素點變化情況為[0,1,0,0,1,0,0,0,1,1],可以看出最長的0 區(qū)間中有 3 個 0。求出這個區(qū)間中最中間的元素所在的列數(shù),找出其對應(yīng)的視頻序列號,如果是奇數(shù)個0就取最中間一列,對應(yīng)視頻序列號為M,如果是偶數(shù)個0就取中間兩列,對應(yīng)視頻序列號為M1和M2。
7)假設(shè)提取的最長0區(qū)間有m個0,則背景圖像BS的每個像素值計算公式如下

每個像素都進(jìn)行處理,最后得到第二個背景模型BS。
8)考慮到兩種方法的優(yōu)缺點,本文將獲取的兩個背景模型按照式(2)結(jié)合來作為初始背景模型B0

式中,λ在(0,1)的范圍內(nèi)。
圖2和圖3顯示了對SampleVideo和highway分別利用時間均值法、文獻(xiàn)[4]的方法以及本文算法建立的背景模型。序列SampleVideo中λ取值為0.97,序列highway中λ取值為0.9。從圖中可以看出,用時間平均法獲取的背景模型會殘留前景部分的重影,尤其在運動目標(biāo)速度較快的時候比較明顯。文獻(xiàn)[4]的方法在目標(biāo)存在或者移動緩慢的情況下會將目標(biāo)部分誤判為背景。而本文算法建立的背景效果較好。


取n幀視頻序列,由視頻序列每個圖像和初始化背景模型對比得到一個差異累計圖像。在差異累計圖像每個像素點設(shè)置一個計數(shù)器,序列圖像和初始化背景模型之間在某個像素點出現(xiàn)一次較小差異就令計數(shù)器加1,差異大小根據(jù)閾值Tf來判斷。當(dāng)?shù)趉幀圖像與初始化背景模型相比較時,差異累計圖像可看作是隨時間變化的一個動態(tài)矩陣A(i,j,tk)。根據(jù)運動對象的像素值變化比背景像素值變化快的特點,按照如下方法更新背景:
設(shè)有 m 幀視頻序列 f1(i,j),f2(i,j),…,fm(i,j),差異累計矩陣為

式中:τ(i,j)記錄每個像素差異累計的次數(shù),由二值圖像序列(g1,g2,…,gn)中每個像素點的最長0區(qū)間長度決定,因此每個像素點的τ值不同。假如當(dāng)前的背景模型為Bk-1(i,j),則當(dāng)累計至 τ(i,j)時,點 (i,j)處的背景像素值根據(jù)式(2)自動更新,而差異累計圖像中為0的像素點處背景像素值不變,公式為

式中:α為更新率,取值在(0,1)區(qū)間。
為了在閾值化時消除部分噪聲的影響,首先對背景差后的灰度圖像進(jìn)行濾波處理,本文采用的中值濾波。fk為當(dāng)前視頻圖像,Bk為當(dāng)前背景圖像。本文采用Otsu法自動選取分割閾值T0,另外為了抑制光照突變的影響,增加一個動態(tài)閾值Ts。計算公式如下

式中:T為選取的閾值,Ts體現(xiàn)了光照的整體變化,增加Ts能夠在閾值時候抑制光線的影響。ε為抑制系數(shù),如果光照變化明顯則取較大值反之,取較小值。
閾值化后的二值圖像中,運動對象已經(jīng)大致獲取,但是由于光照的突變或者噪聲的影響使得檢測到得前景中含有噪聲點、空洞、間隙等,需要進(jìn)一步優(yōu)化才能得到較準(zhǔn)確的運動目標(biāo)。本文首先采用形態(tài)學(xué)的開、閉操作來填充小的空洞間隙,消除小一些的噪聲點,然后對整個圖像進(jìn)行連通性分析,將面積較小的區(qū)域去除,最后留下的即是運動區(qū)域。
背景圖像中,被陰影遮擋后的區(qū)域的灰度值將比原來減小,但是在色度變化不大的情況下可認(rèn)為歸一化的顏色空間對陰影造成的像素點顏色、亮度變化不敏感,具有一定穩(wěn)健性[8]??紤]到只用RGB空間會丟失像素值的亮度信息,因此,分別按照式(4)計算當(dāng)前視頻圖像和當(dāng)前背景圖像的歸一化顏色空間的r和g的值,計算當(dāng)前視頻圖像和當(dāng)前背景圖像的亮度值為

如果在 (r,g,I)空間的當(dāng)前像素值為 (rk,gk,Ik),背景像素值為(rb,gb,Ib),則當(dāng)前像素值同時滿足式(10)的3個條件時,即為陰影

最后將檢測出的陰影部分從提取出運動目標(biāo)的二值圖像中清除,得到更加精確的目標(biāo)對象。
為了驗證本文算法的有效性,選取了2組視頻序列進(jìn)行目標(biāo)檢測,并將本文算法在灰度域進(jìn)行試驗,與在RGB域的試驗結(jié)果進(jìn)行比較。圖4顯示了SampleVideo在灰度域獲取的初始背景模型、目標(biāo)檢測結(jié)果以及經(jīng)過形態(tài)學(xué)處理后得出的目標(biāo)區(qū)域的二值圖像。圖5顯示了SampleVideo在RGB空間獲取的初始背景模型、各個通道的目標(biāo)檢測結(jié)果、3個通道相結(jié)合的檢測結(jié)果以及經(jīng)過形態(tài)學(xué)處理后得出的目標(biāo)區(qū)域二值圖像。


比較圖4和圖5可以看出,在目標(biāo)灰度值和背景相近的情況下,在灰度域進(jìn)行背景差分必然會丟失掉一些有用信息,本文將各個通道分離后分別進(jìn)行目標(biāo)檢測,然后取并集可以得到更完整的運動對象。
圖6是對SampleVideo序列第21幀、第30幀、第45幀的檢測結(jié)果,圖7是對hall的第15幀、第80幀、第100幀的檢測結(jié)果,圖8是對viptraffic的第20幀、第35幀、第51幀的檢測結(jié)果。



本文主要對初始背景模型的獲取加以改進(jìn),采用三通道分離來檢測運動目標(biāo),實時性好,對目標(biāo)和背景灰度相近的情況有較好的檢測結(jié)果。但是也存在一些不足,如果目標(biāo)長時間停留或者做微小的運動,獲取的背景模型會摻雜較多目標(biāo)區(qū)域,使得檢測結(jié)果不夠理想,有待進(jìn)一步研究,結(jié)合其他方法進(jìn)行改進(jìn)。
[1]于忠校.視頻監(jiān)控圖像的運動目標(biāo)檢測方法綜述[J].電視技術(shù),2008,32(5):72-76.
[2]JI Xiaofei,LIU Honghai.Advances in view-invariant human motion analysis:a review[J].IEEE Transaction on Systems,Man,and Cybernetics,Part C:Applications and Reviews,2010,40(1):13-24.
[3]FAI H,YAMAMOTO S.Bayesian online change point detection to improve transparency in human-machine interaction systems[C]//Proc.the 49th IEEE Conference on Decision and Control.[S.l.]:IEEE Press,2010:3572-3577.
[4]楊紅梅.基于人體運動跟蹤的遠(yuǎn)程康復(fù)系統(tǒng)關(guān)鍵技術(shù)的研究[D].重慶:重慶郵電大學(xué),2010.
[5]齊志才.自動化儀表[M].北京:中國林業(yè)出版社,2006.
[6]YANG T,LI S Z.Real-time and accurate segmentation of moving objects in dynamic scene[C]//Proc.the ACM 2nd International Workshop on Video Surveillance & Sensor Networks.[S.l.]:IEEE Press,2004:136-143.
[7]朱瑾瑜,劉海燕,黃淑梅.基于連通性檢測的視頻監(jiān)控運動目標(biāo)提取[J].電視技術(shù),2007,31(10):78-80.
[8]毛曉波,謝曉芳,張曉林.消除運動物體陰影的最大色度差分檢測法[J].電子技術(shù)應(yīng)用,2007,33(1):61-63.