樊秋月
(廣東科學技術職業學院,廣東 珠海 519090)
隨著計算機視覺技術的不斷發展,視頻處理的應用也越加廣泛,尤其是采用圖像處理技術對特定的視頻運動對象的自動檢測,識別,跟蹤等智能監控,有著非常廣泛的應用前景。計算機視覺監控技術能夠利用計算機視覺和圖像處理的方法建立一個智能管理系統,通過對攝像機拍錄的視頻序列來進行分析來實現行人的定位、識別和跟蹤,從而提供了一種更加先進和可行的智能處理方案[1]。行人人數監視與統計技術是當今世界智能視覺系統研究中一個十分活躍的新領域。人數監視與統計在居民小區、地鐵、超市出入口中有著廣泛的應用需求[2]。
傳統的人數統計方法是利用人工計數或人工電子設備觸發計數,隨著信息化時代的到來,發展一種自動化的人數統計方法顯得十分必要。通常采用的人數統計方法主要有紅外檢測法、密度檢測法以及圖像處理法[3]。紅外檢測法是一種較精確的方法,當人通過時遮住了紅外射線,從而完成一次脈沖計數,但對于較多的人同時通過的場合,則顯得無能為力,同時安裝起來比較復雜,應用場合也受到一定的限制;而密度檢測法是一種大范圍的粗略檢測法,根據密度分布來估算人數。現找到切實可行的方法,既能滿足較高的實時性要求,也可以采用現有的普通PC機來處理圖像數據。
模糊集使得某元素可以以一定程度屬于某集合,某元素屬于某集合的程度由0與1之間的一個數值——隸屬度來刻畫和描述[4]。把一個具體的元素映射到一個合適的隸屬度是由隸屬度函數來實現的。隸屬度函數可以取任意的形狀,但要簡單、方便、快速、有效,而且其值域為[0,1]。常見的隸屬度函數有以下幾種:

示意圖見圖1(c)。三角形隸屬度函數,其表達式為:

示意圖見圖1(d)。
模糊邏輯是普通二值邏輯的推廣,在模糊邏輯中,任何陳述都以一定程度的真實性表示,其取值為0與1之間的數值,對應的模糊邏輯運算主要有:
邏輯與:μA∩B( x) = min[μA( x) ,μB(x )],邏輯或:μA∪B(x)=max[μA( x) ,μB( x )];邏輯非:μA(x) =1 - μA(x)。模糊推理是采用模糊邏輯由給定的輸入到輸出的映射過程。其主要包括五個步驟:①輸入變量模糊化,即把確定的輸入轉化為由隸屬度描述的模糊集;②在模糊規則的前件中應用模糊算子(與、或、非);③根據模糊蘊含運算由前件推斷結論;④合成每一個規則的結論部分,得出總的結論;⑤反模糊化,即把輸出的模糊量轉化為確定的輸出。
首先確定監視區范圍,即感興趣的區域,而在監視區范圍外的點不予考慮。這樣既可以減少噪聲的干擾,又可以提高處理速度。對于差減后的圖像,采用比較低的閾值,這樣可以將人物盡可能地包括進來。人物區域相對像素數較多,而噪聲則比較分散,故形態學濾波無疑是一種很好的去噪方法。理想情況下,同一個人的各個部分是連在一起的,但有時由于衣服顏色或光照條件的影響,使得人的各個部分被分離成若干塊,此時可以將面積相對較小且相距較近的連通體連接,就可以盡可能地避免多計數或少計數現象的發生。處理之后的連通體個數即為總的人數,但們還無法分清他們的去向(即進入還是離開)。確定去向的策略如下:首先從上到下,從左到右在形態學濾波后的圖像上找到該連通體的第一個點,并在未進行形態學濾波的圖像(因形態學濾波會濾除一些細節)的某個鄰域內搜尋真正的頭頂點,找到頭頂以后,將該點縱向坐標向下移動某個數值,橫向坐標分別向左右兩個方向移動某個數值檢測頭寬。然后根據人頭部的比例關系(一般頭部的長度與寬度之比在1或多一點,本文中取1.2),在一個局部矩形區中檢測頭發和膚色區域并記錄兩者的像素數,求出各自所占的百分比。取局部矩形區的縱向平分線,并在其中找出頭部區,計算平均灰度值。將膚色所占百分比和平均灰度值作為模糊推理的前提條件件進行模糊判決。

圖1 隸屬度函數曲線示例圖
下面對模糊推理加以較詳細地論述。膚色所占百分比的論域為[0 0.8],分成三個隸屬度函數,小、中、大,函數類型取比較簡單的三角形,隸屬度的中心點分別為 0.2、0.4、0.6,函數取點均為181,如圖2(a)所示;平均灰度值的論域為[0 80],隸屬度的中心點分別為20、40、60,如圖2(b)所示;輸出變量進入可能性的論域為[0 1],隸屬度的中心點分別為0.25、0.5、0.75,如圖2(c)所示。

圖2 輸入輸出隸屬度函數示意圖
在if-then模糊規則中,if部分是規則的前提條件,then部分則是結論或后件。模糊規則為:
①if(膚色百分比小)or(平均灰度值小)then(進入可能性小);
②if(膚色百分比中)or(平均灰度值中)then(進入可能性中);
③if(膚色百分比大)or(平均灰度值大)then(進入可能性大)。
應用模糊算子取或算子中的模糊并(max);模糊蘊含算子取最小運算;糊合成算子取模糊并反模糊化使用中心法。整個模糊推理過程如圖3所示。

圖3 模糊推理過程示意圖
在圖中,假設膚色百分比為0.64,平均灰度值為49,經模糊推理后,進入可能性為0.638,即此人應為進入小區。
為了盡量防止多計數和少計數現象的發生,采樣間隔應根據實際情況進行選取,可以將普通人通過監視區域的時間作為標準。
在實際處理中,考慮了人物正向、側向和背向以及多人進出、衣服顏色干擾等多種情況。針對監視區域的大小,采樣頻率取為每八秒一幀。
下面以多人進出為例加以說明。

圖4 小區監視與人數統計處理示例圖
從上圖中可見,接合處理有效地防止了多計數現象的發生。圖中三個人的膚色百分比分別為0.6、0.64、0.44,平均灰度值分別為61、49、43,進入可能性分別為0.75、0.6385、0.5595,均大于閾值0.5,故三人均為進入。從這個角度來說,基于視頻圖象處理的人數統計方法在實際應用中的準確率是很高的,所以可以應用于實際中。
通常模糊推理由于速度較慢、推理復雜等因素較少用于實時圖像處理中,但這里的問題較適合于其使用,因為由膚色百分比和平均灰度值信息判斷進入還是離開本來就是一個不確定的問題,此時用模糊推理和模糊判別來處理比較適合,同時,該應用是每隔若干秒才拍一幀,所以模糊處理時間上也滿足條件。作為一種比較新的應用,在嘗試和探索中還有一些需要解決的問題。彩色視頻圖像雖然具有比灰度圖像更多的信息量,但其應用場合可能會受到一定的限制,如在夜晚效果可能較差一些。各個閾值的選取也會隨著應用場合的變化而變化,或許在這種場合比較合適而在另一種場合效果就變得較差。這些問題需要在以后的嘗試和探索中進一步來解決。
[1] 鮑占闊.基于視頻圖像的交通信息處理方法研究與實現[D].北京:北京工業大學,2006.
[2] Xu Xiaowei, Wang Zhiyan, Liang Yinghong, et al. A Rapid Method for Passing People Counting in Monocular Video Sequences[C].USA:IEEE,2007:1657-1662.
[3] Valle Jr,Oliveira J D,Koerich L E S, et al. People Counting in Low Density Video Sequences. Conference[C]. Heidelberg:Springer Berlin 2007:737-748.
[4] 程科.模糊形態學技術及其在圖像處理中的應用[D].南京:南京理工大學,2005.