劉洋
(重慶交通大學信息科學與工程學院 重慶市 400074)
教室人數估計,是指利用圖像處理[1]、紅外檢測[2]、物聯網[3]等技術對教室內人數進行估計與計算,得到教室內人數的近似數值。基于教室人數估計可以實現學生到課率統計、教室座位占有率統計以及教室內設備節能控制[4]的智能實現。
教室人數估計是人數統計方法在教室這一室內場景下的應用。傳統人工統計的方法,在人流量或人群密度較大時呈現出誤差大、耗時長的弊端。隨著數字圖像處理技術、物聯網技術等相關技術的發展,以及視頻監控在高校管理中的普及應用,使得基于視頻監控圖像估計教室人數成為教室人數估計的主流趨勢。本文在分析國內外教室人數估計方法和教室視頻監控圖像特點的基礎上,提出了一種基于圖像形態學處理與區域數統計的教室人數估計方法,并通過某高校監控圖像對方法進行測試。
基于視頻監控圖像處理的人數統計方法,根據視頻監控設備的安裝位置與視角不同可分為三類[5]:一是監控設備所在位置能獲取行人形狀信息,基于行人運動目標檢測實現人數統計;二是監控設備所處位置位于進出通道口,通過頭部輪廓信息或頭發顏色信息進行人數統計;三是監控設備位于人臉等高位置,通過人臉檢測實現人數統計。文獻[6]將人數統計方法分為四類:基于形狀特征的人數統計方法、基于模板匹配的人數統計方法、基于目標檢測的人數統計方法以及基于人群密度估計的人數統計方法等。上述人數統計方法分類可看出,人數統計采取何種具體方法與用于人數統計的圖像數據有著密切關系。
由于遮擋、教室人員低頭或側臉、監控圖像近遠景等原因。使得教室監控人體圖像呈現如下特點:
(1)人體輪廓的不全性。由于遮擋或重疊的緣故,監控設備大部分場只能獲得教室內人員上半身圖像或胸部及以上圖像,使得基于人體全身輪廓對教室內人數進行統計不可行。
(2)人臉的不可全檢測性。高校教室的監控設備大多數處于俯視教室內人員的位置,當教室內人員低頭或側臉時,不能獲得教室內人員的完整臉部信息,使得基于人臉識別的教室人數統計存在漏檢可能。
(3)人體的高重疊性。在教室內人員在就坐后,監控設備能獲得前排就座人員較完整的上半身圖像數據,中排和后排就座人員的頭部或頭發區域的圖像信息,使得基于單個人體分散特征的人數統計方法的魯棒性降低。
(4)人體大小不一致性。靠近監控設備的人體圖像顯得更大,遠離監控設備的人體圖像顯得更小,從而使得不能基于單一大小的模板進行匹配識別。

圖1:方法總體流程圖
基于上述分析,本文在對人頭發區域檢測分割的基礎上,利用頭發區域的形狀特征對區頭發域進行篩選和統計,并依據頭發區域數估計教室內人數。
如圖1 所示,基于開運算與區域數統計的教室人數估計方法由基于模板的目標圖像區域提取、基于頭部像素灰度統計的圖像二值化、圖像開運算和基于鏈編碼的白色區域數統計與人數估計四個部分構成。
在教室監控圖像中,人員就座區域為目標區域,包含了人數統計的相關信息。本文依據監控設備實際取景圖像設計圖像模板,屏蔽目標區域之外的圖像數據。
如圖2 所示,圖2(a)為原圖像,圖2(b)為圖像模板。模板圖像中黑色部分為原始圖像需屏蔽的區域,白色部分為保留的區域。圖2(c)為提取出的圖像區域。
由于教室內光照隨氣候、季節、燈光的變化,使得在對圖像進行預處理時需要充分考慮光照影響。本文采取歸一化的方式,對圖像像素灰度值進行線性拉伸或壓縮。具體步驟為:
(1)在基于模板的目標圖像區域提取的基礎上,實現圖像的灰度化;
(2)計算保留區域內灰度的最小值和最大值,利用線性拉伸或壓縮的方式,使得保留區域內灰度值線性映射到[0,1]區間內;
(3)依據樣本采樣統計分析和圖像獲取時間,設定灰度閾值,實現圖像二值化。
如圖3 所示,在統計分析圖像二值化的閾值時,考慮光照、距離對頭發灰度值的影響,對近景、中景和遠景圖像區域內人頭發的灰度值分別進行采樣統計。圖中紅色“+”標注位置為采樣點。

表1:測試結果表

圖2:基于模板的目標圖像區域提取示意圖

圖3:人頭發圖像灰度值采樣示意圖
如圖4 所示,在采樣的20 個人頭發灰度值中,僅3 個采樣值大于0.21,其余皆小于等于0.21,故將此時間段圖像二值化的灰度閾值設為0.21。圖2(c)的二值化效果如圖5 所示。

圖4:人頭發圖像采樣灰度值分布示意圖

圖5:圖2(c)二值化圖

圖6:開運算效果圖

圖7:鏈碼篩選后的人頭發區域檢測分割示意圖
由圖5 可知,監控圖像經過二值化后,仍然存在許多點狀或長條狀的燥點,需要對其進行濾波。近景區域存在長條狀干擾,遠景區域則存在點狀干擾。圖像開運算[7]可使圖像的輪廓變得光滑,斷開較窄的狹頸和消除細的突出物。本文采用開運算對二值化圖像進行濾波。開運算的結構元素如下所示:

開運算后得到的圖像效果如圖6 所示。
頂點鏈編碼[7],是在Freeman 鏈編碼的基礎上發展而來的,其基碼為3。本文采取頂點鏈編碼描述開運算后頭發圖像區域邊緣,通過統計鏈編碼的數量實現對開運算處理后頭發區域數的初步統計。然后,依據鏈碼長度、鏈碼最小外接矩形長寬比和鏈碼最小外接矩形面積數據,對頭發區域進行篩查,獲得符合人頭部特征的頭發區域。最后,通過統計圖像中人頭發區域的數量估計圖像內的人數。依據鏈碼篩查獲得人頭發區域,如圖7 所示。
依據上述人數估計方法,本文基于教室監控圖像構建了測試數據集,依據人員密集程度,將測試圖像教室人員密集程度分為高、中、低三種程度,各3 張圖像。其測試結果如表1 所示。
分析表1 所示測試結果,在人員密集度低的狀況下,本文所提方法對人數估計的準確率較高。分析其原因在于,人員密集度低時,人頭部圖像重合較少,本文所提方法能較好地實現頭發部位與其他部分的分割,從而能更好地實現人頭像區域數統計,從而進一步實現圖像內人數的估計。在人員密集度高的狀況下,本文所提方法對人數估計的效果波動較大。究其原因在于,教室內人數較多時,人員頭部圖像重疊部分多,出現漏檢情況,同樣由于多人穿著黑色或深色衣服,從而出現將學生穿的黑色或深色衣服誤檢為頭發區域的情況。
本文在對教室監控圖像進行模板剪輯、歸一化等圖像預處理的基礎上,利用圖像開運算、頂點鏈編碼方法和區域數統計,實現了圖像人數的估計。通過測驗可知,本文所提方法行之有效。但也存在估計精度不高的情況,為下步基于教室監控圖像和人群密度估計的最新方法進行教室內人數估計指明了研究方向。