龍思凡 金路 王仁捷
摘要:教室人數統計方法,該方法適用于在教室這個特定場景下使用,將采集視頻的攝像頭垂直向下拍攝,能夠有效地避免人體相互遮擋和重疊,能夠將人體目標劃分為單獨的個體。實驗數據表明,該方法計算精度可達90%左右,計算速度可達每秒20幀左右。與現有方法相比,該方法在精度、實時性和健壯性方面都有很大的提高。
關鍵詞:人數統計;前景分割;背景差分;運動檢測;目標跟蹤
中圖分類號:TN948.6 文獻標識碼:A 文章編號:1007-9416(2019)05-0134-02
1 背景
1.1 教室人數統計研究背景
當我們在討論大創的研究方向的時候,我們就在考慮我們的學習生活中有哪些還不夠方便,或者能更方便的地方。我們發現教室的相關情況信息包括人數,在上什么課,將會有什么課,會有什么活動都是封閉的,同學們往往需要打開門看看里面有沒有課,或者有多少人在上自習。想要用教室組織活動的時候,往往也是要在黑板上寫占用教室相關的信息。這種流程是可以更簡單的,并且教室的資源應可視化,并依此合理調度管理。因此我們想做一個以即時視頻圖像識別人數為技術基礎的教室信息活動管理APP。
1.2 課題研究的目的和意義
從算法的角度來看,傳統人數統計算法的一般過程是:首先采用合適的方法如幀差法、背景減除等進行運動目標提取,然后利用時空關系、幀間關系等進行運動目標的跟蹤,最后通過某些判斷方法統計出人數。在這個過程中,最重要的步驟是目標識別和目標跟蹤,其中目標識別的效果直接影響運動目標選擇的準確性,目標跟蹤的效果則是影響最終跟蹤計數的準確度。目前已有的算法能夠取得不錯的人數統計效果,但是不論是在實時性還是準確度上都存在一定程度的限制和不足,仍然存在改進和優化的可能,這也是本課題研究意義所在。
同時,從應用方式的角度來看,人數統計系統的視頻獲取部分一般由紅外攝像頭組成,而且為了在高度一定的時候擴大可視區域攝像頭常常會帶有廣角鏡頭。但是在實際的應用當中,人數統計系統的方案經常會遇到一些復雜的情形與問題:如果攝像頭采取軸線垂直向下的方式安裝,系統能夠避免運動目標相互重疊和遮擋,并且重點針對人頭部分進行處理,避免人體其余部分的干擾。
1.3 國內外研究現狀
現在國內外都有人流量統計的技術,但我們自己想針對教室環境,和我們需要的信息做出優化,能夠讓硬件高效準確的給我們傳遞需要的信息。當前的視頻人數統計大致分為兩類:
(1)基于特征提取的人數統計方法。考慮到在教室中人頭部分遮擋較小,多樣性也相對人體較低,所以本文選擇檢測人頭作為人數統計對象。首先通過機器學習Adaboost的方法得到人頭檢測分類器,并使用多尺度滑動窗配合非極大值抑制算法對視頻圖像進行人頭初步檢測。然后,將第一步人頭初檢測出的結果圖像輸出,并人工挑選出這些難分的正確分類與錯誤分類的圖像,再將它們作為SVM算法的訓練樣本進行再學習。學習得到人頭篩選的二次分類器用以對初步檢測結果進行二次篩選,以此方式有效去除錯誤檢測,增強了計數可信度。最后,使用卡爾曼濾波與檢測結果數據關聯算法彌補幀間漏檢,并把數據關聯處理后的結果作為最終的人數統計結果。實驗證明該方法解決了有效去除誤檢測與幀間漏檢問題,使得檢測與人數統計結果更加穩定,對比初步檢測結果,計數準確率提了10%以上。
(2)基于背景差分的邊緣信息統計方法。通過背景差分等方法獲得圖像的一些邊緣信息,加以深度信息,高斯建模等進行匹配。由于我們主要是針對教室視頻監控的實時人數統計,容易獲得穩定的背景信息.這里參考了基于背景差分法的CSDN博客信息:根據目標的運動軌跡計算目標運動方向和位移,判斷目標是進入還是離開指定區域,從而對目標進行數目統計。例如:需要統計公交車的人數,就可以利用python-opencv對人頭統計,然后利用軌跡分析計算目標運動的方向和位移,來判斷目標是上公交還是下公交。
2 算法簡介
目前有許多實現視頻目標跟蹤的方法,這些方法目的稍微不同。例如,當跟蹤所有移動目標時,幀之間的差異會變得非常有用;當跟蹤視頻中移動的手時,基于皮膚顏色的均值漂移方法在這里有著最好的應用;當知道跟蹤對象的一方面時,模板匹配又會是最優的選擇。所以沒有最好的算法,只有在適當場景中最合適的方法針,對在教室門口跟蹤人體這個特定應用,本文提出了一種基于MeanShift的跟蹤和計數算法,能夠有效實現目標跟蹤并滿足實時性要求。
2.1 目標跟蹤
為了跟蹤視頻中的所有目標,首先要識別視頻幀中那些可能包含運動的目標區域,最簡單的就是幀差法,所謂幀差法就是將視頻中的前幾幀作為輸入的背景然后對于以后讀取的幀都會計算它與背景之間的差異。在這之前要先將幀轉化為灰階,并進行模糊處理(每個輸入的視頻都會因為自然震動、光照變化或者攝像頭本身而產生噪聲。對噪聲進行平滑是為了避免在運動和跟蹤時將其檢測出來),之后進行侵蝕和膨脹處理來達到透明,最后在計算出的差分圖中找到所有白色斑點的輪廓。
2.2 計數線的設置和計數
計數之前需要確定計數線和輔助計數線(可以形成技術區域),這里需要注意的是,計數線和計數區域設置完成后,計數區域不做顯示,僅僅顯示計數線,但是計數區域的數據已經被保存在算法當中,用于輔助判斷。首先通過背景分割器識別出感興趣的區域和與之相應的運動對象(提取出每一個區域,實例話學生類,記錄幀以及跟蹤窗口的目標形成感興趣區域),進而提取ROI的HSV直方圖,計算學生HSV直方圖的反向投影,接下來使用均值漂移對目標進行跟蹤,當目標進入計數區域時根據計數線來判斷學生運動方向,計數區域用于輔助計數線進行判斷。只有進入了計數區域內的對象才會成為計數的候選對象,在此區域外的對象只是被檢測和跟蹤。
3 計數部分算法詳解
3.1 計數線的設置和計數區域
目標跟蹤計數之前需要確定計數線,其中計數線用于判斷行人進出的方向以及是否過線,計數線的方位分為水平方向和垂直方向,分別對應上下過線和左右過線;計數區域中心線即為計數線,基于運動目標在過線時間段內僅僅在局部區域內運動的事實,在此區域外的目標只是被檢測和跟蹤。采用本方法能夠在大大減少計算量的同時保持統計的準確度。
3.2 目標跟蹤
本文采取的目標跟蹤算法主要步驟為:算法維持一個跟蹤目標數組,每個節點存儲了被跟蹤目標的信息(中心點坐標,大小,顏色直方圖)。算法對每一幀檢測到的所有新目標根據特定算法逐個做出判斷:若該目標已經在跟蹤目標中,則忽略該目標;若該目標不在跟蹤目標列表中,則視為新的跟蹤目標,并插入跟蹤目標列表。對于跟蹤目標列表中的每個目標都采用MeanShift算法進行更新,直到滿足某種終止條件則停止跟蹤并清除。
3.3 本章小結
本文提出了一種基于MeanShift的運動物體跟蹤與計數算法,通過維持一個檢測目標的跟蹤數組,實時記錄對象的中心位置,通過判斷軌跡與計數線和區域的相對位置關系來判斷計數與否。從最終的人數統計實驗結果可以看出,本文所提出的人數統計算法能夠取得92%以上的統計精度而且在統計速度和效率上相較于傳統方法有了很大提升。
4 結語
基于教室的這一特定場景,本文提出了一種新穎和有效的人數統計方法斷面式人數統計,首先教室相比于外界背景穩定受光線影響小易于使用幀差法,且運動物體單一(只有人)容易識別誤差小,本文的主要創新點在于:我們想對教室活動和信息的管理和展示的想法本身,以及針對性的統計人數算法的開發與優化。把教室的信息集合在app上,并有一個主動的信息公布(app上有教室信息),基本信息包括實時人數,教室一天的活動,app將會能夠查詢到更多信息并提供更有針對性的信息查詢功能,比如針對占用教室組織活動的查詢,針對上自習人數的查詢。在教室內這個特殊場景下我們采用了斷面式人數統計,將攝像頭自上而下拍攝能夠有效地避免多個人時的相互遮擋和重疊,利用腐蝕和膨脹還有連通器原理能夠將多個人體目標劃分為單獨的人體,能夠準確的確計數。與現有的基于人臉檢測和人體檢測的人數統計方法相比,本方法大大提高了統計準確度而且降低了計算復雜度。
參考文獻
[1] 黃凱奇,陳曉棠,康運鋒,譚鐵牛.智能視頻監控技術綜述[J].計算機學報,2015(06):1093-1118.
[2] 李苗,劉衛寧.視頻監視技術在公交車自動乘客計數中的應用[J].西華大學學報,2006,25(4):04-08.
[3] 張英.基于視頻的實時人數統計關鍵技術的研究[D].杭州電子科技大學,2014.
[4] Ahuja N,Todorovic S.Extracting texels in 2.1D natural textures[C].Computer Vision,2007.ICCV 2007.EEE l1th International Conference on.IEEE,2007:1-8.
[5] Rabaud V,Belongie S.Counting crowded moving obj ects[C].Computer V ision and Pattern Recognition,2006 EEE Computer Society Conference on.EEE,2006(1):705-711.
[6] Chen L, Tao J, Tan Y P, et al. People Counting Using Iterative Mean-Shift Fitting with Symmetry Measure[C].The 6th International Conference on Information, Communications & Signal Processing,2007:1-4.
[7] Wen W, Ho M, Huang C. People Tracking and Counting for Applications in Video Surveillance System[C]. International Conference on Audio, Language and Image Processing,2008:1677-1682.
[8] Aik L E, Zainuddin Z. A Kernelized Probabilistic Neural Network Approach for Counting Pedestrians[C].IEEE International Symposium on Industrial Electronics,2009:2065-2068.