金 鑫 趙 旭 趙朝陽 徐華中 王金橋
(*武漢理工大學自動化學院 武漢 430070) (**中國科學院自動化研究所 北京 100190)
基于計算機視覺的人群計數算法即在圖像或視頻幀中對行人的軌跡進行分析,統計當前時段行人的數量/流量信息。人群計數算法主要分為基于回歸模型和基于目標檢測兩類。
在基于回歸模型的方法中,經典方法如Davies等人[1]在視頻幀中提取前景像素和邊緣特征等原始特征,然后從原始特征導出前景區域和總邊緣計數之類的整體屬性,最后利用線性回歸模型建立整體屬性與實際人數之間的直接映射。隨著深度學習的發展, Zhang等人[2]提出利用深度特征進行人數估計的方法,利用不同尺度卷積核的卷積層提取圖片的深度特征,然后利用深度特征得到人群密度圖,最后根據密度圖估計圖片中行人數量。基于回歸方法的人群計數優點在于對密度極高的人群計數會有較強的魯棒性和較快的速度,然而由于利用圖片整體特征或密度圖進行估計人數的策略無法獲取圖像中單人的位置,在一般場景下精度較低。
在基于目標檢測的人群計數算法中,行人檢測應用最為廣泛。Dalal等人[3]提出了利用梯度方向直方圖(histogram of oriented gradient,HOG)特征檢測圖片中行人的數量,通過提取圖像HOG特征的方式獲取圖像內行人的邊緣特征,根據邊緣特征檢測到行人,直接統計行人位置和數量。在HOG之后,Dollar等人[4]提出了聚合通道特征(aggregate channel feature,ACF)檢測算法進行行人檢測,通過對圖片進行快速特征金字塔變換,然后聚合多通道特征,更加準確和高效地提取行人邊緣特征,最終獲取圖片中行人數量。……