郭瑞琴, 陳雄杰, 駱 煒, 符長虹
(1.同濟大學 機械與能源工程學院, 上海 201804; 2.斯圖加特大學 工程與計算力學研究所, 斯圖加特 70569)
隨著科學技術的快速發展,交通工具更加便利,城市化進程不斷加快,城市流動人口的數量快速增長,城市繁華街道越來越擁擠,各種大型展覽會的參展人員也越來越多.為了保證城市交通通暢,合理控制人群密集場合的人員數量,保證人民群眾生命安全,有必要對行人行為和分布規律進行研究[1-11].人群計數技術作為該領域的重要組成部分之一,近年來受到眾多國內外研究機構的關注[1-7].人群計數主要有以下難點:第一,在一張圖片中,行人的尺度變化;第二,不同場景下的行人分布變化;第三,相同場景下不同時間的行人分布變化.由于不同場景圖片中行人數量和大小差別較大,因此要求計數方法對不同環境場景中行人尺寸的多樣性具有很強的魯棒性.為解決這個難題,學者們提出了各種不同的人群計數方法來保證神經網絡適應這種尺度的變化[1-6].
在早期的人群計數研究中,大多數計數方法是以目標檢測為基礎,其檢測方法主要分為兩類:一類是基于人工設計特征的目標檢測[11];另一類是基于深度神經網絡提取特征的目標檢測[12-13].目標檢測方法首先通過訓練得到能夠定位目標的檢測器,然后使用該目標檢測器在圖片中找到指定目標,并將檢測得到的目標數量作為最后的計數結果.該方法能夠比較……