999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CNN 的人群計數與密度估計研究綜述

2021-08-24 08:37:40鈕嘉銘
軟件導刊 2021年8期
關鍵詞:方法模型

鈕嘉銘,楊 宇

(武警工程大學信息工程學院,陜西西安 710086)

0 引言

隨著人口數量的持續增長以及城市化進程的加速推進,大型集會、商場等處擁擠場景正變得越來越常見。各種各樣的音樂節,隨處可見的購物中心、影劇院,還有體育館、機場、高鐵站,這些人們習以為常的事物,無時無刻不在影響著人們生活。誠然,豐富的基礎設施資源和文娛項目極大地滿足了人民日益增長的物質文化需求,但隨之帶來的高人流量,高擁擠問題也不容忽視。加之近年來復雜多變的國際國內環境造成的群體事件越來越多,人群分析作為一種有效輔助措施受到越來越多的研究者關注。

人群分析是一個復雜的跨學科研究,在計算機視覺、心理學、社會學及物理學的多個領域均有應用,本文主要圍繞其在計算機視覺任務中的應用展開討論。作為計算機視覺領域的一個熱點,人群分析在視頻監控、公共安全、城市規劃和行為識別與理解等任務中發揮了重要作用。作為人群分析問題的重要組成部分,人群計數和密度估計是對擁擠場景進行更高級理解的基礎,如異常行為檢測與識別、分割、跟蹤及場景理解等。此外,人群計數方法可擴展到其他領域的計數任務中,如細胞鏡檢、車輛計數等。

1 相關研究工作綜述

隨著智慧城市、智能監控系統以及深度學習技術的迅猛發展,人群計數與密度估計等人群分析技術發展迅速,許多研究人員對人群計數和密度估計開展研究[1]。如Zhan 等[2]從社會學和心理學角度對人群進行了深入研究,從人群特征提取、人群建模與事件推理等方面對人群分析方法進行介紹;Junior 等[3]總結了人群分析中的3 個重要問題:人群計數及密度估計、擁擠場景中的人群跟蹤和更高層次的人群行為理解,將人群計數與密度估計模型分為基于像素的分析、基于紋理的分析和對象級分析3 類;Li 等[4]從運動模式分割、人群行為識別及異常行為檢測3 個方面綜述了人群場景分析的相關技術,介紹了特征表示及可以為場景分析算法提供基本人群模型的人群動力學領域相關知識;Zitouni 等[5]用不同的標準評估不同的方法。這些文獻對人群分析進行了總結,但對密度估計研究尚不深入;Loy 等[6]將人群計數方法分為基于檢測的方法、基于聚類的方法和基于回歸的方法,并通過系統比較評估對不同的人群計數方法進行了分析,進而為更深入的研究提供新的思路與方向;Ryan 等[7]通過實驗得到基于回歸的人群計數方法的評估結果,該結果是在多個數據集上利用交叉驗證的方法對整體、局部或基于直方圖的特征,以及包括高斯過程回歸、線性回歸與神經網絡在內的各種回歸模型進行分析比較得到的;Saleh 等[8]從兩個角度對人群計數與密度估計方法進行了分類,即直接法和間接法,直接法即基于檢測的方法,而間接法則致力于從像素、紋理與角點3 個角度對問題進行研究;Grant 等[9]對人群統計和行為理解這兩個人群分析的主要領域進行了探討。

上述文獻對人群計數進行了總結,但沒有涉及到基于CNN 的方法。Sindagi 等[10]將人群計數與密度估計方法分為傳統方法與基于CNN 的方法兩類,分別對這兩類方法進行了分析,與之前不同的是,文章不僅考慮了手工提取的特征,還考慮了CNN 提取的特征;Tripathi 等[11]對基于CNN的人群分析法進行了介紹,主要涉及人群統計、人群密度估計、人群場景分析和人群異常檢測4 個方面;Gao 等[12]對人群計數和密度估計方法進行了全面系統的綜述,以CNN的結構、監督形式及學習范式為基準對基于CNN 的方法進行了闡釋,并在此基礎上分析了當前方法的優勢與不足,為進一步的研究指出了方向。

與其他計算機視覺任務類似,人群計數和密度估計也面臨諸多挑戰,如人群間遮擋、復雜背景、尺度變化、人員非均勻分布、透視失真、照明變化及天氣變化等,如圖1 所示。為解決這些問題,研究人員從不同角度提出了多種行之有效的方法,這些方法主要分為傳統方法和基于CNN 的方法。

本文對基于CNN 的人群計數和密度估計方法進行綜述。考慮到邏輯的完整性與連貫性,對基于傳統方法的人群計數和基于CNN 的人群計數方法進行了總結。

Fig.1 Crowd scene picture圖1 人群場景圖片

2 傳統人群計數方法

早期的人群計數方法是通過檢測來估計人群數量[13],使用滑動檢測器遍歷圖像得到檢測結果進行計數。一般來說,這種方法只適用于稀疏場景,擁擠場景中復雜的背景雜波與嚴重的人員遮擋使其效果大打折扣。為了克服這一問題,研究人員提出了基于回歸的方法,其特點是跳過檢測步驟,直接學習從圖像到計數結果的映射。該方法由特征提取和回歸建模兩部分組成。首先,從目標區域提取梯度、紋理等全局特征或局部特征(如HOG,LBP 等),而后使用線性回歸器、嶺回歸器等回歸技術得到統計結果。基于類似思路,Idress 等[14]提出了一種融合傅里葉分析、頭部檢測和SIFT 興趣點提取的局部圖像塊計數方法。這些回歸模型較好克服了遮擋和背景的干擾,但忽略了人群圖像中的空間信息。考慮到這一點,Lempitsky 等[15]提出一種學習局部特征和密度圖之間的線性映射方法,Pham 等[16]則使用隨機森林回歸來學習局部特征和密度之間的非線性映射。

3 基于CNN 的人群計數方法

雖然基于密度估計的方法使人群統計效果得到一定程度的提升,但它們只使用了手工制作特征,這給更深入的研究造成了麻煩。近幾年,由于CNN 的迅猛發展,越來越多的人將目光轉向了CNN。下面對基于CNN 的人群統計方法進行總結。

3.1 多列網絡與單列網絡

首先從網絡結構角度進行分析。Wang 等[17]和Fu等[18]最早結合CNN 進行人群統計。其中,Wang 等將人群計數看作回歸問題,利用CNN 模型建立了人群圖像與計數間的映射。Fu 等不是直接預測總人數,而是先按預設標準將圖像分為5 個密度等級,然后使用級聯的兩個CNN 對圖像進行分析,最終得到結果。這里第二個CNN 對第一個CNN 分類錯誤的圖像進行訓練。

以上方法均使用了基本的CNN,但受模型結構所限,其精度常常不盡如人意。為此,人們相繼提出了多列網絡與單列網絡來解決這個問題。

3.1.1 多列網絡

多列網絡即指模型中包含多列CNN,通常不同的列對應不同的尺度。Zhang 等[19]是最早提出采用多列結構解決多尺度特征提取問題的研究者之一,使用多列網絡MCNN來建立圖像到密度圖的映射,如圖2 所示。

Fig.2 The structure of MCNN圖2 MCNN 結構

該結構由3 列CNN 構成,每列具有不同的感受野,可用來提取不同尺度特征。Onoro 等[20]提出一個尺度感知計數模型Hydra-CNN,它使用一個對應于不同尺度圖像塊的金字塔進行密度圖估計;Boominathan 等[21]考慮到由拍攝視角等的不同帶來的尺度變化問題,提出了CrowdNet 模型,如圖3 所示。該模型使用深層和淺層兩列網絡來處理圖像中的尺度變化問題。其中,淺層網絡負責提取低層信息,深層網絡則主要承擔高層信息提取任務。

Fig.3 The structure of CrowdNet圖3 CrowdNet 結構

Sam 等[22]發現Hydra-CNN 的性能對圖像金字塔變化非常敏感,為此提出了Switch-CNN 模型。該模型主要由Switch 分類模塊和CNN 回歸模塊組成,其所特有的Switch分類器負責根據密度或其他預設分類標準給輸入圖像塊選擇一個最優回歸器,進而實現精確計數;Sindagi 等[23]認為現有方法雖對密度圖進行了回歸,但它們往往更側重于改進計數誤差而不是密度圖質量,同時發現當前方法未明確使用上下文信息,因此提出了CP-CNN 方法,通過顯式地融合從圖像中學到的全局與局部上下文信息來獲得準確的估計,同時將對抗性損失與歐式損失結合起來用于訓練網絡;Ranjan 等[24]提出ic-CNN 模型,該模型包括兩個分支,第一分支為低分辨率CNN(LR-CNN),用于生成低分辨率密度圖,第二分支為高分辨率CNN(HR-CNN),主要合并來自第一分支的低分辨率預測圖和密度圖,以生成高分辨率密度圖。

這些方法沒有探索不同尺度下估計密度圖的相關性,即來自小區域(小尺度)的計數之和不一定對應于其聯合區域(大尺度)的計數。對此,Shen 等[25]提出一種新的AC?SCP 模型,該網絡充分利用了GAN 在圖像生成中的優異性能,同時通過使用尺度一致性正則化來限制人群尺度不同帶來的誤差。Deb 等[26]近期提出了AMDCN 網絡,通過在多列網絡中加入擴張卷積,使網絡選擇性聚合多尺度信息的能力得到提升,并且網絡在訓練時不使用透視圖。

3.1.2 單列網絡

多列結構在一定程度上推動了人群統計研究的發展,但也存在局限性,如參數量大、訓練存在過擬合等。同時,受結構所限,每個列只能在相應尺度上正常工作,在其他尺度上的性能急劇下降。為此,研究者提出了單列網絡。

Li 等[27]提出了CSRNet,通過使用擴張卷積,模型可在分辨率不降低的前提下得到更大的感受野,進而聚集場景中的多尺度信息,實現高精度的密度估計;Zhang 等[28]提出的SaCNN 是一種尺度自適應CNN,它以固定感受野較小的FCN 為主干,將從多個尺度提取的特征調整為相同大小,然后將它們組合起來生成密度圖,為了提高模型對稀疏場景的適應能力,使用了相對計數損失與密度圖損失;Chen等[29]以單列網絡為骨干,使用部署了4 個不同擴張率的并行擴張卷積尺度的金字塔模塊SPM 來提取多尺度特征;Cao 等[30]提出了一種基于編解碼器的尺度聚集網絡SANet,它包括編碼器和解碼器兩部分;Jiang 等[31]提出了網格編解碼網絡TEDNet,它由一個多尺度編碼器和一個多路徑解碼器組成,集成了多個解碼路徑來捕獲多尺度特征,利用密集跳躍連接來獲取監督信息;Dai 等[32]設計的DSNet 是一種采用了密集擴張卷積塊的端到端單列模型。

3.2 其他方法

除了上述構建多列或單列網絡來獲得更豐富的特征表示方法之外,研究人員還通過引入其他模塊來完善模型,以有效結合不同分辨率的特征。

3.2.1 注意力機制

Liu 等[33]認為,由于人群密度在空間、時間上是變化的,因此僅基于檢測或回歸來計數是不夠的,為此構建了DecideNet 模型。該模型同時使用檢測和回歸模型來估計人群數量,然后利用注意力機制自適應地對特定像素決定采用哪種估計結果;Sindagi 等[34]提出了基于反向注意力機制的深度人群計數網絡IA-DCCN。該模型通過反向注意力機制有效地將分割信息注入計數網絡,使特征圖中的背景信息得到了抑制,最終得到更準確的估計;Jiang 等[35]設計了一種新的基于注意力機制的計數網絡,該網絡利用注意力掩膜和尺度因子來修正不同密度區域的密度估計。

3.2.2 透視感知

Zhang 等[36]通過分析發現,當目標場景與訓練場景不一致時,目前的人群統計方法性能會顯著降低。為此使用密度和透視信息作為相似性度量,從訓練數據中檢索與測試相似的圖像,之后利用檢索到的圖像對訓練好的網絡進行微調,進而得到目標測試場景下的密度圖,最終實現跨場景人群統計。

面對透視失真的挑戰,Shi 等[37]提出一個透視感知網絡PACNN 來進行計數,將透視信息整合到密度回歸中,以提供與圖形尺度變化相關的信息;Yan 等[38]提出一種用于人群計數的透視引導卷積網絡,作為一個可插入的模塊,透視引導卷積成功解決了場景內的連續尺度變化問題,還提出一個透視估計分支,該分支用于生成透視圖;Gao 等[39]提出一種多任務透視人群計數網絡PCCNet,它可以對人群場景中的層次特征(全局、局部或像素級特征)和透視變化進行編碼,由密度圖估計(DME)、隨機高密度分類(RHDC)和前背景分割(FBS)組成;Yang 等[40]提出一種無監督的反向透視網絡RPNet 來減小輸入圖像的尺度變化,由透視圖估計器和坐標變化器組成,首先透視圖估計器對透視失真的程度進行評估以獲得透視因子,然后坐標變化器根據透視因子對圖像進行處理以減小圖像尺度變化。

3.2.3 基于視頻的人群計數

Xiong 等[41]提出了ConvLSTM 模型,該模型可對視頻中的人群進行計數。與一般基于CNN 的方法不同,該方法同時利用空間與時間信息進行計數。

Fang 等[42]認為ConvLSTM 只是隱式地對視頻中的時空相關性進行建模,為了提高性能提出了LSTN。該模型由密度圖回歸和LST 空間變換兩個模塊組成。其中,LST 負責處理視頻中的時空相關性。之后又進一步提出了一種基于多層次特征融合的局部訓練空間變換網絡MLSTN[43],該網絡將相鄰幀的密度圖顯式地關聯起來,以實現更為穩健的視頻人群統計。

4 評價指標

為更好地對人群計數與密度估計模型進行評估,同時也為了更直觀地了解模型性能,需要引入一些簡單有效的評價指標,下面介紹兩類評價指標。

(1)為了評估模型的計數性能及密度估計性能,引入平均絕對誤差MAE 和均方誤差MSE,定義如下:

其中,N是測試樣本的數量,yi是樣本的真實計數值,yi'是經模型估計得到的與yi相對應的計數值。MAE 和MSE可以分別在一定程度上反映模型的準確性與穩健性。一般情況下,兩個誤差的值越小表明模型的性能越理想。

(2)為了評估模型生成的密度圖質量,引入峰值信噪比(PSNR)和結構相似性指數(SSIM),PSNR 用來衡量處理后的圖像與原始圖像之間的誤差,一般PSNR 值越高表明誤差越小。同時,受外在因素及人類視覺局限性影響,PSNR 值可能與人們對圖像品質的主觀感受不完全一致。SSIM 用來評價估計的密度圖與實際密度圖間的局部模式一致性,它用亮度、對比度與結構相似度3 個因子來衡量圖像質量,并分別將均值、標準差和協方差看作3 個因子的度量,根據3 個局部統計量計算出兩幅圖像之間的相似性。其范圍為0 到1,一般SSIM 為1 即表明兩個圖像相同。

5 相關數據集

隨著人群統計技術的發展,特別是深度學習等方法的廣泛使用,優秀的數據集在模型的不斷優化及統計效果提升過程中扮演著越來越重要的角色。面對尺度變化、背景雜波和遮擋等人群密度估計任務的挑戰,不同數據集根據實際需求有針對性地在某些方面進行了優化。這些數據集為研究工作帶來了便利,激勵人們不斷地創建出泛化能力更強的模型。表1 展示了常用數據集信息。

Table 1 Commonly used datasets表1 常用數據集

UCSD:UCSD 數據集是最早的人群計數數據集之一,它從一個人行道上的攝像機中采集。該數據集由來自一個視頻序列的2 000 個尺寸為238×158 的幀和每五幀中每個行人的注釋組成,其中包含49 885 個行人實例。

Mall:該數據集是在購物中心收集的,它由200 個尺寸為320×240 的幀組成,共包含62 325 名行人。與USCD 相比,該數據集覆蓋了更多不同的照明條件、更多的密度水平以及不同的活動模式,其具有更大的透視失真及更嚴重的遮擋。

UCF_CC_50:UCF_CC_50[44]是第一個真正具有挑戰性的數據集。它由來自公共網站的50 幅分辨率不同的Web圖像組成,共包含63 075 個被標記的個體。該數據集中的圖像具有較大的密度差異,但其偏少的圖像數量也給研究人員使用帶來了不便。

WorldExpo’10:文獻[35]引入的WorldExpo’10 是一個大型跨場景人群計數數據集,主要收集自上海世博會。它由1 132 個由108 個監控攝像頭拍攝的帶注釋的視頻序列組成,共有3 920 個尺寸為576×720 的幀,有199 923 個被標記的行人。

ShanghaiTech:文獻[19]引入的ShanghaiTech 是近幾年大規模人群統計數據集之一,由1 198 幅圖像和330 165 個注釋組成。其被分為兩部分,A 部分是從網上隨機選取的圖片,具有較高的密度,B 部分圖片是在上海市一條街道上拍攝的。該數據集覆蓋了不同場景類型和不同密度級別,其復雜的尺度變化與透視失真也為研究人員帶來了新的挑戰。

6 結語

本文從傳統方法和基于CNN 的方法兩個方面對當前的人群計數與密度估計方法進行了分析。通過分析,可以得到以下幾點研究啟示:

(1)與CNN 相結合是當前人群計數與密度估計方法發展的方向。近幾年,隨著CNN 的迅猛發展,其在人群密度估計領域的應用潛力為越來越多的研究人員所重視。CNN在特征提取方面得天獨厚的優勢不僅大大提高了模型的運行速度,而且使模型性能跨上了新臺階。

(2)在基于CNN 的方法中,大多數網絡傾向于使用單列結構。多列結構很好地推動了人群計數與密度估計方法的發展,但與單列結構相比仍存在一些不可避免的問題。首先多列網絡參數量大運算較為復雜;其次多列網絡不同的列雖可用來提取不同尺度的特征,但也正是因為這個原因,其提取的特征尺度多樣性往往受制于網絡有限的列數。

(3)尺度變化是人群密度估計面臨的主要挑戰之一。當前,幾乎所有的密度估計模型都是為解決尺度變化問題而設計的。無論是多列結構、多分支結構與單列結構的使用,亦或是擴張卷積、空間金字塔及透視圖的引入,無不都是在解決尺度變化問題。當然,其他問題也不容忽視,比如復雜背景、遮擋及照明變化等。為解決這些問題,人們引入了語義分割、視覺注意力機制及空間變換網絡等方法。

(4)良好的損失函數也是影響模型性能的主要因素。作為一種經典方法,歐式損失在人群密度估計中得到廣泛應用,但由于其存在局部相關性和密度圖的空間相關性考慮不足的缺陷,使歐式損失不利于模型發展。為此,人們結合使用對抗性損失、貝葉斯損失及局部模式一致性損失來優化模型。

本文對基于傳統方法和基于CNN 方法的人群計數與密度估計模型進行了總結,特別對基于CNN 的方法進行了分析,同時介紹了幾個常用的相關數據集以及常用的評價指標。總結了當前方法的特點及發展趨勢,為后續進一步研究指明了方向。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 亚洲va在线∨a天堂va欧美va| 国产成人综合在线观看| 潮喷在线无码白浆| 亚洲天堂视频在线观看免费| 亚洲第一区在线| 亚洲成人一区二区| 浮力影院国产第一页| 国产不卡在线看| 999国内精品久久免费视频| 欧美a级在线| 少妇极品熟妇人妻专区视频| 欧美天堂在线| 国产精品30p| a欧美在线| 中文字幕av无码不卡免费| AV在线天堂进入| 亚卅精品无码久久毛片乌克兰 | 9久久伊人精品综合| 亚洲Av激情网五月天| 永久免费av网站可以直接看的 | 美女被操91视频| 中文字幕免费在线视频| 综合网久久| 欧美激情综合一区二区| 亚洲婷婷六月| 欧美国产日产一区二区| 五月天香蕉视频国产亚| 国产本道久久一区二区三区| 九色综合伊人久久富二代| 日日碰狠狠添天天爽| 在线观看无码av五月花| 久久综合色播五月男人的天堂| 久久国语对白| 欧美国产另类| 精品久久蜜桃| 亚洲二三区| 欧美亚洲国产精品久久蜜芽| 国产成人亚洲无吗淙合青草| 少妇人妻无码首页| 日韩精品成人在线| 无码久看视频| 久久婷婷国产综合尤物精品| 色婷婷电影网| 六月婷婷综合| 美美女高清毛片视频免费观看| 无码精品国产dvd在线观看9久| 久久国产精品影院| 成人a免费α片在线视频网站| 欧美色99| 国产欧美另类| 国产精品自在自线免费观看| 无码在线激情片| 亚洲欧美天堂网| 全部无卡免费的毛片在线看| 亚洲视频在线青青| av尤物免费在线观看| 九色最新网址| 黄片在线永久| 亚洲swag精品自拍一区| 青青热久免费精品视频6| 无码人妻热线精品视频| 国产污视频在线观看| 岛国精品一区免费视频在线观看| 日韩免费成人| 成人在线视频一区| 久久一本日韩精品中文字幕屁孩| 国产黄在线免费观看| 欧美自慰一级看片免费| 日韩毛片在线视频| 欧美一级高清片久久99| 国产精品美女在线| 久久精品无码中文字幕| 国产精品蜜臀| 九九免费观看全部免费视频| 在线观看国产黄色| 全免费a级毛片免费看不卡| 免费无码又爽又刺激高| 人妻丰满熟妇AV无码区| 久久毛片免费基地| 精品视频在线观看你懂的一区| 免费看美女毛片| 国产一线在线|