肖克爽 楊帆 朱宇 覃明其



摘要:隨著各種社會高密集的活動逐漸增加,由此帶來的安全隱患,如踩踏事件、傳染病的傳播等發(fā)生概率也會增大。基于視頻監(jiān)控設備,通過計算機處理和視覺智能算法,實現(xiàn)對視頻中人群數(shù)量和分布狀況進行自動有效估計,避免各類安全隱患。文章采用注意力機制,提出一種基于Transformer的人群計數(shù)方法,即雙重注意力網(wǎng)絡(Dual Attention Net?work,DAN) 。通過在ShanghaiTech數(shù)據(jù)集上對DAN網(wǎng)絡進行測試,并使用評價指標對計數(shù)性能進行評估,結(jié)果表明該網(wǎng)絡有效優(yōu)化了人群計數(shù)領(lǐng)域的人群重疊、尺度變化問題。經(jīng)過在不同數(shù)據(jù)集的實驗結(jié)果和相關(guān)對比發(fā)現(xiàn),證明文章提出的DAN網(wǎng)絡具有優(yōu)秀的計數(shù)精確度與魯棒性。
關(guān)鍵詞:人群計數(shù);深度學習;注意力網(wǎng)絡
中圖分類號:TP391.41 文獻標識碼:A
文章編號:1009-3044(2024)04-0043-03