廖宇杰 東北大學計算機科學與工程學院
隨著城市經濟的快速發展,帶動了城市軌道交通的發展。目前,越來越多的人在出行時選擇軌道交通,因此,保障軌道交通的出行安全是十分必要的。城市軌道交通的安全防護系統針對因客流聚集而容易發生意外事故這一情況,采取了利用智能視頻客流監測技術進行預測這一預防措施。智能視頻客流監測技術的應用可以對突發事件進行預防,提升了現場的管理水平,減少突發事件為軌道交通的運輸帶來的影響。因此,智能視頻客流監測技術的研究,對于城市軌道交通有著重要的意義。
掌握實時客流情況,預測未來客流規模,對于避免大規模旅客滯留具有重要意義。然而,傳統的客流監測技術存在設備安裝和維護困難,數據存儲量大,監測范圍不完整等問題。
目前,更主流的客流監測技術包括:多傳感器協同監測方法,基于計算機視覺的視頻監測方法,基于移動通信網絡信令數據的監測方法,以及WiFi 嗅探監測方法。當人數較少時,多傳感器協同監控更準確,一旦人群擁擠,就很難發揮作用。基于計算機視覺的視頻監控范圍有限,需要大量攝像機覆蓋所有目標區域。而且,由于攝像機視角的影響,近處和遠處的檢測率將不可避免地逐漸降低或甚至不可識別。該方法適合作為關鍵區域的輔助判斷手段。基于移動通信網絡的信令數據的監控要求三大通信運營商公開用戶移動電話的實時數據信息,由于隱私和商業秘密而難以實現。同時,由于無法區分室內和室外,這種方法不適合監測建筑物的內部客流。
現行的人群計數的方法主要包括:基于檢測的方法,基于回歸的方法,以及基于深度學習的方法。這些方法都有著一些缺點導致其檢測效果不盡如意。現行軌道交通客流狀態監測多采用單一視頻監測,單一視頻監測客流信息存在較大誤差,存在信息遺漏、信息重疊等問題。本項目綜合采用視頻監控、WiFi 嗅探、閘機刷卡多元數據收集分析手段,力求得到更為詳實可靠的客流信息數據。
早期的人群研究主要聚焦于基于檢測的方法。基于檢測的方法主要分為兩大類:一種是基于整體的檢測方法,主要訓練一個分類器,利用從行人全身提取的小波,HOG,邊緣等特征去檢測行人。基于整體檢測的方法主要適用于稀疏的人群計數,隨著人群密度的提升,人與人之間的遮擋變得越來越嚴重;另一種是基于部分身體檢測的方法,被用來處理人群計數問題。其主要通過檢測身體的部分結構,例如頭、肩膀等去統計人群的數量。這種方法比之基于整體的檢測,在效果上有略微的提升。
無論何種基于檢測的方法,都很難處理人群之間嚴重的遮擋問題。所以,基于回歸的方法逐漸被用來解決人群計數的問題。
基于回歸的方法,主要思想是通過學習一種特征到人群數量的映射。這類方法步驟主要分為兩步:
第一步提取低級的特征,例如前景特征,邊緣特征,紋理和梯度特征;
第二步是學習一個回歸模型,例如線性回歸,分段線性回歸,嶺回歸和高斯過程回歸等方法學習一個低級特征到人群數的映射關系。
優點在于對高密度人群圖像來說,其效果是比基于目標檢測方法的好,但缺點是沒有精確的定位。
深度學習技術始于2006 年Hinton 等人在Science 發表的文 章“Reducing the Dimensionality of Data with Neural Networks”。近些年來,DL 被廣泛應用于各個研究領域(計算機視覺,自然語言處理等)。 DL 憑借其出色的特征學習能力,同樣被研究人員用于人群計數的研究中。近年來所提出的方法主要 有:MCNN(CVPR 2016),CP-CNN(CVPR 2017),Switch-CNN(CVPR 2017),CSRNet(CVPR2018),ic-CNN(ECC V2018),SANet(ECCV 2018)。上述各種模型有的是提取多尺度特征,有的是逐步細化密度圖,但無論哪種模型,目前最困難的問題仍然是:在人群密集的區域,如何讓模型更精細的區分出人的特征(如人頭重疊);如何教會模型“聚焦”,即在一幅人群密度分布廣泛的圖像中對較小尺度的局部特征能“看”得更清晰。
不同角度拍攝所得的樣本的監測效果相差非常大,因此一個優化方向就是采樣相機的擺放角度。在基于深度學習的人群計數方法中,不同距離的特征提取和重疊部分的特征提取仍是難點。對于軌道交通這一個特定的應用場景,可以很容易想到通過將攝像頭垂直放置采樣,這樣就避免了遮擋和距離不同的問題,基本控制了目標特征的一致性。這樣不論是深度學習的方法,還是基于監測的方法,都可以比較容易地提升效果。
通常的行人檢測采樣中,往往只從一個角度獲取視頻信息。采用多組攝像頭組合采樣,可以減弱遮擋、明暗對視頻處理的影響。此外,在傳統的行人檢測方法中,研究人員只能通過圖像像素反映出的基本特征來完成行人檢測,不能有效利用景深信息。深度攝像頭除了能夠獲取平面圖像以外還可以獲得拍攝對象的深度信息。可以通過景深構建技術解決行人遮擋問題,輔助行人檢測算法對行人信息進行更快速、準確地提取。
行人統計的關鍵在于尋找含有行人的區域并提取其特征。由于人群分布的隨意性使得特定時間段內場景中人群不規律聚集,稠密度不均。在不同稠密度的場景下分別使用不同的特征提取方法:在人數密集的場景下,人和人之間存在遮擋,人群呈團塊區域狀分布,此時采用基于特征回歸的方法,如提取區域紋理、密度分布特征來估計行人數量。在人群稀少的場景中,使用統計回歸方法來估 計人數誤差會很大,此時采用基于目標檢測的方法可以簡單快捷的來統計人數。因此,可以將檢測模型優化為行人識別和特征回歸兩部分以應對不同復雜度的人群場景。
單單靠視頻分析存在許多缺陷。引進WiFi 嗅探技術作為補充,可較好地解決地鐵網絡客流分布和乘客個體出行路徑的高精度識別問題。WiFi 嗅探數據是探針設備(AF)與WiFi 設備(如手機、平板電腦等)的交互信息數據,可以實現對攜帶WiFi 設備對象的動態跟蹤,從而解決視頻檢測難以追蹤對象的問題。同時,其具有檢測范圍相對集中、檢測速度快、采樣率高、實時性強等特點,可實現乘客出行時空軌跡的精準化識別。
閘機刷卡數據也可作為視頻分析的補充。軌道交通站點大多設有閘機進行放行管理。閘機的結構組成中包含了計數模塊,用于記錄通行人數;作為一種通道管理設備,其最本質的功能是通過攔阻和放行實現一次只通過一人。閘機的工作模式使其在客流量統計上具有很強的準確性。通過獲取閘機刷卡數據輔助客流量統計,可以充分發揮軌道交通站點設有閘機設備的優勢,彌補視頻分析的不足。
綜上所述,城市軌道的發展滿足人們的出行需求,但是密集的客流量導致事故的頻繁發生,而智能視頻客流監測技術的應用保障了軌道交通的安全。智能視頻客流監測技術可以通過高效的計數方法,可以對人流量進行精確控制,并進行實時危險預警,最大程度減小事故的發生。獲取各個客流通道的客流相關數據,可以以此為依據對客流通道進行優化,提高通行效率。獲取大量的客流數據可以為其他相關的研究提供數據。可對目標行人進行路徑規劃,優化軌道交通資源配置。