中圖分類號 U491.5 文獻標識碼 A 文章編號 2096-8949(2025)08-0004-03
0 引言
地鐵作為現代城市公共交通系統的重要組成部分,承載著大量乘客的日常出行需求。地鐵站點和車廂內人員密集,一旦發生安全事件,后果往往不堪設想。通過安全行為監測研究,可以及時發現并預警潛在的安全隱患,如乘客攜帶危險品、意圖進行暴力行為、逃票、翻越閘機等,安全行為監測不僅可以有效防止安全事件的發生,提升地鐵公共安全的整體水平,還能幫助優化地鐵運營管理。例如,通過監測乘客上下車行為,可以評估站臺和車廂的擁擠程度,為調度人員提供實時數據支持,以調整列車班次和路線,減少乘客等待時間,提高運營效率,同時也為乘客提供更加便捷、舒適的乘車環境[。該文主要通過YOLOv5最新算法與大華智能技術對地鐵乘客安全行為進行監測研究。YOLOv5算法具有出色的檢測速度,可以達到較高的幀率(如140FPS),這使其非常適合用于實時性要求高的場景,在地鐵這種人流量大,情況比較復雜的場景中,通過實時處理監控視頻數據,能夠迅速響應并發出預警,有效減少安全隱患。相比于之前的版本,YOLOv5最新算法的模型更小、參數更少,這使得它更適合在移動端和嵌入式設備等資源受限的平臺上運行。
1 YOLOv5模型分析
YOLOv5具有4個版本,具體包括YOLOv5s、YOLOv5m、YOLOv51、YOLOv5x四種,其他的版本都在該版本的基礎上對網絡進行加深與加寬。根據不同版本的YOLOv5與EfficientDet的對比研究,得出結論:
與EfficientDet0相比,YOLOv5不僅可以獲得更高的AP指標,而且可以獲得更快的推理速度。
與EfficientDet4相比,YOLOv5不僅能夠獲得更高的AP指標,其推理耗時是EfficientDet4的1/5左右。(見圖1、表1)


YOLOv5在骨干網絡上采用了Focus、C3Net。針對Backbone和Detecthead,YOLOv5設計了兩種不同的C3Net。YOLOv5與YOLOv4不同點在于,YOLOv4中只有主干網絡使用了CSP結構,而YOLOv5中設計了兩種C3Net結構,以YOLOv51網絡為例,C3_X結構應用于Backbone主干網絡,另一種C3_1結構則應用于Neck中,加強了網絡特征融合的能力。圖2所示是YOLOv5框架示例圖。

YOLOv5自發布以來,對目標檢測領域產生了顯著影響。其開源、輕量化、高精度的特性使其迅速成為學術研究和工業應用中的熱門工具。YOLOv5不僅提高了目標檢測的精度和效率,還推動了更多實時應用的發展,尤其是在資源受限的嵌入式設備和移動設備上的部署。隨著YOLOv5在各個領域的廣泛應用,它不僅推動了技術的發展,也加速了人工智能在實際場景中的落地應用,從而對各行業的效率和安全性產生了深遠的影響。
2 大華智能技術
2.1基于Anchor-Based的目標檢測
(1)R-CNN二階目標檢測算法
R-CNN是卷積神經網絡應用于目標檢測的經典二階段目標檢測算法。R-CNN的思想較為簡單,它首先使用選擇性搜索(selectivesearch,SS)創建數千個自標區域,然后將這些區域內的圖像分成固定大小圖像,接著將圖像加入卷積神經網絡來提取特征,最后通過SVM對區域目標分類進行預測,使用回歸器來獲得目標的區域邊框。在視頻流中得到多幀圖像進行目標檢測,得到每幀圖像中與目標行人的對應檢測區域;分別在每幀圖像的檢測區域進行光流檢測,得到每幀圖像檢測區域的光流信息,其中,多幀圖像包括目標幀的圖像和至少一幀樣本幀的圖像;利用至少一幀樣本幀的圖像光流信息,分析目標幀的圖像光流信息;以及基于分析結果,來確定目標行人是否存在安全行為[2。
(2)安全行為數據處理方法
通過一種多模態的處理框架和數據處理方法,數據基于不同傳輸協議初始化并發送給操作算子,初始的數據包括多模態數據和結構化的數據,數據源與一種數據類型的初始數據對應。操作算子應用于對初始數據進行處理;數據匯集用于接收操作算子處理后數據并輸出。將輸入圖像細分為多尺度圖像塊,再將多個尺度上的特征信息進行融合,極大提升了小目標檢測的準確率。通過使用上述的處理框架,可同時進行結構化數據和多模態數據采集,解析、處理等操作,而不用投入大量時間、人力成本分別處理不同模態的數據,從而實現了多模態數據的實時處理和融合分析,極大簡化了對多模態數據實時分析的處理難度,降低多模態數據實時融合分析時的復雜性和操作門檻[3]。
2.2 圖像編解碼裝置
圖像解碼裝置采用的編碼率失真優化(RateDistortionOptimization)是一種提升視頻壓縮性能的最優化算法。在AV1(AOMediaVideo1)圖像幀幀內的預測和圖像幀幀間的預測中,遞歸執行RDO按確定每個編碼單元的最佳編碼結構和最佳預測模式,在壓縮失真和比特率之間找到最佳折衷。其中,以RD為代價的計算過程如下所示。

式中, J ——是率失真代價函數,這在視頻壓縮中用于平衡失真和碼率; D ——失真,表示當前塊中原始像素和重構像素之間平方差的和; R —多元算數熵編碼對應整個塊進行編碼的比特率;—與量化參數相關的拉格朗日乘子。為使AV1編碼器能夠實時編碼,這種較低復雜度和高精度快速RDO算法非常必要。 (見圖3)

(1)基于估計碼率和估計失真,確定待編碼塊的預測模式和變換類型組合率失真代價
低頻失真計算:對于 3 2 × 3 2 低頻部分量化域的失真,其計算方式為:

式中,
(2 頻域預估失真;tcoeff
量化系數;dqcoeff
—反量化系數;
變換塊中的行列索引值;
-高頻失真補償。
(2)圖像編解碼裝置
通過率失真優化的硬件架構實現,圖像編解碼裝置能夠快速地計算待編碼塊在使用每一種編碼模式進行編碼的率失真代價值。選擇率失真代價值最小的編碼模式將待編碼塊進行編碼,獲取編碼流,能有效提高編碼效率和效果。
2.3技術從智能走向智慧
現代交通問題的復雜性要求智能系統不僅要具備數據處理能力,還要通過結合人類智慧進行決策。這與地鐵安全監控的核心需求相吻合,監控系統通過自動識別安全行為,結合人工干預能夠有效防止潛在的事故發生。
(1)大華智能技術的應用
大華智能技術可整合到乘客行為安全監測系統中,通過實時預警機制,一旦發現乘客行為異常或安全隱患,系統會立即觸發預警信號,并通過聲光報警、短信、郵件提醒等多種方式向相關人員發送預警信息。這有助于相關工作人員迅速響應并采取措施,防止事態進一步惡化。同時,該技術還制定了詳細的應急處理流程,規范各級人員在應急情況下的職責和行動步驟。在發生緊急情況時,系統能夠自動啟動應急處理流程,指導工作人員按照既定方案進行處置。
大華智能技術憑借強大的硬件和軟件集成能力,在地鐵監控中具有重要應用價值。智能攝像頭搭載YOLOv5算法后,可對地鐵乘客進行實時監測并識別異常行為,如突然奔跑、跌倒或爭執。通過智能監控平臺,這些異常行為能夠及時被檢測并報警,有效降低了地鐵站的安全風險[4]。
(2)異常行為識別的應用
目前杭州地鐵在各大站點和車廂內部署應用了智能攝像頭,這些攝像頭通過YOLOv5算法對乘客的安全行為(如摔倒、奔跑、打架等)進行實時檢測,并在發現異常情況時及時向控制中心報警[5。杭州地鐵還能通過對大量視頻數據的長期存儲與分析,在特定時間段或特定站點中發現潛在的安全隱患,提高整體運營效率。
3結語
隨著YOLOv5算法的進一步發展和優化,地鐵乘客安全行為監測系統將變得更加智能和高效。杭州地鐵計劃在未來繼續擴展智能監控的應用范圍,并引入更多基于人工智能的功能,如實時的乘客行為預測和更精細的風險預警系統。這些技術的升級將進一步提高地鐵的安全性和運營效率,為乘客提供更加舒適和安全的出行體驗。同時,杭州地鐵在智能監控技術應用方面的經驗,將為其他城市的公共交通系統提供重要的參考和借鑒,進而推動全球智能交通管理的進步。
參考文獻
[1]許立楊.智慧工地系統在地鐵施工現場安全管理中的應用研究[J].現代城市軌道交通,2024(6):26-30.
[2]浙江大華技術股份有限公司.異常行為檢測方法、裝置、計算機設備和存儲介質:CN202211695602.4[P].2023-05-09.
[3]浙江大華技術股份有限公司.行為數據處理方法、裝置、計算機設備和存儲介質:CN202310445324.5[P].2023-08-29
[4]周琛,張蘭春.基于改進YOLOv5的交通目標檢測算法[J].電腦知識與技術,2024(20):33-36+40.
[5]高金銘,李燕,厲風.自動化監測系統在既有地鐵線路監測中的應用[J].現代交通技術,2024(3):87-91.