








摘要:煤礦井下環境復雜,對部分作業現場人員行為進行檢測時易出現漏檢與誤檢問題。針對該問題,提出了一種煤礦井下暗光環境人員行為檢測方法,包括暗光環境圖像增強和行為檢測2 個部分。暗光環境圖像增強基于自校準光照學習(SCI)進行改進,由圖像增強網絡和校準網絡構成。人員行為檢測通過引入DynamicHead 檢測、跨尺度融合模塊和Focal?EIoU 損失函數來改進YOLOv8n 模型。SCI+網絡增強后的圖像作為人員行為檢測模型檢測的對象,完成井下暗光環境人員行為的檢測任務。實驗結果表明:① 井下暗光環境人員行為檢測方法的mAP@0.5 為87.6%,較YOLOv8n 提升了2.5%,較SSD,Faster RCNN,YOLOv5s,RT?DETR?L 分別提升了15.7%,11.5%,0.9%,4.3%。② 井下暗光環境人員行為檢測方法的參數量為3.6×106 個,計算量為11.6×109,檢測速度為95.24 幀/s。 ③ 在公開數據集EXDark 上,井下暗光環境人員行為檢測方法的mAP@0.5 為74.7%,較YOLOv8n 提升了1.5%,表明該方法具有較強的泛化能力。
關鍵詞:暗光環境;井下人員行為檢測;自校準光照學習;圖像增強;SCI+網絡;Dynamic Head;跨尺度融合模塊;Focal?EIoU 損失函數;YOLOv8n
中圖分類號:TD67 文獻標志碼:A
0 引言
煤礦井下人員、車輛、設備眾多,存在許多安全隱患,如礦工斜靠、攀爬設備等[1]。為了保證井下人員正確的作業行為,大部分煤礦主要通過安全員對作業人員違規行為進行巡查,并通過人工視頻監控作業人員行為,但該方法存在檢測效率不高、范圍有限、實時性差等問題[2]。計算機視覺檢測技術為井下人員行為檢測帶來了變革[3]。但煤礦井下環境復雜,煤塵多、光源少,導致部分作業現場采集到的圖像存在光照不足的現象,且在井下狹長巷道中,一般成像儀器工作時易出現曝光不足、邊界模糊、偽影等問題,許多潛在信息無法被圖像采集系統有效感知和理解,進而導致對目標進行檢測時出現漏檢與誤檢的問題。因此,研究井下暗光環境中的圖像增強和作業人員行為的檢測方法,對于減少安全事故、加快采煤作業智能化發展有著重要意義。
許多專家學者對井下作業人員行為檢測方法進行了研究。黃瀚等[4]通過動態多層感知和時間卷積網絡提取人體關鍵點特征,并引入動態注意力機制,在提高網絡泛化能力的同時增加了對動作的注意力程度,但構建的數據較少,導致模型在訓練過程中難以充分學習到各種行為特征。劉浩等[5]采用YOLOv3 神經網絡設計了井下人員不安全行為檢測系統,實現了不安全行為的識別,但準確率不高。溫廷新等[6]將遷移學習融入到殘差網絡,實現了礦工不安全行為的識別,且改進后的模型優于AlexNet,VGG16 等模型,但礦工不安全行為僅分為跌倒和投擲2 種,實際生產中不安全行為可能更加復雜多樣,因此需要進一步細化不安全行為分類。李偉山等[7]對Fast RCNN 算法的區域生成網絡(Region ProposalNetwork,RPN)結構進行改進,同時增加特征融合技術,增強了對井下目標遮擋情況的檢測能力,但該方法提高檢測精度的同時會增加參數量,降低檢測效率。延曉宇等[8]對全卷積單階段目標檢測(FullyConvolutional One-Stage Object Detection,FCOS)算法進行改進,將FCOS 算法中的骨干網絡進行輕量化設計并采用特征金字塔結構增強網絡,實現了檢測精度與速度的平衡,但FCOS 算法本身檢測能力有限, 改進后的方法檢測精度也不高。ShaoXiaoqiang 等[9]通過引入通道?向量?通道注意力機制,設計新的骨干網絡,采用Slim?neck 結構實現了復雜環境下井下人員的高效檢測,但模型的召回率較低,目標檢測過程中會發生漏檢問題。Xin Fangfang等[10]通過對YOLOv8n 進行改進,提出了一種實時、高效、輕量級的礦工行為檢測方法,但在處理小目標時檢測精度仍然不足。Wang Zheng 等[11]通過集成可變形卷積和應用偏移學習來增強細粒度特征提取,提升了模型對礦工行為特征的識別能力,但在復雜環境下(如光照不足、背景復雜)模型的魯棒性仍需進一步優化。
針對上述問題,本文提出一種煤礦井下暗光環境人員行為檢測方法。首先以自校準光照學習(Self-Calibrated Illumination, SCI) [12]為參考,設計了SCI+網絡,用于提高暗光環境下圖像質量、恢復圖像信息。然后通過引入Dynamic Head 檢測、跨尺度融合模塊(Cross?Scale Feature Fusion Module, CCFM) 和優化損失函數改進YOLOv8n。最后將SCI+圖像增強后的高質量圖像作為改進后模型檢測的對象,完成井下暗光環境人員行為檢測任務。
1 井下暗光環境人員行為檢測網絡結構
井下暗光環境人員行為檢測網絡包括暗光環境圖像增強網絡和人員行為檢測網絡,如圖1 所示,其中,k 為卷積核大小,s 為步長。井下采集到的現場數據往往具有對比度低、飽和度低、干擾信息多、邊界模糊等不利于特征識別與定位的特點,因此,通過SCI+網絡增強低光照圖像的質量。人員行為檢測網絡是基于YOLOv8n 進行改進而構建的,檢測頭改為Dynamic Head,通過引入動態卷積和多頭自注意力機制,提升模型對不同大小目標的檢測能力;CCFM 作為頸部結構,通過融合不同尺度的特征圖來增強模型對尺度變化的適應性和對小尺度目標的檢測能力;使用Focal?EIoU 損失函數提高目標檢測任務中邊界框回歸的精度和魯棒性。