





摘要:針對現有基于深度學習的綜放工作面混矸率檢測方法在井下低照度、高粉塵、煤矸堆疊等復雜條件下存在煤矸識別精度低、分割效果差、模型參數量和運算量大、未實現混矸率的實時檢測等問題,提出了一種基于GSL?YOLO 模型的混矸率檢測方法。GSL?YOLO 模型在YOLOv8?seg 的基礎上進行以下改進:在主干網絡中引入全局注意力機制(GAM),通過減少信息彌散和放大全局交互表示提高模型特征提取能力;選用具有高效局部聚合網絡的空間金字塔池化(SPPELAN)模塊,提升模型處理不同尺寸目標時的檢測性能;采用輕量級非對稱多級壓縮檢測頭(LADH),降低模型的訓練難度,同時提高推理速度。提出了一種基于類別分割掩碼的混矸率計算方法,該方法基于煤流圖像處理結果中的分割掩碼信息,計算其中矸石的像素面積與總像素面積的比值,作為瞬時混矸率。實驗結果表明:① GSL?YOLO 模型的mAP@0.5∶0.95 達96.1%,比YOLOv8?seg 模型提高了0.8%。② GSL?YOLO 模型的參數量為2.9×106 個, 浮點運算次數為11.4×109, 模型權重為6.0 MiB, 比YOLOv8?seg 模型分別降低了12.1%,5.8%,11.8%,實現了模型的輕量化。③ GSL?YOLO 模型在測試集上的幀率為12 幀/s,基本滿足實時檢測要求。④ 與YOLO 系列模型相比,GSL?YOLO 模型分割效果最好,檢測精度最高,參數量和運算量較少,綜合性能最佳。⑤ 基于截取的綜放工作面后部刮板輸送機上煤流視頻中的3 幀圖像,計算了瞬時混矸率,結果表明,提出的混矸率計算方法基本實現了綜放工作面混矸率的實時計算。
關鍵詞:智能放煤;煤矸識別;混矸率檢測;YOLOv8?seg;圖像分割;全局注意力機制;非對稱檢測頭
中圖分類號:TD823.49 文獻標志碼:A
0 引言
煤炭是我國的主體能源,煤礦智能化轉型是煤炭行業高質量發展的必由之路[1-3]。放頂煤開采技術是開采厚及特厚煤層的一種有效方法[4-5],但與綜采工作面智能化相比,智能放煤技術研究進展緩慢。實現智能放煤的核心難題是確定放煤口的開啟與關閉時機。研究表明,在綜放工作面煤炭放出后,當混矸率為10%~15% 時關閉放煤口才能使頂煤采出率最大化[6],因此實現綜放工作面混矸率的精準快速檢測是實現智能放煤的關鍵技術。
綜放工作面混矸率檢測的常用方法有自然伽馬射線識別法、聲音與振動信號識別法和圖像識別法[7-8]。射線識別法對人體有一定危害,聲音與振動信號識別法易受環境噪聲和其他振動源的影響,因此這2 種方法受到的限制較大。圖像識別法具有效率高、非接觸、無危害和準確性高等優點,隨著深度學習理論的發展,基于深度學習的煤矸識別方法迅速成為研究熱點[9-12]。王家臣等[13-14]通過對煤矸塊體進行三維精準重建,建立了體積混矸率計算模型,該方法精度高,但進行三維重建需要的數據量巨大。賀海濤等[15]先將煤流區域進行前景分割,再基于U?Net 對煤矸圖像進行語義分割,通過計算2 個區域面積的比值求出煤矸混合圖像的矸石占比,并以此作為“見矸關門”的閾值,但該方法未考慮模型運算量和參數量的影響。單鵬飛等[16]提出了一種基于“預處理+CBAM Faster R?CNN”的煤矸混合放出狀態分析識別方法,實現了放落狀態下的煤矸識別,但未實現混矸率的實時檢測。
針對上述問題,本文提出一種基于GSL?YOLO模型的混矸率檢測方法。通過在YOLOv8?seg 模型中引入全局注意力機制(Global Attention Mechanism,GAM )、具有高效局部聚合網絡的空間金字塔池化(Spatial Pyramid Pooling with Efficient LocalAggregation Network,SPPELAN)模塊和輕量級非對稱多級壓縮檢測頭(Lightweight Asymmetric Dual-Head,LADH),降低了模型參數量和運算量;提出了一種基于類別分割掩碼的混矸率計算方法,實現了綜放工作面混矸率精準、快速檢測。
1 GSL?YOLO 模型
1.1 GSL?YOLO 模型結構
YOLOv8?seg 是YOLOv8[17-18]的圖像分割模型,結合了目標檢測和圖像分割2 種功能,非常適用于綜放工作面混矸率檢測。GSL?YOLO 模型在YOLOv8?seg 的基礎上進行以下改進:1) 因綜放工作面低照度、高粉塵等環境的影響,采集的煤矸圖像會丟失大量紋理特征,導致煤矸圖像有效特征提取難。為了增強模型對有效特征的提取能力,在YOLOv8?seg 主干網絡中引入GAM[19]。