





摘要:針對煤矸音頻特征提取過程中設備運行噪聲干擾嚴重及單一提取方法易導致信息丟失的問題,提出了一種基于改進EfficientNet 的煤矸音頻分類方法。采用基于Mel 頻譜和Gammatone 倒譜系數的特征提取方法,有效捕捉矸石聲音中的低頻信息和細節特征。選擇EfficientNet?B0 作為骨干網絡,并對其進行以下改進:將原有的多尺度通道注意力模塊換成卷積塊注意力模塊,得到卷積注意力特征融合(CAFF)模塊,通過網絡自學習為不同空間位置的特征分配不同的權重信息,生成新的有效特征;在原有的MBConv 模塊中并行嵌入頻域通道注意力(FCA)模塊,加強特征圖的表達能力,從而提高整個網絡的性能。實驗結果表明:引入CAFF 模塊后,模型準確率提升了0.61%,F1 得分提升了0.52%,且模型收斂更快,說明CAFF 模塊有效提升了模型對頻譜特征的捕捉能力;引入FCA 模塊后,準確率提升了0.45%,F1 得分提升了0.62%,說明模塊的疊加可以進一步提高模型的泛化能力和處理復雜特征的能力;改進EfficientNe 模型的準確率為91.90%,標準差為0.108,顯著優于同類對比音頻分類模型。
關鍵詞:綜放開采;煤矸識別;音頻特征提取;EfficientNet;Mel 頻譜特征;Gammatone 倒譜系數;注意力機制
中圖分類號:TD823.49 文獻標志碼:A
0 引言
傳統的放頂煤方法通常憑借工人耳聽來判斷放煤階段,存在較大不確定性和人為誤差,難以準確控制放煤過程的啟停動作,易造成過放和欠放[1-2],導致煤炭采出率低、含矸量高,嚴重影響資源的有效利用和經濟效益[3]。為實現煤矸精準識別,近年來研究人員對多種方法進行了深入研究,包括自然γ 射線法[4]、紅外探測法[5]、圖像識別法[6]、液體介入分析法[7]等。這些方法存在輻射安全性、設備成本高、易受煤粉影響等問題。