王 斌,賈澎濤,郭風景,孫劉詠,林開義
(1.陜西建新煤化有限責任公司,陜西 黃陵 727300;2.西安科技大學計算機科學與技術學院,陜西 西安 710054;3.陜西陜煤蒲白礦業有限公司,陜西 蒲城 715517)
煤礦火災是影響煤礦生產的重大災害之一,其中由于煤自燃引發的火災占礦井火災90%以上[1-3]。煤自燃是一個復雜的動態氧化過程,其發生具有隱蔽性、突變性的特點,一旦發生會嚴重威脅礦井生產安全和礦工生命安全[4-5]。因此,開展煤自燃的監測預測研究對防控煤自燃災害發生具有重要意義[6]。
近年來,學者們圍繞煤自燃預測相關問題提出多種預測方法,主要有測溫法、自燃發火實驗預測法和氣體分析法等[7-9],其中氣體分析法因規律性強、靈敏度高而被廣泛使用[10-11]。在煤氧化升溫進程中,會釋放出標志性氣體,通過分析這些氣體的組成及含量變化情況,可以反演采空區煤炭氧化自燃程度,這類分析方法被稱為氣體分析法[12-14]。但是在利用多特征氣體指標數據時,需要對煤自燃多特征數據進行關鍵特征提取融合,保障分析預測煤自燃危險性時用到的數據具有高可靠性。
近年來,學者們圍繞數據融合開展了大量研究工作,所采用的方法主要有傳統的數學分析法和基于機器學習的方法。數學分析方法主要有主成分分析法[15]、自適應加權平均法[16]、卡爾曼濾波法[17]、貝葉斯估計法[18]、D-S證據理論方法[19]、基于信息融合模型的廣義多傳感器數據融合模型[20]、基于張量的多傳感器異構數據廣義融合算法[21]等?;跈C器學習的方法有基于卷積神經網絡(Convolutional Neural Network,CNN)的多特征融合方法[22]、結合注意力機制的深度卷積神經網絡方法[23]、雙支卷積神經網絡深度學習融合框架[24]等。這些方法在一些工業生產領域取得了較好的效果,但是在煤自燃預測領域還較少有人應用。
隨著煤自燃預測技術研究的深入,采用機器學習算法預測煤自燃的狀態已成為了研究的熱點。機器學習方法依賴于數據的可靠性,但是因為煤自燃監測數據受井下復雜環境的影響,易存在缺失值、隨機噪聲和粗大噪聲,直接通過多個特征進行煤自燃趨勢的預測判斷,會受到數據噪聲和可信度差異的干擾,影響煤自燃預測精度。因此,本文提出基于多特征數據融合的煤自燃溫度預測方法,選取與煤溫相關性較強的O2、CO、CO2、CH4、C2H4作為煤溫預測指標,通過降噪和多特征融合提升原始數據的有效性,從而提高煤自燃危險預測的精度。
煤自燃標志性氣體濃度變化趨勢與煤溫之間存在復雜的非線性關系[25],這種關系能預測出煤溫的變化。為了準確地預測煤溫變化,構建基于多特征融合的煤自燃溫度深度預測模型,如圖1所示。圖1中的編碼降噪層和CNN特征提取層完成了煤自燃數據的多特征融合;門限循環單元(Gate Recurrent Unit,GRU)神經網絡層完成了煤自燃溫度的預測;差分進化算法(Differential Evolution,DE)優化參數層采用差分進化算法對降噪自編碼器和CNN的神經網絡參數進行優化。

圖1 基于多特征融合的煤自燃溫度預測模型框架Fig.1 Prediction model framework of coal spontaneous combustion temperature based on multi-feature fusion
為了給煤自燃溫度預測模型提供更可靠的特征數據,需要對煤自燃監測數據進行多特征數據動態融合,過程如圖2所示。首先,采用降噪自編碼器網絡對煤自燃數據進行降噪;其次,采用多特征矩陣動態切片方法,將歷史數據和當前數據相結合;最后,基于CNN進行特征提取與融合。具體介紹如下所述。

圖2 煤自燃數據多特征融合過程Fig.2 Multi-feature fusion process of coal spontaneous combustion data
1)首先,為了增強數據的魯棒性,對含有高噪聲的煤自燃數據進行編碼降噪。構造一個具有n個煤自燃監測數據樣本的時間序列數據集合:X={X1,X2,...,Xn},X集合中,第i(i=1,2,...,n)元素Xi=[xtemp,xO2,xCO,xCO2,xCH4,xC2H4]分別表示第i時刻的煤自燃溫度、O2、CO、CO2、CH4、C2H4氣體濃度數據。
將特征樣本數據中的噪聲值看作異常值,然后基于降噪自編碼器網絡(Denoising Autoencoder,DAE),對數據集合X進行降噪處理。降噪自編碼器網絡結構如圖3所示。

圖3 降噪自編碼器結構圖Fig.3 Structure diagram of denoising autoencoder
DAE由編碼解碼過程兩部分組成。編碼過程(式(1))是將輸入X通過隱藏層進行壓縮操作,輸出隱含特征向量Y;解碼部分(式(2))對隱含特征向量Y進行解碼重構,輸出X',從而完成對高噪音數據的降噪處理。
式中:w1和w2分別為編碼和解碼的權重矩陣;b1和b2為偏移量;f和g為激活函數,通常使用ReLU函數、sigmoid函數、softmax函數等非線性激活函數。
2)傳統煤自燃數據融合方式,通常僅對某一時刻的多特征樣本數據進行特征融合,忽略了當前時刻煤溫和氣體濃度是相近尺度內的歷史煤自燃溫度和氣體濃度不斷累加變化的結果。為了特征融合時能包含更多歷史煤自燃信息,采用數據矩陣動態切片的方法對數據進行重構。對煤自燃時間序列數據集合X以寬度為5的滑動窗口進行切片,切片過程如圖4所示。

圖4 煤自燃時間序列數據集合切片示意圖Fig.4 Schematic diagram of time series data collection slicing of coal spontaneous combustion
3)采用CNN神經網絡對矩陣切片中的重要信息進行提取。將這個全新的時間序列數據組成的特征切片作為CNN模型的輸入,提取其數據特征并進行融合。
為了獲得更好的預測效果,采用差分進化算法(Differential Evolution,DE)對降噪自編碼器和CNN的神經網絡參數進行優化。DE是一種基于群體差異的模擬生物進化算法,通過對隨機初始種群進行迭代的變異、交叉和選擇等操作,保存適應環境的優秀個體,淘汰劣勢個體,從而獲得最優的神經網絡參數組合。對于煤自燃數據來說,在訓練降噪自編碼器和CNN神經網絡時,采用DE算法進行參數優化,對神經網絡的初始組合參數(隨機初始種群)進行迭代的變異、交叉和選擇等操作,保存神經網絡的輸出值更貼近真實煤自燃數據特征的較優參數組合(適應環境的優秀個體),淘汰較差的參數組合,從而獲得最優的神經網絡參數組合。差分進化算法的操作步驟如下所述。
1)變異操作。變異操作通過差異化思想來完成個體的變異,即在種群中任意選擇三個互不相同的個體向量,將其中兩個個體向量的差加權后與剩下的第三個個體向量求和,通過式(3)完成變異操作。
式中:Vi(t+1)為變異個體;μ為變異因子,用于調整差分向量占比情況;Xr1(t)、Xr2(t)、Xr3(t)為t代種群中的個體矢量;r1、r2、r3為互不相同的隨機正整數,且r1≠r2≠r3;Xr1(t)-Xr2(t)為差分向量差。
2)交叉操作。交叉過程就是變異個體與父代個體按照交叉概率部分交換,形成新個體的過程。將第t代種群中的每一個個體矢量Xij與變異個體Vi(t+1)根 據 式(4)進 行 交 叉,得 到 新 個 體Ui(t+1)。
式中:i或j以及k均為大于等于1的隨機整數;random(j)為隨機數取值范圍為[0,1];Cr為交叉率,其大小控制著父子及中間體間信息交換的程度。
3)選擇操作。依據個體適應環境的能力強弱,根據式(5)選擇下一代更優秀個體Xi(t+1)。
式中:f為適應度函數;f(Ui(t+1))為個體Ui(t+1)對應的適應度值。
經過交叉、變異和選擇操作后,得到了降噪自編碼器和CNN神經網絡的最優參數,從而提取到了最優的煤自燃數據特征和最好的融合效果。
為了驗證融合后的數據對于煤自燃溫度預測的有效性,建立煤自燃溫度GRU預測模型。分別把未融合和融合后的數據輸入GRU預測模型,通過預測結果的平均絕對誤差來判斷融合效果。
實驗選取陜西省某礦煤樣的程序升溫實驗采集的指標氣體(O2、CO、CO2、CH4、C2H4)和溫度數據共625組。制備裝煤總質量1 kg、裝煤高度17 cm、平均粒徑4 mm的混合煤樣,升溫速率為0.3 ℃/min,供風量為120 mL/min,采集頻率10 min。利用程序升溫裝置進行加熱,測定氣體產物,當溫度升高到預定溫度437 ℃時停止加熱。實驗數據的缺失值采用拉格朗日插值法補足。
實驗環境配置:CPU型號為i5-6500、GPU型號為RTX1080Ti、內存容量為16 GB、操作系統為Windows、編程語言為Python-3.6、編程平臺為PyCharm 2018.3.7、集成環境管理為Anaconda Navigator-1.3.1、深度學習框架為PyTorch-1.6。
采用降噪自編碼器網絡對煤自燃數據進行降噪處理,各個屬性數據處理前后的對比圖如圖5所示。由圖5可知,降噪前數據具有較強的噪聲,經過降噪后,各個特征指標噪聲明顯降低,無毛刺現象且曲線更加平滑,符合指標氣體出現的規律,更有利于煤溫的預測。數據降噪后,煤溫與其他指標屬性之間的關系如圖6所示。由圖6可知,O2濃度呈現隨煤溫升高而逐漸減小的趨勢,符合煤自燃耗氧的特性;CO和CH4濃度呈現隨著煤溫升高而上升的趨勢由緩慢增加變至急劇增加;CO2和C2H4的濃度在煤溫100 ℃以前沒有明顯變化,而在煤溫達到100 ℃以后,氣體產物濃度變化趨勢陡增明顯,能夠用于反映煤溫超過100 ℃時的劇烈氧化程度。

圖5 編碼降噪前后各個屬性對比效果圖Fig.5 Comparison of various attributes before and after coding denoised

圖6 煤溫與其他指標性氣體之間的關系Fig.6 Relationship between coal temperature and other indicator gases
為了驗證基于深度學習的煤自燃多特征指標數據動態融合模型的有效性,將降噪前和降噪后多特征數據、CNN融合后的多特征數據與本文方法進行性能比較。將各組數據按照7∶3的比例劃分訓練集和測試集,采用GRU預測模型來驗證三組數據所表征出來的特征情況,并采用平均絕對誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Square Error,RMSE)和決定系數(R-Square,R2)等指標對預測值的結果進行評價。GRU模型的超參數:窗口大小為4,隱層數為32,損失函數選擇MSELoss函數,優化器選擇Adam,學習率0.001,epoch為25。數據在不同處理方式下預測誤差對比見表1。

表1 數據在不同處理方式下預測誤差對比Table 1 Comparison of prediction errors of data under different processing methods
由表1可知,經過降噪和本文提出的降噪融合方法處理后的數據,在同一預測模型結構情況下,預測精度有一定提升。降噪后和本文融合方法融合后的數據預測結果的MAE誤差比未降噪的預測誤差分別降低6.55%和69.26%,RMSE誤差分別降低13.23%和63.49%,說明經過編碼器降噪處理后能夠提升煤自燃多特征數據的可靠性和有效性。本文融合方法融合后的數據在MAE誤差和RMSE誤差分別比僅作降噪處理的數據降低67.11%和57.92%,說明融合后的數據有效性進一步提高。相較于采用CNN融合數據,本文融合方法MAE誤差降低了56.70%、RMSE誤差降低了51.21%,說明本文融合方法融合數據好于CNN融合方法。同時在四組數據中,本文融合方法的R2值最大,說明本文融合方法融合后的數據增強了模型預測的擬合效果,提升了數據的魯棒性。
針對復雜的煤自燃溫度預測問題,本文提出了基于多特征融合的煤自燃溫度深度預測模型,結論如下所述。
1)經過編碼降噪和多特征處理后的數據,在相同預測模型結構情況下,相較于原始數據,預測精度有較大提升,說明數據經過編碼器降噪處理和多特征數據融合后能夠提升煤自燃數據預測的可靠性和有效性。
2)本文提出的差分進化優化的多特征融合模型,相較于未優化的多特征融合模型CNN,預測精度有一定的提升,進一步說明本文提出模型的有效性。