徐耀松,邱 微,王治國
(遼寧工程技術大學電氣與控制工程學院,遼寧 葫蘆島 125105)
煤與瓦斯突出是煤礦井下含瓦斯煤體在短時間內從煤巖層以極快的速度與強大的沖擊力向采掘空間噴出大量瓦斯的一種強烈動力過程,是最嚴重的瓦斯災害之一[1-2]。對煤與瓦斯突出強度進行準確預測是煤與瓦斯防治工作的基礎,目前針對煤與瓦斯突出預測問題,國內外學者已經研究了很多方法,楊力[3]等耦合了模糊理論和支持向量機算法,建立了基于模糊支持向量機的煤與瓦斯突出預測模型。朱志潔[4]等將主成分分析(PCA)方法應用到BP神經網絡中,實現了對煤與瓦斯突出的有效預測。陳全秋[5]等充分結合BP神經網絡和遺傳算法兩種算法的優點,建立了煤與瓦斯突出新的預測方法,該方法預測精度更高。溫廷新[6]等利用量子遺傳算法(QGA)對最小二乘支持向量機(LSSVM)進行優化,建立了QGA-LSSVM煤與瓦斯突出預測模型。針對煤與瓦斯突出災害預測,影響因素復雜繁多,各因素之間具有一定的相關性和非線性,且在突出災害的發生發展過程中多種因素的影響程度各不相同,使得傳統的預測方法在預測精度和效率方面難以滿足生產需求,還需深入研究致突因素間的相關復雜性及各因素對突出災害發生的影響程度,以提高突出預測的精度和效率。
因此,本文提出一種基于小波核主成分分析(KPCA)與改進的極限學習機(IQGA-ELM)相結合的預測模型。把小波分析的思想引入到核主成分分析中,先用小波核主成分分析(KPCA)對致突指標進行非線性降維處理,提取其主成分序列,并將提取的主成分序列作為改進量子遺傳—極限學習機預測模型的輸入,此模型充分利用改進量子遺傳算法來優化極限學習機ELM的輸入權值和隱含層閾值,極大地提高了ELM模型的預測精度和效率,并通過實例驗證、對比分析和實測數據預測分析,證明該模型具有較強的泛化能力。
煤與瓦斯突出現象是由地應力、瓦斯壓力和煤巖物理力學性質等多種因素共同作用產生的[7-8]。在進行煤與瓦斯突出預測時,致突因素的選取影響著整個預測模型的收斂性及準確性[9]。為了準確的評價每個因素,筆者根據煤與瓦斯突出特性相關研究及文獻[10],結合突出事故的歷史數據,考慮影響因素的易取性和礦區實際情況下,建立了包含地應力P0(MPa)、瓦斯含量Gc(m3/t)、瓦斯壓力Pg(MPa)、瓦斯放散初速度V(m/s)、垂深H(m)、地質構造Gs、軟分層煤體厚度Hmm、煤的堅固性系數f、煤體破壞類型Dt、煤層原始含水率Wc%、片幫掉渣Cd和瓦斯壓力變化Gv共12個致突因素的預測指標系統。由于影響煤與瓦斯突出的因素較多,致突因素間具有復雜的非線性關系,且每種因素對突出事件發生的影響程度均不同,因此選用合適的方法來確定各致突因素對煤與瓦斯突出的影響權重大小十分重要。因此,本文采用核主成分分析方法對預測指標進行降維處理,為了更準確地提取出影響權重較大的幾項指標,本文把小波分析的思想引入到KPCA中,將小波核函數當作核主成分分析的核函數來進一步增強KPCA的非線性降維能力。
核主成分分析(KPCA)是把核函數引入到主成分分析(PCA)中的一種處理非線性問題的一種方法,即通過一個非線性映射函數,將原始低維線性不可分空間中的數據映射到一個高維線性可分空間,并在高維空間中進行主成分分析[11-12]。本文用Morlet母小波核函數來替代傳統核函數增強KPCA的非線性降維能力。

h(x)=cos(1.75x)exp(-x2/2)
(1)
設伸縮因子為a,令a∈R;變量x,x′∈Rn,則生成的小波核函數如下所示:
(2)
利用式mλKα=k2α即mλα=kα,在特征空間中求解特征空間上的特征值λi=(λi1,λi2,…,λim)和特征向量ωi=(ωi1,ωi2,…,ωim)。就可得到一組主成分指標Fi為:
Fi=ωi1X1+ωi2X2+…+ωimXm
(3)

(4)
如果前K個主成分指標的累計貢獻率超過一個指定的數值(通常取80%~95%),則可認為求得的K個主成分指標能夠充分體現原始預測指標的數據信息。即可寫出前K個主成分指標表達式,將K個主成分指標代替原始預測指標進行后續分析。
極限學習機是一種新型單隱層前饋神經網絡,它解決了前饋神經網絡學習速度較慢的缺點[13-14]。建立ELM煤與瓦斯突出預測模型時,先將隱含層節點數設為N,訓練樣本為(xi,ti)∈RN×RM,其中xi=(xi1,xi2,…,xiN)T,ti=(ti1,ti2,…,tiM)T,隱含層的激活函數為G(X),則預測模型表示為:
(5)
式中:βi是第i個隱含層與輸出層之間的連接權值,ωi是輸入節點到第i個隱層節點的輸入權值,bi是第i個隱含層節點的偏差即閾值,h(X)是神經網絡隱含層輸出矩陣,β是輸出層權值。式(5)可簡化為:
Hβ=T
(6)

(7)
上述即為對ELM的訓練過程,由此可建立ELM預測模型。式中H+為矩陣H的Moore-Penrose廣義逆矩陣。
與傳統的訓練方法相比,ELM神經網絡具有學習速度更快,泛化能力更強等優點。因此,把ELM神經網絡運用在煤與瓦斯突出預測領域,能夠極大地提高突出的預測精度和效率。
量子遺傳算法(QGA)是量子計算與遺傳算法相結合的產物,它實現了比遺傳算法更好的效果[15-16]。為提高算法收斂速度和尋優能力,本文對量子旋轉門轉角的確定進行改進,并融入免疫算法中抗體多樣性保持機制和免疫記憶思想以保證種群多樣性,得到改進量子遺傳算法(IQGA),IQGA算法流程如圖1所示。

圖1 IQGA算法流程圖
在QGA算法中,旋轉門轉角θi一般通過查表來確定,致使算法收斂速度和尋優效果不理想。因此,本文直接比較當前量子位與最優二進制解來確定旋轉門轉角。以角度形式考慮旋轉門的進化,定義某二進制數角度為:
(8)
旋轉角確定公式:
Δθi=(θci-θi)d
(9)
式中:θci為搜索到的最優二進制解第i位的角度,該最優二進制解采用最優保留機制所得二進制解以保證算法的全局收斂性;θi為當前量子染色體第i位所對應角度;d為旋轉角調整系數,定義為:
d=(k/N+r)h
(10)
式中:k為種群中第k個個體;N為種群規模;r和h均是常數,r的作用是避免由于種群規模N太大導致d值過小,使旋轉角Δθi過小,致使進化速度減慢,h的作用是從整體上調節d值,來控制收斂速度。r和h的取值根據具體情況來設定。該確定方法可使種群中每個個體以不同的速度向最優解進化,進而加快收斂速度,提高算法的尋優能力。
IQGA算法還融合了免疫算法,把適應度函數作為抗原,種群個體作為抗體,則群體個體的期望繁殖概率P的計算公式為:
(11)
式中:λ為概率常數,fv為個體適應度,Cv為抗體濃度。由式(11)可知算法抑制高濃度低適應度的抗體,促進低濃度高適應度的抗體,這一機制保證了種群的多樣性。
ELM隨機產生輸入權值和隱含層閾值,使得模型存在泛化能力較差和預測精度不理想的缺點。因此,本文用IQGA算法對ELM的輸入權值和隱含層閾值進行優化,進而建立煤與瓦斯突出IQGA-ELM預測模型。
尋優步驟如下:
Step 1 設置種群規模N、記憶庫容量M及最大進化代數K等參數。
Step 2 將煤與瓦斯突出ELM預測模型中待優化輸入權值和隱含層閾值級聯進行量子編碼,并初始化量子抗體種群Q(t0)。
Step 4 對各確定解作適應度評價(以均方誤差函數作為其適應度函數),記錄最優個體,如當前最優個體適應度優于目標值,則以新的最優個體作為下一代進化目標;否則,保持目標值不變。
Step 5 判斷是否終止。若所得最優個體為滿意解,則終止算法;否則,繼續進行。
Step 6 計算P(t)個體繁殖概率P,P值從大到小排序并提取前N個個體,組成父代種群,同時采用精英保留策略更新記憶庫。
Step 7 父代群體通過量子旋轉門得子代種群。
Step 8 測量子代種群,子代群加入記憶庫里的抗體,形成新抗體種群Q(t+1)。
Step 9t=t+1,轉至Step 3,直到得到滿足條件的最優解,該解即為煤與瓦斯突出ELM預測模型的最優輸入層權值和隱含層閾值,由此建立煤與瓦斯突出IQGA-ELM預測模型。
本文從開灤錢家營礦1376綜采工作面2016年2月到2016年5月突出事件中隨機篩選出200組實測數據作為研究對象,將前160組作為訓練樣本,后40組作為檢驗樣本,將上述12個變量作為初選預測指標,其中煤體破壞類型共有5類,分別用1~5表示。地質構造分為4類,分別用0~3表示,0、1、2、3分別代表地質構造復雜程度的無、簡單、中等和復雜。截取了第191~第200組數據列舉如表1所示。

表1 煤礦突出部分數據
先對200組數據進行歸一化處理,然后利用小波KPCA對初選預測指標降維,得到的特征值大小及其貢獻率如表2所示。根據KPCA的提取原則:主成分累積貢獻值必須大于85%。表2中樣本集前5項的累計貢獻率為86.600%,因此選用前5項主成分指標代替原來的12項初選預測指標,作為建立ELM預測模型的新指標,并計算ELM網絡的核矩陣在提取出的特征向量上的投影X1、X2、X3、X4、X5,即可得到降維后的主成分數據,降維后的第191組~第200組數據如表3所示。

表2 各主成分貢獻率

表3 降維簡化后的部分主成分數據
利用前160組數據訓練ELM網絡性能。極限學習機學習性能的優劣取決于隱含層節點數和激勵函數的選取。據經驗公式,假定煤與瓦斯突出模型的隱含層節點個數為70,在相同網絡復雜度下比較各激勵函數的泛化性能,如表4所示。

表4 不同激活函數的性能比較
由表4可看出,在相同網絡復雜度下Sigmoidal函數與其他激活函數相比,性能較優異,且訓練誤差較小;在對Sigmoidal函數進行隱含層節點選取時,當L=90時函數訓練誤差最小并接近平緩,如圖2所示。因此,本文中極限學習機的激活函數選取Sigmoidal函數,且隱含層節點個數為90。

圖2 隱含層節點的選取
利用前160組數據訓練預測模型,設置IQGA算法初始化參數:設N=30,M=30,P=95%,相似度系數為0.7,r=0.01,h=0.1,K=100。按照IQGA算法不斷優化ELM的輸入層權值及隱含層閾值,其適應度收斂曲線如圖3所示。

圖3 IQGA-ELM適應度收斂曲線
由圖3可看出,算法大約進化到20代全局最佳適應度值收斂且達到最大,從而得到全局最優的ELM模型輸入權值和隱含層閾值,進而建立煤與瓦斯突出IQGA-ELM預測模型。
訓練模型結束后利用后40組數據進行驗證,為了體現該預測模型的優越性,將IQGA-ELM模型與QGA-ELM、ELM、BP模型均對后40組數據進行預測,圖4與圖5為各模型對后10組數據預測結果和預測相對誤差。表5為分別經高斯KPCA和小波KPCA降維后各模型對后5組數據預測的結果。

圖4 經小波KPCA處理后各預測模型結果

圖5 經小波KPCA處理后各模型預測相對誤差比較

編號經高斯KPCA處理的預測誤差BPELMQGA-ELMIQGA-ELM經小波KPCA處理的預測誤差BPELMQGA-ELMIQGA-ELM19615.78212.3739.9327.10913.48210.4387.8234.56319716.00512.2689.7467.21412.99311.0237.9364.78219815.90313.0929.4616.98613.05810.9218.0144.69719914.89212.9789.9947.13512.78211.2137.8954.58920015.73213.1909.7816.87913.72110.8238.8994.742收斂時間/s1.0210.9291.6731.9020.9710.7681.4461.812
由圖4和圖5可知,在經過小波KPCA處理過的4種預測模型中,IQGA-ELM預測模型的預測值最接近于樣本的真實值,而且該模型在每個驗證樣本上測試所得的預測相對誤差均小于其他模型。
從表5中可看出,經小波KPCA處理后各預測模型的收斂時間明顯優于經高斯KPCA處理后所花費的時間,且經小波KPCA處理后4種模型的預測誤差更小,穩定性更高,特別是IQGA-ELM預測模型表現更為顯著。對BP模型和ELM模型而言,后者的運算速度和預測誤差均優于前者,QGA-ELM模型雖在一定程度上優化了ELM 模型,但效果仍不理想,IQGA-ELM預測模型的預測誤差相對于BP、ELM、QGA-ELM模型有了明顯的提高。從收斂時間來看,IQGA-ELM模型耗時較長,但仍處在合理范圍內,在煤與瓦斯突出災害問題上,當收斂時間在合理范圍內更加看重預測模型的精確性。因此,經小波KPCA處理后的IQGA-ELM模型預測值最準確,預測精度比BP、ELM、QGA-ELM模型都高,泛化能力最好,能夠用來有效預測煤與瓦斯突出強度。
筆者在錢家營礦1376綜采工作面的突出數據中截取2015年1月到12月的4800組突出數據進行了實測數據預測分析。將數據按照時間順序輸入到訓練好的小波KPCA-IQGA-ELM預測模型中,把這一時間段內模型的預測結果與該礦實際發生的災害次數和災害程度進行了比較,結果如表6所示。

表6 錢家營煤礦突出數據預測結果
結果表明,基于小波KPCA和IQGA-ELM預測模型的平均預測相對誤差為4.786%,模型的輸出值與真實值較接近,平均預測準確率高達95.79%。因此,本文提出的基于小波KPCA和IQGA-ELM預測模型誤差小、預測結果準確度高、泛化能力強,可應用于煤與瓦斯突出預測領域,有利于預防煤礦瓦斯突出災害。
①本文把小波分析思想與核主成分分析方法相結合,提出小波核主成分分析方法,提高了核主成分分析的非線性映射能力,準確地提取出煤與瓦斯突出的主成分指標。
②針對傳統ELM算法的隨機性缺點,將改進量子遺傳算法(IQGA)與極限學習機(ELM)進行耦合,提出基于小波KPCA和IQGA-ELM的煤與瓦斯突出預測模型,優化了ELM模型的輸入權值和隱含層閾值,顯著地提高了模型的預測精度。
③通過實例驗證、對比分析以及實測數據預測分析,證明該預測模型的辨識度較高、泛化能力強、具有較高的預測精度,能夠應用在煤與瓦斯突出預測領域。
參考文獻:
[1] 閆江偉,張小兵,張子敏. 煤與瓦斯突出地質控制機理探討[J]. 煤炭學報,2013,38(7):1174-1178.
[2] Li Shugang,Zhang Tianjun. Catastrophic Mechanism of Coal and Gas Outbursts and Their Prevention and Control[J]. Mining Science and Technology(China),2010,20(2):209-214.
[3] 楊力,耿紀超,汪克亮. 模糊支持向量機在煤與瓦斯突出預測中的研究[J]. 中國安全生產科學技術,2014,10(4):103-108.
[4] 朱志潔,張宏偉,韓軍,等. 基于PCA-BP神經網絡的煤與瓦斯突出預測研究[J]. 中國安全科學學報,2013,23(4):45-50.
[5] 陳全秋,郭勇義,吳世躍,等. 遺傳算法與神經網絡的結合在煤與瓦斯突出危險性預測中的應用研究[J]. 中國煤炭,2010,36(3):86-89.
[6] 溫廷新,孫紅娟,張波,等. 煤與瓦斯突出預測的QGA-LSSVM模型[J]. 中國安全生產科學技術,2015,11(5):5-12.
[7] 付華,王馨蕊,王志軍. 基于PCA和PSO-ELM的煤與瓦斯突出軟測量研究[J]. 傳感技術學報,2014,27(12):1710-1715.
[8] 謝國民,謝鴻,付華,等. 煤與瓦斯突出預測的NN-SVM模型[J]. 傳感技術學報,2016,29(5):732-738.
[9] 付華,李海霞,盧萬杰,等. 一種改進的極限學習機煤與瓦斯突出預測模型[J]. 傳感技術學報,2016,29(1):69-74.
[10] 周壘. 淺析開灤錢家營礦地質類型劃分[J]. 水力采煤與管道運輸,2015(1):65-68.
[11] Zyad Elkhadir,Khalid Chougdali,Mohammed Benattou. Intrusion Detection System Using PCA and Kernel PCA Methods[M]. Springer International Publishing:2016:13-22.
[12] 遲恩楠,李春祥. 基于優化組合核和Morlet小波核的LSSVM脈動風速預測方法[J]. 振動與沖擊,2016,35(18):52-57.
[13] Xin Yuanfang,Jiang Yuanyuan,Zhang Xuemei. Gas Outburst Prediction Model Based on Empirical Mode Decomposition and Extreme Learning Machine[J]. Recent Advances in Electrical and Amp;Electronic Engineering,2015,8(1):50-56.
[14] Deng Chenwei,Huang Guangbin,Xu Jia,et al. Extreme Learning Machines:New Trends and Applications[J]. Science China(Information Sciences),2015,58(02):5-20.
[15] 王濤,王洋洋,郭長娜,等. QGA-RBF神經網絡在礦井瓦斯涌出量預測中的應用[J]. 傳感技術學報,2012,25(1):119-123.
[16] 張立仿,張喜平. 量子遺傳算法優化BP神經網絡的網絡流量預測[J]. 計算機工程與科學,2016,38(1):114-119.