付 華,劉 昊,徐耀松,趙俊程,許 桐
(遼寧工程技術大學電氣與控制工程學院,遼寧省 葫蘆島 125105)
煤礦井下開采過程中,煤壁縫隙會涌出瓦斯氣體,過快或過量的瓦斯涌出會引發(fā)瓦斯爆炸、煤與瓦斯突出等事故,對瓦斯涌出量的精準預測是防治煤礦瓦斯事故的重要措施[1]。
近年來,國內外許多學者利用瓦斯涌出密切相關的易測過程變量和機器學習算法建立預測模型,有效地提升了對瓦斯涌出的防治能力。Yang 等[2]構建了一種改進的灰色GM(1,1)和RBF 神經網絡相結合的瓦斯涌出量預測模型;劉鵬等[3]融合支持向量機和決策樹算法提出一種增強決策樹回歸算法,并應用于瓦斯涌出量的預測。上述研究沒有對所用算法的參數進行優(yōu)化,在一定程度上限制了預測精度。任志玲等[4]采用遺傳模擬退火算法優(yōu)化回歸型支持向量機的參數,建立了瓦斯涌出量的非線性回歸擬合模型;徐耀松等[5]提出一種改進的萬有引力算法,用于搜索更優(yōu)的BP 神經網絡的初始權值和閾值,提高了瓦斯涌出量預測模型的精度和收斂速度;董曉雷等[6]采用遺傳算法優(yōu)化SVM 的關鍵參數,對回采工作面瓦斯涌出量進行預測;溫廷新等[7]提出了融合BP 神經網絡、PSO 算法和AdaBoost 算法的瓦斯涌出量的分源預測模型。上述學者利用智能優(yōu)化算法對預測模型的關鍵參數進行優(yōu)化,有效提升了預測的精準度。但瓦斯涌出不是簡單的靜態(tài)過程,影響因素眾多且信息堆疊,有必要經過預處理以進一步提高數據驅動預測模型的效率和精度。皮子坤等[8]使用主成分分析方法進行降維,建立了改進果蠅算法優(yōu)化GRNN 的預測模型。但主成分分析更適用于線性數據,對于存在復雜非線性關系的瓦斯涌出量相關因素數據[9],采用非線性降維方法更合理高效。肖鵬等[10]通過改進的遺傳算法優(yōu)化BP 神經網絡的參數,經核主成分分析(Kernel Principal Component Analysis,KPCA)維數約簡后的瓦斯涌出量相關數據作為輸入變量,所構建的耦合算法預測模型表現(xiàn)出較好的泛化能力和預測精度。
最小二乘支持向量機對于非線性小樣本問題具有優(yōu)秀的求解精度[11],相比神經網絡更適用于瓦斯涌出量的預測建模,但其預測能力受懲罰參數和核參數配置的影響較大。亨利溶解度優(yōu)化算法(Henry Gas Solubility Optimization,HGSO)具有全局尋優(yōu)能力強、需調節(jié)參數少等特點,已成功應用于多類實際優(yōu)化問題[12]。因此,將融合Tent 混沌映射和哈里斯鷹算法(Harris Hawk Optimization,HHO)的改進亨利溶解度算法(Improved Henry Gas Solubility Optimization,IHGSO)用于優(yōu)化最小二乘支持向量機(Least Squares Support Vector Machines,LSSVM)的關鍵參數,建立煤礦井下回采工作面的瓦斯涌出量動態(tài)預測模型。為降低瓦斯涌出量影響因素數據間相關性的影響,提高模型的運算效率,使用KPCA 對選取的瓦斯涌出量影響因素進行特征提取。
瓦斯涌出是煤體或巖層破裂向采掘空間釋放瓦斯的動態(tài)過程。瓦斯在煤層中的賦存狀態(tài)隨礦井開采區(qū)域地質條件和采掘情況的變化而動態(tài)變化,煤層厚度和深度等地質因素決定著煤層瓦斯含量和分布情況,開采規(guī)模、開采順序和采掘工藝等開采因素影響著瓦斯涌出的速率。
瓦斯涌出量的影響因素具有強耦合性、高度非線性和隨機性等特征[13],煤層中的瓦斯含量作為瓦斯涌出量最主要的影響指標,兩者之間的關系可以利用下式表示,

式中:q1表示排放時間內單位暴露面積上的瓦斯量;q0表示在排放時間內的平均瓦斯量;a為瓦斯含量系數,可根據w=求得;w表示瓦斯含量;p表示瓦斯壓力;re為鉆孔半徑;m為煤層厚度。由式(1)可以確定煤層瓦斯含量與瓦斯涌出量呈正相關關系。
瓦斯涌出過程可由多種影響因素從不同的角度表征,選取多個影響因素可以彌補不同檢測手段的不足。因此,根據回采工作面瓦斯涌出特性和影響因素的分析以及有關研究[14],結合礦區(qū)的實際情況,從地質因素和開采技術角度出發(fā)選取瓦斯涌出量指標變量,并從時間角度將其劃分為動態(tài)和靜態(tài)變量。動態(tài)輔助變量包括開采層瓦斯含量、臨近層瓦斯含量、推進速度、采出率、日產量;靜態(tài)輔助變量包括煤層深度、煤層厚度、煤層傾角、煤層間距、采高、鄰近層厚度、層間巖性、工作面長度,將其中13個指標作為瓦斯涌出量預測模型的輔助變量。
運用KPCA 算法提取出低維瓦斯涌出量主成分影響因子代替高維初始影響因子,實現(xiàn)對預測模型效率的提升。瓦斯涌出的相關因素數據共同構成數據集D=[D1D2…Dp]T,其中,p為選取瓦斯涌出量影響因素的種類數目。為減少量綱對預測指標的影響,首先對D進行標準化處理得到D′。

式中:i,j=1,2,…,m,m為數據集樣本數量。通過映射函數將D′映射到高維空間,即:

式中:φ為非線性映射函數。將K中心化得到,通過對其協(xié)方差矩陣特征分解[15],計算得的n個特征值λ和特征向量μ。選取前q個較大的特征值,對這q個特征值及其對應的特征向量計算得到特征提取后的瓦斯涌出量影響因素主成分數據集Z,即預測模型的輸入參量,

標準亨利溶解度算法中的初始個體都是在搜索空間內隨機生成的,迭代過程中在集群內逐漸靠攏;最差個體以隨機更新的方式帶領種群跳出局部空間,但在一定程度上削弱了算法在局部空間的開發(fā)能力;而且只有一種位置更新策略,導致算法難以實現(xiàn)全局遍歷搜索和局部開發(fā)之間的平衡和適時切換。因此,將Tent 混沌映射引入種群初始化過程,利用概率轉換參數實現(xiàn)搜索策略的自適應變換,增強算法的尋優(yōu)性能。
利用混沌變量的隨機性、遍歷性和規(guī)律性的特性在初始解空間內進行優(yōu)化搜索,生成分布性更好的初始種群。Tent 混沌映射相比其他混沌映射具有更好的遍歷性和更快的搜索速度[16],Tent 混沌映射的表達式如下:

將混沌序列分量轉換到對應解空間內:

隨著IHGSO 的尋優(yōu)迭代,IHGSO 通過概率轉換參數自適應地選擇HGSO 算子或HHO 算子,進而實現(xiàn)IHGSO 在全局和局部空間內搜索策略的轉換[17]。概率轉換參數E的公式如下:

式中:t為當前迭代次數,T為最大迭代次數,E0為(-1,1)的隨機值。由式(7)可以看出,概率轉換參數E的選取考慮了隨機性和迭代次數的作用,其值是隨著迭代過程動態(tài)變化的。在算法迭代初期,t值較小,E的絕對值大于1,算法自適應地選擇HGSO 算子執(zhí)行全局探索過程索;隨著尋優(yōu)過程的推進,t值越來接近T,E的絕對值逐漸小于1,算法自適應地選擇HHO 算子執(zhí)行局部開采過程。設R為逃脫系數,是在0 到1 間的隨機數,則IHGSO 在局部領域內尋優(yōu)LSSVM 最佳關鍵參數的過程為:
①當R≥0.5 且|E|≥0.5 時,執(zhí)行軟圍攻策略靠近關鍵參數最優(yōu)解,數學表達式為:

式中:Δx(t)表示第t次迭代最優(yōu)個體與當前個體的差值,J=2(1-R)。
②當R≥0.5 且|E|<0.5 時,執(zhí)行硬圍攻策略靠近關鍵參數最優(yōu)解,公式如下:

③當R<0.5 且|E|≥0.5 時,執(zhí)行漸進式軟圍攻策略靠近關鍵參數最優(yōu)解,迭代公式如下:

式中:D表示問題維度;S為D維隨機向量;LF 為Levy 飛行函數;u和v為(0,1)均勻分布的隨機數;τ=1.5。
④當R<0.5 且|E|<0.5 時,執(zhí)行漸進式硬圍攻策略靠近關鍵參數最優(yōu)解,如式(13):

2.3.1 測試函數選取
為了驗證IHGSO 的優(yōu)化性能和穩(wěn)定性,選用10個單峰、多峰和固定維數基準測試函數進行尋優(yōu)對比測試。測試函數的具體信息如表1 所示。
2.3.2 實驗參數設置
選取亨利氣體溶解度算法、哈里斯鷹算法、海洋捕食者算法[18](Marine Predators Algorithm,MPA)、鯨魚優(yōu)化算法[19](Whale Optimization Algorithm,WOA)、粒子群算法[20](Particle Swarm Optimization,PSO)、灰狼優(yōu)化算法[21](Grey Wolf Optimizer,GWO)、麻雀搜索算法[22](Sparrow Search Algorithm,SSA)和改進算法進行對比,所有算法的共有參數保持一致,種群規(guī)模設置為50,最大迭代次數設置為1 000,維數取值如表1 所示。各算法參數的詳細設置如表2 所示。

表1 測試函數

表2 各算法的參數設置
2.3.3 實驗結果及分析
為了去除偶然性引起的誤差,通過MATLAB 分別對10 個標準測試函數進行30 次獨立試驗。表3列出了上述8 種算法對單峰(F1-F5)、多峰(F6-F8)和固定維數(F9-F10)測試函數得到的實驗結果。

表3 測試函數尋優(yōu)結果

續(xù)表3 測試函數尋優(yōu)結果
在相同的約束條件下,對于單峰函數F1、F3 和F4,SSA 和IHGSO 能找到其理論最優(yōu)解0,但SSA的平均尋優(yōu)結果不如IHGSO,IHGSO 對比其他算法在標準差上的表現(xiàn)優(yōu)異;對于單峰函數F2,只有IHGSO 算法經過迭代搜尋到理論最優(yōu)值,并且平均值和標準差都為0;對于單峰函數F8,雖然IHGSO沒有尋找到其理論最優(yōu)解,但是三個評價指標都優(yōu)于其他算法。在對5 個單峰函數的多次尋優(yōu)測試中,IHGSO 各評價指標均為最優(yōu),說明IHGSO 具有優(yōu)秀的局部尋優(yōu)能力和穩(wěn)定性。對于多峰函數F6,HHO、WOA 和IHGSO 都能夠尋找到最優(yōu)值,但HHO 的30 次尋優(yōu)結果的平均值和標準差更加優(yōu)秀,證明了HHO 良好的局部極值逃逸能力;對于多峰函數F7 和F8,HGSO、HHO、WOA、SSA 和IHGSO在對其多次尋優(yōu)得到的結果基本都為理論最優(yōu)值,IHGSO 表現(xiàn)出優(yōu)秀的收斂精度和穩(wěn)定度。在對固定維數測試函數的尋優(yōu)中,幾種算法尋找到的最優(yōu)解基本一致,都能收斂到理論最優(yōu)解附近。但在平均值和標準差上,IHGSO 優(yōu)于其他對比算法幾個至十幾個數量級,展現(xiàn)出更優(yōu)秀穩(wěn)定的尋優(yōu)效果。
通過基準測試函數迭代收斂曲線的繪制進一步直觀地對比各個算法的收斂性和跳出局部空間的能力,選取測試中與結果平均值相近的一次繪制各算法的迭代收斂曲線,其中橫軸表示迭代數,縱軸表示適應度值的對數。由圖1 可知,對于不同類型的測試函數,在幾種算法收斂到相同精度的情況下,IHSGO 所需的迭代次數最少,證明改進策略能有效提升算法的收斂速度。隨著迭代次數的增加,其他幾種算法均出現(xiàn)不同程度的停滯,IHGSO 收斂曲線階梯波動式下降表明IHGSO 能夠脫離局部最優(yōu)停滯。

圖1 部分函數收斂曲線
綜上可知,IHGSO 在對不同測試函數的尋優(yōu)中,相比于其他算法不僅尋優(yōu)精度高,尋優(yōu)穩(wěn)定性方面也優(yōu)勢明顯,證明了改進策略的有效性和改進算法的優(yōu)越性。
將瓦斯涌出量影響因素維數約簡至q維的主元數據Z=[Z1Z2…Zq]T作為LSSVM 預測模型的輸入參量,對瓦斯涌出量Y進行預測。LSSVM 的目標優(yōu)化函數和約束條件如下式:

式中:J(·)表示目標函數,φ(·)表示非線性函數,c表示懲罰因子,ξ表示誤差變量,ω表示法向量,b表示偏置量。
經過訓練得到的瓦斯涌出量LSSVM 模型回歸函數為:

式中:K(zi,zj)表示徑向基核函數,g表示核函數寬度。
瓦斯涌出量LSSVM 預測模型中有2 個待優(yōu)化參數,即懲罰系數c和核函數參數g,這兩個參數的選取直接關系到模型的抗干擾能力和泛化能力。利用改進的亨利溶解度優(yōu)化算法調整LSSVM 的關鍵參數,從而得到煤礦井下瓦斯涌出量IHGSO-LSSVM預測模型。
①IHGSO 參數初始化。設置種群規(guī)模、迭代次數等參數,在搜索空間內隨機選取初始種群,然后經過Tent 混沌搜索得到混沌種群;
②確定LSSVM 參數c和g的范圍,c∈(0,100],g∈(0,100];
③IHGSO 根據概率轉換參數自適應地選擇搜索策略,通過個體迭代更新不斷靠近LSSVM 關鍵參數最優(yōu)解,并更新迭代次數t;
④將瓦斯涌出影響因素特征提取后的主成分數據作為模型的輸入,從而進行模型訓練。將模型的輸出值和真實值之間的均方根誤差作為適應度函數來度量模型的偏差情況,適應度最優(yōu)時作為最優(yōu)解,

⑤判斷是否滿足終止條件:t≥T,若滿足則繼續(xù)執(zhí)行步驟⑥,否則返回步驟③;
⑥輸出最優(yōu)解,即LSSVM 模型的核函數參數值和懲罰參數值,利用該優(yōu)化后的參數訓練LSSVM 模型,即完成IHGSO 優(yōu)化LSSVM 的瓦斯涌出量預測模型的建立。
實驗數據選自某礦井工作面的歷史監(jiān)測數據,篩選出30 組實測數據作為研究對象,并從中選取21 組數據作為訓練樣本,剩余數據作為測試樣本。部分瓦斯涌出量影響因素數據如表4 所示。

表4 部分瓦斯涌出量影響因素數據
對十三類瓦斯涌出量預測指標進行核主成分分析,得出各主成分排序后的方差貢獻度并計算累計方差貢獻度,如圖2 所示。
從圖2 中可以看出,前3 個主元的累計方差貢獻率為87.09%,表明這3 個主元能夠實現(xiàn)所有主元表達能力的85% 以上。因此,在原始的13 個特征指標提取3 個主成分作為瓦斯涌出量預測模型的輸入變量。

圖2 各成分貢獻占比圖
將KPCA 預處理后的瓦斯涌出相關因素主成分數據作為輸入,對IHGSO-LSSVM 預測模型進行仿真實驗,結果如表5 所示。IHGSO-LSSVM 預測模型的最小誤差為0.036 3,最大誤差為0.198 7,測量結果的誤差均在0.2 m3/min 以內,說明該模型具有較好的擬合精度。

表5 IHGSO-LSSVM 預測模型結果
經過多次訓練得到改進的亨利溶解度算法優(yōu)化LSSVM 的最優(yōu)適應度,如圖3 所示。

圖3 適應度值曲線圖
由圖3 可知,IHGSO 優(yōu)化算法在迭代前期能夠快速收斂,且具有優(yōu)秀的尋優(yōu)精度。當迭代次數接近20 時,樣本的均方誤差就可以到達最優(yōu)狀態(tài),得到的尋優(yōu)參數分別為:c=5.24,g=2.23。
為進一步驗證瓦斯涌出量IHGSO-LSSVM 預測模型的性能,將其與ELM(Extreme Learning Machine,ELM)模型、LSSVM 模型、PSO-LSSVM 模型和SSALSSVM 模型和對比,比較測試樣本的預測結果。為保證實驗的客觀性與一般性,對各模型進行多次實驗取平均值。其中,IHGSO、PSO 和SSA 參數設置如表2 所示,種群規(guī)模和迭代次數分別設置為30 和100。圖4 為5 種模型在測試樣本下得到的瓦斯涌出量預測值和實際值的對比曲線,圖4 中IHGSOLSSVM 預測模型效果更好,擬合精度更高。

圖4 不同預測模型結果
通過均方根誤差(RMSE)、平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE)三種評價指標,對比分析不同模型的測量性能。三種評價指標的數學表達為:

式中:n為測試集樣本個數,Yi為預測值,為實際值。三種誤差RMSE、MAE 與MAPE 的值越小,代表預測的精度越高,即模型的效果越好。表6 為5 種預測模型預處理前后的誤差對比。
由表6 可得,經核主成分分析非線性約簡后的多種模型在整體上預測準確率呈不同程度的提升,運行時間也較未經預處理有所減少。經特征提取處理后的ELM、LSSVM、PSO-LSSVM、SSA-LSSVM 和IHGSO-LSSSVM 五種模型的平均絕對百分比誤差分別為8.015 2%、14.465 0%、12.390 4%、3.041 1%和1.565 6%。經PSO、SSA 和IHGSO 優(yōu)化后的LSSVM模型在預測精度上提升顯著,運行時間雖有所增加但仍處在合理范圍內。其中,IHGSO-LSSVM 模型在預處理前后都表現(xiàn)出優(yōu)秀的預測性能,能夠準確實時地對井下瓦斯涌出量進行預測,達到理想的預測效果。

表6 不同預測模型結果誤差對比
本文提出了一種基于混沌雙算子亨利溶解度算法優(yōu)化LSSVM 的煤巖瓦斯涌出量預測模型。引入Tent 混沌映射和哈里斯鷹算子的改進亨利溶解度算法在基準函數尋優(yōu)測試中,相較標準HGSO 綜合性能顯著提升,相比于其他算法具有更好的收斂性能和求解穩(wěn)定性,驗證了改進策略的有效性和改進算法的優(yōu)越性。IHGSO 能夠有效地對LSSVM 的懲罰因數和核函數參數進行優(yōu)化,改善了LSSVM 對初始懲罰因數和核函數參數依賴。利用KPCA 進行瓦斯涌出特征的提取,降低了模型輸入參量的維數。經KPCA 特征提取后的煤巖瓦斯涌出量預測模型的均方根誤差和平均絕對誤差可縮小至0.156 4 和0.133 2,平均絕對百分比誤差為1.565 6%,運行時間僅為0.024 9 s,比其他預測模型具有更好的表現(xiàn)。