謝國民,謝鴻,付 華,閆孝姮
(遼寧工程技術大學電氣與控制工程學院,遼寧葫蘆島125105)
煤與瓦斯突出預測的NN-SVM模型*
謝國民*,謝鴻,付華,閆孝姮
(遼寧工程技術大學電氣與控制工程學院,遼寧葫蘆島125105)
為提高煤與瓦斯突出預測的精度和速度,通過基于鄰域粗糙集(NRS)理論對特征向量降維,提取出影響煤與瓦斯突出的核心致突因素,采用改進的支持向量機(NN-SVM)理論來構建煤與瓦斯突出風險與由各種致突因素組成的特征向量之間的非線性關系。從而建立了基于鄰域粗糙集(NRS)與改進的支持向量機(NN-SVM)相結合的煤與瓦斯突出預測模型。實驗結果表明,該預測模型預測精度高,運算速度更快,同時還具有很好的泛化能力。
煤與瓦斯突出;預測模型;鄰域粗糙集理論;改進的支持向量機
EEACC:7230doi:10.3969/j.issn.1004-1699.2016.05.019
煤與瓦斯突出是煤礦重大災害之一,制約著我國煤礦的安全生產和煤礦工業的發展。由于煤與瓦斯突出的產生是受地應力、煤層瓦斯、煤層機構等因素共同作用的結果[1],導致突出發生的各種因素和條件又相互制約,相互影響,所以煤與瓦斯突出的預測一直是世界性難題。如何更加科學地精確地對煤與瓦斯突出進行預測和防治一直是近年來國內外學者不懈探索的目標。近年來涌現了許多新方法:神經網絡[2-3]、耦合算法[4]、模糊神經網絡[5]、灰色關聯分析[6]等多種學習算法和預測模型,而這些研究中也存在著自己的局限性,神經網絡的學習效率不高,模糊神經網絡預測的精度有待提高等問題。針對這些問題,本文提出了一種基于鄰域粗糙集(NRS)和改進的支持向量機(NN-SVM)相結合的瓦斯突出預測模型。
鄰域粗糙集(NRS)理論可對原始屬性約簡,克服經典的粗糙集理論需要對數據離散化處理而丟失原有信息重要成分的缺陷[7-8],直接處理數值型屬性。改進后的支持向量機(NN-SVM)算法,能夠對樣本集有效地刪減,減少所需評價樣本的數量,降低不同類別之間的混淆程度,同時兼備縮短訓練時間、處理致突因數與突出強度之間的非線性關系的能力。融合NRS和NN-SVM的優點,構造了通過兩者相結合的煤與瓦斯突出預測模型,模型訓練和樣本試驗證明,該方法具有很好的運算速度、較高的預測精度和泛化能力。
由于煤與瓦斯突出是受多方面因素的共同影響,是受地應力、煤層瓦斯、煤層機構、物理特性等共同作用的結果。而影響因素的選取與最終的預測結果有密切的聯系,因此對于影響因素合理的選取至關重要。本文根據國內外學者的研究和理論分析并查閱相關文獻[9-12],選取了以下11個屬性作為了煤與瓦斯突出預測的原始指標:①開采深度:隨著開采深度增加,煤層所積聚的能量增加,發生煤與瓦斯突出的機率和強度也會增加;②地質構造:有無褶皺、有無斷層影響著煤與瓦斯突出的強度和次數;③瓦斯含量:瓦斯含量是煤與瓦斯突出發生的必要物質條件,發生突出的物質基礎;④煤的普氏系數:反映煤抗擊外力的一個綜合指標。煤層越堅固,抵抗煤與瓦斯突出能力越強;⑤瓦斯放散初速度:瓦斯含量越高,瓦斯放散初速度越大。煤體破壞的程度越大,瓦斯的放散初速度越大,突出可能性越大;⑥瓦斯涌出初速度:在一定程度上反映了煤層構造的破壞程度;⑦瓦斯壓力:瓦斯壓力特性反映出煤與瓦斯突出的危險程度。煤層中瓦斯壓力越大,突出可能性越大。
除了以上的7個列出的指標外,煤層的頂板巖性、煤層變異系數、瓦斯含量是否變化、工作面風速等共11個指標作為了本文預測煤與瓦斯突出的具體指標。
2.1鄰域粗糙集基本原理
鄰域粗糙集模型是在經典的粗糙集理論上進行的延拓[13-14]。鄰域粗糙集理論無需進行離散化處理,減少樣本比較次數,提高分析效率,在屬性約簡上較經典的粗糙集理論更有優勢。
建立關于煤與瓦斯突出預測的鄰域決策系統NDS=(U,A,V,f),決策屬性D,條件屬性C是11個致突因數組成,決策屬性D將論域U劃分為N個等價類(x1,x2,…,xN),A=C?D,如果?B?A,V為各屬性值Va的集合,為信息函數,則有如下的定義:
①決策屬性D關于子集B的上、下近似以及決策邊界分別定義如下:
上近似:

其中,-NBX={xi/δB(xi)?X≠φ,xi∈U};
下近似:

決策邊界:

②定義鄰域決策系統的正域為:
正域:

③決策屬性D對條件屬性子集B的依賴度為:

④對于煤與瓦斯突出的鄰域決策系統(U,A,V,f),B?A,?a∈B-A;則定義a對B的重要度:

2.2基于鄰域粗糙集的煤與瓦斯突出屬性約簡
采用向前貪心約簡算法,不僅能夠刪除冗余特征,還能保證重要特征屬性優先被加入到約簡集中。向前貪心約簡算法以空集為出發點,根據鄰域粗糙集模型中重要度值依次選擇重要度最大的屬性,增加到約簡集中,直到剩余屬性重要度為0。約簡算法如下:
步驟1?a∈A,對屬性進行鄰域劃分,得到鄰域關系矩陣Na;
步驟2φ→red;
步驟3對任意屬性ai∈A-red,計算重要度:SIG(ai,red,D)=γred?ai(D)-γred(D)
和red?ai的正域Posred?ai(D);
步驟4得到重要度最大的屬性和其正域Posred?a(D);
步驟5如果SIG(ai,red,D)>0,red?ai→red,返回到步驟③;
步驟6否則輸出red,約簡結束。
3.1樣本集修剪
本文采用一種改進的支持向量機NN-SVM[15-16],針對訓練樣本中每一個樣本點,找出它的最近鄰點,根據樣本點的類別歸屬度是否大于設定的閾值來決定其取舍。然后將修剪后的樣本集輸入到SVM中訓練分類。
給定訓練樣本為(x1,y1),(x2,y2),…,(xn,yn),x∈Rm,用矩陣表示訓練集TRn×(m+1)=(XY),X=(x1,x2,…,xn)T,Y=(y1,y2,…,yn)T。利用歐氏距離定義每個樣本點xi與其他樣本點xj的距離為:

用1/Di表示第i個點從距離因素上考慮樣本類別歸屬的影響因子。如果T個樣本中有r個與考察樣本是同一個類的(假設距離為D1,D2,…,Dr),而剩余的T-r個與考察樣本都不是同一個類的(假設距離為Dr+1,Dr+2,…,DT),定義類歸屬度為:

對樣本集的修剪算法如下:
步驟1計算每一個樣本點與其他樣本點的距離Di,其中定義樣本點與自身距離為∞;
步驟2找出最短距離以及相應的點(即最近鄰);
步驟3判斷樣本點的類歸屬度Ei;
步驟4將樣本的類歸屬度與設定的閾值ε比較,刪除Ei小于ε的樣本;
步驟5將經過上述方法刪除后的樣本集TR,再利用SVM訓練分類。
3.2支持向量機(SVM)[17-20]
支持向量機通過尋求結構風險最小來提高學習機泛化能力,實現經驗風險和置信范圍最小化,達到在統計樣本較小的情況下,也能獲得良好統計規律的目的。
針對樣本集T={(x1,y1),(x2,y2),…,(xn,yn)},其中xi∈Rm,i=1,2,…,n,m為每個訓練樣本向量的維數,yi則為決策屬性。構造分類函數:

式(5)中φ(x)是輸入空間到高維特征空間的非線性映射,ω→為權系數向量,b為分類閾值。
SVM構造的分類函數可轉化為二次規劃問題:在約束條件yi(ωTxi+b)≥1-ξi(其中,i=1,2,…,n, ξi≥0)下,求函數的最小值,式中ξi為松弛變量,C為懲罰函數。采用lagrange乘子法,并引入滿足mercer條件的核函數k(xi,xj)=φ(xi)φ(xj)。
常用核函數有線性核函數、多項式核函數、徑向基核函數(RBF)以及神經網絡核函數,本文主要從以下方面考慮:①RBF可以將樣本映射到更高維的空間,與線性核函數不同,它可以處理類別和特征之間是非線性時的樣本,并且線性核函數是RBF的一個特例;②與多項式核函數相比,RBF需要確定的參數要少,模型更加簡單,訓練速度更快;③RBF與神經網絡核函數相比,不易陷入局部最優。
綜上考慮,RBF核函數具有較強的回歸能力,較準確的預測性能,因此本文選取了工程上應用性較好的RBF核函數再通過常用的網格搜索法確定RBF核函數的參數C和σ。
將上述的二次規劃問題轉化為:

并得到非線性問題的分類函數:

3.3多分類器系統
考慮到煤與瓦斯突出是一個多分類問題,支持向量機實質上是一個兩類分類器,因此采用基于SVM的多層次分類系統[21],構造分類器原則如下:使用SVM的分類思想在訓練數據中的任意兩個子類數據之間構造出一個分類器。假設需要分類第i類和第j類的數據,則需要解決下面的兩類分類問題:

通過核函數φ將訓練數據xi映射到高維空間。求解上式,便可得到分類結果[22-23]。
將上述的NRS和NN-SVM應用到煤與瓦斯突出預測中,不但能夠實現對冗余信息的刪減,還能加快預測速度,提高預測精度。充分地體現了利用NRS和NN-SVM兩種算法相結合的優勢。具體地實現煤與瓦斯突出預測的流程圖如圖1所示。

圖1 基于NRS和NN-SVM預測流程圖
針對本文選取的開采深度x1(m)、地質構造x2、瓦斯含量x3(m3/t)、煤的普氏系數x4(f)、瓦斯的放散初速度x5(ΔP/(L/min))、瓦斯的涌出初速度x6(P/(L/min))、瓦斯壓力x7/MPa、頂板巖性(滲透率)x8(%)、煤層變異系數x9(%)、瓦斯含量是否變化x10、工作面風速x11(m/s)等11個指標,一共100組原始數據建立了煤與瓦斯突出的知識決策表,截取了第81~第90組數據列舉如表1所示。
為了消除原始數據中存在的數量級和量綱帶來的差異,本文采用了最大最小值法對知識決策表歸一化處理[24]。然后采用鄰域粗糙集算法對上表的數據進行降維,提取出影響煤與瓦斯突出的核屬性。由于鄰域粗糙集屬性約簡過程運算的復雜性,因此利用MATLAB編程實現屬性約簡過程。約簡結果得到8個核屬性,消除了3個冗余屬性,簡化了NN-SVM的輸入變量,提高NN-SVM的處理速度和泛化能力。約簡結果見表2所示。

表1 煤與瓦斯突出預測知識決策表

表2 降維后的煤與瓦斯突出預測知識決策表
將100組數據的前75組數據作為訓練樣本集送入到NN-SVM模型中進行訓練得到經驗模型。為了顯示出對模型的訓練效果,本文將經過NRS屬性約簡后的前75組數據分別輸入到NN-SVM,SVM和BP模型中訓練,將訓練精度與訓練次數進行比較分析,見圖2所示。
通過圖2可以看出:對NN-SVM模型訓練了45次以后訓練精度的曲線變化趨于平緩,較SVM以及BP模型相比,經NRS處理后的NN-SVM模型的收斂速度更快;從圖2中還可以發現,NN-SVM模型的訓練精度變化曲線變化幅度明顯小于其他兩種預測模型,說明NRS與NN-SVM相結合的模型穩定性很好,性能優于BP和SVM模型。

圖2 不同模型的訓練次數與訓練精度對比
經過訓練之后,將剩下25組數據輸入到NNSVM中預測突出強度,并將預測結果與實際突出強度進行比較,得到煤與瓦斯突出預測結果,表3為最后5組預測結果。

表3 煤與瓦斯突出預測結果表
從表中結果可以看到,在樣本集有限的情況下,通過本文提出的模型進行訓練之后能夠得到較準確的煤與瓦斯突出強度預測結果,與煤礦現場實際情況吻合良好。NRS和NN-SVM相結合的預測模型很好地解決了煤與瓦斯突出與影響因素之間的非線性映射關系。說明采用的NRS和NN-SVM相結合的預測模型具有很好的泛化能力和預測效果。
為了分析本文提出的NRS和NN-SVM相結合的模型的優劣性,進行了如下對比實驗。將經過NRS降維前和降維后的原始數據分別輸入到NN-SVM,SVM和BP模型中,預測準確率和運行時間如表4所示。

表4 不同模型的屬性約簡前后預測效果對比表
根據表4預測結果表明:無論是采用NN-SVM,SVM還是BP模型,經過NRS算法對致突因數屬性約簡去除冗余屬性之后,三種模型的預測結果的準確率都得到了提高,且NN-SVM方法在NRS約簡前后均優于SVM和BP方法;同時,屬性約簡后的預測模型的預測速度也比降維之前速度有顯著提升,并且NN-SVM模型所需運行時間最短。實驗數據表明,本文采用的NRS算法對原始屬性約簡的方法行之有效。
通過對比表4可以明顯看出,經NRS約簡后的SVM準確率為91.215%,BP神經網絡的準確率為86.478%,本文采用的預測模型的準確率達到94.444%,比SVM以及BP更有優勢。對比運算速度,NRS與NN-SVM相結合的預測模型運算速度為0.1334S,在保證較高準確率情況下,比SVM的0.1958S和BP模型的0.3646S的速度都快。
將鄰域粗糙集(NRS)屬性約簡的方法引入到煤與瓦斯突出預測中,不僅克服了常規的支持向量機在選擇致突因素上的盲目性,科學地保留了致突因數中的特征屬性,并且大大地減少了模型預測的工作量,提高了工作效率。
利用改進的支持向量機(NN-SVM)中基于結構風險最小化原則和小樣本處理學習算法,較好地處理煤與瓦斯突出預測模型中的致突因素與突出等級之間的非線性關系。在NN-SVM中對訓練樣本進行修剪,相比傳統方法,不僅能夠提高分類的準確率,而且大大提高了運算速度,同時其泛化能力也有顯著提升。
基于鄰域粗糙集(NRS)與改進的支持向量機(NN-SVM)相結合的煤與瓦斯突出預測模型設計實現簡單,而且克服了傳統預測模型和預測方法精度低、速度慢以及泛化能力差等問題,實驗結果表明該方法適用礦井煤與瓦斯突出實時預測,具有較好的工程實用性及理論研究價值。
[1]李希建,林柏泉.煤與瓦斯突出機理研究現狀及分析[J].煤田地質與勘探,2010(1):7-13.
[2]曲方,張龍,李迎業,等.基于BP神經網絡的煤與瓦斯突出預測系統開發[J].中國安全科學學報,2012(1):11-16.
[3]付華,劉汀,張勝強,等.基于SOM-RBF算法的瓦斯涌出量動態預測模型研究[J].傳感技術學報,2015,28(8):1255-1261.
[4]付華,姜偉,單欣欣.基于耦合算法的煤礦瓦斯涌出量預測模型研究[J].煤炭學報,2012(4):654-658.
[5]郝天軒,宋超.基于模糊神經網絡的煤層瓦斯含量預測研究[J].中國安全科學學報,2011(8):36-42.
[6]王天瑜,劉勇,徐德宇.滴道礦立井28#煤層瓦斯含量灰色關聯分析及預測[J].安全與環境學報,2014(1):13-16.
[7]張慶寶,程浩忠,劉青山,等.基于粗糙集屬性約簡算法和支持向量機的短期負荷預測[J].電網技術,2006(8):56-59+70.
[8]謝國民,丁會巧,付華,等.基于FRS與GA-ELM的煤與瓦斯突出預測研究[J].傳感技術學報,2015,28(11):1670-1675.
[9]國家安全生產監督管理總局.防治煤與瓦斯突出規定[J].北京:煤炭工業出版社,2009.
[10]閆江偉,張小兵,張子敏.煤與瓦斯突出地質控制機理探討[J].煤炭學報,2013(7):1174-1178.
[11]陳祖云.煤與瓦斯突出前兆的非線性預測及支持向量機識別研究[D].中國礦業大學,2009.
[12]朱莉.基于SVM的煤與瓦斯突出預測模型研究[D].西安科技大學,2009.
[13]胡清華,于達仁,謝宗霞.基于鄰域粒化和粗糙逼近的數值屬性約簡[J].軟件學報,2008(3):640-649.
[14]韓虎,黨建武,任恩恩.基于鄰域粗糙集的支持向量機分類方法研究[J].計算機科學,2010(2):229-231+285.
[15]李紅蓮,王春花,袁保宗.一種改進的支持向量機NN-SVM[J].計算機學報,2003(8):1015-1020.
[16]于秋玲.基于改進NN-SVM算法的網絡入侵檢測[J].系統工程理論與實踐,2010(1):126-130.
[17]孫玉峰,李中才.支持向量機法在煤與瓦斯突出分析中的應用研究[J].中國安全科學學報,2010(1):25-30,179.
[18]Wu Yuping.Application of Support Vector Machine in Coal and Gas Outburst Area Prediction[C]//Proceedings of 2009 IEEE In?ternational Conference on Intelligent Computing and Intelligent Systems(ICIS2009).2009:5.
[19]Du Anli,Wang Yingchun,Wang Jie,et al.Research of Fault Diag?nosis Based on Rough Sets and Support Vector Machine[C]//Pro?ceedings of IEEE 2011 10th International Conference on Electron?ic Measurement&.2011:4.
[20]付華,王馨蕊,楊本臣,等.基于MPSO-CWLS-SVM的瓦斯涌出量預測[J].傳感技術學報,2014,27(11):1568-1572.
[21]孫涵,諸克軍.基于鄰域粗糙集與支持向量機的油層識別研究[J].計算機工程與應用,2008,30:219-222.
[22]周雪忠,吳朝暉.文本知識發現:基于信息抽取的文本挖掘[J].計算機科學,2003(1):63-66.
[23]單玉剛,王宏,董爽.改進的一對一支持向量機多分類算法[J].計算機工程與設計,2012(5):1837-1841.
[24]柳小桐.BP神經網絡輸入層數據歸一化研究[J].機械工程與自動化,2010(3):122-123+126.

謝國民(1969-),男,遼寧阜新人,博士,副教授,研究生導師。主要為從事工業自動化和智能檢測及電氣控制方面的研究工作,Lngdxgm@163.com;

謝鴻(1992-),男,重慶銅梁人,碩士研究生,主要為研究智能檢測與電氣控制,91017907@qq.com。
Prediction Model for Coal and Gas Outburst Based on NN-SVM*
XIE Guomin*,XIE Hong,FU Hua,YAN Xiaoheng
(School of Electrical and Control Engineering,Liaoning Technical University,Huludao Liaoning 125015,China)
In order to improve the accuracy and efficiency of coal and gas outburst prediction,NRS theory is used to do the feature vector dimension reduction and extract the main sudden factors which affect coal and gas outburst,and then,the relationship between coal and gas outburst risk and the feature vectors which consist of the factors that affect coal and gas outburst is analyzed by the NN-SVM theory.So,the coal and gas outburst prediction model is es?tablished based on the NRS theory and NN-SVM.The experiment results show that:NRS theory can do well in the knowledge reduction about the original characteristics.The model has a high prediction accuracy and the generaliza?tion ability is well.
coal and gas outburst;prediction model;neighborhood rough sets(NRS)theory;improved support vec?tor machine(NN-SVM)
TP39;TP183;TP212
A
1004-1699(2016)05-0733-06
項目來源:國家自然科學基金項目(51274118);遼寧省教育廳基金項目(UPRP20140464)
2015-12-14修改日期:2016-01-20