999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CART算法的煤與瓦斯突出判別分析

2015-06-27 05:55:23劉年平胡慧慧
中國礦業 2015年6期
關鍵詞:數據挖掘規則方法

劉年平,胡慧慧

(1.西南科技大學環境與資源學院,四川 綿陽 621010;2.西南科技大學固體廢物處理與資源化教育部重點實驗室,四川 綿陽 621010)

基于CART算法的煤與瓦斯突出判別分析

劉年平1,2,胡慧慧1

(1.西南科技大學環境與資源學院,四川 綿陽 621010;2.西南科技大學固體廢物處理與資源化教育部重點實驗室,四川 綿陽 621010)

基于分類回歸決策樹(CART)算法,考慮影響煤與瓦斯突出的主要因素,建立了煤與瓦斯突出判別的CART模型。模型選擇瓦斯壓力、瓦斯放散初速度、煤的破壞類型、堅固性系數和垂深作為煤與瓦斯突出的判別指標體系,選取國內典型煤與瓦斯突出礦井的突出數據建立模型樣本訓練庫,利用k-折交叉驗證方法尋找最優樹,并提取優化后的突出規則,最后將提取的規則對實例進行驗證。研究表明,該模型簡單有效,可以作為煤與瓦斯突出判別分析的一種輔助方法。

煤與瓦斯突出;決策樹;CART算法;判別分析

煤與瓦斯突出是一種復雜的動力學現象,嚴重影響著礦工的生命安全和礦井的生產,目前還無法準確的分析其發生機理。針對這類具有機理復雜、非線性顯著等特點的礦井災害判別問題,一般無法建立準確的數學模型予以分析,因而研究該類危險性判別方法一直是礦井災害預測的重要方向。數據挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的各種數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程[1]。鑒于煤與瓦斯突出的非線性特點和數據挖掘技術的優點,利用數據挖掘方法研究突出規律進而進行突出危險性判別成為一種較為可行的方法,目前研究較多的煤與瓦斯突出數據挖掘方法有神經網絡方法[2]、支持向量機方法[3-4]、灰色系統方法[5]、模糊模式識別方法[6]、免疫遺傳算法[7]、時間序列方法[8]、可拓方法[9-10]、多元判別法[11]等,這些數據挖掘方法的應用為煤與瓦斯突出判別提供了較好的模型。決策樹學習是以客觀數據為基礎的歸納算法,它采用自頂向下的遞歸方法,能從一組無次序、無規則的大量數據中獲得內含的知識分類規則,不僅能用類似樹層的模式形象的表示出所獲得的知識,還可以用多個IF-THEN規則的形式表示,具有較高的可讀性。有學者對決策樹與神經網絡做了分類對比,結果發現決策樹具有更高的分類準確率[12]。另外,決策樹能處理各種類型的數據,尤其擅長處理非數值型數據。決策樹方法在在數據挖掘中具有較好的準確性,已在醫療、氣象、投資風險等領域有了廣泛的應用,但煤礦災害的判別方面研究較少,本文將決策樹方法引入到煤與瓦斯突出的判別中,利用分類回歸決策樹(Classification And Regression Tree,CART)進行煤與瓦斯突出的危險性判別。

1 CART決策樹的工作原理

CART決策樹是由Breiman等人提出的一種典型二叉決策樹,現已在統計分析中得到了廣泛的應用[13]。與其他決策樹相比,CART可以同時處理連續變量和分類變量,當目標變量是連續變量,CART生成回歸決策樹,當目標變量是分類變量時,CART就會生成分類決策樹。另外,CART能有效的處理數據樣本的非線性問題,不需要對數據樣本作特定假設,因此非常適用于解決機理不明確的復雜性問題。CART生成回歸決策樹要經過建樹和剪枝兩個主要步驟。

1.1 CART的建樹

決策樹算法的核心是選取每個結點上要測試的屬性,依據不同的屬性劃分度量方法進行數據純度的劃分,屬性的度量方法有多種,如信息增益、信息增益比、基尼指數、χ2統計、G統計、證據權重、最小描述長度、相關度等方法。分類回歸樹(CART)以Gini(基尼)指數作為屬性度量方法, Gini系數定義如式(1)所示。

(1)

式中:p(i|t)為測試變量t屬于類i的樣本的概率;c為樣本的個數。當Gini=0時,所有的樣例屬于一類。在CART的二元劃分中,如果屬性滿足一定純度則劃分在左子樹,否則劃分到右子樹。假設訓練數據集C中的屬性A將C劃分為C1與C2,則給定劃分C的Gini系數為式(2)。

(2)

為了確定劃分效果,可以用增益Δ來確定劃分效果的標準,增益為父結點不純度與子結點不純度的差。增益定義為式(3)。

(3)

式中:I()是給定結點的Gini系數;N是父結點上的記錄總數;k是屬性值的個數;N(vj)是與子女結點相關聯的記錄個數。

CART算法在滿足下述條件之一時停止建樹。①所有葉節點的樣本數為1、樣本數小于某個給定的最小值或者樣本都屬于同一類的時候;②決策樹的高度達到用戶設置的閾值,或者分支后的葉節點中的樣本屬性都屬于同一個類的時候;③當訓練數據集中不再有屬性向量作為分支選擇的時候。

1.2 CART的剪枝

決策樹初步建立后,為了提高決策樹的準確率和簡潔度,需要考慮對樹進行剪枝,通過剪枝減少決策樹的規模,消除由于噪聲或缺乏代表性樣本而導致的過分擬合現象。在決策樹的剪枝研究中,目前常用的剪枝方法有四種:悲觀錯誤剪枝PEP(Pessimistic Error Pruning)方法、最小錯誤剪枝MEP(Minimum Error Pruning) 方法、代價-復雜度剪枝CCP(Cost-Complexity Pruning)方法和基于錯誤剪枝EBP(Error-Based Pruning) 方法。CART采用的是CCP方法,這種方法包括兩個過程:自底向上,對原始決策樹中的每一次修剪得到一棵樹,從而得到一系列的樹,包括原始樹和只有一個結點的樹;評價這些樹,根據真實誤差率來選擇一個最優秀的樹作為最后被剪枝的樹[13]。決策樹建立并剪枝完成后,最后需要采用某種方法對所建立的一系列子樹進行評估尋找最優樹。本文建模采用k-折交叉驗證尋找最優樹,當樣本數量較少時,該方法可以有效的利用所有可能的數據進行建模與驗證,同時剔除了由于數據自身特性帶來的過度適應,具有較高的準確性。

1.3 CART的構建步驟

依據上面的分析,設訓練樣本集L={X1,X2,…,Xn,Y},其中,Xi(i=1,2,…,n)稱為屬性向量,Y為類別。

1)在根節點T處,搜索數據空間,利用Gini系數找到使得下一代子節點中數據集的非純度下降最大的最優分裂變量和相應的分裂閥值。

2)用1)中的分裂變量和分裂閥值把根節點分成T1和T2。

3)如果在某個節點Ti處滿足上述停止建樹條件,則該節點為葉節點,否則轉為1)繼續建樹。

4)利用代價-復雜度剪枝方法對樹剪枝,并尋找最優二叉樹。

2 應用實例

針對煤與瓦斯突出的特點,參照相關文獻研究,選取瓦斯壓力、瓦斯放散初速度、煤的破壞類型、堅固性系數和垂深作為煤與瓦斯突出的判別指標,選取國內21個典型突出礦井的煤與瓦斯突出數據建立指標集[14],將突出類型分為突出與不突出兩部分,利用CART對煤與瓦斯突出的數據樣本進行知識規則的提取,為了在增加有限樣本的數據集,采用交叉驗證法對樣本數據進行劃分,建好決策樹后,利用提取的規則對未參加訓練的其他5個典型樣本進行分析以驗證該模型的有效性,樣本數據見表1。

利用MatLab軟件,對CART算法編程構建煤與瓦斯突出數據決策樹,利用訓練樣本所得到的決策樹見圖1。

表1 煤與瓦斯突出訓練樣本及測試樣本數據

圖1 基于CART算法的煤與瓦斯突出決策樹

從CART決策樹模型中提取的規則如下所示。

規則1:IfΔP≤5.50 andP≤2.15 Then 不突出。

規則2:IfΔP>5.50 andD≤2.00 andP≤2.20 Then 不突出。

規則3:IfΔP≤5.50 andP>2.15 Then 突出。

規則4:IfΔP>5.50 andD>2.00 Then 突出。

規則5:IfΔP>5.50 andD≤2.00 andP>2.20 Then 突出。

《煤礦安全規程》中規定了煤與瓦斯突出單項指標的參考臨界值,預測煤層突出危險性的單項指標可用煤的破壞類型、瓦斯放散初速度、煤的堅固性系數和煤層瓦斯壓力等,采用該法預測時,各種指標的突出危險臨界值應根據礦區實測資料確定,無實測資料時可參考表2,只有當全部指標達到或超過其臨界值時才可視該煤層為突出危險煤層。

選取其他典型礦區的煤與瓦斯突出指標數據,利用所建立的決策樹模型和單項指標對樣本進行判別,判別結果如表3所示。

表2 預測煤與瓦斯突出危險性的單項指標

表3 決策樹與單項指標預測結果

由決策規則與預測結果可以看出,利用決策樹可以從具有代表性的樣本中提取合理的規則,決策樹模型的判別結果較為準確,由于這類樣本數據能真實的反應突出指標的各種非線性相互作用,該方法能有效的避免專家的知識局限性和判別指標閥值規則制定的主觀性,具有很強的實際應用價值。

3 結論

煤與瓦斯突出危險性判別是煤礦災害防治的核心問題之一,針對突出機理的復雜性,利用分類回歸樹算法,通過MatLab開發了相應程序,以典型煤與瓦斯突出數據作為訓練樣本建立了決策樹模型。將建立的模型應用在未知判別結果的工程實例中進行驗證后發現,決策樹模型具有較高的精度,同時還能獲取簡單的突出規則,為快速準確判別突出提供了一種輔助方法。由于分類回歸樹的準確性受到樣本個數及訓練樣本數據庫的制約,而支持向量機對小樣本的預測能量較強,因此在后續的研究中,將重點研究利用隨機森林的思想把決策樹與支持向量機等數據挖掘方法融合起來進一步提高模型的實用性。

[1] 馬國兵,薛安克.數據挖掘技術在運動目標軌跡預測中的應用[J].計算機工程與應用,2004 (11):210-211.

[2] 楊敏,李瑞霞,汪云甲.煤與瓦斯突出的粗神經網絡預測模型研究[J].計算機工程與應用,2010,46(6):241-244.

[3] 邵劍生,薛惠鋒.基于PSO-SVM的煤與瓦斯突出強度預測模型[J].西華大學學報:自然科學版,2012,31(1):63-66.

[4] 孫玉峰,李中才.支持向量機法在煤與瓦斯突出分析中的應用研究[J].中國安全科學學報,2010,20(1):25-30.

[5] 張大偉,郭立穩,杜通.灰色系統理論在煤與瓦斯預測中的應用[J].河北理工大學學報:自然科學版,2009,31(2):1-5.

[6] 張子戌,劉高峰,呂潤生,等.基于模糊模式識別的煤與瓦斯突出區域預測[J].煤炭學報,2007,32(6):592-595.

[7] 朱玉, 張虹,蘇成.基于免疫遺傳算法的煤與瓦斯突出預測研究[J].中國礦業大學學報,2009,38(1):125-130.

[8] 鄧明,張國樞,陳清華.基于瓦斯涌出時間序列的煤與瓦斯突出預報[J].煤炭學報,2010,35(2): 260-263.

[9] 楊玉中,吳立云,高永才.煤與瓦斯突出危險性評價的可拓方法[J].煤炭學報,2010,35(S1):100-104.

[10] 郭德勇,鄭茂杰,郭超,等.煤與瓦斯突出預測可拓聚類方法及應用[J].煤炭學報, 2009,34(6):783-787.

[11] 王超,宋大釗,杜學勝,等.煤與瓦斯突出預測的距離判別分析法及應用[J].采礦與安全工程學報,2009,26(4):470-474.

[12] Muhammad A.Razi,Kuriakose Athappilly.A comparative predictive analysis of neural networks,nonlinear regression and classification and regression tree models [J].Expert Systems with Appocatons,2005,(29):65-74.

[13] Breiman L,Friendman J,Olshen R.Classification and regression trees[M].Califomia:Wadsworth Belement,1984.

[14] 肖紅飛,何學秋,劉黎明.改進BP算法在煤與瓦斯突出預測中的應用[J].中國安全科學學報,2003,13(9):59-62.

Discriminate analysis of coal and gas outburst based on CART algorithm

LIU Nian-ping1,2,HU Hui-hui1

(1.School of Environment and Resources,Southwest University of Science and Technology,Mianyang 621010,China;2.Ministry of Education Key Laboraory of Solid Waste Treatment and Resource Recycle,Southwest University of Science and Technology,Mianyang 621010,China)

Based on the algorithm of classification and regression tree (CART (Classification And Regression Tree)),a discriminate model of coal and gas outburst was established according to main factors,which are gas pressure,gas initial velocity,destructive type of coal,hard coefficient and depth.Select data of discriminating indexes from typical mines with coal and gas outburst as training data,and find the champion tree by the method of k - fold cross-validated,then extract the optimized rules,at lased,the rules is used to discriminate the coal and gas outburst in the instance.The results show that CART model is a simple and effective method,it can be used in discriminate analysis of coal and gas outburst as a auxiliary method.

coal and gas outburst;decision tree ;CART algorithm;discriminate analysis

2014-08-05

西南科技大學博士研究基金項目資助(編號:12zx7118)

劉年平(1979-),男,講師,博士,主要從事礦山災害與防治,災害預警管理、安全管理方面的工作。E-mail:happyfy2@163.com。

TD713.2

A

1004-4051(2015)06-0128-04

猜你喜歡
數據挖掘規則方法
撐竿跳規則的制定
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
TPP反腐敗規則對我國的啟示
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
一種基于Hadoop的大數據挖掘云服務及應用
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 色悠久久久| 欧美69视频在线| 福利视频久久| 欧美爱爱网| 黄色网站不卡无码| 2020亚洲精品无码| 亚洲精品动漫在线观看| 国产福利影院在线观看| 国产成人无码播放| 日韩第九页| 久久成人国产精品免费软件| 亚洲欧美日韩另类| 国产精品内射视频| lhav亚洲精品| 在线免费亚洲无码视频| 国产成人av一区二区三区| 狂欢视频在线观看不卡| 114级毛片免费观看| 日韩欧美在线观看| 色综合天天操| 最新痴汉在线无码AV| AV老司机AV天堂| 欧美中文字幕在线二区| 热久久这里是精品6免费观看| 日韩色图区| 人妻无码AⅤ中文字| 日本黄网在线观看| 在线日韩一区二区| 国产精品美女自慰喷水| аⅴ资源中文在线天堂| 72种姿势欧美久久久久大黄蕉| 欧美激情视频二区三区| 精品夜恋影院亚洲欧洲| 久久综合干| 1级黄色毛片| 奇米精品一区二区三区在线观看| 精品久久高清| 黑色丝袜高跟国产在线91| 国内毛片视频| 国产无码精品在线| 91蜜芽尤物福利在线观看| 99在线观看精品视频| 精品国产Ⅴ无码大片在线观看81| 青青青伊人色综合久久| 这里只有精品在线| 99精品热视频这里只有精品7| 国产青榴视频| 91福利免费| 亚洲国产欧美国产综合久久| 首页亚洲国产丝袜长腿综合| 精品无码一区二区在线观看| 97se亚洲综合不卡 | www.99精品视频在线播放| 亚洲欧美自拍中文| 精品欧美日韩国产日漫一区不卡| 亚洲第一区在线| 毛片网站在线看| 久久国产精品无码hdav| 国产剧情国内精品原创| 一级高清毛片免费a级高清毛片| 亚洲高清在线播放| 99在线视频免费观看| 日韩大片免费观看视频播放| 亚洲中文久久精品无玛| 国产精品自在自线免费观看| 国产女人18水真多毛片18精品| 亚洲毛片在线看| 欧美国产日韩另类| 国产在线观看精品| 中文字幕在线看| 久久伊人色| 国产精品久久自在自线观看| 欧美区日韩区| 国产精品视频观看裸模| 无遮挡一级毛片呦女视频| 国产午夜人做人免费视频中文| 日本午夜精品一本在线观看| 日韩国产黄色网站| 69国产精品视频免费| 欧美激情,国产精品| 自偷自拍三级全三级视频| 欧美性天天|