楊 峰,海 玲,劉 文,2
(1.新疆工程學(xué)院,新疆 烏魯木齊 830000;2.新疆暢森數(shù)據(jù)科技有限公司,新疆 烏魯木齊 830000)
在礦井水文地質(zhì)的災(zāi)害中,水害是當(dāng)前急需處理的問題,開采煤礦時(shí)導(dǎo)致含水層遭到破壞,水力平衡無法維持。在水壓的作用下,地下水以滴淋方式或以大量地下水的形式向巷道和開采場(chǎng)涌入,導(dǎo)致礦井水害的發(fā)生[1]。水害事故的發(fā)生,讓礦工的生命安全受到威脅,給礦區(qū)的環(huán)境造成了嚴(yán)重破壞,也給國(guó)家經(jīng)濟(jì)帶來了影響,導(dǎo)致后續(xù)的煤礦開采不能正常開展[2]。
隨著礦區(qū)開采工作的深入發(fā)展,水害的威脅也越來越大,因此對(duì)水文地質(zhì)大數(shù)據(jù)水害的預(yù)測(cè)是非常重要的[3]。
貝葉斯分類算法使用概率統(tǒng)計(jì)的方式對(duì)大數(shù)據(jù)進(jìn)行預(yù)測(cè),具有結(jié)合先驗(yàn)概率和后驗(yàn)概率的特點(diǎn),既避免了只使用先驗(yàn)概率的主觀偏見,也可以對(duì)單獨(dú)使用樣本時(shí)易造成的過擬合現(xiàn)象進(jìn)行避免[4]。本文采用貝葉斯分類算法對(duì)礦井涌水量數(shù)據(jù)進(jìn)行分析[5]。
大數(shù)據(jù)不是一種固定的產(chǎn)品,所謂大數(shù)據(jù)不只是在時(shí)代變化數(shù)據(jù)增長(zhǎng)的情況下生成的產(chǎn)物,也是如今這個(gè)充滿數(shù)據(jù)的社會(huì)化的一種現(xiàn)象。
大數(shù)據(jù)的特點(diǎn)在表現(xiàn)形式上具有多元,快速,價(jià)值高、海量等特點(diǎn);這些特點(diǎn)是與以往的數(shù)據(jù)相比體現(xiàn)出來的特點(diǎn),而大數(shù)據(jù)在實(shí)際上應(yīng)是具有變化性、可視化、真實(shí)性和不穩(wěn)定性。
本文針對(duì)伊犁一礦進(jìn)行相關(guān)探討,伊犁一礦的煤層存儲(chǔ)量巨大,僅僅12.4m就有600多億噸。據(jù)勘探資料顯示,伊犁一礦的開采條件與我國(guó)東部地區(qū)的礦區(qū)差異很大,因此面臨的水文地質(zhì)問題有很多。
在大數(shù)據(jù)社會(huì)中數(shù)據(jù)挖掘是一個(gè)關(guān)鍵技術(shù),就是從不規(guī)律、不完整的海量大數(shù)據(jù)中篩取出人們所需要的信息或規(guī)律。
根據(jù)不同類型的數(shù)據(jù)挖掘,數(shù)據(jù)挖掘的方法也不相同,數(shù)據(jù)挖掘的方法如表1所示。

表1 數(shù)據(jù)挖掘技術(shù)方法分析
貝葉斯分類算法以概率統(tǒng)計(jì)學(xué)為基礎(chǔ),由于其誤判率低,計(jì)算方式結(jié)合先驗(yàn)概率與后驗(yàn)概率。故貝葉斯算法在進(jìn)行運(yùn)算時(shí)可以避免只使用先驗(yàn)概率時(shí)的主觀偏見,同時(shí)對(duì)避免單獨(dú)使用樣本時(shí)的過擬合現(xiàn)象。面對(duì)大數(shù)據(jù)計(jì)算時(shí)仍具有很高的準(zhǔn)確率,運(yùn)行計(jì)算時(shí)的過程也相對(duì)簡(jiǎn)單,所以被廣泛使用于各個(gè)領(lǐng)域行業(yè)中。
貝葉斯分類算法主要是以概率統(tǒng)計(jì)為原理進(jìn)行計(jì)算。當(dāng)事件發(fā)生的概率已知時(shí),可以依據(jù)數(shù)學(xué)理論的方式預(yù)測(cè)將要發(fā)生的概率。假設(shè)數(shù)據(jù)樣本集合為是事件A的概率,是事件B的概率。事件A和事件B同時(shí)發(fā)生的概率用表示。那么當(dāng)事件A已發(fā)生時(shí)概率為
貝葉斯算法的定理可以用數(shù)學(xué)公式進(jìn)行表示,即為貝葉斯公式。具體如下所示:

貝葉斯預(yù)測(cè)方式的目的是為了能夠的得到一個(gè)準(zhǔn)確的判別。傳統(tǒng)的預(yù)測(cè)方式是先根據(jù)過去的信息建立模型,再進(jìn)行預(yù)測(cè),這種方式只是將輸入的以往信息轉(zhuǎn)變成現(xiàn)在輸出的信息,處理方式比較單一,不能處理異常發(fā)生的情況;貝葉斯預(yù)測(cè)能夠很好的處理這方面的問題,不僅可以處理以往的信息,還可以應(yīng)對(duì)突發(fā)異常的情況。
據(jù)查閱資料顯示,在伊犁一礦的數(shù)據(jù)中新生代的地層中以第四系為主,第四系的地層在全礦區(qū)分布廣泛,并且由南向北逐漸加深,有砂土、礫石等組成,沉積物的粒度由大變小,地形由陡峭變平緩。統(tǒng)計(jì)第四系的含水層厚度如表2所示。

表2 含水層參數(shù)選取
由表2可得,在伊犁一礦的開采區(qū)的含水層厚度是3.40至52.43之間,平均厚度為20.47。對(duì)表2進(jìn)行統(tǒng)計(jì),分別為試采區(qū)中部北部跟南部三部分,從而進(jìn)行直觀的看出含水層的統(tǒng)計(jì)宏觀變化特征,如表3所示。

表3 含水層厚度統(tǒng)計(jì)表
由表3可知,試采區(qū)南部的第四系的含水層平均厚度最小,而從南到北的厚度逐漸增加,因?yàn)槟喜康某练e顆粒比較大,所以滲透性比較好,地下水的流速比較快。
對(duì)礦區(qū)含水層進(jìn)行求參可得如表4所示。

表4 含水層求參
由表4可知,第四系的含水層的富水性中等,滲透性比較好。第四系含水層水量補(bǔ)給充沛,透水性好,所以會(huì)容易對(duì)礦區(qū)的開采造成很大的影響。
因?yàn)榈谒南岛畬邮欠浅袎旱暮畬樱韵炔捎梅€(wěn)定流理論公式進(jìn)行涌水量的計(jì)算。公式如(2)所示。

計(jì)算的涌水量為南部試采區(qū),所以根據(jù)表3可得含水層平均的厚度為11.17m。引用半徑帶數(shù)值為250m,當(dāng)?shù)谒南档牡叵滤咳朐嚥蓞^(qū)時(shí),含灰層中的水將會(huì)被疏通,所以h應(yīng)該為0m。據(jù)資料顯示,滲透系數(shù)為K=1.47,影響半徑為300m,最大涌水量的變化系數(shù)是1.5。將這些數(shù)據(jù)代入穩(wěn)定流理論公式可得Q(正常)=60m3/h,Q(最大)=93m3/h。
由上可得,正常情況下的涌水量為60m3/h,最大涌水量為93m3/h。當(dāng)超過正常涌水量時(shí)就會(huì)容易發(fā)生突水水害。
用貝葉斯分類算法進(jìn)行涌水量的預(yù)測(cè),首先要進(jìn)行突水的概率計(jì)算分析,也就是先驗(yàn)概率。表示后驗(yàn)概率,也就是在B已知的情況下A事件表示發(fā)生突水的概率,表示的是先驗(yàn)概率,就是A事件本身發(fā)生的概率。在這里以往發(fā)生突水的概率用A事件表示。涌水量超過正常值用B事件表示。

運(yùn)用貝葉斯分類算法預(yù)測(cè)將來會(huì)發(fā)生突水的概率,公式如下:


本文從大數(shù)據(jù)介紹,數(shù)據(jù)挖掘方式,貝葉斯算法簡(jiǎn)介,涌水量預(yù)測(cè)四個(gè)方式進(jìn)行介紹。通過貝葉斯算法的先驗(yàn)概率來驗(yàn)證后驗(yàn)概率的性質(zhì)對(duì)水文地質(zhì)的涌水量進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果為80%,從預(yù)測(cè)結(jié)果來看發(fā)生水害的概率很大應(yīng)提前做好預(yù)防措施。