雷 萌,李 翠,王 鑫,陳瑞成
(中國礦業大學 信息與電氣工程學院,江蘇 徐州 221116)
基于模糊聚類徑向基神經網絡的煤質分析模型
雷 萌,李 翠,王 鑫,陳瑞成
(中國礦業大學 信息與電氣工程學院,江蘇 徐州 221116)
為了實現煤炭指標的快速智能預測,建立了基于模糊聚類的徑向基函數(RBF)神經網絡預測模型,將已測定的收到基全水、收到基灰分、收到基揮發分和收到基全硫的含量作為分類指標進行模糊聚類,根據分類結果分別建立了基于徑向基函數神經網絡的定量分析模型,對干燥無灰基揮發分、空干基全硫、收到基低位發熱量和空干基高位發熱量進行了預測,并與直接使用徑向基神經網絡模型進行比較。結果表明,該分析模型不僅精度高,且泛化能力強,魯棒性好。
煤質分析;分類指標;模糊聚類;徑向基函數神經網絡;定量分析模型
煤炭作為一種重要的化石能源,其質量的優劣對煤炭資源的生產、加工和應用有著極大影響,從而使得煤質分析工作顯得尤為必要。 在實際生產加工過程中,通常采用工業分析和發熱量等指標來研究煤的性質和組成[1-2]。根據文獻[1],反映煤質的主要指標有全水、灰分、揮發分、全硫、高位發熱量及低位發熱量,其中高位發熱量可以采用氫彈量熱法測得,低位發熱量可以根據相關指標采用公式計算得到。對于上述指標,如果采用傳統的煤質化驗方法測得,則煤質分析的過程繁瑣,分析時間較長,需要消耗大量的人力和物力,且無法實時反饋煤炭的質量情況,具有一定局限性[3]。
由于煤炭的工業分析指標存在復雜的對應關系[4],因此可以根據部分指標推算得到剩余指標。例如:文獻[5]介紹了一種利用粒子群優化算法進行煤炭發熱量的預測;文獻[6]介紹了一種基于機器學習的煤質近紅外光譜分析的方法。文章利用模糊聚類的方法,將已測定的收到基全水、收到基灰分、收到基揮發分和收到基全硫的含量作為分類指標,對數據進行分類,并根據分類結果分別建立徑向基函數神經網絡預測模型,實現了干燥無灰基揮發分、空氣干燥基全硫、收到基低位發熱量和空氣干燥基高位發熱量的快速預測。
模糊聚類是按照一定的規則來對事物進行區分和分類的過程,在這個過程中沒有任何關于分類的先驗知識的指導,僅據事物屬性的相似性作為類別劃分的依據,它屬于無監督的范疇。模糊聚類就是用數學的方法研究和處理給定對象的分類[7]。
模糊聚類的數學模型是使用數學語言及表達式對模糊聚類進行描述[8-9]。設樣本集X={x1,x2,…,xn},它的每一個對象xk(k=1,2,…,n)有特征向量P(xk)=(xk1,xk2,…,xkn),其中xki是xk第i個特征上的值。聚類分析即為分析數據集X中的n個樣本所對應的特征向量間的相似性問題,按照樣本間的相似性關系,將樣本分成不相交的子集X1,X2,…,XC,該子集滿足條件:
X=X1∪X2∪……∪XC,
Xi∪Xj=Φ(1≤i≤j≤C)。
樣本點xk(k=1,2,…,n)對子集X1,X2,…,XC的隸屬關系可表示為:
(1)
模糊聚類的方法一般可分為以下幾種:譜系聚類方法、基于等價關系的聚類方法、基于圖論的聚類方法和基于目標函數的聚類方法[10]。本研究主要采用譜系聚類法對樣本進行分類。
徑向基函數(RBF)神經網絡是一種兩層神經網絡,其隱含層的激活函數是高斯函數,輸出層的激活函數是線性函數。由于高斯函數具有局部化接收輸入信息的特點,所以RBF神經網絡具有較強的局部映射能力,并且泛化能力較好,學習收斂速度很快,在非線性函數逼近、系統建模和模式識別等領域應用較為廣泛。
隱含層第j個節點的輸出為:

(2)
式中:u1,j為隱含層第j個節點的輸出;x為n維輸入向量;w1,j為隱含層第j個高斯函數的中心;σ2j是反映第j個高斯函數的寬度;N1是隱含層的節點數。
輸出層第i個節點的輸出為:
yi=wT2,iu1(i=1,2,…,N2),
(3)
式中:yi為輸出層第i個節點的輸出;w2,i為隱含層指向輸出層第i個節點的權值向量;u1為隱含層的輸出向量;N2是輸出層的節點數。
由隱含層和輸出層節點的輸出表達式可以看出,RBF神經網絡有三類可調參數,分別為高斯函數的中心w1,i和寬度σ2i以及隱含層和輸出層之間的連接權值w2,i。RBF神經網絡的學習就是以上三個參數的整定。1989年,Moody和Darken提出了一種由兩個階段組成的混合學習過程的思路[11]。兩個階段分別為:
(1)根據所有輸入樣本信息,利用聚類方法進行隱含層徑向基函數(高斯函數)中心和寬度的學習,屬于無導師學習方法,常采用K均值聚類算法[12]。
(2)根據給定的訓練樣本,利用有導師學習算法調整隱含層節點和輸出節點之間的連接權值,一般采用基于Delta學習規則的最小均方算法[13]。
利用譜系聚類的方法,將樣本中收到基全水分Mt(%)、收到基灰分Aar(%)、收到基揮發分Var(%)和收到基全硫St,ar(%)的含量作為分類指標,建立煤質成分數據分類模型,將樣本進行分類。
煤質成分數據分類模型建立步驟:①樣本數據集X={x1,x2,…,xn}中的n個樣本點各自成為一類,計算任意兩個樣本點間的距離;②計算各類中的距離的最小值,如果兩類中的距離值最小,則兩類歸為一類,并由此建立新的分類;③計算合并后的新類別之間的距離值,此距離的計算準則要和上步驟中計算距離的準則一樣;④重復計算距離并合并類,一直將各類樣本歸為一類為止;⑤設置分類數目,將給定的樣本集合劃分成不同的類別[14]。
根據模糊聚類得到的分類結果,分別建立每一組樣本的RBF神經網絡模型,輸入變量為收到基全水Mt(%)、收到基灰分Aar(%)、收到基揮發分Var(%)和收到基全硫St,ar(%);輸出變量為干燥無灰基揮發分Varf(%)、空干基全硫St,ad(%)、收到基低位發熱量Qnet,v,ar(kcal/kg)和干燥基高位發熱量Qgr,v,d(kcal/kg)。
RBF神經網絡模型建立步驟:①初始化高斯函數的中心和寬度以及隱含層和輸出層的連接權值;②選擇均方誤差作為適應度函數訓練網絡;③利用測試集樣本驗證RBF網絡的性能。
根據國家標準[15],利用水分快速測定儀、灰分爐、揮發份爐、量熱儀、天平和干燥箱等設備測量煤炭樣本的收到基全水、收到基灰分、收到基揮發分、收到基全硫、干燥無灰基揮發分、空氣干燥基全硫、低位發熱量和干燥基高位發熱量[1]。所有測定指標的精度均滿足相應國家標準的要求,為預測模型提供了高可靠性的學習數據。
隨機抽取160組數據進行分類,選取收到基全水、收到基灰分、收到基揮發分、收到基全硫作為分類指標,將數據分為兩類。模糊聚類分類模型的參數設置如下:樣本點距離采用歐氏距離d(xi,xj),類間距離采用類平均距離Dpq,分類數為2。d(xi,xj)和Dpq計算公式如下:

(4)
(5)
式中:xi、xj為兩個樣本點;p為樣本容量;d(xi,xj)為兩個樣本點之間的距離;Gp、Gq為兩類不同的樣本;np、nq分別為各類樣本的樣本點數量;Dpq為類平均距離。
經過仿真,得到前30個樣本點的譜系聚類圖,橫坐標表示每個樣本點,縱坐標表示樣本點之間的距離,如圖1所示。圖1描述了樣本按距離準則的聚集過程。

圖1 譜系聚類圖
模糊聚類的結果是:樣本被分為兩組,分別取名為樣本1和樣本2,樣本1容量為69,樣本2容量為91。每個樣本分別作為下一步驟中徑向基網絡預測模型的樣本集。
從樣本1中抽取60組樣本點作為訓練集,8組樣本點作為測試集。建立RBF網絡模型,RBF網絡模型參數通過迭代法得到,參數設置結果如表1所示。
按照表1中設置的參數,使用MATLAB軟件進行仿真。圖2為樣本1各指標徑向基網絡建立的訓練過程,其中:圖2(a)為干燥無灰基揮發分訓練過程,圖2 (b)為收到基低位發熱量訓練過程,圖2 (c)為空干基全硫訓練過程,圖2 (d)為空干基高位發熱量訓練過程。從圖2中可看出,各指標的訓練過程在30步以內均能完成,最終誤差小于0.000 4,即在設置的目標誤差之下。

表1 迭代法得到的RBF網絡模型參數

圖2 樣本1各指標訓練過程
按照表1中設置的參數,使用MATLAB軟件進行仿真。圖3為樣本1各指標徑向基網絡建立的訓練過程。從圖3中可看出,各指標的訓練過程在30步以內均能完成,最終誤差小于0.000 4,即在設置的目標誤差之下。選取的評價指標為相對誤差Eri,同時為了更好地觀察同一徑向基網絡的總體性誤差,定義一個標準誤差Emsr,其中Eri和Emsr計算公式如下:

(6)

(7)
式中:pi表示測試值;ti表示真實值;Eri表示相對誤差;Emsr為反映總體性的標準誤差;N表示每個樣本點的包含的指標數量。
通過進行了8次仿真實驗得到了各類誤差結果。表2為該樣本的干燥無灰基揮發分、空氣干燥基全硫、收到基低位發熱量和空干基高位發熱量的相對誤差Er1、Er2、Er3、Er4,以及根據這四項指標計算的反映總體性的標準誤差Emsr。從表2中可以看出,各指標的相對誤差均較小,總體誤差在0.005~0.025之間。

表2 樣本1四項指標相對誤差與總體的標準誤差
從樣本2中抽取60組樣本點作為訓練集,8組樣本點作為測試集,建立RBF網絡模型,參數設置與樣本1相同。圖3為樣本2各指標徑向基網絡建立的訓練過程,圖3 (a)為干燥無灰基揮發分訓練過程,圖3 (b)為收到基低位發熱量訓練過程,圖3 (c)為空氣干燥基全硫訓練過程,圖3 (d)為空氣干燥基高位發熱量訓練過程。從圖3可以看出,和樣本1相似,訓練網絡在30步以內也可以達到目標誤差。

圖3 樣本2各指標訓練過程
建立樣本2的訓練網絡,對測試樣本進行測試,可得到各指標相對誤差和標準誤差,如表3所示。從表3數據可看出,樣本2建立的RBF預測模型,預測誤差略大,但也在允許范圍內。
對抽取的160組樣本數據不做聚類處理,從中隨機抽取60組樣本點作為訓練集,8組樣本點作為測試集,建立RBF網絡預測模型,參數設置不變。在同一張圖上繪制不分類和分類后樣本1與樣本2的標準誤差,如圖4所示。

表3 樣本2四項指標相對誤差與總體的標準誤差

圖4 樣本1、2與不分類樣本的總體標準誤差
從圖4可以明顯看出,不進行模糊聚類,預測誤差遠大于分類后的預測誤差。因此得出如下結論:基于模糊聚類的RBF網絡預測模型比僅僅使用RBF網絡預測模型的預測更加準確,效果更好。
煤質分析在煤炭資源的生產、加工和利用中起著至關重要的作用,因此尋找一種預測精度更高的煤質指標分析預測模型尤為必要。實驗證明,基于模糊聚類的徑向基函數神經網絡預測模型對干燥無灰基揮發分、空氣干燥基全硫、收到基低位發熱量和空干基高位發熱量等煤質指標的預測較為準確,為實現煤質智能分析系統的設計提供了一種預測精度高的新模型。
[1] 張雙全, 吳國光. 煤化學[M].徐州:中國礦業大學出版社, 2004.
[2] 龔利華,劉廣新.用工業分析數據預測煤炭發熱量[C]. 工業技術委員會地質分會/中國煤炭學會礦井地質專業委員會2001年學術年會論文集.福建:煤炭工業技術委員會地質分會、中國煤炭學會礦井地質專業委員會,2001:118-120.
[3] 施玉英.煤炭分析試驗儀器設備的使用與維修[M].北京:煤炭工業出版社,2007.
[4] 江文豪,韋紅旗,屈天章,等.基于遺傳算法優化參數的支持向量機燃煤發熱量預測[J].熱力發電,2011(3):14-19.
[5] 王建軍,王世營,雷 萌.粒子群優化算法在煤炭發熱量中的應用[J].工礦自動化,2012(5):50-53.
[6] 雷 萌.基于機器學習的煤質近紅外光譜分析[D].徐州:中國礦業大學,2013.
[7] 高新波.模糊聚類分析及其應用[M].西安:電子科技大學出版社,2004.
[8] 李晶皎,朱志良,王愛俠.模式識別(第二版)[M].北京:電子工業出版社,2004.
[9] 葉海軍. 模糊聚類分析技術及其應用研究[D]. 合肥:合肥工業大學,2006.
[10] 汪慶淼. 基于目標函數的模糊聚類新算法及其應用研究[D].鎮江:江蘇大學, 2014.
[11] 鞏敦衛,孫曉燕.智能控制技術簡明教程[M].北京:國防工業出版社,2010.
[12] 張 彬.基于聚類算法的RBF神經網絡設計綜述[J].綜述與評論,2012,31(12):1-7.
[13] 張 艷.基于RBF網絡辨識的模型參考自適應控制系統分析與仿真[D].西安:西安交通大學,2007.
[14] 葉海軍.模糊聚類分析技術及應用研究[D].合肥:合肥工業大學,2006.
[15] GB/T 213—2008煤的發熱量測定方法[S].
Coal assay analytical model based on fuzzy clustering RBF Neural Network
LEI Meng, LI Cui, WANG Xin, CHEN Rui-cheng
(School of Information and Electrical Engineering, China University of Mining and Technology, Xuzhou, Jiangsu 221116, China)
To achieve rapid and intelligent prediction of coal quality, a radial basis function (RBF) neural network prediction model based on fuzzy clustering was established. Based on measured contents of total moisture of as
basis, ash of as received basis, volatile matter of as received basis and total sulfur of as received basis in coal, fuzzy clustering was made; according to the results, several quantitative analytical models RBF based on neural network were established. The model can predict volatile matter of dry ash-free basis, total sulfur of air dried basis, low calorific value of as received basis and gross calorific value of dry basis in coal. And the comparison between the model and the direct use of RBF neural network model was made. The experimental results showed that the analytical model has high precision, strong generalization ability and good robustness.
coal assay; classification index;fuzzy cluster; RBF neural network; quantitative analytical modeling
TQ533
A
1001-3571(2015)04-0010-05
2015-04-09
10.16447/j.cnki.cpt.2015.04.003
江蘇省自然科學基金(BK20140215);中國博士后基金(2014M551695)
雷 萌(1987—),女,安徽省碭山市人,講師,博士,從事機器學習、煤質智能在線分析等方面研究。
E-mail:leimengniee@163.com Tel:15895208707