李養勝
(陜西工業職業技術學院 信息工程學院,陜西 咸陽 712000)
基于數據挖掘技術的煤礦電網綜合管理系統的設計與實現
李養勝
(陜西工業職業技術學院 信息工程學院,陜西 咸陽 712000)
摘要:在傳統的煤礦電網中,由于井下信息不能被及時獲取,也就無法對存在的隱患甚至是發生的故障立即發出預警。針對這一問題,基于數據挖掘技術,設計研究了一種綜合管理系統,該系統綜合應用了嵌入式技術、實時數據庫技術以及工控組態軟件,能使煤礦電網高效運行。在對多方面的數據進行分析和建模時,結合了數據倉庫技術,采用多種挖掘模式,達到了預測報警的目的。基于數據挖掘技術的煤礦電網綜合管理系統不僅解決了供電監控技術問題,還解除了煤礦安全運行中的重大隱患,使礦井的安全生產能力和抗災能力都得到有效增強。
關鍵詞:數據挖掘;煤礦電網;故障預警;實時監視
隨著經濟社會的不斷發展,煤礦開采量也在不斷增加,但煤礦開采的安全形勢不容樂觀。導致事故發生的因素很多,其中最主要的原因來自于供電網絡監測系統,現有的系統在進行不間斷監測井下情況時,信息孤島的存在導致電網的運行狀態不能被管理人員全面的掌握[1]。針對上述問題,本文基于數據挖掘技術,對煤礦電網的綜合管理系統進行設計研究,綜合了以太網、現場總線技術以及井下局域網等進行不同形式數據的大量積累[2],包括歷史數據、實時數據以及歷史故障記錄,進行綜合預測平臺的構造。應用綜合管理系統可以使煤礦電網的運行效率得到有效提高,危險系數得到降低,在預防隱患和事故發生的杜絕方面頗有成效,在煤礦安全生產方面具有現實意義。
在數據挖掘技術中,任務分為描述和預測2類,本文從這2類任務出發引入了挖掘算法,對煤礦電網綜合管理系統進行設計并完成了對模塊的實現。在系統的設計中,針對數據類型的不同,使用算法進行數據的轉換與集成,使用特定的挖掘模式,采用可視化技術對數據進行圖形展示,最終達到了預測與預防電網故障的目的[3-4]。
1數據挖掘
1.1研究背景和意義
隨著數據庫技術在許多領域的迅速發展,大型數據庫得到廣泛的建立。目前,對數據庫的使用還僅限于一些基本的操作,例如對數據進行查詢。在數據庫中,許多有價值的信息是隱藏起來的。對數據庫的使用不能僅限于粗加工數據,應通過對數據的處理,把隱藏的那部分信息歸納出來,把這些知識進行有效地利用。在進一步加工數據和分析內容的需求背景下,應運而生出了數據挖掘等技術。
數據挖掘比數據分析更深層次,從大量數據中進行數據挖掘可以發現數據的一定規律,更深層次的分析可以把信息資源的使用價值進一步提高,使信息資源得到充分利用,使使用效益得到有效提高。數據挖掘的使用給決策分析提供了一條新的途徑,使決策的準確性和可靠性都得到了有效提高,為科學決策提供了基礎[5]。
1.2數據挖掘的定義
數據挖掘又可以認為是從數據庫中發現知識,是一個對大量數據進行分析的復雜過程,通過這一過程可以把未知的、有價值的模式等知識抽取挖掘出來。數據挖掘設計的學科領域很多,是一個交叉學科領域,使用的方法也很多,包括數據庫技術、神經網絡和可視化等。
數據挖掘演化過程示意圖如圖1所示。首先,把數據庫中的數據進行清洗,并集成進入到數據倉庫中,數據清洗不僅可以清除噪聲,還可以把與主題無關的數據都清除出去,數據的集成是把多數據源的相關數據組合到一起;其次,進入數據倉庫中的數據還要進行選擇和轉換進入到特定的數據集中,在這部分主要是轉換數據的存儲形式,以便于數據挖掘的進行;再次,應對特定數據集中的數據進行數據挖掘,這只是總的數據挖掘的一個步驟,主要是進行數據模式或規律的挖掘;最后,進行模式評估和知識表示,利用評估標準和可視化表達技術,篩選出有意義的知識模式并向用戶進行展示。

圖1 數據挖掘演化過程示意圖
2煤礦電網綜合管理系統的設計
2.1總體要求
煤礦電網綜合管理系統要使系統服務器與變電站重點計算機進行互聯,使操作和信息網絡化,實現多種信息的共享和交互;遠程計算機的互聯通過建設專用通信網絡來實現;變電站終端計算機要具備存儲管理各類信息,自動生成五防及操作票,以及顯示實時數據的功能;數據備份與更新功能要完善;要具備系統時間同步功能;系統要具備良好的擴展性;在權限的劃分方面要合理,并能實現數字化的筆跡簽名。
2.2設計原則
在煤礦電網綜合管理系統中,依據了計算機集成制造系統的相關思想,系統的設計遵循如下原則:系統采用的軟、硬件產品技術要成熟,以確保系統的可靠性;使用的技術產品應是專業廠家生產、有國際先進技術的產品,以確保技術的先進性;在設計中要確保系統的實用性;在模塊化結構的實現時要充分考慮可擴展性及開放性,以便于對模塊進行擴容與擴展。
2.3軟、硬件配置
利用調制解調器,借助PSTN通信網絡及終端服務器,可以實現各變電站和電務廠之間的聯系。系統硬件配置結構圖如圖2所示。軟、硬件主要包括數據庫、服務器、網關以及光纖收發器和數據采集等控制系統的硬件設施。

圖2 系統硬件配置結構圖
2.4結構設計
基于煤礦電網實際管理中的特點,運用數據倉庫技術,采用SQL Server 2000數據庫環境進行預警報警系統模塊的設計。系統結構示意圖如圖3所示,對數據倉庫的維護通過數據管理模塊來實現;通過數據管理模塊進行數據庫和其他格式數據源的操作,進行數據倉庫的架構,對數據的描述和預測則通過數據挖掘模塊進行;報表管理模塊則主要實現定制與打印報表的功能。

圖3 系統結構示意圖
3模塊的實現
在系統模塊的實現中,數據挖掘主要由4部分組成。其中,數據的預處理是數據挖掘的前期操作;數據可視化可以形象地把相關數據進行圖表的展示,并對記錄抽樣和字段抽樣進行簡單地集成,只把用戶關心的數據顯示出來;挖掘引擎中,針對數據挖掘知識,用戶可以選擇特定的挖掘模式完成對規則知識的導出;回歸建模預測模塊主要是實現電網運行中的回歸建模與預測,并對模型庫進行維護[6]。
數據挖掘具有如下特點。
1)數據規范化。在模塊的實現中,一般都要對數據進行規范化處理,以適應挖掘算法。
2)數據離散化。在該模塊主要是對屬性進行概念分層,給定連續屬性值的個數要減少,盡量使用高層次的概念。在進行離散的數值屬性的選擇時,要根據實際情況劃分離散區間。
3)在數據缺損處理中,要填充字段,填充方式有平均值、最大值、最小值以及指定值填充。
4)分類方法是在數據挖掘中的數據歸納方法,用于預測離散無序類別值,在本文中,分類模式基于決策樹而實現。
目前,常用的決策樹算法為C4.5算法,其構建步驟如下:先給定1組訓練樣本,設S是樣本數據集,其具有m種不同的類標號屬性Ci;然后預處理數據源形成決策樹的訓練集;最后把樣本分類。其信息熵值可以用下式表式:

(1)
式中,pi是樣本屬于屬性類Ci的概率。對屬性A進行假設,假設其有很多個不同的值{a1,a2,…,an},樣本集就可以根據屬性劃分為不同的子集,其熵可以用下式表示:
(2)
式中,sj是屬性類Ci的樣本數;s是S的樣本數。那么,就可以得出屬性A的信息熵E(A)、信息增益Gain(A)以及信息增益率Gain_Ratio(A),其表達式見式3。通過信息增益率的計算,就可以進行決策樹的構造。
(3)
決策樹構造完成后,用分類規則的形式對得到的分類模型進行描述輸出,然后利用模型進行位置數據實例歸屬類別的預測。估計模型分類準確率常用的方法是保持方法,樣本集根據訓練比例可分為訓練和測試樣本集,前者用于決策樹的建立,后者用于分類規則準確率的計算。
5)聚類是把1個數據集按照一定的規則劃分為若干類或若干組的過程,不同類或不同組的數據之間的相似度較低,在同一類或同一組內數據之間的相似度通常較高。聚類分析與分類不同的是在對數據進行歸類時,數據是無類別歸屬的。
6)關聯規則挖掘實際上就是采用算法從給定的數據集中對數據項進行搜索,找出數據項之間有價值或隱藏的聯系。根據數據規則的特點,在進行規則挖掘時本文采用了Apriori算法,其使用的迭代方法是逐層搜索方法,該搜索方法利用了Apriori性質,即要求在頻繁項集中,其所有的非空子集都必須是頻繁項集。在獲取關聯規則時有2個階段,首先是Apriori算法的使用,通過該算法滿足最小支持度要求進行頻繁項集的產生;然后進入第2階段,滿足最小置信度的要求,即根據第1階段的頻繁項集進行強關聯規則的制定。實際上,第1階段結束之后,使用集合求冪方法可以獲取全部的關聯規則,本文只選取強關聯規則。在算法實現中,第1階段的最小支持度設置為5%,第2階段的最小置信度設置為60%。
7)回歸的建模與預測。這部分內容的實現通常依靠利用統計回歸方法所建立的模型。在建模時所采用的回歸模型為基于最小二乘法的線性回歸方法,并進行相應變量和預測變量的選擇,進行回歸系數的計算,得到回歸模型之后還要進行檢驗和模型的保存,最終預測相應變量。
4系統功能
1)實時測量與監視功能。系統提供了比較友好的界面,在界面上各個變電所中開關的情況可以同時得到實時顯示,而且顯示結果是按照順序進行排列的。實時顯示的數據主要為電壓、電流、電阻和功率等電量數據;另外,還能對線路以及開關分合閘狀態、開關機構異常等情況進行監視[7]。
2)預警報警功能。其中,預警主要指開關變位以及保護動作的預警;報警主要出現在電壓電流越限設置中,這樣一旦出現開關跳閘現象,就可以對故障所在范圍進行迅速的判斷,并實現了聲音、圖像以及文字窗口的提示,而且在提示故障的發生時,系統還能進行事故的回推畫面顯示。
3)一鍵復電功能以及無人值守功能。在停電時,能判斷出故障的性質并使用技術人員設定好的一鍵復電功能。當無人值守時,用戶可以根據權限對保護設置實現遠程控制,實現變電所的無人值守功能。在局域網中的計算機,經過管理員的授權都可實現對各類數據的web瀏覽功能,另外由于后臺數據庫采用的是實時讀取訪問技術,所以可以實現對數據以及數據庫的安全管理。
5結語
計算機及網絡技術的飛速發展使其在煤礦電網中的應用更為廣泛,使遠程監控系統的開發變為可能。在進行綜合管理系統開發之前,監控數據只能在局、礦調度室顯示;在對煤礦電網進行綜合管理之后,監控數據可以在本地服務器上進行保存,并能夠在本企業內部信息網上進行數據的傳輸。數據挖掘技術的引入,使煤礦電網監控運行數據分析的效率和深度都得到有效提高,不僅能解決井下監控技術的難點問題,還可以解除煤礦安全運行中的重大隱患,在現實生產中有一定的應用推廣前景。
參考文獻
[1] 蔡林沁,謝閱,李鳳得,等.基于Web混合模式的煤礦安全管理信息系統[J].工業控制計算機, 2002,15(8):7-8.
[2] 夏巍,丁剛,嚴輝.基于CAN 總線的智能煤礦安全監控系統的設計[J].工礦自動化, 2006(6): 37-38.
[3] 劉希軍,席波.煤礦井下電網綜合自動化監測系統的應用[J].煤炭科學技術, 2008(5): 80-92.
[4] 陳躍,李德臣,袁小平,等.煤礦計算機監視監控系統中多媒體技術的應用[J].能源技術與管理, 2004(4):68-70.
[5] 張齊,周博慧.組態軟件實時數據庫的設計與實現[J].微計算機信息,2007(6): 161-163.
[6] 錢笑宇,張彥武.工業實時數據庫的研究和設計[J].計算機工程,2005,30(1): 98-99.
[7] 陳京民.數據倉庫與數據挖掘技術[M ].北京:電子工業出版社, 2002.
責任編輯鄭練
Design and Implementation of Management System of Coal Mine Power Grid based on Data Mining
LI Yangsheng
(Shaanxi Polytechnic Institute Information Engineering Institute, Xianyang 712000, China)
Abstract:In the traditional coal mine power grid, due to the underground information can’t be timely got, so it is not able to immediately issue a warning for the existence of hidden failure. To solve this problem, based on the data mining technology, and put forward the design of a kind of comprehensive management system, it includes the application of embedded technology, real-time database technology and industrial control configuration software. They can make the efficient operation of the power grid of coal mine. With the data analysis and modeling combined with the data warehouse technology, use a variety of data mining model, and finally reach the purpose of predicting alarm. Based on data mining technology, the coal mine power network integrated management system not only solves the monitoring technology problem, but also may relieves the great hidden danger to the safe operation of coal mine. Mine safety production and resilience capacity can be effectively enhanced.
Key words:data mining, coal mine power network, coal mine power network, real-time monitoring
收稿日期:2015-01-21
作者簡介:李養勝(1974-),男,講師,碩士,主要從事計算機應用和圖像處理等方面的研究。
中圖分類號:TD 611
文獻標志碼:A