楊國慶,張 宇
(1.上海電力學院 電力與自動化工程學院,上海 200090;2.上海市電力公司 技術與發(fā)展中心,上海 200122)
隨著信息技術的迅速發(fā)展,數(shù)據(jù)庫規(guī)模的擴大帶來了大量的數(shù)據(jù).但大量的數(shù)據(jù)往往使人們無法辨別隱藏在其中的能對決策提供支持的信息,而傳統(tǒng)的查詢和報表工具無法滿足挖掘這些信息的需求[1].
數(shù)據(jù)挖掘技術就是通過處理大量的數(shù)據(jù)并從中抽取有價值的潛在信息的一種新的數(shù)據(jù)分析技術.隨著電力系統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù)也呈爆炸性趨勢增長,在電力設備的在線監(jiān)測系統(tǒng)中引入數(shù)據(jù)挖掘技術勢在必行.
數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中挖掘出有用的信息,即從大量的、不完全的、有噪音的、模糊的、隨機的實際應用數(shù)據(jù)中發(fā)現(xiàn)隱含的、規(guī)律性的、人們事先未知的,但又是潛在有用的并且最終可理解的信息和知識的非平凡過程[2].近年來,數(shù)據(jù)挖掘技術的研究和應用發(fā)展迅猛,在商業(yè)和銀行領域已有廣泛的應用.隨著相關學科的發(fā)展出現(xiàn)了各種數(shù)據(jù)挖掘算法[3].
數(shù)據(jù)挖掘的一般過程包括以下5個方面:
(1)數(shù)據(jù)選擇 指與要解決的問題有關的數(shù)據(jù)的選取,當前,數(shù)據(jù)可以很方便地通過互聯(lián)網(wǎng)進行采集;
(2)數(shù)據(jù)預處理 即通過濾噪進行信息處理的過程;
(3)數(shù)據(jù)轉換 將定性的數(shù)據(jù)轉換成定量的數(shù)據(jù),在某種意義上也叫特征提取;
(4)數(shù)據(jù)挖掘 尋找數(shù)據(jù)庫中隱藏的重要模式,該步驟在知識發(fā)現(xiàn)的過程中起著關鍵的作用;
(5)數(shù)據(jù)解釋 用來評價和解釋通過數(shù)據(jù)挖掘獲得的結果,即知識.
從數(shù)據(jù)挖掘中發(fā)掘有關知識的規(guī)則需要具備以下4個條件:
(1)有效性 意味著規(guī)則或知識的重要性,得到的規(guī)則或知識應適用于未知的數(shù)據(jù);
(2)新穎性 即與先驗的知識沒有關系,在實踐中,重要的是要發(fā)現(xiàn)新規(guī)則;
(3)有用性 目的在于發(fā)現(xiàn)對用戶有用和感興趣的規(guī)則;
(4)簡單性 即發(fā)現(xiàn)的規(guī)則應力求簡單,應能夠創(chuàng)建和容易解釋復雜的數(shù)據(jù).
數(shù)據(jù)挖掘技術與其他的研究領域如統(tǒng)計分析、機器學習、數(shù)據(jù)庫,以及可視化技術等密切相關.數(shù)據(jù)挖掘的方法和數(shù)學工具包括關聯(lián)規(guī)則、統(tǒng)計學、決策樹、神經(jīng)網(wǎng)絡、線性規(guī)劃、模糊邏輯等.
目前,數(shù)據(jù)挖掘在我國電力部門的應用還不多,它在電力系統(tǒng)中的應用包括電力設備狀態(tài)評估、電力系統(tǒng)負荷預測和分類、電力系統(tǒng)的運行模式分類、電力系統(tǒng)運行狀態(tài)、設備監(jiān)控、電力設備故障診斷、電力調(diào)度優(yōu)化、電力系統(tǒng)建模等[4].
隨著電力設備監(jiān)測系統(tǒng)中數(shù)據(jù)規(guī)模的不斷擴大,電力新技術的發(fā)展,以及各種監(jiān)測設備的使用,將數(shù)據(jù)挖掘技術與狀態(tài)檢修相結合也是大勢所趨.目前,致力于這方面的研究和應用越來越多,并取得了一定的成果.
國外有關數(shù)據(jù)挖掘方法在電力系統(tǒng)中應用的論文統(tǒng)計結果如圖1和圖2所示[5].從圖1和圖2可以看出,在電力系統(tǒng)領域的數(shù)據(jù)挖掘方法中,決策樹是主流的方法,占88.6%;使用數(shù)據(jù)挖掘解決的具體問題主要有安全評估(48.8%)、故障診斷(11.6%)、電力系統(tǒng)控制(9.3%)、負荷預測(6.9%)、負荷擬合(6.9%)等.由于電力設備的狀態(tài)檢修就是以狀態(tài)在線監(jiān)測和故障診斷(占11.6%)為基礎的,因此數(shù)據(jù)挖掘技術在電力設備狀態(tài)檢修領域的應用也占據(jù)不小的比重,發(fā)展空間廣闊.此外,應用于故障診斷的主要方法有決策樹、人工神經(jīng)網(wǎng)絡、統(tǒng)計分析和粗糙集等.

圖1 國外各種數(shù)據(jù)挖掘方法應用于電力系統(tǒng)領域統(tǒng)計

圖2 數(shù)據(jù)挖掘解決的主要具體問題
國內(nèi)數(shù)據(jù)挖掘在狀態(tài)檢修中的應用并不普遍,僅在個別企業(yè)或部門少量使用;技術也不成熟,總體還處于初級階段.目前,數(shù)據(jù)挖掘技術在發(fā)電廠設備、變壓器、配電網(wǎng)設備及高壓輸電線路等的狀態(tài)檢修中已有研究和應用,如:采用模糊聚類和粗糙集理論分析汽輪機軸系振動的數(shù)據(jù),得出相關規(guī)則對機組進行故障診斷[6];將粗糙集技術應用于高壓輸電線路的故障診斷[7];將決策樹算法應用于變電站的電氣設備在線監(jiān)測系統(tǒng)[8]等.
電力系統(tǒng)中,數(shù)據(jù)挖掘的處理過程要求有較深厚的電力系統(tǒng)知識,而該方面專業(yè)人才較為缺乏;目前電力設備的監(jiān)測設備不夠完善,只能從不完備的狀態(tài)數(shù)據(jù)中挖掘規(guī)律;狀態(tài)數(shù)據(jù)收集分布于各單位,缺少公共數(shù)據(jù)平臺.這些都制約了狀態(tài)檢修的發(fā)展.
國家電網(wǎng)公司已經(jīng)提出統(tǒng)一輸變電設備狀態(tài)監(jiān)測系統(tǒng)的要求,以滿足堅強智能電網(wǎng)建設及生產(chǎn)精益化管理工作要求.目前福建電力公司、華東電網(wǎng)公司和華北電網(wǎng)公司都相繼建立了狀態(tài)監(jiān)測系統(tǒng),并與電力生產(chǎn)管理系統(tǒng)(PMS)實現(xiàn)數(shù)據(jù)共享,個別單位還開發(fā)了檢修輔助決策系統(tǒng).但在數(shù)據(jù)處理技術上普遍實力不足,這樣便造成海量數(shù)據(jù)的利用率不高,且缺乏專門的機構負責技術的研發(fā)和推廣.
以上海為例,目前上海市電力公司正在大力研究和推廣在線監(jiān)測,為狀態(tài)檢修打好基礎.公司正在建設一個輸變電設備狀態(tài)監(jiān)測中心,已經(jīng)構造了狀態(tài)監(jiān)測的系統(tǒng)框架,中心建設的技術方案也已編制完成.建設工作在不斷進行中.接下來的工作將涉及對在線監(jiān)測數(shù)據(jù)的研究分析、數(shù)據(jù)挖掘技術的應用研究.
圖3為狀態(tài)檢修管理流程,其中的數(shù)據(jù)管理和專家診斷兩個環(huán)節(jié)將涉及數(shù)據(jù)挖掘技術的應用研究.

圖3 狀態(tài)檢修管理流程示意
在專家診斷和狀態(tài)評估的過程中,將構建基于設備故障模式分析結果的診斷知識庫,采用人工診斷和基于人工神經(jīng)網(wǎng)絡、模糊邏輯等數(shù)據(jù)挖掘技術相結合的方法,以實現(xiàn)對設備缺陷和故障的診斷.
目前電網(wǎng)中的部分運行設備已有比較成熟的狀態(tài)監(jiān)測參數(shù)及監(jiān)測手段,能夠?qū)υO備的狀態(tài)進行明確量化闡述.對此國家電網(wǎng)公司也發(fā)布了相關標準,提出了幾大類電力設備的狀態(tài)評價導則和狀態(tài)檢修導則.若電力設備出現(xiàn)導則中明確的缺陷,其問題會迅速顯現(xiàn).但部分設備狀態(tài)監(jiān)測參數(shù)或監(jiān)測手段還未成熟,不能對設備狀態(tài)進行明確量化闡述,這就需要設備專家通過數(shù)據(jù)中心的數(shù)據(jù)挖掘功能,充分利用不能量化闡述的設備狀態(tài)參數(shù),對設備進行綜合診斷,以便發(fā)現(xiàn)設備的隱性問題.
圖4和圖5分別是設備的顯性問題和隱性問題的觸發(fā)處理流程.對比圖4和圖5可以看出,兩類問題的處理過程存在差別.設備隱形問題的相關處理步驟可以作為處理顯性問題不足時的補充,而對于隱形問題,目前設備專家可以利用數(shù)據(jù)挖掘技術對設備進行缺陷確認或故障診斷.

圖4 設備顯性問題觸發(fā)處理流程

圖5 設備隱性問題觸發(fā)處理流程
狀態(tài)檢修實質(zhì)上就是建立一套設備的運行狀態(tài)分析系統(tǒng)來判斷設備的健康狀況,以決定是否對其進行檢修.基于數(shù)據(jù)挖掘的電力設備狀態(tài)評估模型如圖6所示[9].

圖6 基于數(shù)據(jù)挖掘的電力設備狀態(tài)評估模型
對電力設備狀態(tài)進行評估,首先要收集設備的相關信息,包括設備的基礎信息、歷史運行數(shù)據(jù)及設備缺陷信息等.通過對設備歷史運行數(shù)據(jù)和缺陷信息進行挖掘,得出設備缺陷情況下的特征值和設備關聯(lián)參數(shù)值,方便用戶對設備的歷史情況進行查詢和使用;設備當前監(jiān)測值從實時數(shù)據(jù)庫或試驗中獲得,是被分析的對象;設備健康狀況分析就是以數(shù)據(jù)挖掘的結果為依據(jù),對設備當前監(jiān)測值進行對比分析,判斷當前設備運行狀態(tài)是否正常.
關聯(lián)規(guī)則是數(shù)據(jù)挖掘方法中的一個重要分支,通過分析數(shù)據(jù)庫中不同數(shù)據(jù)屬性之間存在的潛在關系,找出滿足給定支持度和置信度的關系規(guī)則,對設備進行在線故障診斷[10,11].表 1 是某電廠汽輪機振動報警記錄.

表1 參數(shù)報警歷史記錄
利用關聯(lián)規(guī)則挖掘算法,選擇最小支持度為20%,最小置信度為20%(關于關聯(lián)規(guī)則的算法描述及支持度、置信度的計算公式參見文獻[2]和文獻[10]).對表1進行分析后的故障現(xiàn)象記錄如表2所示.

表2 分析表1后的故障現(xiàn)象記錄
通過分析可獲得以下的強關聯(lián)規(guī)則:
A?C,支持度 =0.75,置信度 =0.75.
表明在A振動報警后不久就會出現(xiàn)C也振動報警.該規(guī)則可以向運行人員提供早期故障預警和故障原因分析,從而在故障發(fā)生前將其排除,以確保電力設備的安全運行.
近年來隨著狀態(tài)檢修的蓬勃發(fā)展,以及各大電網(wǎng)公司狀態(tài)監(jiān)測中心的建設,為數(shù)據(jù)挖掘技術的研究和應用提供了基礎平臺.同時電力設備監(jiān)測系統(tǒng)中數(shù)據(jù)規(guī)模的增大,也推動了數(shù)據(jù)挖掘技術在電力設備狀態(tài)檢修中的研究和應用.但數(shù)據(jù)挖掘在電力設備狀態(tài)檢修中的應用還處于初級階段,仍存在許多問題,如:面臨多維超大量數(shù)據(jù)集的挑戰(zhàn);如何正確處理冗余信息和噪音數(shù)據(jù)的問題;挖掘結果的無效性問題等.因此,電力設備狀態(tài)檢修中的數(shù)據(jù)挖掘技術還需作進一步的深入研究.
[1]陳超金.基于數(shù)據(jù)挖掘的電力設備狀態(tài)檢修技術研究綜述[J].廣東電力,2009,22(9):21-24.
[2]張云濤,龔玲.數(shù)據(jù)挖掘原理與技術[M].北京:電子工業(yè)出版社,2004:1-2.
[3]王光宏,蔣平.數(shù)據(jù)挖掘綜述[J].同濟大學學報,2004,32(2):246-252.
[4]何友全.數(shù)據(jù)挖掘方法及其在電力系統(tǒng)故障診斷中的應用研究[D].成都:西南交通大學,2004.
[5]HIROYUKI Mori.State-of-the-art overview on data mining in power systems[C]//Power Engineering Society General Meeting,2006:1-4.
[6]張勤.基于數(shù)據(jù)挖掘技術的汽輪機性能分析系統(tǒng)的研究與實現(xiàn)[D].北京:華北電力大學,2007.
[7]廖志偉,孫雅明.基于數(shù)據(jù)挖掘模型的高壓輸電線系統(tǒng)故障診斷[J].電力系統(tǒng)自動化,2001,25(15):15-19.
[8]周茜.數(shù)據(jù)挖掘技術在電氣設備在線監(jiān)測系統(tǒng)中的應用[J].科技情報開發(fā)與經(jīng)濟,2006,16(8):209-210.
[9]成永強.基于數(shù)據(jù)挖掘的設備狀態(tài)檢修[D].北京:華北電力大學,2005.
[10]梁志瑞,陳鵬.關聯(lián)規(guī)則挖掘在電廠設備故障監(jiān)測中的應用[J].電力自動化設備,2006,26(6):17-19.
[11]LI Jian-qiang,WANG Song-ling,NIU Cheng-lin,et al.Research and aplication of data mining technique in power plant[C]//International Symposium on Computational Intelligence and Design,2008:250-253.