鄒子豪,鄧 輝
(國網(wǎng)湖北省電力有限公司武漢供電公司,湖北 武漢 430014)
目前來看,智能變電站的占有率呈逐年上升的趨勢,三層兩網(wǎng)這一結(jié)構亦更加的完善。但這也給運檢人員帶來了新的關注點,三層兩網(wǎng)結(jié)構的關鍵點還不明確,目前需要花費較多時間進行經(jīng)驗總結(jié),影響了工作效率。關鍵點則指的是其中功能較為重要,需要重點關注的設備,一旦發(fā)生故障將會對整個三層兩網(wǎng)結(jié)構造成較大影響。
因此運檢人員對三層兩網(wǎng)的關鍵點進行分析,通過查閱實際工作中記錄的數(shù)據(jù),可以發(fā)現(xiàn)關鍵點中存在著一定的相關性。那么引入數(shù)據(jù)挖掘算法[1-8],對關鍵點進行關聯(lián)性分析[9-15]便成為了可能。
文中利用經(jīng)典關聯(lián)分析算法Apriori 算法[16-24],對智能變電站三層兩網(wǎng)結(jié)構中的關鍵點進行關聯(lián)規(guī)則挖掘[25-30]。借助該算法可協(xié)助運檢人員更快找出三層兩網(wǎng)結(jié)構中的關鍵點,在某些方面提高變電站運行穩(wěn)定性。
對于智能變電站來說,三層兩網(wǎng)結(jié)構是由站控層、間隔層、過程層、站控層網(wǎng)絡、過程層網(wǎng)絡五個部分共同組成。站控層包括監(jiān)控主機、數(shù)據(jù)通信網(wǎng)關、數(shù)據(jù)服務器、綜合應用服務器、PMU 數(shù)據(jù)集中器和計劃管理終端等;間隔層包括繼電保護裝置、測控裝置、故障錄波裝置、網(wǎng)絡記錄分析儀、穩(wěn)控裝置等;過程層包括合并單元、智能終端、智能組件等;站控層網(wǎng)絡包括站控層中心交換機和間隔交換機;過程層網(wǎng)絡包括GOOSE網(wǎng)絡和SV網(wǎng)絡。
面對三層兩網(wǎng)結(jié)構中數(shù)量如此龐雜的設備,尋找并發(fā)現(xiàn)其中存在的關鍵點,能夠為變電站穩(wěn)定運行提供有力的支持。然而僅憑運檢人員的經(jīng)驗總結(jié),無法量化分析關鍵點。因此借助數(shù)據(jù)挖掘算法中的關聯(lián)分析算法Apriori,可以對運行過程中出現(xiàn)的大量數(shù)據(jù)進行高效準確分析,并尋找出其中的關聯(lián)規(guī)則,便于三層兩網(wǎng)結(jié)構關鍵點的確定,并且指導運檢人員更精確地對三層兩網(wǎng)結(jié)構關鍵點出現(xiàn)的設備故障進行處理。
面對智能變電站三層兩網(wǎng)結(jié)構中涉及到的大量設備,可采用關聯(lián)分析算法進行數(shù)據(jù)挖掘并尋找出其中的關鍵點。為了直觀分析其中的關聯(lián)規(guī)則,建立了相應的算法模型以便理解。建模的流程圖如圖1所示。

圖1 三層兩網(wǎng)關鍵點關聯(lián)規(guī)則建模流程圖Fig.1 Three-layer two-network key point association rule modeling flowchart
數(shù)據(jù)挖掘開始之前,應當進行數(shù)據(jù)預處理。隨后將智能變電站三層兩網(wǎng)結(jié)構中涉及到的設備,按照結(jié)構分為五大部分,分別是:站控層、間隔層、過程層、站控層網(wǎng)絡以及過程層網(wǎng)絡。隨后分別對各個部分進行關聯(lián)分析,采用Apriori 算法,引入支持度、置信度以及提升度,從3 個維度來驗證所得出關聯(lián)規(guī)則的可靠性與準確性,從而得出每個部分的關鍵點所在。最后利用得出的關聯(lián)規(guī)則,即可形成關鍵點分析數(shù)據(jù)庫,為智能變電站三層兩網(wǎng)結(jié)構關鍵點的確定提供支持。
文中采用的Apriori 算法是一種古典關聯(lián)分析算法,其原理是:如果某個項集是頻繁的,那么它的所有子集也是頻繁的。同時研究人員指出Apriori 算法可以幫助減少計算量,它能夠按照專家經(jīng)驗設置的支持度、置信度、提升度,對數(shù)據(jù)集進行反復迭代的同時剔出不符合條件的數(shù)據(jù),從大規(guī)模數(shù)據(jù)集中尋找事物間的隱含關系,即頻繁項集。基于這種特性,借助該算法可以從變電站二次系統(tǒng)海量數(shù)據(jù)中發(fā)現(xiàn)其中的關鍵點之間存在的關聯(lián)規(guī)則,從而實現(xiàn)三層兩網(wǎng)結(jié)構關鍵點的確定。
在關聯(lián)規(guī)則分析中,通常需要引入限定條件,來使得分析結(jié)果更加準確。文中采用的是支持度、置信度以及提升度3個限定條件來對分析結(jié)果進行處理。接下來,以項目集N為例,處理事物X與事物Y之間的關聯(lián)規(guī)則。
1)支持度(support):在所有的數(shù)據(jù)中,{X,Y}出現(xiàn)的可能性,即項目集中{X,Y}同時出現(xiàn)的概率,如式(1)所示。

式(1)中,N表示項目集的總數(shù),是判斷關聯(lián)規(guī)則可靠性的約束條件,能計算出關聯(lián)規(guī)則的出現(xiàn)頻率。通過設定最小支持度的閾值(minsup),消去出現(xiàn)頻次較低的非頻繁項集,使頻繁出現(xiàn)的關聯(lián)規(guī)則得以保留,篩選出滿足式(2)的項集Z,即為頻繁項集。

2)置信度(confidence):在關聯(lián)規(guī)則中的事物X已經(jīng)出現(xiàn)的情況下,另一關聯(lián)規(guī)則事物Y出現(xiàn)的概率,即含有X項集情況下,同時含有Y項集的概率,如式(3)所示。

3)提升度(lift):指事物X和事物Y一同出現(xiàn)的頻率,提升度大于1且越高表明正相關性越高,提升度小于1且越低表明負相關性越高,提升度等于1表明沒有相關性,如式(4)所示。

經(jīng)過支持度、置信度以及提升度的篩選,即可消除非頻繁項集,得出有效的關聯(lián)規(guī)則。
為尋找三層兩網(wǎng)結(jié)構的關鍵點,從供電公司搜集了近3年某市110 kV以及22 kV智能變電站三層兩網(wǎng)設備發(fā)生的全部異常運行情況,對三層兩網(wǎng)設備與發(fā)生在其中的故障進行關聯(lián)規(guī)則分析。
經(jīng)數(shù)據(jù)預處理后,篩選出共計1 028條數(shù)據(jù)用于數(shù)據(jù)挖掘,分析了三層兩網(wǎng)設備與設備故障之間的關聯(lián)規(guī)則;結(jié)合專家經(jīng)驗,設置最小支持度為0.3,最小置信度為0.7,采用Apriori 算法對數(shù)據(jù)集進行挖掘,尋找其中存在的關聯(lián)規(guī)則,并在得出關聯(lián)規(guī)則結(jié)果后,計算其提升度,刪去提升度小于1的項集。
為驗證關聯(lián)規(guī)則分析的準確性,文中將前兩年共計630 條數(shù)據(jù)作為訓練樣本集,建立設備缺陷關聯(lián)性分析數(shù)據(jù)庫;再將第三年共計398條數(shù)據(jù)作為測試集,對挖掘到的關聯(lián)規(guī)則進行匹配與驗證。
首先對訓練樣本集的630 條數(shù)據(jù)進行數(shù)據(jù)挖掘,將置信度與支持度作為約束條件得到三層兩網(wǎng)設備與發(fā)生在其中的故障之間關聯(lián)規(guī)則,如表1所示。

表1 訓練樣本集中發(fā)現(xiàn)的關聯(lián)規(guī)則Table 1 Association rules found in the training sample set
然后對訓練樣本集進行數(shù)據(jù)學習,挖掘三層兩網(wǎng)設備與發(fā)生在其中的故障之間存在的關聯(lián)規(guī)則并存入關鍵點分析數(shù)據(jù)庫。
分析數(shù)據(jù)挖掘出的關聯(lián)規(guī)則,從表1中的序號2可以得出,運檢人員在日常工作時,對間隔層的繼電保護裝置光纖應著重注意,如若出現(xiàn)故障會影響保護裝置正常運行,可以視為三層兩網(wǎng)結(jié)構的一個關鍵點。而通過表1中的序號4能夠發(fā)現(xiàn),站控層中心交換機是站控層網(wǎng)絡中至關重要的一環(huán),若出現(xiàn)故障將影響全站的通訊功能,有可能使得變電站陷入半癱瘓狀態(tài)。通過Apriori 算法挖掘到的關聯(lián)規(guī)則建立數(shù)據(jù)庫,能夠發(fā)現(xiàn)智能變電站三層兩網(wǎng)結(jié)構中存在的關鍵點。表1篩選出的8 條數(shù)據(jù),其提升度均大于1,可以認為它們之間存在著強關聯(lián)規(guī)則,即可認為以上8 條關聯(lián)規(guī)則即為智能變電站三層兩網(wǎng)結(jié)構中存在的關鍵點。
之后將第3年的398條數(shù)據(jù)作為測試集,對訓練樣本集中發(fā)現(xiàn)的關聯(lián)規(guī)則進行驗證:將訓練樣本集通過數(shù)據(jù)挖掘得出的三層兩網(wǎng)關鍵點(如表1所示)與測試集中通過實際統(tǒng)計得到的三層兩網(wǎng)關鍵點結(jié)果進行對比,根據(jù)結(jié)果得出文中所采用方法的準確性,如圖2所示。

圖2 三層兩網(wǎng)關鍵點分析驗證流程圖Fig.2 Three-layer two-network key point analysis and verification flow chart
最后,將驗證的結(jié)果進行統(tǒng)計,如表2 所示,以便直觀得出文中方法對智能變電站三層兩網(wǎng)結(jié)構關鍵點分析的準確性。為排除季節(jié)對三層兩網(wǎng)設備的影響,將時間劃分為四季,分時間段驗證準確性。從結(jié)果可看出,文中提出的方法對于三層兩網(wǎng)關鍵點的查準率可達85%以上。

表2 文中算法的關鍵點查準率Table 2 The key point precision rate of the algorithm in the article
文中將智能變電站三層兩網(wǎng)的結(jié)構按照結(jié)構類型分為5 種進行分析,采用Apriori 算法篩選出三層兩網(wǎng)設備與發(fā)生在其中的故障之間的關聯(lián)規(guī)則,得出該算法的準確性。
結(jié)果表明:利用文中算法,可較為高效發(fā)現(xiàn)智能變電站中三層兩網(wǎng)設備與發(fā)生在其中的故障之間的關聯(lián)規(guī)則,能夠發(fā)現(xiàn)其中的關鍵點,為運檢人員的日常維護檢修工作提供支持。
由于智能變電站三層兩網(wǎng)結(jié)構較為復雜且重要,而運檢人員的經(jīng)驗尚不夠豐富,無法高效發(fā)現(xiàn)三層兩網(wǎng)結(jié)構中的關鍵點。而借助文中的關聯(lián)分析算法則能夠?qū)Υ罅康臍v史數(shù)據(jù)進行有效的處理,并得出其中存在的關鍵點,協(xié)助運檢人員在日常工作中對三層兩網(wǎng)結(jié)構的關鍵點進行重點維護,為變電站穩(wěn)定運行提供支持。