肖 飛,冷喜武,徐元直,何 忠
(1.上海市電力公司,上海 200122;2.國調(diào)中心,北京 100031;3.泰豪軟件股份有限公司,南昌 330096)
電力系統(tǒng)集中監(jiān)控設(shè)備的可靠性是保證電網(wǎng)安全運行、提升供電可靠性的基礎(chǔ)。在實際運行中,有些電力系統(tǒng)集中監(jiān)控設(shè)備雖然能繼續(xù)使用,但運行狀態(tài)可能存在異常或隱患,將影響工作人員人身安全、電網(wǎng)的可靠運行、設(shè)備壽命以及電能質(zhì)量等,這種異常或隱患便稱之為缺陷[1]。對電力系統(tǒng)集中監(jiān)控設(shè)備可能發(fā)生的缺陷提前加以控制或消除,能夠有效保障電網(wǎng)安全、可靠運行。
當前,電力系統(tǒng)集中監(jiān)控設(shè)備的缺陷分析、預(yù)測的技術(shù)主要可以分為三大類[2]:基于物理模型(model-driven)的缺陷預(yù)測技術(shù)[3-4]、基于數(shù)據(jù)驅(qū)動(data-driven)的缺陷預(yù)測技術(shù)[5]、基于經(jīng)驗預(yù)測(experience based)的缺陷預(yù)測技術(shù)[6]。傳統(tǒng)基于數(shù)據(jù)驅(qū)動的缺陷預(yù)測方法一般基于神經(jīng)網(wǎng)絡(luò)、回歸分析、時間序列、馬爾可夫[7]等機器學習方法或這些方法的改進、組合(回歸神經(jīng)網(wǎng)絡(luò)[8]、模糊神經(jīng)網(wǎng)絡(luò)[9]、小波神經(jīng)網(wǎng)絡(luò)[10]),去嘗試對某一個指標進行分析、預(yù)測,然后根據(jù)該指標的預(yù)測值去推斷設(shè)備缺陷發(fā)生的可能性,但該方法具有以下缺點:在電力系統(tǒng)集中監(jiān)控設(shè)備缺陷發(fā)生時,往往伴隨著不同類型監(jiān)控數(shù)據(jù)值的異常變化,但是每一個監(jiān)控值的異常變化又極其不明顯。因此,僅僅對某一類監(jiān)控數(shù)據(jù)進行分析根本無法準確預(yù)測電力系統(tǒng)集中監(jiān)控設(shè)備存在的缺陷,只有對多類監(jiān)控數(shù)據(jù)進行綜合分析才能準確預(yù)測出可能存在的缺陷。
為了解決傳統(tǒng)的基于數(shù)據(jù)驅(qū)動的缺陷預(yù)測方法存在的問題,現(xiàn)提出一種基于數(shù)據(jù)挖掘的集中監(jiān)控設(shè)備典型缺陷預(yù)測方法。該方法主要通過引入大數(shù)據(jù)相關(guān)技術(shù)及支撐平臺來克服傳統(tǒng)缺陷預(yù)測方法的不足。根據(jù)薛禹勝等[11]中對大數(shù)據(jù)進行的分析、總結(jié),所提方法在以下方面體現(xiàn)了大數(shù)據(jù)的特點:①該系統(tǒng)構(gòu)建在大數(shù)據(jù)領(lǐng)域主流技術(shù)之上,基于Hbase存儲平臺,實現(xiàn)海量數(shù)據(jù)的高效存取,并采用Spark Streaming及MapReduce等計算引擎實現(xiàn)海量信息的分析及處理;②在進行電網(wǎng)設(shè)備缺陷預(yù)測時,本文所提方法利用概率轉(zhuǎn)移矩陣確定每一類監(jiān)控數(shù)據(jù)的權(quán)重,以此為基礎(chǔ)實現(xiàn)基于多監(jiān)控數(shù)據(jù)的設(shè)備缺陷預(yù)測。
在數(shù)據(jù)挖掘過程中,可以使用許多不同的模型,如分類模型、回歸模型、時間序列模型、聚類模型和關(guān)聯(lián)規(guī)則模型等。針對同一模型,可以使用不同的算法進行數(shù)據(jù)挖掘。算法的目的就是找到適合于當前場景的模型。在所提的集中監(jiān)控設(shè)備典型缺陷預(yù)測方法中采用了多種算法結(jié)合的方式,體現(xiàn)了大數(shù)據(jù)的特點,以克服傳統(tǒng)預(yù)測技術(shù)的主要缺陷,實現(xiàn)了對異構(gòu)數(shù)據(jù)的綜合分析、處理,達到了提高預(yù)測準確度的目標。算法主要分為三個關(guān)鍵環(huán)節(jié):關(guān)鍵監(jiān)控數(shù)據(jù)搜索與權(quán)重分析、監(jiān)控數(shù)據(jù)變化趨勢分析及設(shè)備缺陷預(yù)測分析。
(1)關(guān)鍵監(jiān)控數(shù)據(jù)搜索與權(quán)重分析
對典型缺陷的歷史監(jiān)控數(shù)據(jù)進行分析,找出缺陷發(fā)生前及發(fā)生時數(shù)據(jù)特征跟設(shè)備狀態(tài)正常時相比發(fā)生異常的監(jiān)控數(shù)據(jù),并根據(jù)異常發(fā)生的時間計算缺陷開始的實際周期。將異常監(jiān)控數(shù)據(jù)與設(shè)備正常狀態(tài)下的理論監(jiān)控數(shù)據(jù)進行對比得出監(jiān)控數(shù)據(jù)異常變化的幅度,并將異常變化的幅度大小作為后續(xù)相似度指標計算的權(quán)重。
(2)監(jiān)控數(shù)據(jù)變化趨勢分析
根據(jù)歷史監(jiān)控數(shù)據(jù)的特征,選擇合適的時間序列模型,并根據(jù)歷史數(shù)據(jù)求出模型的參數(shù),最終得到監(jiān)控數(shù)據(jù)隨時間和其他相關(guān)歷史監(jiān)控數(shù)據(jù)變化的數(shù)學模型作為監(jiān)控數(shù)據(jù)未來時間取值的預(yù)測公式。
(3)典型設(shè)備缺陷預(yù)測
根據(jù)典型缺陷周期和預(yù)測時間點得到需預(yù)測的時間段,將需預(yù)測的時間段一一代入所有該典型缺陷發(fā)生時異常監(jiān)控數(shù)據(jù)的預(yù)測公式中,得到每個監(jiān)控數(shù)據(jù)未來時間的變化趨勢。將監(jiān)控數(shù)據(jù)未來時間的變化趨勢與該典型缺陷歷史發(fā)生時的實測變化趨勢進行相似度對比,并將對比結(jié)果按照上述算法求出的權(quán)重進行加權(quán)平均,最終得到的相似度系數(shù)即可評估該設(shè)備未來發(fā)生該典型缺陷的可能性。
1.1.1 關(guān)鍵監(jiān)控數(shù)據(jù)搜索
關(guān)鍵監(jiān)控數(shù)據(jù)是在統(tǒng)計的基礎(chǔ)上對某一監(jiān)控數(shù)據(jù)未來缺陷發(fā)生產(chǎn)生重要影響的其他監(jiān)控數(shù)據(jù)的集合。本節(jié)將計算關(guān)鍵監(jiān)控數(shù)據(jù)集合和權(quán)重模型。
由于電力設(shè)備的部分潛伏性缺陷發(fā)展緩慢,當設(shè)備剛開始處于異常狀態(tài)時往往巡視人員難以察覺,缺陷實際發(fā)生的時間往往早于缺陷歷史記錄中記錄的時間。因此需要對缺陷發(fā)生的周期進行分析,以找出缺陷發(fā)生的時間,獲得該缺陷發(fā)生周期內(nèi)相關(guān)監(jiān)控數(shù)據(jù)的統(tǒng)計特征量。
概率轉(zhuǎn)移矩陣模型相較文獻[5]方法有如下兩點優(yōu)勢:①在整合多個監(jiān)控數(shù)據(jù)上,提供了統(tǒng)一的框架和計算方法;②可以從觀測數(shù)據(jù)中,不斷學習參數(shù)、優(yōu)化結(jié)構(gòu)。
概率轉(zhuǎn)移模型為
(1)
式(1)中:P(x)表示監(jiān)控數(shù)據(jù)在時間點x上取值的概率函數(shù);PAR(x)表示監(jiān)控數(shù)據(jù)在時間點x之前時間點上取值的概率函數(shù);P[xi/PAR(xi)]表示監(jiān)控數(shù)據(jù)在時間點之間取值的概率函數(shù)。
基于貝葉斯理論,通過計算監(jiān)控數(shù)據(jù)在缺陷發(fā)生時每個時間點其最可能發(fā)生的取值及其發(fā)生概率,即
(2)
式(2)中:θ表示概率函數(shù)的參數(shù);f(x|θ)表示監(jiān)控數(shù)據(jù)在n時間點取得的觀測值;argmaxθf(x|θ)表示使得f(x|θ)最大化的參數(shù)θ。
缺陷周期計算的主要過程為:將要進行異常檢測的缺陷記錄開始時間及開始時間前一天的所有該監(jiān)控數(shù)據(jù)實測值代入上述轉(zhuǎn)移概率矩陣,獲得該監(jiān)控數(shù)據(jù)的概率序列。將不在置信區(qū)間內(nèi)的點設(shè)置為異常點,該點對應(yīng)的時間即認為是該監(jiān)控數(shù)據(jù)發(fā)生異常的時間。根據(jù)其關(guān)聯(lián)的各個監(jiān)控項異變的時間,取異變最早發(fā)生的時間作為缺陷開始時間,缺陷記錄中的消缺時間為缺陷結(jié)束時間,從而得到每個缺陷發(fā)生的時間周期。并根據(jù)時間周期得出缺陷發(fā)生時各監(jiān)控數(shù)據(jù)隨時間變化的缺陷特征曲線。
1.1.2 關(guān)鍵監(jiān)控數(shù)據(jù)權(quán)重分析
本文通過計算在缺陷發(fā)生時其監(jiān)控數(shù)據(jù)發(fā)生異常變化的幅度,作為相似度分析時的權(quán)重。計算關(guān)鍵監(jiān)控數(shù)據(jù)權(quán)重的思想為:計算監(jiān)控數(shù)據(jù)在正常狀態(tài)下缺陷發(fā)生時間段內(nèi)的概率轉(zhuǎn)移矩陣的參數(shù),并將該概率轉(zhuǎn)移矩陣與缺陷發(fā)生時的異常數(shù)據(jù)概率轉(zhuǎn)移矩陣做對比。根據(jù)兩個轉(zhuǎn)移概率矩陣計算每一個監(jiān)控變量對應(yīng)狀態(tài)取值的差異絕對值及該差異的置信區(qū)間。將置信區(qū)間中的每一個差異乘以其對應(yīng)發(fā)生的概率(最大后驗概率),得到最大后驗計算值,即:
(3)
式(3)中:g(θ)表示監(jiān)控數(shù)據(jù)n-1時間點,對n時間取值的先驗概率函數(shù)。
最后計算其期望值,該期望值體現(xiàn)了監(jiān)控數(shù)據(jù)異常變化的幅度,過程如式(4)所示:
(4)
確定了缺陷發(fā)生周期內(nèi)的監(jiān)控數(shù)據(jù)異常變化后,利用ARMA(auto-regressive and moving average model)時間序列模型分析其變化趨勢得出其監(jiān)控數(shù)據(jù)隨時間變化的函數(shù),從而對監(jiān)控數(shù)據(jù)在未來時間段的變化趨勢進行預(yù)測。計算過程如式(5)所示:

(5)
式(5)中:α表示預(yù)測模型的截距;t表示目標監(jiān)控數(shù)據(jù)的變化周期;lag[Ih(t)]表示以預(yù)測時間點為基準、目標監(jiān)控數(shù)據(jù)在td前的實際值;lag[Ih(5)]表示目標監(jiān)控值在預(yù)測時間點5 d前的實測值;lag[Im(t)]表示其相關(guān)的監(jiān)控數(shù)據(jù)Im在td前的實際值;lag[Ph(i)]表示其相關(guān)的監(jiān)控數(shù)據(jù)Ph在td前的實際值;c1、c2、c3、c4表示預(yù)測模型的系數(shù)。預(yù)測值所選擇的相似時間數(shù)據(jù)需根據(jù)預(yù)測時間段與歷史時間段的相關(guān)性選取,最終得到所有與主變油溫異常缺陷發(fā)生有關(guān)系的監(jiān)控數(shù)據(jù)的變化趨勢預(yù)測公式。相關(guān)目標監(jiān)控數(shù)據(jù)通過皮爾遜系數(shù)檢驗獲得。
在得到典型缺陷發(fā)生期間發(fā)生異常的監(jiān)控數(shù)據(jù)及其對應(yīng)的變化趨勢函數(shù)后,即可將根據(jù)函數(shù)得到未來時間段的相關(guān)監(jiān)控數(shù)據(jù)變化曲線。將變化曲線跟該典型缺陷的多個歷史缺陷記錄進行對比求出相似度后,取相似度最高的為該時間該典型缺陷的相似度指標。其具體步驟如圖1所示。

圖1 典型設(shè)備缺陷預(yù)測過程Fig.1 The process of predicting of typic equipment defect
(1)根據(jù)需預(yù)測的時間點及該典型缺陷的周期得出需預(yù)測的時間段。
(2)將需預(yù)測的時間段一一代入該典型缺陷相關(guān)的監(jiān)控數(shù)據(jù)預(yù)測函數(shù)中,得出每個相關(guān)監(jiān)控數(shù)據(jù)在該時間段的變化趨勢曲線。
(3)將得到的變化趨勢曲線與該典型缺陷的歷史發(fā)生時間內(nèi)的監(jiān)控數(shù)據(jù)實測曲線進行相似度對比,得出每個監(jiān)控數(shù)據(jù)的相似度系數(shù)。
(4)將每個監(jiān)控數(shù)據(jù)的相似系數(shù)進行加權(quán)平均計算,其中權(quán)重為各監(jiān)控數(shù)據(jù)在該缺陷發(fā)生時數(shù)據(jù)異常變化的程度,最終結(jié)果即為該時間點的設(shè)備缺陷相似度指標。
(5)依次計算每個需要預(yù)測的時間點,得出預(yù)測時間段的設(shè)備缺陷相似度曲線,即可根據(jù)曲線的取值高低判斷每個時間點發(fā)生該典型缺陷的可能性。
下面主要針對典型設(shè)備缺陷預(yù)測中涉及的曲線相似度計算和缺陷相似率指標計算進行詳細討論。
1.3.1 曲線相似度對比
曲線相似度對比采用皮爾遜系數(shù)來衡量兩條曲線的相似性,可以避免兩條曲線形狀相似而取值差距很大被認為不相關(guān)的情況。
計算過程如下:
(6)

1.3.2 缺陷相似率指標計算
由于影響缺陷可能性評價的因素往往是眾多而復(fù)雜的,如果僅從每一項單一的維度曲線相似度指標上對缺陷可能性進行綜合評價不盡合理,因此需要將反映缺陷可能性的多項指標的信息加以匯集,得到一個綜合指標,以此來從整體上反映缺陷可能性的整體情況。綜合指標處理的方法有多種,由于每個典型缺陷其相關(guān)維度都經(jīng)過了篩選,因此影響缺陷的各個指標之間沒有很強的相關(guān)性。在計算綜合指標時,不需要考慮指標間的相關(guān)關(guān)系,只需要采用以加權(quán)平均為基礎(chǔ)的指標評分法即可。其實質(zhì)是將多個指標用加權(quán)平均的方法綜合成一個評價值。
未檢驗所提方法的有效性,設(shè)計如下實驗進行驗證。
測試數(shù)據(jù)來自于某電力公司500 kV主變歷史油溫異常缺陷記錄,實驗在Hadoop平臺上進行。實驗所需的設(shè)備監(jiān)控信息存儲在Hbase中,利用離線計算組件完成所需模型的訓練,并利用實時計算組件實現(xiàn)電力設(shè)備缺陷的在線預(yù)測。
針對油溫異常缺陷計算其發(fā)生前一天及缺陷發(fā)生時有異常變化的監(jiān)控數(shù)據(jù)。以主變A相油溫1為例。
(1)針對主變A相油溫1的歷史數(shù)據(jù)集合,劃分成等距長度區(qū)間,再對區(qū)間里的數(shù)據(jù)集進行建模,獲得區(qū)間里數(shù)據(jù)集的統(tǒng)計特征。
(2)將每一個分布所代表的結(jié)點用全連通的無向圖連接并存儲。
(3)對每一條結(jié)點之間的邊進行獨立性統(tǒng)計假設(shè)檢驗,利用深度優(yōu)先算法,對每一條邊,使用最大擬然估計對邊的轉(zhuǎn)移概率分布的參數(shù)進行學習。
如表1所示為主變A相油溫1在學習完成后的轉(zhuǎn)移概率矩陣計算結(jié)果。
將缺陷發(fā)生時的主變A相油溫1歷史數(shù)據(jù)代入到上述的概率轉(zhuǎn)移矩陣中,得到如表2所示的轉(zhuǎn)移概率序列。

表1 主變A相油溫1轉(zhuǎn)移概率矩陣Table 1 The transition probability matrix about a phase of main transformer oil temperature 1

表2 主變A相油溫1概率序列Table 2 The probabilistic sequences of a phase of main transformer oil temperature 1
根據(jù)轉(zhuǎn)移概率序列,在3:41時出現(xiàn)大批量0值。因此主變A相油溫1的異常時間點為第一天3:41,依次類推求出其他該缺陷相關(guān)監(jiān)控數(shù)據(jù)的異常時間點。其中主變A相油溫1的異常時間點最早。根據(jù)歷史記錄,該缺陷結(jié)束時間為第二天3:20,由此得出該缺陷記錄的實際發(fā)生周期為23 h 39 min。
根據(jù)式(4)計算各監(jiān)控數(shù)據(jù)隨時間變化的時間序列模型,預(yù)測各監(jiān)控數(shù)據(jù)未來時間的變化曲線。采用式(5)計算未來時間變化曲線與歷史缺陷實測曲線的相似性。對于油溫異常缺陷,將同一主變第二次發(fā)生油溫異常缺陷的時間點代入,得到各監(jiān)控數(shù)據(jù)在缺陷周期內(nèi)的相似性計算結(jié)果如表3所示。

表3 各監(jiān)控數(shù)據(jù)相似性計算結(jié)果Table 3 The results of similarity calculation about remote measurements
經(jīng)過加權(quán)平均后,最終典型缺陷相似性指標為0.863 6,同時計算出缺陷發(fā)生時間前后的相似度部分指標計算值如圖2所示。

圖2 各時間點相似度指標計算結(jié)果Fig.2 The results of similarity calculation in different time points
綜合上述實驗結(jié)果可知,在缺陷實際發(fā)生時,根據(jù)所提方法計算出的相似度指標形成了一個峰值,而缺陷未發(fā)生時的相似度指標較低。這證明所提方法能夠較好地體現(xiàn)缺陷發(fā)生的可能性,對設(shè)備發(fā)生缺陷的情況具有較好的預(yù)測效果。
(1)設(shè)計了一種基于大數(shù)據(jù)挖掘的集中監(jiān)控設(shè)備典型缺陷預(yù)測方法,分析缺陷發(fā)生時每種不同監(jiān)控數(shù)據(jù)的異常變化幅度,并根據(jù)這種異常變化幅度對每一種監(jiān)控數(shù)據(jù)賦予不同的權(quán)重,實現(xiàn)基于多種不同類型的監(jiān)控數(shù)據(jù)對設(shè)備缺陷的預(yù)測,以避免傳統(tǒng)的基于數(shù)據(jù)驅(qū)動的缺陷預(yù)測方法由于僅考慮某一種監(jiān)控數(shù)據(jù)所帶來的預(yù)測準確度不高的缺點。
(2)所提方法為了降低監(jiān)控數(shù)據(jù)的預(yù)測誤差,引入了時間序列預(yù)測技術(shù),對大量統(tǒng)計數(shù)據(jù)進行數(shù)學處理,確定因變量與某些自變量的相關(guān)關(guān)系,以建立回歸方程(函數(shù)表達式),用于預(yù)測今后的因變量的變化,能夠提高預(yù)測準確性。
(3)為了提高設(shè)備缺陷預(yù)測的準確度,所提方法綜合考慮多種不同的監(jiān)控數(shù)據(jù)變化曲線與典型缺陷發(fā)生時的監(jiān)控數(shù)據(jù)變化曲線的相似度,并在此基礎(chǔ)上獲得一個綜合指標,以實現(xiàn)從整體上客觀評價缺陷發(fā)生的可能性,使得所提方法更具應(yīng)用優(yōu)勢。