鐘燕


摘要:文章結合相關的研究工作,提出了一種基于大數據分析手段下的檢測方法,由數據的演進過程、數據關聯等角度實現了對于異常情況有效檢測,并進一步提出了異常檢測體系,使其能夠使用在輸變電設備的狀態監測數據流中,促使數據流當中的異常狀況能夠得以及時測出。
關鍵詞:大數據;輸變電設備;異常檢測;時間序列;神經網絡 文獻標識碼:A
中圖分類號:TM764 文章編號:1009-2374(2016)29-0128-02 DOI:10.13535/j.cnki.11-4406/n.2016.29.058
在輸變電設備的日常運行過程中常常會遭受到負荷、過電壓、內部絕緣老化、自然環境等多方面異常狀況的影響,此類異常狀況往往會致使設備出現缺陷情況,因而針對設備狀態實施異常檢測十分重要,應當引起人們的重視與思考。
1 單狀態量數據流特征量提取
1.1 自回歸模型
時間序列的自回歸模型大多應用在許多工業過程之中,其主要的特點即為具備有極強記憶能力的AR系統,在時間維度的t值上往往需借助于從前時刻行為,這和設備運行過程當中的低動態性完全符合。輸變電設備在日常運行過程當中其一部分狀態量的改變程度相對較小,例如導線拉力、接地電流等內容,這些狀態量的數據信息往往從屬于平穩序列,能夠直接應用于AR擬合;此外還有一部分的狀態量會伴隨時間的推移而呈現出周期性的改變,但改變的幅度相對較小,例如油溫、環境溫度等情況,將其日周期性的改變因素排除后亦可借助于AR進行擬合,因而針對狀態數據則可利用一階AR進行模型擬合。
1.2 時間序列量化
自組織神經網絡具體的運行機制是借助于無監督學習方式,來促使競爭層當中不同的神經元可以利用競爭和輸入模式予以匹配,最終僅保留一項神經元即為獲勝者,此種獲得神經元的輸入方法即為輸入模式分類法。因為無監督學習的訓練樣本不具備有期望輸出情況,沒有任何的經驗知識,因而較適用在數據量大、不含有標簽的狀態監測數據當中。
采用SOM可以實時無監督分類,進而促使整體序列成為SOM的一項輸出節點,其中序列是其中一項輸出節點,針對每一項訓練其專屬于節點的公式可表述為:
進行持續性的循環與改進,以保障距離所屬節點的距離值能夠達到最小。
1.3 時間序列變化過程
與徑向基、反饋型等神經網絡所不同的是,SOM神經網絡的輸出節點之間是互相關聯的,其相互間的關系可以借助于網絡拓撲結構來表達。在拓撲結構中,因為SOM在訓練過程當中的競爭性,使得每一項神經元節點和鄰域當中的節點存在明顯的關聯性,和鄰域外部的節點關聯性較弱。也正是基于SOM神經網絡的此種特性,在量化之后的時間序列可被視作為拓撲結構中一項神經元到另一項神經元的轉移,進而挖掘出數據伴隨時間發生改變的規律性。
第一,計算神經元所屬概率密度函數。借助于第一階段的轉移概率P值來達標神經元間的相關性,AR模型當中神經元的一階轉換概率可表述為,據此可求出AR模型在位于一階轉移之時的概率即為。
第二,計算神經元間的轉移概率。因為AR過程較為穩定,距離相對較近的神經元之間發生轉移的概率也就相對較大,距離較遠的神經元之間出現轉移的概率相對較小。利用變壓器油溫正常狀況之下的在線監測數據進行舉例說明,首先使數據可以借助于AR模型予以擬合表述,進而得出相應的模型參數值即為,,,而后將數量點的溫度數據值錄入至包含有12項神經元的SOM當中予以擬合訓練,進而得到訓練完成的SOM神經網絡系統。截取出其中的一段溫度數據值,如圖1(a)所示,同時將之錄入到完成擬合訓練的SOM當中進而取得量化輸出,即為圖1(b)所示。
依據AR模型參數,求得SOM神經元之間的轉移概率值,如圖2所示。通過觀察圖2可以發現,位于對角線當中的轉移概率值最大,并且在灰色區域當中的轉移概率要顯著大于灰色區域之外的轉移概率,此即表明AR過程之中的數據在神經元間的轉移概率和神經元距離呈現出反比狀況,神經元間的距離越大,相應的數據信息也就越難發生轉移。
通過將溫度數據伴隨時間推移而產生的動態性改變,利用轉移概率序列來進行表達,如圖1(c)所示。通過觀察可以明顯的發現在一般狀況下,數據的轉移概率都較大,并且通常都是由圖2當中的灰色區域進行數值選取,此即表明溫度數據會伴隨著時間的改變而逐漸趨于平穩。相反若序列當中的一段數據轉移概率在灰色區域之外時,則表明這一段數據在神經元間的轉移相對更加頻繁,因此即可判定狀態量出現了異常。
2 多狀態量數據流特征提取
在日常的設備運行時,因受設備屬性、運行工作狀況、環境差異等因素的影響,通常會使得設備的狀態監測量,多為參量間的相關性往往無法做出明確的函數表達。例如變壓器的熱點溫度、油溫、環境溫度以及負荷量等參數值往往需要借助于熱平衡方程予以表達,但是熱平衡方程參數數量較多并且在高溫環境下也會出現計算不準確的情況,進而使得熱點溫度值出現異常無法做出準確測定。
通過輸電線路覆冰舉例說明,將在線監測的參量值Z作為一項三維數組,進而借助于DBSCAN算法進行類型聚合處理。如果一項三維數組與所有簇中點的距離均超過了某一特定值R,那么即表明這一數據不屬于任何一項簇組。因而,在某一參量值發生異常情況進而使得這一多維數組當中的Z不屬于任何一簇之時,即可判別這一時刻的多維數據發生了異常狀況。
3 異常檢測步驟
依據上文內容當中的時間序列特征量提取算法,針對在線監測數據實施以異常檢測的流程如圖3所示。
第一,對于每一項參量的歷史數據信息,借助于單狀態量數據流特征量的提取算法來就其轉移概率的矩陣模型進行計算處理。
第二,對于每一項參量的歷史數據信息,借助于多狀態量數據流特征量的提取算法針對多元時間序列予以聚合處理,從而使得歷史數據可以被聚集為m個簇。
第三,將實時監測所得到的數據流信息導入至轉移概率矩陣當中,從而取得不同參量的轉移概率序列,進而就不同時間點當中數據是否為多狀態量數據流特征量的m聚類予以判別。
第四,依據上述判定結果針對數據流采取異常檢測,其中異常檢測的邏輯表述如下:(1)在不同的參量值轉移概率序列均不具備0值之時,并且數據流之中不同時間點數據從屬于m簇當中的1項之時,則這一段的數據即不存在異常狀況;(2)在鉻參量的轉移概率序列存在有少量的0值之時,同時數據流當中少數時間點數據均不為m簇,那么這一段落數據當中則存在有少量的幾個噪聲點,此為傳感器狀態異常,可忽略不計;(3)若k個參量的轉移概率序列存在有一連續的整段0值時,那么數據流當中的一大段時間點數據則均不屬于m簇,相應的即可判定設備出現了異常運行狀況;(4)針對設備所出現的異常狀況,可依據參量轉移概率序列經過0點位置的情況,判定出設備發生異常情況的具體時間點。
4 結語
本次研究所探討的方法其優點即為能夠結合多元狀態量的歷史數據及目前數據,同時可以實現對動態數據的異常檢測,相較于一般的閾值判定方法而言準確率相對較高。在設備被檢測出異常狀態后,此項檢測方法同時也存在有一定的缺陷,在今后的工作當中進行不斷改進與完善,從而避免由于外界環境異常所帶來的不利影響。
參考文獻
[1] 王佳明,劉文穎,魏帆,等.基于壽命周期成本管理的輸變電設備狀態檢修策略研究[J].電力系統保護與控制,2014,(5).
[2] 孫才新.輸變電設備狀態在線監測與診斷技術現狀和前景[J].中國電力,2015,(2).
[3] 孫鵬,李劍,張勁,等.基于Markov過程的輸變電設備一體化智能監測裝置可靠性評估[J].高電壓技術,2015,(12).
(責任編輯:小 燕)