杜梓銘,馬靜波,張立輝,汪 巖
(國網河北省電力有限公司保定供電分公司,保定 071000)
隨著國家電網公司確立以“三型兩網、世界一流”為新戰略的核心任務,泛在電力物聯網將提供物理基礎,推動傳統業務提質增效并衍生新業務新業態新商業模式,這種新變化展現出“智能業務”的特征,核心就是數據和智能的驅動。變電站設備結構復雜化,發生缺陷的位置、時間的不確定性,導致故障發生后檢修人員無法對事故原因作出快速判斷,同時告警眾多,故障排查定位困難,潛在風險缺乏有效辨識手段,導致問題出現時無法及時處理。因此,提出變電站繼電保護分析平臺,以確保電網能安全、穩定、高效、經濟的運行。
變電站繼電保護分析平臺由裝置信息[1]、運行信息、保護動作分析、事故原因推演、保護邏輯優化、缺陷分析及消缺建議幾部分板塊組成。平臺通過數據采集處理、波形提取、模型比對三部分對數據進行采集處理分析得出分析結論。數據采集處理主要應用現有站端系統進行數據采集,實時傳送到平臺后臺進行波形提取和模型比對。在波形提取和模型比對模塊我們研究并運用了一種基于支持向量機(Support Vector Machines,SVM)分類技術的故障原因診斷方法。
分析平臺通過站端故障錄波器采集[2]保護運行數據,如:實時電流電壓及動作信息;通過保護子站系統采集錄波文件;同時收集裝置信息及定值、壓板投入等信息進行核實比對;將這些數據通過數據緩沖區、數據倉庫、數據集市進行數據存儲和預處理。
波形提取模型比對主要運用基于SVM的故障診斷方法,不僅針對單個錄波文件獨立進行分析,而且將所有錄波數據整體上進行考慮,深度洞察隱藏于海量錄波文件中確定性的規律和模式。便于輔助電網運行人員快速判定故障異常相位及故障原因,以及時采取對應的保護措施。SVM建立在統計學習VC維理論和結構風險最小原理基礎上的識別方法,有效地解決了小樣本、高維數、非線性等的學習問題,并克服了人工神經網絡學習合理結構難以確定和存在局部最優等缺點,大大提高了學習方法的泛化能力,能對多類別進行故障原因識別,速度快,對噪聲不敏感,識別率高,具有較高的識別精度。
基于SVM分類技術是建立在嚴密的數理統計理論之上的新型分類方法,其基本思想是通過用內積函數定義的非線性變化,將輸入空間變換到高維特征空間,在這個高維空間中尋找輸入變量與輸出變量之間的一種線性關系。采用結構風險最小化原則,將問題轉化為一個凸二次優化問題,簡化了計算的復雜性,保證得到的解是全局最優解,提高分類模型的精度,較好的解決了分類方法中的小樣本、非線性、高維數等實際難題。
SVM是一種二分類模型,通過在原特征空間或經投影后的高維空間上構造最優分類面,將給定的屬于2個類別的訓練樣本分開,構造超平面的依據是兩類樣本離超平面的距離最大化。便于理解,現以線性可分情況下SVM為例敘述其基本原理:
設線性可分集(xi,yi),1<i<N,xi∈Rd,y i∈{-1,1}是類別編號,d維空間中線性判別函數的一般形式為g(x)=ω·x+b,相應的分類面方程為ω·x+b=0。將g(x)進行歸一化,使所有的xi都滿足,即離分離面最近的樣本,這樣分類間隔就等于(1/2)|ω|。求解最優分類面就等效于最小化|ω|,目標函數為

采用拉格朗日乘子法,引入乘子α=[α1,…,αN],可以將上述問題轉換成二次規劃問題

αi≥0,i=1,2…,N
f(x)=sgn(ω*·x+b*)
對于線性不可分情況,SVM一方面引入松弛變量和懲罰因子來構造目標函數,一方面通過非線性變換將輸入空間變換到高維空間,然后在新空間中求解最優分類面,此時,線性可分情況下的點積運算 (xi,xj)變為 (Φ(xi),Φ(xj)=K(xi,xj),K(xi,xj)為核函數。
將SVM推廣至多分類問題需要構造SVM多分類器。目前常見的構造方法是通過組合多個二分類器來實現,具體涉及兩種思路:一對多算法和一對一算法。
一對多算法對于N類問題構造N個二分類器,第i個SVM用第i類中的訓練樣本作為正的訓練樣本,而將其他的樣本作為負的訓練樣本,最后的輸出是兩類分類器輸出為最大的那一類。這種方法的好處是每個優化問題的規模比較小,而且分類的時候速度很快(只需要調用N個分類器就知道了結果);缺點是訓練樣本數大,訓練困難,推廣誤差無界。
一對一算法在N類訓練樣本中構造所有可能的兩類分類器,每類僅僅在N類中的兩類訓練樣本上訓練,結果可構造N(N-1)/2個分類器,使用投票法決定樣本所屬類別。這類方法的好處是訓練階段復雜度低,計算量小;缺點是分類數目隨類數急劇增加。
基于SVM技術的故障原因診斷方法,包括數據抽取、訓練樣本數據構造、多類別的故障原因模型訓練和故障原因診斷等關鍵步驟。具體流程見圖1。
基于SVM分類技術的電網故障原因診斷方法,從步驟上分為數據抽取、數據探索與預處理、建模與診斷、結果與反饋等步驟,在每個步驟,根據應用的層級分為離線建模和在線實時應用2個層次,2個層次在每個步驟中處理方式有細微的差別。

圖1 基于SVM分類技術的電網故障原因診斷方法流程
2.2.1 數據選擇與抽取
數據抽取步驟根據從與應用端的保信軟件系統的歷史錄波數據庫中,取到原始的錄波數據,并取得錄波數據相關的信息,包括錄波來源線路、廠站、時間、事后確認數據,而對于實時部分,則從保護裝置取得定時或條件觸發的錄波數據。
2.2.2 數據預處理與規范化
a.數據質量檢查對數據樣本進行探索分析,對關鍵字缺失的數據進行篩除,根據算法對數據質量的要求,對原始數據進行判定,篩除質量較低的原始樣本。
b.故障相關原始數據提取。提取出與故障相關聯的電流電壓通道Uu、Uv、Uw、Iu、Iv、Iw。
c.故障時間點、故障相別判定。利用故障錄波分析庫,進行故障點判定。
d.故障時間點對齊。基于c中所判定故障時間點,將前后若干原始錄波信號進行提取。
2.2.3 特征提取
因為原始數據為生數據,在進行模型訓練前,需要將生數據轉換為熟數據即特征數據。本方法引用小波分析技術,提取錄波信號在各頻率波段中的特征,采用多尺度的空間能量分布的分析方法對信號進行頻帶分析,再分別計算所得的各個頻帶的能量作為特征向量,完成從原始信號到特征向量數據的變換。
采用小波分析,對上步中提取出故障點前后的若干周波進行信號分解,首先需要根據原始信號的特點選擇小波基,考慮到原始信號是電壓電流信號,為正弦信號疊加異常信號,因此選擇db4小波基作為基函數。
采用db4基波進行小波變換后,信號f(t)的二進制小波分解可表示為:
f(t)=Aj+∑Dj,其中A為近似信號,是低頻部分;D為細節信號,是高頻部分。信號的總能量為:

選擇第j層的近似信號和各層的細節信號的能量作為特征。
針對該電壓/電流信號,構造子特征向量為:

利用小波變換可以對時間序列信號進行特征提取,提取出可以代表時間序列信號的向量數據,完成從原始信號到特征向量數據的變換。
經過之前步驟提出來各個電壓電流的子特征向量為<FUu、FUv、FUw、FIu、FIv、FIv>
根據判定的故障相別,采用故障相別優先的字母序原則。如故障相別確定為V相故障,則形成的該樣本對應的特征向量為:<FUv、FUw、FUu、FIv、FIw、FIu>
2.2.4 故障原因模型的訓練
在進行分類的時候,每一個訓練樣本由一個特征向量和一個分類標記組成。

式中:xi為特征向量(維數一般較高);yi為分類標記。
在樣本集訓練過程中,核函數算法的選取對故障診斷模型的準確度有很大的影響,不同的核函數可以構造實現輸入空間中不同類型的非線性決策面的學習模型。選取不同的核函數對于不同的樣本差異很大,所以通過實驗進行核函數的選取。
2.2.5 故障原因模型的診斷
基于SVM分類技術的故障原因模型的診斷與訓練的預處理過程類似,同樣是采用特征提取算法,將原始數據轉化為與模型訓練輸入相同屬性的特征向量。故障原因模型將此特征向量作為輸入,最終給出屬于每個類別的概率:

以某電網的故障錄波數據來診斷故障原因的實驗為例,說明如何基于歷史數據診斷電網故障。
2.3.1 數據描述
該故障錄波數據為某省網2014年1、5、6、7、11月份發生故障事件對應錄波數據,共154個。按故障相別的統計結果,1相故障119次,2相故障33次,3相故障2次。
因2相3相的故障樣本過少,不利于進行SVM訓練,因此重點針對1相故障錄波數據進行分析。對1相故障原因的統計:對樹木放電4次,雷擊56次,凝冰9次,其他4次,山火8次,外力破壞13次,異物25次。
2.3.2 數據選擇與抽取
故障錄波數據及相關信息,包括廠站id列為廠站的編號,時間為故障錄波數據的開始生成時間。錄波數據中,其內容為發生故障前、后一段時間的狀態檢測數據,應包含了故障的全過程監測數據,列舉了錄波文件相關的參數。故障原因為事后確認的故障原因。
2.3.3 數據預處理與規范化
對每一個提取出的錄波文件,按照統一的頻率對原始信號進行插值。對于本次實驗來說,設定統一的頻率為5 k Hz,則其他頻率的樣本數據根據此頻率進行降采樣或插值。將某錄波文件前2個步驟提取完的電壓電流信號見圖2。

圖2 從錄波中提取與挖掘相關的電壓電流信號
由圖2可看出,對信號的選擇與抽取必要的,在減少數據冗余的同時,涵蓋了與故障原因相關的故障點前后的關鍵特征。
2.3.4 關鍵特征的提取
用小波變換將原始信號分解到第5層,得到各個錄波數據對應的樣本。
2.3.5 按故障相別進行特征向量組合
以一個樣本的特征向量生成作為例子,比如樣本1的故障相別為V,經過之前步驟提出來各個電壓電流的子特征向量為FUu、F Uv、F Uw、F Iu、F Iv、F Iv,最終形成的該樣本對應的特征向量為<FUv,F Uw,F Uu,F Iv,F Iw,F Iu>
進行訓練時,需要將樣本類別進行數值化處理,建立映射表。
最終的訓練樣本數據集見表1。

表1 訓練樣本數據集
在樣本集訓練過程中,核函數算法的選取對故障診斷模型的準確度有很大的影響,不同的核函數可以構造實現輸入空間中不同類型的非線性決策面的學習模型。常用的核函數有:
線性內核:K(x i,x j)=x i·x j
高斯徑向基內核:K(x i,x j)=exp(-g‖x i·x j‖2)
多項式內核:K(x i,x j)=[(x i·x j)+1]q
S形內核:K(x i,x j)=tanh(v(x i·x j)+c)
選取不同的核函數對于不同的樣本差異很大,所以核函數的選取,要通過實驗進行不同核函數的性能表現見圖3。

圖3 不同核函數的性能表現
由實驗結果可以看出,選擇高斯徑向基內核(Radial Basis Function)的準確率要比其他內核略好,因此對于本例實驗采用高斯徑向基內核進行模型訓練。
2.3.6 故障原因診斷
模型訓練完畢后,對一批測試數據進行診斷和驗證,測試數據原始錄波信息表所示,通過診斷算法將原始數據轉換為模型的輸入向量進行診斷,診斷結果如表2所示。可以看出,對于測試的8個樣本,除了6和7號樣本,其他樣本的診斷結果與樣本的實際所屬類別是一致的。同時在6和7號樣本中,樣本的診斷結果與實際類別較為接近,如6號樣本實際類別為“外力破壞”,診斷結果中,類別為“外力破壞”和“異物”的概率分別為18.83%和50.64%,分別為概率最大的前兩位;同樣7號樣本實際類別為“異物”,而診斷結果中,類別為“雷電”和“異物”的概率分別為39.93%和25.98%。

表2 診斷結果
本平臺對故障的分析判斷是自我完成的,當發生故障后,故障錄波器會將錄波文件傳給后臺,同時平臺將所有相關的數據進行匯總,通過基于SVM分類技術的故障原因模型的診斷,將診斷的結果推送給相關人員并且給出消缺建議。
通過統計這幾年變電站總數的變化,可以清楚地看見變電站的數量再逐步增長,同時設備的數量也在逐年增多。檢修人員素質和數量的提高速度遠遠趕不上變電站的增速,導致工作量的加大,由于素質高低不齊,導致處理問題的速度快慢不一。同時變電站設備越來越復雜,分析故障過于繁瑣,經過多次試驗,驗證此平臺對于檢修工作起到一定積極作用。故障搶修流程中各環節用工時見表3。
通過表3可以得出,工作繁瑣的步驟十分耗時,導致工作中出現很多安全問題,同時造成停電時間的增長,通過此平臺可以有效的化簡工作流程,使很多工作可以遠方進行,減少人力物力,并且分析結束后可以第一時間得到試驗報告,并且進行故障推演[3],用動畫形式形成動作過程,使故障的發展過程更加直觀。
變電站繼電保護分析平臺通過將大量歷史錄波數據綜合分析的手段。使大量的歷史數據形成能幫助運行人員理解電網狀態的知識,能及時識別故障原因及采取相應的措施進行應對,甚至進行預測以便制定必要的預防措施。

表3 故障搶修各環節用時比較
基于支持向量機的方法屬于有指導型的數據挖掘,適合于具有維度完備數據樣本、數據特征可提取、樣本類別信息已知的應用場景。此方法對缺失數據敏感,而且對非線性問題沒有通用解決方案,必須謹慎選擇核函數來處理。此外,其對超大規模訓練樣本難以實施,由于SVM是借助二次規劃來求解支持向量,而求解二次規劃將涉及m階矩陣的計算(m為樣本的個數),當m數目很時該矩陣的存儲和計算將耗費大量的機器內存和運算時間,需要對算法進行改進。