張蒙,朱永利,賈亞飛,張寧,張媛媛
(新能源電力系統國家重點實驗室(華北電力大學),河北保定071003)
局部放電是變壓器安全運行的主要威脅之一。局部放電既是變壓器絕緣老化的原因,又是絕緣老化的表現形式[1]。局部放電的檢測和識別是變壓器在線監測和故障診斷的重要組成部分[2]。識別局部放電類型有利于了解設備的絕緣狀態,制定合理的檢修計劃。
局部放電的分類本質上是模式識別的問題。近些年,國內外的學者這個領域做了大量的工作,許多方法如神經網絡[3-5]、支持向量機[6-8]、聚類算法[9-11]以及貝葉斯分類[12-13]等都已經應用局部放電類型的識別中。然而,這些算法也存在著各種的問題。神經網絡分類器的網絡結構要靠先驗知識確定,且易出現過學習,欠學習和局部極小值等問題。支持向量機是基于VC維和結構風險最小化的統計學習方法,非常適合于處理非線性、小樣本的數據分類問題。但是支持向量機的分類效果很大程度取決于核函數及其參數的選擇。聚類算法屬于非監督式機器學習算法,在樣本量較大或噪聲水平較高時,聚類效果較差。并且以上算法都沒有利用所提取特征量之間的相互關系。2008年,Raghuraj等人提出一種新的模式識別方法——基于變量預測模型(VPMCD)的識別方法,并將其成功應用在蛋白質結構的識別中[14-16]。VPMCD算法利用特征值之間的內在相互關系建立變量預測模型并完成分類,不需要先驗知識,避免了神經網絡的迭代和支持向量機的尋優過程,計算速度快。同時,該方法使用多項式響應面法建立變量預測模型,對非線性數據有著較好的分類效果。
文中將VPMCD引入到變壓器局部放電信號的模式識別領域。首先在實驗室條件下構造四種變壓器局部放電實物模型,并對采集的放電信號提取18維的統計特征。最后使用VPMCD實現變壓器局部放電信號的識別。
文獻[15]認為,在給定的多變量系統中,反映系統狀態的不同特征量之間不僅存在獨立性也存在相關性。這種性質可用變量預測模型近似表示,其定義如下:在一個多變量系統中,特征向量[x1,x2,…xp]用來表征系統狀態。則有:
xi=g(xj,…,xk,bm,…,bn)+ε (1)式中 i=1,…,p;1≤j,…,k≤p,且 j,…,k≠i;bm,…,bn為模型參數;ε為預測誤差。VPMCD采用多項式響應面法求解變量預測模型:
Y=D·B (2)式中Y是模型響應值,也就是特征Xi的預測值。D是輸入變量的多項式基函數。B是模型參數。四種變量模型的結構和相應細節如表1所示。其中r≤p-1,為模型階數,代表著在多項式響應模型中輸入變量的數目。對于多變量系統某一特征Xi來說,選定變量預測模型的類型和模型階數r后,可建立個多項式響應模型。則從個多項式響應模型選出預測誤差最小的模型,即為特征Xi的最優變量預測模型vpmi。這樣,變量預測模型的建立問題就轉化成用最小二乘法求解模型參數B的回歸問題。
VPMCD算法簡單流程圖如圖1所示。

圖1 VPMCD算法簡單流程圖Fig.1 Simple flow chart of VPMCD algorithm
1.2.1 模型訓練
(1)給定一個由C類樣本組成的訓練集,N[n×p;C];n為訓練樣本總數;p為特征維數。其中每類樣本記作 Ng[ng×p],g=1,…,C,∑ng=n。選擇最大模型階數rmax;
(2)用 m表示預測模型的類型(L,LI,Q和 QI分別用1,2,3和4表示),r表示模型階數。令 m=1,r=1;
(3)對樣本集 Ng[nj×p]的特征 Xi(i=1,2,…,p按照式(2)建立個變量預測模型,計算并保存模型預測誤差;
(4)先后令 m=m+1和 r=r+1,循環步驟(2)和(3),直到m=4和r=rmax為止。這樣共有nk=4×種組合方式。從nk個組合方式中選取預測誤差SSE最小的模型作為第g類樣本中特征 Xi(i=1,2,…,p)的最優變量預測模型保存相應的自變量集合,模型類別和模型參數;
(5)循環步驟(2)~(4),直到所有 C類樣本中每個特征值都建立最優變量預測模型。這樣就得到訓練樣本的變量預測矩陣VPM[C×p]。
1.2.2 模型測試
(1)選擇測試樣本,提取特征值 S[X1,X2,…,Xp];
(2)將測試樣本特征集S分別帶入VPM[C×p]中,求出相應預測值 S^g(g=1,2,…,C);
(3)把預測的誤差平方和值 SSEg=∑(S-S^g)2,g=1,2,…,C作為分類的依據。若測試樣本在使用第 g(g=1,2,…,C)類樣本的最優預測模型時,預測誤差平方和最小,則把樣本歸為第g類。

表1 不同變量預測模型的結構和相應細節Tab.1 Structures and the corresponding details of different VPMs
根據變壓器局部放電的形式和特點,在實驗室中構造四種放電模型。為使采集的放電信號更有代表性,對每一種類型的放電都設計多種尺寸和參數的放電模型。四種局部放電實驗室模型如圖2所示。

圖2 四種局部放電實驗室模型Fig.2 Four types of partial discharge models in lab
(1)電暈模型。此模型用來模擬變壓器在空氣中的電暈放電。放電尖端分別采用長度為30 mm,50 mm和70 mm,直徑1 mm的銅絲。放電尖端下接直徑320 mm的圓形無暈電極;
(2)沿面模型。此模型用來模擬變壓器內部的沿面放電。使用的圓形環氧樹脂絕緣板直徑分別為30 mm,40 mm和50 mm;
(3)針板模型。此模型用來模擬變壓器內部存在尖銳導體而引起的局部放電。模型分別使用3,4和5根針電極,均由直徑3 mm的鋁棒制成,端部打磨成30°的錐形。針電極按照環形排列,針電極和板電極之間放置厚度為1 mm的絕緣板;
(4)懸浮放電。此模型用來模擬變壓器內部接觸不良或接地不良產生的懸浮放電。絕緣板直徑為50 mm,厚度為1mm。金屬墊片厚度為3mm,直徑分別為5 mm和10 mm。
模型所有部件的表面和邊緣都打磨光滑。除電暈模型外,其余三種模型都放置在盛滿變壓器油的容器中。使用帶寬為100 kHz~500 kHz的寬頻電流傳感器和TWPD-2F局部放電綜合分析儀采集放電信號,采集頻率為 40 MHz。高壓試驗平臺型號為TWI5133-10/100am。實驗條件見表2。

表2 放電模型試驗條件Tab.2 Test conditions of partial dischargemodel
將連續50個工頻周期的放電信號作為一個放電樣本,構造最大放電量相位分布qmax-φ,平均放電量相位分布qmean-φ和放電次數相位分布n-φ三個二維譜圖,并從中提取偏斜度,陡峭度等18個統計參數,如表3所示。

表3 PD信號的統計特征Tab.3 Statistical feature of PD signal
采集320個局部放電樣本(每種放電類型80個),其中訓練樣本200個,測試樣本120個。用VPMCD算法對訓練樣本進行訓練,模型階數設為3,得到4類樣本的最優變量預測模型。由于篇幅所限,表4只給部分預測結果。

表4 基于VPMCD的PD信號識別的部分結果Tab.4 Part of the results of classification of PD signal based VPMCD
為了進行對比分析,分別使用BP神經網絡和VPMCD兩種分類算法實現局部放電信號的識別。BP神經網絡的輸入層節點數為18,隱層節點數為5,輸出層節點為4,訓練截止誤差為10-3,學習率為0.1。兩種算法都采用10折交叉驗證。
從表5可以看出,VPMCD的識別效果要明顯好于BP神經網絡。電暈放電脈沖多出現在工頻周期的270°附近且具有明顯的極性效應,特征明顯。故兩種算法對電暈放電都能準確識別。而在其余三種放電類型的識別上,VPMCD的表現明顯好于BP神經網絡。這是由于VPMCD利用預測誤差最小原則從全局選擇最優預測模型,穩定性強,也避免了BP神經網絡算法可能出現的局部最優。
同時,VPMCD算法的訓練時間為1.793 s,而BP神經網絡的訓練時間要35.064 s。當輸入的特征維數和樣本類別較高時,需要建立的預測模型數量也隨之增加,但是多項式響應面法建立的變量預測模型結構簡單,不需要迭代學習,計算速度快,訓練時間反而要比BP神經要少。最優變量預測模型是從所有可能的模型(類型和階數不同)中選擇預測誤差最小的模型,在訓練時不需要進行參數調整,保證了模型的精度和泛化能力。

表5 PD信號識別的準確率Tab.5 Recognition accuracy rate of PD signal
(1)VPMCD算法利用多項式響應面法建立特征量的預測模型,通過預測誤差來識別不同放電類型,能夠有效解決局部放電信號模式識別問題,分類正確率要高于BP神經網絡。
(2)VPMCD本質上是利用特征值之間相互內在聯系的參數估計方法建立預測模型,運算速度快,同時避免了參數選擇的主觀性。