李君科,李明江,李德光
(1.黔南民族師范學院計算機與信息學院,貴州都勻 558000;2.洛陽師范學院信息技術學院,河南洛陽 471934)
氣體絕緣開關設備(gas insulated switchgear,GIS)因其安全運行可靠性高、低成本、低污染運行等特點,在電力系統中得到了廣泛應用[1-2]。但GIS 設備的長時間運行以及制造和安裝時存在的疏漏會導致內部絕緣缺陷,引起設備的局部放電(partial discharge,PD)行為[3]。對GIS 設備內部各種絕緣缺陷的PD 信號監測并進行分析和識別,能夠為評估設備運行狀態和制定可靠的檢修方案提供合理依據[4-5]。
目前在GIS的PD 模式識別的研究中,主要是從特高頻(ultrahigh frequency,UHF)測量[6]信號中提取出類別特征集以便于分類,常用的特征量提取方法有分形特征法[7-8]、統計特征法[9-10]和矩陣特征法[11-12]等。但是,特征提取所得到的高維數據不僅增加分類器的計算量,更會引起識別率的下降。目前常用的降維方法是主成分分析法(principal components analysis,PCA)[13-14],但是該方法基于求得樣本協方差矩陣的特征貢獻率,沒有體現樣本間的類別信息。屬于監督降維的線性判別分析法(linear discriminant analysis,LDA)能夠使樣本空間具有明顯的類別信息,提高模式識別的正確率,在各領域得到了很好的應用[15-16]。
國內外學者對GIS 的PD 模式識別進行了大量研究,其中,BP 神經網絡(back propagation neural networks,BPNN)[13,17]和支持向量機(support vector machine,SVM)的應用比較廣泛[7,14]。但BP網絡在訓練時存在過擬合、容易陷入局部極值以及收斂速度慢等問題。SVM是基于二次規劃求解支撐向量,該方法隨著樣本增加,矩陣階數上升,且相應的運算量和運算時間也急劇攀升。概率神經網絡(probabilistic neural network,PNN)可以從海量樣本中學習出類別特征信息,與其他方法相比,該方法具有收斂速度快且分類能力強等特點,在模式分類領域得到了廣泛應用[12]。由于PNN對訓練樣本的類別信息的要求比較高,所以本文采用LDA數據分析方法,且引入遺傳算法對平滑因子進行優化來提高網絡的收斂速度和識別精度。
本文針對GIS 的PD 模式識別開展如下研究工作:利用GIS 局部放電高壓實驗平臺模擬了5類典型的GIS 設備缺陷模型,采用UHF 獲取局部放電的原始信號參量;采用統計特征法提取出18個統計參量并進行LDA 分析,對統計參量進行降維處理得到新的特征參量;用優化平滑因子后的概率神經網絡作為PD 類型識別器對低維樣本進行模式識別。
Ronald Fisher 于1936 年提出的LDA 分析法是提取特征的有效方法。采用Fisher準則函數對多類樣本數據進行線性判別分析,其目標是通過計算高維特征空間的類內離散度矩陣和類間離散度矩陣,提取出具有類別可分性的低維特征,即新樣本有最大的類間距離和最小的類內距離。

式中:Sb,Sw分別為類間離散度矩陣和類內離散度矩陣;w為待求的最優投影集;ml為各個類內樣本均值;m為樣本空間均值。
構造拉格朗日乘子,將式(1)表示為

概率神經網絡是在徑向基神經網絡的基礎上發展起來的,融合了Parzen 窗概率密度函數估計和Bayes 分類準則,可以實現任意的非線性逼近,收斂于貝葉斯分類最優解。基本思想為:設有d維輸入特征樣本x=[x1,x2,x3,…,xd],對應于C個類別w1,w2,…,wC之一。P(wi)和P(x|wi)分別為類wi的先驗概率和類條件概率密度函數。貝葉斯決策通過最小化風險進行決策,決策規則為

式中:d(x)為決策;P(wi)為類wi的先驗概率;Ni為類別i的訓練樣本數;N為訓練樣本總數。
類條件概率密度函數P(x|wi)采用Parzen 窗非參概率密度函數方法進行估計,且將多元高斯核函數作為窗函數,即P(x|wi)的Parzen 窗估計表示為

式中:Ni為i類的訓練樣本數;xij為該神經元的權向量(同時也是第i類中的第j個訓練樣本);σ為平滑因子,決定了以樣本點為中心的曲線寬度。
PNN 模型由輸入層、模式層、求和層和輸出層組成,結構如圖1所示。

圖1 PNN網絡結構圖Fig.1 PNN network structure diagram
1)輸入層神經元個數與特征樣本x的維數相等,該層接收特征空間樣本并傳遞給網絡模式層。

3)求和層神經元個數與樣本類別數C相同,該層神經元與僅屬于同一類的模式層神經元連接,將模式層中所有同類神經元的輸出累計后取均值:

式中:Ni為訓練樣本類別i的數量。
4)輸出層有C個神經元(對應每個模式類),該層接受求和層輸出的類別條件概率密度函數,采用貝葉斯分類準則,每個神經元的輸出為

對于未知類別的特征樣本x,有r,s(r,s∈{1,2,3,…,C},且r≠s),若存在Or>Os,則判定特征樣本屬于r類。
由概率密度函數可知,平滑因子σ的變化會影響PNN 網絡的性能。取值過小,密度估計會出現過擬合,容易受到噪聲干擾;取值過大,函數逼近平滑,會增加參與計算的模式層神經元,兩者皆會影響分類器的識別效果。
目前常采用經驗法確定平滑因子,但該方法不能完全表述特征樣本的概率特性。遺傳算法可以無需先驗知識進行全局尋優,在模式識別、函數優化、控制和故障診斷等方面得到了廣泛的應用[18-19]。本文選取遺傳算法對PNN分類器的平滑因子進行優化,找到適合對特征樣本識別的平滑因子。
采用樣本特征分布信息設計初始種群來代替傳統的隨機分布初始種群。Parzen 概率的估計值主要是取決于臨近點距離影響,當待測樣本與模式樣本的距離分別為1σ,2σ,3σ時,產生的相應高斯值相差懸殊,能夠直接影響概率估計值。因此σ值的選取要有一定的范圍,可采用下式表示:

式中:pˉav[k]為同類樣本最小距離平均值;g為比例系數,選取為0.9~1.8。
遺傳算法的適應度函數采用誤差函數計算個體的適應度,如下式所示:

式中:E為誤差值;d(xj)為期望輸出;o(xj)為網絡的實際輸出。
綜上,基于遺傳算法優化的概率神經網絡步驟如下:
1)計算特征空間的同類樣本的最小距離平均值集,并利用比例系數在區間內形成初始種群{σ′1,σ′2,σ′3,…,σ′M},M為種群規模;
2)進行種群二進制編碼;
3)執行遺傳算法的選擇、交叉、變異操作,并解碼;
4)評價適應度函數,得到理想平滑因子則進行步驟5),否則轉入2)繼續執行;
5)優化后平滑因子確定PNN 網絡分類器模型。
基于GIS局部放電高壓實驗平臺進行模擬局步放電缺陷類型。實驗平臺示意圖如圖2 所示,試驗變壓器的額定電壓為150 kV,額定容量為15 kV·A,隔離開關動作速度3 s 左右。瓷套用于電氣設備引線的絕緣支撐。試驗腔內設置缺陷類型模型,腔體內含有少量空氣并充以SF6 氣體至0.4 MPa。仿真平臺采用UHF 檢測法,檢測頻段為300~3 000 MHz,用以避開電暈放電等干擾。實驗電路接線示意圖如圖3所示。

圖2 實驗仿真平臺示意圖Fig.2 Schematic diagram of experimental simulation platform

圖3 實驗接線示意圖Fig.3 Schematic diagram of experimental wiring
針對GIS 設備在實際運行中的典型絕緣缺陷類型,設計了如尖端導體放電(T)、分散型顆粒放電(D)、集群型顆粒放電(C)、絕緣子內部放電(I)、懸浮放電(S)等5 種典型的PD 模型,如圖4 所示。

圖4 典型的局部放電模型Fig.4 Typical partial discharge model
模型規格:尖端放電,選取長度l=15 mm、針尖直徑d=0.5 mm 的銅質尖端導體,距離電極7 mm;懸浮電位放電,接地電極上放置厚5 mm 的環氧樹脂材質板,環氧樹脂板上面放置直徑10 mm、高10 mm 的銅質導體;分散性顆粒群放電,選取若干直徑d=0.4 mm、高h=10 mm 的銅質三角錐體,分散于GIS母線導體的絕緣子上;絕緣子表面金屬顆粒群放電,選取若干直徑d=0.4 mm、長高h=10 mm 銅絲,分堆放置于GIS 母線導體的絕緣子上;絕緣子內部缺陷放電,將絕緣子替換成內部有介質缺陷的絕緣材質。
3.2.1 信號采集概述特征參量提取
利用3.1 節實驗平臺進行局部放電實驗,將上述放電模型置于試驗腔內,接高、低壓電極進行實驗,通過UHF 檢測各類缺陷的信號。每種缺陷類型采集3 000 個工頻周期內的局部放電波形。將50 個周期的工頻數據存為1 個樣本,即每類信號含有60個樣本。不同缺陷模型的PD 放電次數m,放電相位φ,放電電荷量q等統計參數有明顯的差異,各缺陷類型的UHF 二維圖譜如圖5~圖9所示。
由圖5~圖9 可知,T 類放電缺陷在負半周有較高的放電量,D 類缺陷在正負半周的峰值處的放電次數比較多且正半周的峰值處存在離散樣本,C 類缺陷放電主要發生在正負半周的峰值之前且相應的放電量比較多,I 類缺陷在正負半周存在較少的放電量,S 類缺陷的放電分布比較分散且放電量表現比較平穩。

圖5 尖端導體放電相位分布圖譜Fig.5 Discharge phase distribution of tip conductor defect type

圖6 分散型顆粒放電相位分布圖譜Fig.6 Discharge phase distribution of dispersed particles defect type

圖7 集群型顆粒放電相位分布圖譜Fig.7 Discharge phase distribution of clustered particles defect type

圖8 懸浮放電相位分布圖譜Fig.8 Discharge phase distribution of suspension defect type

圖9 絕緣內部放電相位分布圖譜Fig.9 Discharge phase distribution of insulation internal defect type
依據各類缺陷的二維圖譜,分別提取能夠描述局部放電特性的統計算子,包含偏斜度SK,陡峭度Ku,放電量因數Q,互相關系數CC,峰值不對稱度P等共18個統計參量,如表1所示。

表1 統計算子表Tab.1 Table of statistical parameters
3.2.2 統計參量的線性判別分析
以偏斜度的6 個參量為例進行LDA 數據分析,求解Fisher 準則函數矩陣的特征值及其主導向量。對求得特征值的貢獻率和累計貢獻率(如表2所示)進行分析,選擇較大特征值的特征向量作為主要向量用以確定轉換矩陣。

表2 特征值及其貢獻率Tab.2 Characteristic values and their contribution rates
如表2 所示,從第3 個特征值之后貢獻率已經很小,累計貢獻率波動不大。因此,提取前3個特征值就能夠代表99.7%的信息,此時將此3 個特征值所對應的特征向量作為最優投影集,經過最優投影后將原始的樣本空間的維數降低,這樣就能夠將偏斜度參量從6 維空間降為3 維。同樣對整個統計參量空間進行LDA 數據分析,對特征空間的18個參量進行分析,提取貢獻率高且累計貢獻率在99.8%的前6個特征值,得到對應的6個特征向量并建立轉換矩陣,進行最優投影后將原始特征空間的18維數據降為6維的樣本空間。
輸入向量的選擇:本次GIS 局部放電實驗是采用表征圖譜特性的特征參數(偏斜度、陡峭度、放電量因數等18 個特征量)經過LDA 方法降維后的6維樣本空間作為網絡的輸入特征量。采用標準化后的特征量作為輸入向量,以消除量綱的影響。
輸出向量的選擇:PNN 網絡模式識別的輸出層的設計取決于放電類型數,文中模擬了5 類比較典型的GIS 局部放電類型,因此輸出層為5 個輸出節點且分別對應于模式類別,用于識別局部放電類型。
平滑因子優化:采用遺傳算法進行平滑因子的優化,選取種群規模popsize為10,個體長度chromlength取為5,進化次數maxgeneration為50,交叉概率pcross為0.4,變異概率pmutation為0.2,適應度函數誤差為0.001。經過遺傳算法尋優后,本次實驗的平滑因子確定為0.052。
基于LDA 和GA_PNN 分類器的模式識別方法流程圖如圖10所示,并利用Matlab編程實現:

圖10 模式識別流程圖Fig.10 Flow chart of pattern recognition
1)針對UHF 所檢測得到的各類GIS 局部放電類型的特征,確定各局部放電類型的二維圖譜,并采用統計特征法提取特征參量;
2)引入線性判別分析對特征空間進行降維處理;
3)依據降維后的樣本空間,確定PNN 的輸入向量以及輸出向量;
4)降維后的特征樣本劃分為訓練樣本和測試樣本,并依據訓練樣本確定分類器的結構(各層的神經元個數);
5)采用遺傳算法對PNN 的平滑因子進行優化;
6)將訓練樣本送入GA_PNN 網絡進行模式識別。
4.2.1 各放電類型的模式識別
為驗證所提出的模式識別方法對局部放電模式的識別效果,從每類缺陷類型的樣本集選取30 個測試樣本和30 個訓練樣本,分類進行識別,試驗結果如表3 所示。由表3 中的數據可以看出,基于該方法的模式總體識別率達到96.0%,其中有2 類模式存在少量樣本的誤分類,主要原因是這2類模式的二維圖譜存在少量的離散樣本。

表3 各類模式的識別率Tab.3 Recognition rate of various patterns
4.2.2 不同分類器的識別效果比較
為模擬現實工作中故障的隨機性,本次實驗從經過降維的5 類共300 個樣本中,隨機選取150個訓練樣本和150 個測試樣本,模式識別效果圖如圖11 所示。可以看出,經過訓練后,所選取的150 個測試樣本中,除了少數的絕緣內部放電類型之外,其余類別都能和其實際的類別對應上,識別率達96.7%。

圖11 隨機選取測試樣本的識別結果Fig.11 Recognition results of randomly selected test samples
利用BPNN,SVM,PNN 和GA_PNN 方法對相同的訓練樣本和測試樣本進行GIS 模式識別。BPNN 的隱節點采用試湊法確定,采用監督學習方式進行權值和閾值的訓練,訓練目標為0.000 05;大量實驗表明,SVM 的核函數選用徑向基核函數能夠得到較優的結果,擴展常數為1,因SVM是二分類器,因此采用4 個SVM 分類器拓展成五分類器;PNN 的平滑因子采用經驗法設為0.1。分別將降維前和降維后的特征樣本送入4個分類器進行模式識別,結果如表4和表5所示。

表4 降維前4種識別方法的識別率和識別時間Tab.4 Recognition rate and recognition time of four recognition methods before dimension reduction
由表4 和表5 可知,相比較于降維前的樣本數據,各識別方法在處理降維后的特征樣本時具有更短的識別時間和更高的識別率。這是因為降維方法提供的低維樣本空間便于縮短識別時間,且LDA 降維后的樣本空間具有明顯的類間信息,能夠提高識別率。

表5 降維后4種識別方法的識別率和識別時間Tab.5 Recognition rate and recognition time of four recognition methods after dimension reduction
由表5 可知,GA_PNN 與PNN 的識別速度快并且相差不多,SVM 的速度次之,BP 網絡則需要更多時間。這是由于PNN 網絡無需反復訓練,SVM 需要求得支撐向量,建立分類超平面,BP 網絡則需要多次迭代以更新權值和閾值,且極易陷入局部最優而表現出較差的識別率和識別時間。SVM 和PNN 識別效果相差不大,識別率能夠達到88%左右,而經過遺傳算法優化平滑因子的PNN方法的識別率能夠達到96%,且擁有最短的識別時間。
對于GIS 局部放電信號的特性,提出了采用LDA 數據分析方法并結合改進的概率神經網絡進行局部放電模式識別。基于GIS 高壓實驗平臺,模擬了5 類典型的GIS 局部放電模式,并采用線性判別分析法對超高頻信號的統計特征參量進行降維處理,結合GA_PNN 的識別方法進行局部放電模式識別,并與目前常用的分類方法進行比較,結論如下:
1)對于GIS 局部放電原始信號的特性,采用線性判別分析法對特征空間進行降維處理,得到含有明顯類別信息的低維特征空間,提供給PNN識別模型具有類別信息的訓練樣本,能夠有效提高識別率。
2)采用遺傳算法對PNN 的平滑因子進行優化,得到適合PD 模式分類的平滑因子,相對于常用的經驗法選取的平滑因子而言,優化平滑因子后的PNN 更適合解決GIS 局部放電模式識別問題。
3)采用優化后的PNN 作為模式識別器,分別對降維前和降維后的特征樣本進行局部放電模式識別,相比較于常用的BPNN,SVM,PNN 等識別方法,GA_PNN 方法具有較高的識別精度和較快的識別速度。所提方法并不局限于解決GIS設備的局部放電問題,亦適用于其他電氣設備的局部放電問題。
4)采用常見的高斯窗函數作為概率密度函數。依據實際問題,選擇最佳的窗函數,能夠直接影響GIS 局部放電模式的識別結果,該部分研究仍需進一步展開。