李成強,許冠芝
(西安工程大學電子信息學院,西安710600)
電力變壓器中的任何故障都可能導致電源意外中斷,同時帶來巨大損失。變壓器早期故障的發現,將降低非計劃停電的成本,提高電力系統的可靠性和運行水平。因此,對其進行故障診斷具有重大意義[1]。電暈、電弧以及過熱是變壓器早期故障的主要原因。這些故障導致變壓器絕緣油分解,形成不同濃度的氣體,有一些技術曾被用于檢測故障氣體,但DGA(Dissolved Gas Analysis, 油中溶解氣體分析法)是國內外公認的有效方式[2-3]。DGA 是根據氣體的濃度來判斷變壓器故障的分析方法,特別是針對變壓器內部的潛伏性故障,DGA 能夠及時發現并得知故障發展的程度[4]。傳統的針對變壓器故障診斷的方法大多是根據導則[5],通過結合特征氣體分析法[6]以及比值法[7]分析變壓器內的絕緣材料和外部環境等作用下發生老化過程中所產生的特征氣體(H2、CH4、C2H6、C2H4、C2H2)的體積分數或比值,進行變壓器故障的診斷和分析。在實際診斷過程中當變壓器發生一個或多個故障時,氣體濃度存在差異且各種氣體之間的關系變得過于復雜,與預先定義的值不匹配。隨著神經網絡[8]、遺傳算法[9]以及模糊理論[10]等理論的提出和發展,人工智能[11]被應用到變壓器故障診斷中。人工神經網絡(ANN)[12]、支持向量機(SVM)[13]等是用于溶解氣體分析的常見方法;在實際運用中取得了一定的效果,但也有不足處。如ANN 方法用于變壓器故障診斷時有訓練速度慢、易陷入局部最優并且在結構復雜和大樣本時,極易出現過度學習或泛化能力低的缺陷。因冗余信息的影響使得SVM 在處理較大數據量訓練時間過長、速度變慢,不適合大樣本,其參數選取很困難[14]也降低了實用性;并且SVM 的診斷輸出為硬分割邊界。粒子群優化算法具有簡單通用、容易實現的特點,并且幾乎不涉及其調整參數,適合求解優化問題,但是對于離散化的優化問題處理不佳,容易陷入局部最優,并且在其進化后期會出現收斂速度慢等,進而發生早熟收斂。基于模糊神經的專家系統因算法本身的局限性,將其應用到變壓器故障診斷中不能準確反應問題。
鑒于混沌運動具有規律性、隨機性、遍歷性等特點,能夠用于解決算法收斂速度慢以及陷入局部極值的問題,針對上述問題,在此提出一種基于混沌粒子群優化核極限學習機的變壓器故障診斷方法,引入CPSO(Chaotic Particle Swarm Optimization,混沌粒子群優化)對KELM(Kernel Extreme Learning Machine,核極限學習機)參數進行優化,將特征氣體參數輸入到優化后的核極限學習機分類模型中實現診斷。在彌補單一算法不足的同時提高變壓器故障的分類能力以及診斷準確率。
ELM 算法是一種單隱藏層前饋型神經網絡,模型可表示為:

其中X 為輸入;f(X)為類別向量輸出結果;h(X)及H為隱藏層特征映射的矩陣;β 為輸出鏈接的權重。計算如下式:

其中,T 為訓練樣本類向量組矩陣,λ 表示正則化系數。
KELM 是新型的單隱藏層前饋型神經網絡算法。對于N 個訓練樣本?= {(Xi,ti)|Xi∈Rd,t i∈Rm,i=1,...,N}(其中Xi為輸入,ti為輸出),核函數KELM 的模型可表示為:

式中,f(X)表示KELM 分類結果輸出;h(X)及H 為隱含層特征映射的矩陣;ω 為輸出層間和隱含層的連接權值;h(X)·h(XN)=K(X,XN)為核函數;ΩKELM=HHT為核矩陣;I 為單位對角矩陣;為正則化系數;T 為期望輸出的矩陣。
徑向基函數(RBF)中只需確定一個參數(s)的特點對優化更有利,所以使用RBF 作為核函數,即:

由于λ 和s 需要事先設定,因此KELM 分類器性能受其影響。
實踐證明,KELM 的分類準確率受正則化系數以及核函數參數s 設置的影響,且分類的準確率極易陷入局部最小值。因此,此處對KELM 的參數通過改進粒子群優化算法進行優化,以得到最優網絡結構模型。
粒子群優化算法(PSO)建立在模擬鳥群社會的基礎上,源于對鳥群捕食行為的研究[15]。粒子在搜索范圍內飛行的過程中會不斷地通過自己以及相鄰粒子的所歷經驗來改變自己的位置,并在所有的位置里找出最佳值。
若粒子群由群體規模為M 的隨機粒子構成,D為群體的維數,令第i 個粒子所處的位置是xi=(xi1,xi2,…,xiN)。優化問題的隨機解之一就是該粒子所處的位置,再由迭代求出最優解。粒子通過跟蹤該粒子的局部最優位置pbest和所有粒子的最優位置gbest,兩個極值來更新自己的位置,得到兩個最優值之后,由如下二式來更新粒子的速度和位置:


式中,k 為當前代數;i=1,2,…,M;d=1,2,…,D;是粒子的速度;pbesti,d表示粒子群的局部最優位置;gbesti,d表示粒子群的全局最優位置,r1、r2是(0,1)中的一個隨機數;表示粒子當前所處的位置。
為改善收斂性,引入慣性權重因子ω 后的粒子群速度,更新公式為:

PSO 對于離散化的優化問題處理不佳,容易陷入局部最優,進化后期收斂的速度和精度都會下降,混沌搜索的引入解決了這一問題。在給定范圍內混沌搜索可以按照其自身規律在每個狀態只遍歷一次的情況下達到所有狀態。能夠避免陷入局部最優的情況。因此將混沌搜索應用于神經網絡的訓練中,能提高收斂速度和收斂性,具有快速和全局收斂性能。同其他隨機算法相比混沌搜索有更高的收斂精度[16]。
此處采用經典的帳篷(Tent)方程構成混沌序列,其數學表達式為:

式中,0≤Zn+1≤1;μ 為控制參量,在μ=1 時,Tent 映射在[0,1]上呈現各狀態歷變以及完全混沌動力學特性。
若粒子群出現停滯陷入局部最優,容易導致PSO 算法早熟。利用災變擺混合粒子群進化停頓,可加快其進化的速度。對于第n 代群體,令fm(n)為其最優適應度,fa(n)為其平均適應度,載氣滿足下式時,算法會出現停頓[17]:

式中,fa(n-n1)表示近期n1代平均進化速率(n >n1)。保留全局搜索的最優粒子,并對其附近的粒子給以混沌擾動[18],使粒子擺脫局部最優,提升算法的全局搜索能力。令混沌的擾動范圍為[-β,β],并將各分量映射到該范圍,擾動量Δx=(Δx1,Δx2,…,ΔxD),則:

此時擾動前、后粒子的位置分別由如下二式所示:

通過計算比較這兩個位置的適應值來確定是否跟新粒子的位置?;煦缌W尤核惴軌虮苊馑惴ê笃诘恼鹗?,提高了收斂性?;煦缌W尤核惴ǖ木唧w思想歸納如下:
一、慣性權重ω
為了平衡算法的局部和全局的搜索能力,既保證其快速收斂又避免陷入局部最優,引入慣性權重,此ω 的值越大越有助于全局尋優,反之有助于局部尋優,即:

式中,ωmin、ωmax的取值范圍為[0.4,0.9]。
二、加速常數c
要使算法的收斂速度得到保證,加速常數調整更新為:

式中,z=1,2;cmin、cmax的取值范圍為[1.5,2]。
三、隨機數
處理隨機數以保證效率,如下式所示:

式中rz的取值范圍為[0,1],z=1,2。
四、早熟處理
針對粒子群算法后期收斂速度較慢、容易陷入局部極值點從而出現早熟的問題,粒子群的適應度與于粒子的位置息息相關,通過粒子群的方差δ2來判斷是否早熟,即:

式中,Fi表示粒子的適應度;Favg表示粒子的平均適應度。
當δ2小于給定值時粒子已經進入早熟,為跳出局部最優,此時需要重新設定粒子速度和位置。圖1為CPSO 與PSO 參數尋優過程中適應度值收斂曲線,從圖中收斂曲線可見,與PSO 相比使用CPSO 可獲得精度較高的解。

圖1 適應度值收斂曲線圖
對正則化系數λ 和核函數參s 數的優化及KELM 最優參數,就是選擇適當的正則化系數和核,通過矩陣運算得到最大的分類準確率。記Acc(λ,s)為KELM 的分類準確率,其最大值記為:maxAcc(λ,s),其中λ∈[0,a] , s∈[0,b]。
此處采用5 折交叉驗證法(5-CV)生成隨機的訓練集、驗證集以及測試集。在避免使用Holdout 驗證泛化性能差的缺點的同時使有限的DGA 數據得以充分利用。記去掉第i 折后的分類模型為f-k(i)(xi);第i 折上分類模型驗證的準確率為d[yi,f-k(i)(xi)],分類準確率平均值就是交叉驗證準確率,即:

基于5-CV 和CPSO 算法結合的KELM 核函數參數優化過程歸納如下:
1)種群初始化,生成粒子群,給各粒子在搜索空間內賦予隨機的位置和速度;
2)用5-CV 方法評估KELM 分類器參數;
3)是否到達終止條件4);
4)更新粒子的位置和速度并回到2);
5)根據最優參數得到最優模型。
通過CPSO 對KELM 的核函數的優化,得到優化后的KELM 分類器。
基于KELM 的變壓器故障診斷模型,是把測試數據輸入到先前所建立的變壓器各故障和與之相應的狀態映射模型中進行分類處理。
給定訓練集,通過結合混沌粒子群算法對核函數參數進行優化,并達到模型的最優分類性能。
通過不同特征氣體含量來反映變壓器的運行狀態,已得到大量理論研究和實踐的證明。在油浸式電力變壓器運行過程中所產生的氣體對其故障診斷極具意義的有H2、CH4、C2H6、C2H4和C2H2。此處以國際電工委員會(IEC)推薦的DGA 數據中的H2、CH4、C2H6、C2H4和C2H2的溶解量作為特征量。DGA 數據分布區間大,并且數據之間有較大差異性,為降低其相互間由于量值差異造成的影響,減少計算的誤差,提高診斷的精度,在將特征量輸入分類器前首先要對特征氣體數據進行歸一化處理。令xnew為進行歸一化處理之后的氣體體積分數;xmin為其對應的最小值;xmax為其對應的最大值,有:

式中,Up、Lo為常數,表示氣體體積分數歸一化的上下限,且Up∈[-1,1] , Lo∈[-1,1]。
KELM 算法的多分類能力正好用來解決變壓器故障診斷這一多分類問題,因此可以用一個分類器來辨識變壓器的低能放電、高能放電、中低溫過熱、高溫過熱以及正常5 種狀態。各狀態編碼如表1。

表1 變壓器狀態編碼
此處采用5-CV 和CPSO 結合對KELM 分類器的參數進行優化,設置粒子群的大小為30,進化的迭代數為50,慣性權重為0.4,加速因子c1、c2都為常數2,其適應度函數為式(19),具體流程如3.2 節所述。
基于CPSO-KELM 算法的壓器油中溶解氣體預測具體實現過程如下:
①對于樣本數據按4:1 分為訓練集和測試集;
②選取樣本數據并按公式(20)做歸一化處理;
③結合粒子的位置以及參數(λ,s),訓練組數據對應用了CPSO、5-CV 結合方法的KELM 進行訓練;
④訓練結束,歸一化處理測試集數據;
⑤由公式(1)得到X 所對應的輸出向量o(X)={on},n=1,2,…,5;
⑥由下式求得o(X)的編碼向量T={tn},n=1,2,…,5:

⑦對照表1 變壓器狀態編碼獲得最終分類結果。
為避免樣本數據選取時數據集不均衡的問題,應使各類樣本數量相近。原始數據中的故障樣本全部采用。選取與DT/L 722-2014《變壓器油中溶解氣體分析和判斷導則》中所給出的氣體注意值相近的樣本作為正常類數據。從公開發表的刊物、資料所確定的變壓器故障的DGA 樣本數據中選取樣本訓練集與樣本測試集共150 組[19-23]樣本數據分別為低能放電、高能放電、中低溫過熱、高溫過熱以及正常共五組,各樣本數量如表2 所示。

表2 各故障選取的樣本數
樣本數據中每一折數量為30,120 組訓練樣本集用于每次的交叉驗證,30 組樣本用于驗證。表3為PSO-KELM 與CPSO-KELM 的診斷結果對比(對訓練集進行5 折交叉驗證),與CPSO-KELM 相比文中所提出的CPSO-KELM 方法訓練、測試時間短且更精度高。

表3 兩種方法的結果對比
為驗證CPSO 優化KELM 故障診斷方法的分類性能,將同樣的故障樣本數據分別用CPSO-KELM、ELM 和SVM 三種不同方法進行對比試驗,對于ELM 采用默認的Sigmoid 函數,隱藏層結點數為100,通過十次實驗。結果列于表4,其中每一個結果均為10 次實驗的平均值,對比曲線如圖2 所示。

表4 三種診斷方法性能對比

圖2 三種診斷方法性能對比
可以看出,同其他兩種方法相比,基于CPSOKELM 的變壓器故障診斷方法需要的訓練時間和測試時間更短,同時還兼有更高的準確率。從圖2 中可以看出,CPSO-KELM 的性能與ELM、SVM 相比也更穩定。
將混沌理論、PSO 與核極限學習機相結合,以CPSO 優化KELM,可有效應用到變壓器故障診斷當中。混沌理論與PSO 進行混合,提高了PSO 的局部能力。將混合后的CPSO 用于對KELM 參數進行尋優的神經網絡訓練中,可使KELM 的網絡結構最優,以此提高了診斷的可靠性。結合實際數據,SVM、ELM 與所提新方法在診斷結果上的不同表現得到直觀的對比。實驗結果表明, 所提出的CPSO 優化KELM 的故障診斷方法具有更好的學習能力和更高的診斷精度。