張 弛 王廣民 許會博 佘 維 田 釗*
1(鄭州大學軟件學院 河南 鄭州 450001) 2(國網天津市電力公司電力科學研究院 天津 300000) 3(許繼電氣股份有限公司 河南 許昌 461000)
故障診斷的目的是為了更好地描述故障的相關信息,其中故障的原因是故障診斷的重要目標,只有確定故障原因之后才能根據相應的原因排除相關故障,避免出現更多的經濟損失。智能變電站故障診斷的本質就是探索變電站相關設備引發的故障與其原因之間規律性關系的過程[1]。設備的故障與故障原因之間通常會有一定的邏輯關系,因此探尋它們之間的因果相關性對于變電站故障診斷具有積極的意義[2]。當前應用于故障診斷的方法主要有專家系統[3]、粗糙集[4]、模糊集[5]、人工神經網絡[6]和Petri網[7]等,這些算法在各個領域都得到了十分廣泛的應用。
專家系統在變電站故障診斷中起到了舉足輕重的作用,并且也是應用最為成熟的技術之一。文獻[8]針對變電站故障問題,采用專家系統對變電站告警信號進行數據建模,建立一種面向對象的知識庫模型描述故障之間的聯系,實驗證明具有良好的診斷效果。雖然該方法具有高水平的推理和決策能力,被研究者廣泛使用,但其知識庫中的診斷規則仍是以領域技術的專家憑經驗確定和調整為主,缺少自適應及自主學習能力[9]。因此,當變電站相關設備出現故障時,使用專家系統結果就可能會產生較大的誤差。
支持向量機(SVM)由于具有堅實的統計學理論基礎,能夠很好地解決高維數據、非線性特征問題[10]。而這些恰恰與智能變電站故障結構復雜、樣本有限的特征不謀而合[11],所以適合處理變電站故障診斷問題。文獻[12]面對變電站過熱故障問題,建立了基于SVM的設備故障識別模型,利用核函數的高維映射功能,從而尋找最優超平面實現對數據樣本的分類,通過變電站實例驗證了SVM強大的分類功能,達到了較好的分類精度。文獻[13]針對無刷直流電機的故障診斷問題,利用PCA從故障特征值中提取敏感特征,然后利用SVM對特征數據進行分類,實現故障的識別與診斷,該方法在六種典型故障中證實了有效性。但是SVM的性能主要取決于它的核函數及其參數[14],一個優化后的核參數有利于模型整體精度的提高,因此選用一個合適的優化算法來優化核函數參數對于變電站故障診斷尤為重要。
帝國競爭算法(ICA)是一種依托于帝國主義殖民競爭機制,通過帝國間的殖民擴張,從而獲得優化參數的算法[15]。相比于其他優化算法,該算法的優點主要體現在運算時間短、優化效果好等方面。文獻[16]在變壓器故障問題中使用ICA對所建立的基于SVM的變壓器故障診斷模型進行優化,同時利用交叉驗證原理對變壓器進行了故障診斷,通過仿真實驗驗證了其分類準確率優于標準SVM。
主成分分析法(PCA)是一種無監督高維數據降維方法,其通過在降維過程中保留重要的多個分量來實現最大化原數據方差[17],減少了變量的個數,使得結果的解釋性更強。文獻[18]針對220 V變電站故障問題,將PCA應用于貝葉斯網絡,從而簡化故障源,并根據變電站運行模式建立相應的貝葉斯網絡模型,通過對220 V變電站的實例分析,驗證了該方法的可靠性。在變電站故障問題中存在多個影響因素,每一類故障類型和原因對應于一個故障參數,參數之間具有相關性及重疊性,解決變電站故障問題即需要從這些參數中提取出關鍵數據[19]。
綜上所述,本文提出了一種基于PCA和優化參數SVM的智能變電站故障診斷方法。該方法首先利用PCA分析影響因素,從而實現數據降維,然后構建出多分類SVM分類器,并通過ICA進行參數尋優,最后利用優化的SVM分類器對篩選后的樣本數據進行訓練與測試,測試結果得到了理想的效果。
為了實現對智能變電站故障問題的準確診斷,本文提出了一種基于PCA和優化參數SVM的智能變電站故障診斷模型。首先通過對第三代智能變電站設備故障信息進行篩選,挑選出典型故障樣本,將變電站典型故障樣本分為訓練集和測試集,同時進行PCA的降維處理,在不影響模型整體診斷的基礎上,保留盡量多的故障特征。然后根據智能變電站結構復雜的問題,構造了多分類SVM分類器,并選取高斯徑向基(RBF)核函數為本文模型的核函數。接著采用ICA對核函數參數進行優化選取,使用訓練集對SVM分類器進行訓練,生成優化參數后的SVM分類器。模型如圖1所示。

圖1 故障診斷模型
PCA可以將高維度的數據降到低維度,并保留原始數據中一些最重要的特征,同時去除噪聲和部分關聯特征,從而提高數據的處理效率,降低時間成本[20]。智能變電站每一條故障數據都可能由多種故障特征同時引起,然而有一些故障特征與其他故障特征有著重復性,如果都用來進行故障診斷,會造成時間成本的增加,而且對模型整體準確率有著一定的影響,所以需要進行降維處理,在不影響整體診斷的基礎上,保留一些最重要的故障特征。本文使用PCA對智能變電站故障樣本進行降維處理,在PCA應用于智能變電站故障診斷時,一般遵循如下步驟:
假設有m個變電站樣本故障數據,每個數據有n個故障特征,組成矩陣Xmn:
步驟1均值化矩陣Xmn,可以得到:
(1)
步驟2根據均值化后的矩陣X,計算出協方差矩陣C:
(2)
步驟3計算出協方差矩陣C的特征值λi和特征向量ωi。
步驟4選取k個最大的特征值對應的特征向量ω1,ω2,…,ωk,按對應特征值大小從上到下按行組成矩陣Wkn,特征值選擇方法:
(3)
t越大保留的特征值越多,可以根據變電站故障信息復雜程度進行選擇。
步驟5得到降維后的矩陣:
Ykm=WknXmn
(4)
步驟6依次計算所有主成分向量的貢獻率,主成分向量對整體變電站故障信息的貢獻率yi為:
(5)
計算出所有主成分向量的貢獻率與累計貢獻率,按貢獻率大小從大到小進行排序。為了能夠保留更多的故障特征,使得診斷的結果更加準確有效,本文決定最后留下的數據量要達到90%以上。因此,可以根據累計貢獻率達到90%的原則,選擇智能變電站的最佳故障特征。
SVM的核心目標是針對線性可分問題,通過不斷訓練,能夠找到一個最優分類超平面進行分類,是一個典型的二分類問題。
但是,在實際的應用過程中,大部分的問題都是線性不可分問題,不能用線性可分來解決[21]。智能變電站故障診斷屬于線性不可分的多分類問題,標準SVM不足以滿足智能變電站的故障問題,因此需要進行非線性變換。
SVM非線性變換有如下步驟:
步驟1求解以下優化問題:
(6)
s.t.yi[ωTφ(xi)+b]≥1-ξi
ξi≥0,i=1,2,…,l
(7)
式中:Φ為一個非線性映射;ω為SVM超平面的法向量;ξi為松弛變量;參數C為懲罰因子;xi為第i個故障樣本;b為SVM超平面的偏移量;yi是一個類別標簽,取值為{-1,1}。
步驟2構建出拉格朗日函數:
L(ω,b,ξ,α,β)=Φ(ω,ξ)-
(8)
式中:αi、βi為拉格朗日乘子,其中αi>0、βi>0。
步驟3通過拉格朗日函數,可以得到其對偶化形式為:
(9)
(10)
步驟4從而可以得到決策函數為:
(11)
式中:K(x,xi)為核函數,核函數具有處理非線性數據的能力,為了實現SVM的非線性變換,實現智能變電站故障診斷問題的準確診斷,需要選擇一個合適的核函數,并用一個合適的優化算法對核函數參數進行優化。
和所有優化算法相同的是,ICA開始也是隨機生成一些初始解,通過優化所設置的目標函數來篩選出這些初始解中最優解[22]。
整個ICA優化的過程如下:
步驟1在函數上隨機選擇一些點,初始化帝國。
步驟2將殖民地移往相關的帝國主義國家(同化)。
步驟3如果帝國中有一個殖民地的成本比帝國主義低,交換殖民地和帝國主義的位置。
步驟4計算所有帝國的總成本(與帝國主義及其殖民地的力量有關)。
步驟5從最弱的帝國中選出最弱的殖民地,并將其給予最有可能擁有他的帝國(帝國主義競爭)。
步驟6消滅軟弱的帝國。
步驟7如果只有一個帝國,停止算法,如果沒有,轉到步驟2。
大量的實驗結果表明,使用RBF核函數,SVM的分類效果更好[23],因此本文選取RBF核函數作為本文模型的核函數:
(12)
式中:γ稱為模型的關鍵參數。在SVM的訓練過程中,懲罰因子C和核函數γ對模型整體的泛化性能有很大的影響,所以需要調節這兩個參數以改善SVM的泛化性能。本文為了應用ICA進行參數優化,將國家成本函數設置為目標函數。在樣本量不充足的情況下,為了充分利用數據集對模型進行測試,使模型具有較好的泛化效果,減少因樣本量偏少產生的過擬合現象,本文選擇k折交叉驗證(將數據集隨機分為k個包,每次將其中一個包作為測試集,剩下k-1個包作為訓練集進行訓練)后的平均分類準確率來構建目標函數P(C,γ):
(13)

目標函數P的兩個重要參數(C和γ)需要提前設置。目標函數值(目標值)越小,分類精度越好。總而言之,目標函數P的最佳值與ICA中最佳國家的成本相同。當所有的國家都統一到一個最強大的帝國時,這個帝國的總成本將是ICA中最小的值,目標函數同時得到最小值。
在故障分類問題中,基于二叉樹的多分類方法相比其他分類方法具有訓練時間短、沒有不可分區域、需要最少的分類器等優點[24],因此本文研究基于二叉樹的多分類支持向量機。
根據第三代智能變電站設備故障信息,選取了變電站的五種故障,即斷路器滅弧室爆炸、保護動作斷路器拒分、斷路器跳閘、操作機構頻繁打壓、SF6氣體壓力低故障、故障與故障之間沒有必然的因果聯系,而斷路器跳閘又分為斷路器偷跳和控制回路斷線故障,操作機構頻繁打壓分為操作機構油(氣)壓力低閉鎖分合閘故障和液壓機構油泵打壓超時,所以本文以分層二叉樹為基礎進行變電站的故障診斷,分類圖如圖2所示。圖中:a代表正常;b代表斷路器偷跳;c代表控制回路斷線故障;d代表操作機構油(氣)壓力低閉鎖分合閘故障;e代表液壓機構油泵打壓超時;f代表斷路器滅弧室爆炸;g代表保護動作斷路器拒分;h代表SF6氣體壓力低故障。識別步驟如下:

圖2 多分類SVM分類器
步驟1選擇訓練樣本中的正常樣本標記為1,故障樣本標記為-1,利用RBF核函數同時進行ICA參數尋優,生成一層分類器。
步驟2選擇故障樣本,其中斷路器跳閘故障(b,c)標記為1,余下故障標記為-1,利用RBF核函數同時進行ICA參數尋優,生成二層分類器。
步驟3選擇斷路器跳閘故障樣本(b,c),其中斷路器偷跳故障標記為1,控制回路斷線故障標記為-1,利用RBF核函數同時進行ICA參數尋優,生成第一個三層分類器。
步驟4選擇剩下故障樣本(d,e,f,g,h),其中操作機構頻繁打壓故障(d,e)標記為1,剩余故障標記為-1,利用RBF核函數同時進行ICA參數尋優,生成第二個三層分類器。
步驟5選擇操作機構頻繁打壓故障樣本(d,e),其中操作機構油(氣)壓力低閉鎖分合閘故障標記為1,液壓機構油泵打壓超時故障標記為-1,利用RBF核函數同時進行ICA參數尋優,生成第一個四層分類器。
步驟6選擇剩余故障樣本(f,g,h),其中斷路器滅弧室爆炸故障標記為1,其余故障標記為-1,利用RBF核函數同時進行ICA參數尋優,生成第二個四層分類器。
步驟7選擇余下故障樣本(g,h),其中保護動作斷路器拒分故障標記為1,SF6氣體壓力低故障標記為-1,利用RBF核函數同時進行ICA參數尋優,生成五層分類器。
為了對故障實現準確的診斷,需要對本文所提出的多分類支持向量機模型進行多次訓練。通過對第三代智能變電站設備故障信息的篩選,將提取后的數據分為訓練集和測試集,選取RBF核函數,并采用ICA對核函數參數進行優化選取,生成優化分類器。整體的操作步驟如下:
步驟1使用PCA對初始樣本集進行線性變換,利用變換后的累計貢獻率來選擇主成分。通過選取的主成分對線性變換后的樣本集進行降維處理,得到一組新的樣本集。
步驟2集中訓練新樣本,利用新樣本集和參數未知的SVM形成目標函數。
步驟3使用ICA找出目標函數的優化解,確定SVM用于智能變電站故障分類的優化參數,使用優化后的參數建立第一層分類器。
步驟4根據圖2中多分類SVM分類器的順序,將訓練集依次分類,根據步驟3中的方法建立全部分類器,形成故障識別的多分類SVM分類器模型。
步驟5將測試樣本輸入支持向量機模型,計算其預測值。
模型整體流程如圖3所示。

圖3 故障診斷流程
本文采用第三代智能變電站設備故障數據進行分類測試。通過對數據的篩選與整合,本文選取了8類具有代表性的數據共164組,其中訓練樣本120組,測試樣本44組,各種樣本數據的分布如表1所示。

表1 故障數據
所有故障信息的故障特征如表2所示。

表2 故障特征表
對所有故障樣本組成的故障特征組進行PCA主成分分析,根據式(5)依次計算所有主成分向量的貢獻率,結果見表3,所有的故障特征按照貢獻率大小降序排列。

表3 主成分貢獻率
本文根據留下的數據量要達到90%以上的原則篩選故障特征。從表3中可以看出,前11個主成分的累計貢獻率達到了92.253 9%,因此選擇前11個特征作為最佳故障特征。降維后的故障特征與數據類型表如表4所示。

表4 故障特征與數據類型表
使用ICA對模型參數進行優化,參數的設置如下:優化函數的維數設置為2,交叉驗證的折數設置為10,國家個數固定為20,初始帝國數設置為6,進化率設置為0.3,同化系數設置為2,同化系數角設置為0.5,參數C和γ在[10-1,102]和[10-2,102]兩個固定范圍內變化。
圖4展現出了所有的帝國在各個迭代階段的平均代價值與最小代價值。剛開始所有帝國的平均代價值遠遠高于最小代價值,但是在之后的迭代過程中,最小代價與平均代價之間的差距逐漸縮小,到最后差距已經達到最小,此時的平均代價值基本與最小代價值相等。通過帝國競爭算法優化后的模型參數確定為C=65.19,γ=0.467 3。

圖4 ICA參數尋優
利用測試樣本對所訓練的多分類SVM分類器進行測試,表5為測試數據的故障樣本預測情況,未列出的故障全部預測正確。從表5可知,44組測試數據僅有6組測試樣本故障診斷結果出錯。測試數據樣本的故障準確率為86.364%,說明本文方法能夠有效地診斷變電站的故障。每個故障對應的準確率與查全率如表6所示,準確率與查全率能夠進一步表現出模型的精度與準確率。在智能變電站故障診斷情況下,本文更希望漏掉盡量少的故障,所以此時的查全率比較重要。從表6可知,斷路器偷跳(D2)、保護動作斷路器拒分(D7)、SF6氣體壓力低故障(D8)三種故障的查全率為1,說明本文模型更適用于斷路器偷跳、保護動作斷路器拒分、SF6氣體壓力低故障三種故障的診斷。

表5 故障預測情況

續表5

表6 準確率與查全率
根據故障與故障特征之間的邏輯關系,驗證了本文對智能變電站故障診斷的真實有效性。
(1) 斷路器滅弧室爆炸故障邏輯圖如圖5所示。

圖5 斷路器滅弧室爆炸故障
根據表7可知,故障12的故障特征為發生主保護動作(A6),相應斷路器在分位(A1),故障斷路器電流(A2)、電壓(A3)顯示為零,預測故障為斷路器滅弧室爆炸(D6),根據圖5的故障邏輯圖可知,診斷正確。

表7 故障12診斷過程
(2) 保護動作斷路器拒分故障邏輯圖如圖6所示。

圖6 保護動作斷路器拒分故障
根據表8可知,故障14的故障特征為發生主保護動作(A6),斷路器拒分。拒分斷路器在合位(A4),故障斷路器電流(A2)、電壓(A3)顯示為零,預測故障為保護動作斷路器拒分(D7),根據圖6的故障邏輯圖可知,診斷正確。

表8 故障14診斷過程
(3) 斷路器跳閘故障邏輯圖如圖7所示。

圖7 斷路器跳閘故障
根據表9可知,故障3的故障特征為斷路器分位(A1),SF6氣體壓力低告警(A14)預測故障為斷路器偷跳(D2)。

表9 故障3診斷過程
根據表10可知,故障6的故障特征為監控系統發生控制回路斷線告警信號(A7),預測故障為控制回路斷線故障(D3)。

表10 故障6診斷過程
根據圖7的故障邏輯圖可知,故障3與故障6診斷正確。并且斷路器偷跳與控制回路斷線故障兩者發生其一,可引起斷路器跳閘故障。
(4) 操作機構頻繁打壓故障邏輯圖如圖8所示。

圖8 操作機構頻繁打壓故障
根據表11可知,故障9的故障特征為監控系統發出操作機構油(氣)壓力低告警(A10),閉鎖分閘,閉鎖合閘,閉鎖重合閘(A11),控制回路斷線(A7)告警信息,出現壓力低閉鎖信號(A12),預測故障為操作機構油(氣)壓力低閉鎖分合閘故障(D4)。

表11 故障9診斷過程
根據表12可知,故障10的故障特征為監控系統發出油泵打壓超時告警信息(A13),出現壓力低閉鎖信號(A12),預測故障為液壓機構油泵打壓超時(D5)。

表12 故障10診斷過程
根據圖8的故障邏輯圖可知,故障9與故障10診斷正確。并且操作機構油(氣)壓力低閉鎖分合閘故障與液壓機構油泵打壓超時兩者發生其一,可引起操作機構頻繁打壓故障。
(5) SF6氣體壓力低故障邏輯圖如圖9所示。

圖9 SF6氣體壓力低故障
根據表13可知,故障16的故障特征為監控系統發出SF6氣體壓力低告警(A14),壓力低閉鎖信號(A12),壓力低閉鎖同時伴隨控制回路斷線信號(A7),預測故障為SF6氣體壓力低故障(D8),根據圖9的故障邏輯圖可知,診斷正確。

表13 故障16診斷過程
為了驗證本文方法的有效性,將在變電站故障診斷應用中比較常見的BP神經網絡方法與本文的多分類支持向量機方法相比較。
從表14中展現的數據可知,使用多分類支持向量機進行分類準確率為86.364%,BP神經網絡的分類準確率為84.091%,分類準確率能表現出一個模型的精度,說明多分類支持向量機在解決小樣本、多維數問題時具有良好的效果。

表14 故障診斷方法比較(%)
為了進一步驗證本文分類方法對于變電站故障診斷的有效性,采用多分類支持向量機常用的OVO-SVM與本文方法進行分類對比,由表15中展現的實驗數據可知,本文方法在訓練樣本和測試樣本中的準確率都優于OVO-SVM,驗證了其在分類上的準確性和有效性。

表15 分類方法比較(%)
提出了一種基于優化參數支持向量機的智能變電站故障診斷方法。利用主成分分析法提取關鍵特征值,有效地減少了重復變量,降低了數據的復雜性,將降維后的故障數據集在模型中進行訓練,通過帝國競爭算法進行參數尋優。實驗結果表明:(1) 使用PCA進行降維可以顯著減少計算復雜程度;(2) 利用ICA可以進行參數的優化處理,從而對模型整體的準確率有較大的提升;(3) SVM對于小樣本、多類故障識別具有很好的效果。