祖文超,苑津莎,張衛華
(華北電力大學電子與電氣工程學院,河北保定071003)
變壓器運行狀態關系到電力系統的安全與穩定,所以,及時而準確檢測出變壓器潛伏性故障對變壓器的正常使用具有重要的實際價值[1]。目前,變壓器故障診斷方法很多,如油中溶解氣體分析方法、D-S證據理論推理方法、支持向量機(SVM)的硬判決輸出信息法[2-3],但實際使用中發現它們都具有不確定性,甚至出現誤判以及不可分的情況。因此,為了實現對故障全面而準確的診斷,本文提出了基于SVM與證據理論融合的變壓器故障診斷方法,并利用證據理論對多個SVM的輸出結果進行融合及在DGA數據中進行了驗證。
1.1.1 基本概念
基本概率分配(BPA):設Θ表示X所有可能取值的1個論域集合,所有Θ內各元素間互不相容,則Θ稱為X的識別框架。定義函數m:2Θ∈[0,1]滿足如下條件:

則稱m為框架Θ上的基本概率分配(BPA),稱m(A)為A的基本概率分配值或基本概率賦值。
1.1.2 融合規則
Dempster[4]提 出 的 直 交 和 證 據 合 成 公 式(Dempster’s Rule of Combination)為

式中:mi(i=1,2,…n)為問題的n個證據對應的基本信任分配函數;m⊕(A)為集成的基本信任分配;系數K為沖突系數。
標準的SVM的判決輸出屬于硬判決輸出,這將導致在利用多個SVM分類器進行數據融合時主要依賴于投票法。關于SVM的概率輸出,已有很多學者對其展開了研究,目前普遍接受并采用的方法由Platt[5]提出,即用 sigmoid 函數作為連接函數把SVM的輸出f(x)映射到[0,1]來實現SVM的后驗概率輸出,其后驗概率輸出形式為

式中參數A、B可以通過下式得出:為樣本的類別標簽。

Platt提出的方法是把SVM的輸出結果映射到區間[0,1],無法保證映射后結果與SVM后驗概率近似。D-S證據理論在滿足比概率論弱的公理條件下可以處理不確定信息,不需要精確的概率值,符合SVM的不精確概率輸出的后續數據處理。
對于樣本點x,SVM的輸出為f(x*),設點x所對應的幾何間隔為Y(x),得到

因此,|f(x)|反映了點x經非線性映射F的像φ(x)(核函數)至高維隱空間的最優分類超平面的相對代數距離。從證據理論角度來講,它反映了對類別的相對支持信息,在此基礎上對D-S證據理論識別框架Θ進行基本概率分配。
在D-S證據理論應用中,對基本概率賦值函數BPA的賦值沒有統一的標準,需要根據實際情況來獲取。然而,BPA的賦值方法是否合適,直接影響到融合決策結果的有效性和準確性。本文結合“一對多”策略多分類支持向量機提出一種基本概率賦值方法,由此建立了證據理論的多分類SVM。
信息融合的實質是在同一識別框架下將各個獨立的證據體合成為一個新的證據體的過程,其中合并規則通過D-S證據理論來實現,這樣可以較好地處理多信息融合中的不確定性問題。對于SVM的輸出結果進行合并,需要根據上述方法把SVM輸出結果進行軟輸出處理,以便構造基本概率分配函數。由于在D-S證據理論中沒有給出基本概率分配函數的一般形式,所以應根據具體問題構造合適的形式。在SVM應用在變壓器故障診斷中,基本概率分配函數[6]構造形式為

式中:ri為分類精度為SVM的概率輸出。
對于SVM的分類準確率r,那么1-r就是SVM分類器不能確定輸入實例屬于某一類的概率,即分類錯誤率1-r和D-S證據理論中不確定信息相吻合。可以將它看作SVM在融合決策中的不確定信息。所以,在基本概率分配中,1-r賦值給識別框架是合理的,然后依據融合規則[5]進行融合,得到識別框架中每個焦元BPA。在對融合后的結果進行最終的決策時,由于焦元中的非單元素集合不能給出明確決策,考慮單元素集,即采用最大信任決策值[7]來判定最終實例所屬的類別,即

變壓器故障診斷的識別框架為{正常,低溫過熱,中溫過熱,高溫過熱,局部放電,低能放電,電弧放電},相應 SVM 模型為{svm1,svm2,svm3,svm4,svm5,svm6,svm7},則相應設置了7個二類的SVM,其中mi(Ai)就是識別框架對Ai的BPA,mi(Ai)就是識別框架中A之外所有類別的BPA,也可表示為mi({A1…Ai-1})。svm的信息融合系統框圖如圖1所示。
在Visual Studio2008環境結合LIBSVM軟件包對DGA數據進行試驗,SVM的輸入為特征氣體的體積分數,選取 5 種氣體(H2、CH4、C2H6、C2H4、C2H2)作為輸入。

圖1 svm的信息融合系統框圖
基于一對多多分類算法進行信息融合,對SVM模型的訓練均采用RBF高斯核函數,懲罰因子C為1 000,選取200條樣本作為訓練樣本,100條用來測試樣本,得到需要的模型。

表1 證據體的基本概率分配
根據文獻[8]中提供的數據:H2=117uL/L,CH4=5.8uL/L,C2H6=15.9uL/L,C2H4=7uL/L,C2H2=12.8uL/L,利用D-S證據理論進行基本概率分配如表1所示。
根據識別框架對每種故障進行證據合成,前2個SVM的融合方法為


然后,逐次合成最終合成結果,得到每種故障的BPA為

依據最大和決策規則,判定該數據對應的故障為電弧放電,給出可信度為0.583 5。
為了評估該診斷方法的性能,分別應用本文方法svm+D-S和傳統svm作對比,選取油氣5條數據,測試結果如下表2所示。
從表2可以發現,本文方法診斷全部正確,診斷精度大大提高,而利用傳統支持向量機判斷很容易誤判以及可能出現不可分現象。當利用D-S合并規則進行合并之后,結果很理想,說明融合后診斷決策的可信度大幅度提高。由于SVM硬判決輸出基于是或否的應判決,包含的信息量很少。采用SVM+D-S方法以概率形式輸出的最終識別結果,可以對識別結果中所包含的不確定性有更清晰的了解。因此,本文方法提高了SVM的識別精度,給出每種故障的可信度,克服了SVM多分類算法對多種故障的不可分性,判斷結果能給用戶很大的信息量,這為變壓器故障診斷提供了一個很好的途徑。
1)支持向量機與信息融合兩者結合應用,能減少多種因素引起的不確定性,提高變壓器診斷率。此方法用于DGA數據中得到了較好的診斷效果。
2)根據D-S證據理論進行故障診斷時需要基本概率分配函數,SVM的軟輸出和D-S證據理論相結合的故障診斷方法提高了診斷精度,證明了該方法在變壓器故障診斷中的有效性。

表2 典型樣本測試診斷結果
[1] Wang Menghui.A novel extension method for transformer fault diagnosis[J].Power Delivery,2003,18(1):164 -169.
[2] 操敦奎.變壓器油中氣體分析診斷與故障檢查[M].北京:中國電力出版社,2005.
[3] 王蓓蓓,郭基偉,謝敬東,等.基于信息融合技術的電力變壓器故障部位診斷[J].高壓電器,2003,39(1):49 -52.
[4] 楊風暴,王肖霞.D-S證據理論的沖突證據合成方法[M].北京:國防工業出版社,2010.
[5] Platt J.Probabilities for Support Vector Machines[C].Advances in Large Margin Classifiers,Massachusetts Avenue:MIT Press,2000.
[6] 李燁,蔡云澤,尹汝潑,等,基于證據理論的多類分類支持向量機集成[J].計算機研究與發展,2008,45(4):571 -578.
[7] 徐翻翻.基于D-S證據理論的模式分類問題的研究[D].哈爾濱:哈爾濱工業大學,2010.
[8] 劉曉津.基于支持向量機和油中溶解氣體分析的變壓器故障診斷[D].天津:天津大學,2007.