張英,徐龍舞,*,王明偉,劉喆,張倩,潘云
(1.貴州電網有限責任公司電力科學研究院,貴州 貴陽 550002;2.貴州大學,貴州 貴陽 550025;3.貴州電網有限責任公司凱里供電局,貴州 凱里 556000)
油浸式變壓器在電力系統中擔任著重要的輸配電功能,其安全穩定運行關乎著電力系統的安全穩定。然而,系統中運行的變壓器難免存在各種潛伏性故障,主要分為過熱故障及放電故障[1-2]。油浸式變壓器在過熱及放電下,變壓器油及變壓器內部絕緣物質發生分解,釋放出表征設備運行狀況的特征氣體。針對變壓器故障狀態不同,其特征氣體的產氣速率、組分以及含量信息也有區別,研究其氣體信息可實現變壓器的故障診斷。然而,從大量油中溶解氣體組分(DGA)數據分析可知,特征氣體信息與變壓器故障類型,故障程度間為復雜的關聯關系,從而給基于變壓器油中溶解氣體的變壓器故障判斷工作帶來了困難,本文將對經典方法、智能算法等進行簡要分析,從而為DGA數據分析方向提供一些建議。
利用變壓器油中溶解氣體分析變壓器故障的工作起始于19世紀60年代,隨著大量研究的開展,變壓器油中溶解氣體分析變壓器故障的工作取得了一系列的成效。國際電工委員會在熱力動力學基礎及大量的實踐基礎上,相繼推薦IEC三比值法和改良三比值法分析充油變壓器內部故障;德國發展的四比值法較三比值法而言,加入了C2H6與CH4氣體組分的比值,四比值法對過熱類的鐵芯接地故障判斷最有效;我國推薦的三比值法是基于我國的研究經驗以及IEC標準所制定。在實踐中,這些方法的可行性都被有力地證實[3];然而在實踐中,該方法存在一定缺陷,三比值法存在編碼不足問題,使得超出編碼邊界的故障無法判斷,從而影響其判斷的準確性[4]。基于智能算法的變壓器故障診斷研究應需而生。
19世紀90年代以來,為克服傳統方法的缺陷,以新方法新思路解決問題。典型的方法有專家系統[5],模糊理論[6],機器學習[7]等。
專家系統模擬了專家基于自身知識進行推理的過程,國外應用專家系統大多只針對色譜分析數據的單項診斷,而我國的專家系統充分整合了變壓器的色譜分析數據以及預防性試驗所得的歷史性數據。知識庫和推理機是專家系統的主要部分。知識庫獲取是專家系統中的重點難點問題,研究者在該方面做了大量研究,常規表示知識的方式有產生式規則、框架式表示方法、面向對象的表示方法等。此外,知識庫的模塊化形式設計有利于整合變壓器內外部的特征,嵌入其他故障診斷方法,建立多指標判斷方法[8]。而推理機則基于豐富的知識庫信息進行正向或方向鏈推理。
由于變壓器故障原因與故障現象之間的映射關系復雜,各故障原因之間又存在模糊不確定性,而傳統的三比值法采用的比值區間過于絕對,導致使用三比值等傳統方法診斷時,對處于區間邊界的數據易發生誤判。利用模糊理論對變壓器油中溶解氣體數據進行模糊化處理,將故障現象作為模糊輸入,故障原因作為模糊輸出,建立變壓器故障診斷模糊系統,能夠有效提高診斷效果。
正是由于故障現象與故障原因之間的不確定性,模糊理論作為解決不確定性問題的有力工具,可用于變壓器的故障診斷。文獻[9]利用模糊理論處理了DGA,電氣試驗及絕緣油特性試驗組成的多源參數,但在隸屬度的選擇存在主觀性,導致實現結果存在一定局限。在模糊理論中,隸屬函數的選擇直接影響著模糊模型的準確度,而隸屬度的選擇仍是困擾研究者的關鍵問題。近年來,研究者在這方面也做了大量工作,然而所選擇的隸屬函數都存在一定的局限。因此,隸屬函數的選擇將仍然是近幾年的研究熱點之一。
隨著人工智能的興起,機器學習在故障診斷,行為預測,智能識別等領域發揮著巨大的作用。機器學習在變壓器故障診斷中的應用較早,且占據了一定比重。機器學習按照監督方式可分為監督學習,無監督學習,半監督學習。傳統采用監督學習機制診斷變壓器故障的有神經網絡,決策樹,支持向量機等,無監督學習有聚類和主成分分析(PCA),以及半監督學習有協同學習(Co-Training),三訓練算法(Tri-Training)。
早些年的機器學習模型診斷變壓器故障研究雖然較多,但未取得突破性進展。關鍵原因在于機器學習模型對訓練樣本集的數據,網絡結構以及訓練方案有著嚴格要求[10-11]。而早些年研究者又未對數據,網絡結構以及訓練方法進行充分的探討。近年來,數據處理,智能優化計算,以及機器學習等技術的迅猛發展,使得研究者開始在數據、結構、訓練方法上做大量的研究。
2.3.1 集成學習與深度學習
近年來,機器學習迅猛發展,更多的機器學習模型:極限學習機[12]、雙向長短時記憶(Bi-LSTM)網絡[13]、集成學習、深度學習等應用于變壓器故障診斷中。其中,集成學習和深度學習由于獨到的優勢成為近幾年來廣受研究的熱點模型。集成學習[14-15]由于組合了多種學習器的結果而獲得比個體學習器更優的性能;深度學習模型在傳統的淺層網絡上改進,它模擬人腦的深層結構,對故障信息逐層抽象,逐次迭代,深度挖掘故障的潛在規則。分類回歸樹CART為基分類器的XGBoost模型在損失函數中增加正則化項,提高了模型的泛化能力。此外,為克服交叉驗證以及網格搜索參數尋優等傳統優化方法的缺點,使用GA遺傳算法訓練模型參數。深度學習最具代表的模型有卷積神經網絡(CNN)[16],深度信念網絡(DBN)[17],堆疊自編碼器(SAE)[18-19]等。卷積神經網絡由于加入了卷積層而實現了高層次特征提取。卷積操作實質是對原始特征的轉換,從低層次的特征經卷積操作后不斷獲得高層次的特征,通過訓練得到的卷積神經網絡內部蘊含了反應故障的高層次特征。
2.3.2 樣本集數據的處理
作為診斷模型的輸入量,特征量的性質決定性地影響著診斷模型的精度。早些年的研究未取得突破性的進展,關鍵原因之一在于未考慮模型輸入數據中存在的冗余信息,輸入信息與模型的匹配度,以及DGA數據作為單一指標數據的局限性等。近年來,研究者在樣本數據問題的研究上取得了一系列進展。文獻[20]利用數據處理工具,挑選出與故障類型最相關的輸入變量。文獻[21]對特征氣體進行關聯分析,在原始的DGA數據中得到一組新的特征量,基于此特征量能有效提高變壓器的故障診斷率。文獻[22]針對變壓器不同故障類別發生概率不平衡及不同故障識別效果迥然不同等問題,利用層次分類和集成學習建立了一種多級層次變壓器故障診斷模型。文獻[23]以及文獻[24]將DGA與電氣試驗數據等多信息融合作為診斷模型的樣本數據,解決了DGA單指標難以完整表達故障信息的問題。
2.3.3 智能優化算法與診斷算法融合
診斷模型的訓練問題是非線性函數求最優解解問題,訓練方法的好壞直接影響著網絡模型的診斷速度和精度。由于傳統訓練方法存在的固有缺陷,近年來,研究者們開始將智能計算方法引入到模型的訓練中,力求獲得用時少,占用內存少,精度高的智能診斷模型。GA、ACS-SA、帝國殖民競爭算法等進化計算和粒子群算法(PSO)、蝙蝠算法、天牛須算法等群智能算法[25-29]被廣泛用于訓練模型中,表1給出了智能優化算法與診斷算法融合建立的模型案例。

表1 智能優化算法與診斷算法融合案例Tab.1 Fusion case of intelligent optimization algorithm and diagnosis algorithm
這些智能優化算法雖能在一定程度上改進模型,然而,其模型在診斷速度以及準確率上仍未取得重大突破,需要進一步研究。
本文在綜述了相關智能算法在變壓器故障診斷的基礎上,應用決策樹算法對變壓器的故障進行了預測工作。
決策樹是一種典型的監督學習方式,結構呈樹狀。決策時,從根結點出發依次遞歸到中間結點,葉子節點。根結點和中間結點為每個屬性的測試,決策樹分支表示測試的輸出,葉子結點表示最終的測試類別。
對于給定的屬性集合,可以訓練出的決策樹模型數量可以達到指數級別,其中的模型準確率不盡相同,如何建立出分類性能優越的決策樹模型是關鍵問題,解決此問題的關鍵在于如何分裂訓練數據以及如何結束樹的分裂行為。
3.2.1 選擇屬性測試條件
決策樹的好壞以劃分前后的類分布定義,劃分后的結點不純度的高低反映了類分布的傾斜程度。Gini指標是衡量劃分后的子女結點不純度的度量方式之一。
(1)
其中,c為記錄的類別,p表示某一類別占據總記錄的比重。
Gini值越低反應劃分后的子女結點純度越高。Gini的取值范圍在0到1之間。
進一步,增益G反映了劃分前后的決策樹效果。增益Z的定義為:
(2)
其中,Gini(parent)是給定父節點下的Gini不純度度量,N為父節點上的記錄總數,N(vj)為與子女結點vj相關聯的記錄數。Gini(parent)為定值,因此獲得最佳決策樹的劃分方法等價于最小化子女結點的Gini加權平均值。
3.2.2 決策樹剪枝
選取何種策略結束決策樹的劃分是關鍵問題之一。欠生長的決策樹難以形成較為完備的分類規則,分類準確率欠佳;過分生長的決策樹雖在訓練樣本上具有較低的分類誤差,但同時會面臨著過擬合的風險。先剪枝和后剪枝是終止決策樹增長的主要策略。先剪枝是在完全擬合全部訓練數據的決策樹之前停止決策樹的進一步增長。而后剪枝是預先讓樹充分增長,直到完全擬合訓練數據,再通過自下而上地剔除子樹。后剪枝是在完全生長的決策樹上進行的剪枝操作,因此可避免先剪枝過早地停止樹的增長的缺陷。
3.3.1 實驗設計
本實驗選取IEC TC10故障數據,共118條數據,包含低能放電,高能放電、中低溫過熱、高溫過熱以及正常數據。選取其中93條數據作為訓練數據,25條數據用于測試,訓練數據和測試數據的具體分布如表2。

表2 訓練數據、測試數據分布Tab.2 Distribution of training data and test data
1)特征量選擇
本文使用三比值法提供的三對比值乙炔含量與乙烯含量之比(C2H2/C2H4)、甲烷含量與氫氣含量比(CH4/H2)以及乙烯含量與乙烯含量比(C2H4/C2H6)作為特征量。
2)建立基于決策樹的變壓器故障診斷模型
將93條訓練數據訓練生成完全生長的決策樹,再利用后剪枝對決策樹進行修剪。
3.3.2 結果分析
利用93條訓練數據訓練出來的完全生長的決策樹以及修剪后的決策樹分別如圖1、2所示。

圖1 完全生長的決策樹Fig.1 Fully grown decision tree

圖2 剪枝后的決策樹Fig.2 Decision tree after pruning
訓練及經過后剪枝處理的決策樹模型預測結果如圖3所示。

圖3 基于DGA數據的變壓器故障診斷決策樹Fig.3 Transformer fault diagnosis decision tree based on DGA data
在25條測試數據中,8條數據預測錯誤,其中低能放電共5條數據,預測成功3條;高能放電數據10條預測成功8條;中低溫過熱數據3條成功預測1條;高溫過熱3條數據成功預測2條;正常數據共4條成功預測3條,該模型的準確率在68%。提供的三比值法預測結果(準確率60%)相比提高了8%。
從數據的分析可知,本文提出的基于決策樹的變壓器故障診斷相比三比值法而言,預測故障準確率有一定程度的提高,是一種積極有效的診斷方法,但準確率仍有較大的提升空間。本文在通過綜述智能算法在變壓器故障診斷上的應用研究以及該決策樹算法預測驗證的基礎上,對進一步提高各種基于DGA數據的變壓器故障診斷提出相關建議。
未來應充分借助數據挖掘技術等數據處理技術處理數據缺失,數據不平衡,數據冗余,數據含噪等問題,并深入挖掘數據的潛在價值。卷積神經網絡應考慮如何最大效率地發揮卷積操作的價值,提取有用的特征。此外,未來還應將DGA數據,電氣試驗數據等多指標信息整合,實現數據深度融合應用于變壓器故障診斷。在應用多指標信息診斷時,結合變壓器故障案例,充分考慮不同指標對故障診斷的權重問題。
模型的結構對診斷的效果有著直接影響:(1)深度學習應充分考慮模型深度,模型參數等信息。(2)集成學習除選擇同類基分類器外,還應組合不同基分類器,充分綜合各模型的優點。(3)結合各智能算法的優勢。專家系統,模糊理論,神經網絡,智能優化計算等多種智能方法應相輔相成,揚長避短,從而發展出性能優越的模型。(4)模型的選擇和訓練方法應當考慮數據的特點。將數據的不平衡,數據冗余等問題采用合適的模型及訓練方法來解決,將更有利于提高DGA診斷變壓器故障的準確率,指導生產運行。