



摘要:近幾年,對于變壓器故障診斷的研究逐漸增加,提高其診斷準確率具有明確的價值。以往常用的診斷方法雖然具有一定準確率,但效率較低,缺乏時效性。隨著對于機器學習的相關研究不斷深入,其在變壓器故障診斷中的應用逐漸被發現?;跈C器學習,分別在K鄰近(K-NearestNeighbors,KNN)算法、決策樹(DecisionTree,DT)算法、支持向量機(SupportVectorMachine,SVM)算法3方面搭建了診斷模型,并進行了縱橫交叉優化(CrisscrossOptimization,CSO)算法的超參數優化模型搭建。最后,經過仿真實驗驗證可知,經CSO優化后,3種診斷模型的準確率和平均診斷時間均得到了有效提高。
關鍵詞:機器學習變壓器故障診斷優化模型
ResearchonTtransformerFaultDiagnosisMethodBasedonMultipleMachineLearningAlgorithms
CHENGRongsen
XinyangAgricultureandForestryUniversity,Xinyang,He’nanProvince,464000China
Abstract:Inrecentyears,researchontransformerfaultdiagnosishasgraduallyincreased,andimprovingitsdiagnosticaccuracyhasclearvalue.Thecommonlyuseddiagnosticmethodsinthepasthaveacertainaccuracy,buttheirefficiencyislowandlacktimeliness.Withthecontinuousdeepeningofresearchonmachinelearning,itsapplicationintransformerfaultdiagnosisisgraduallybeingdiscovered.Thisarticlebuildsdiagnosticmodelsbasedonmachinelearninginthreeaspects:theK-NearestNeighbors(KNN)algorithm,theDecisionTree(DT)algorithm,andtheSupportVectorMachine(SVM)algorithm,andconstructsahyperparameteroptimizationmodelbyusingtheCrisscrossOptimization(CSO)algorithm.Finally,itwasverifiedthroughsimulationexperimentsthattheaccuracyandaveragediagnostictimeofthethreediagnosticmodelswereeffectivelyimprovedafterCSOoptimization.
KeyWords:Machinelearning;Transformer;Faultdiagnosis;Optimizationmodel
目前來說,變壓器故障診斷方法主要有三比值法、三查法、特征氣體法等,但也存在故障診斷效率不高、診斷實時性不強等問題。機器學習被認為是目前實現人工智能最為可行的方法,將其應用于變壓器故障診斷中,對于加強變壓器故障診斷準確率有著極為重要的現實意義。
1變壓器故障類型
1.1變壓器熱性故障
變壓器熱性故障是由溫度異常升高引起的故障類型,通常是由絕緣材料老化、過載運行或冷卻系統失效等原因導致。按照過熱位置溫度,可將變壓器熱性故障分成3種類型,如表1所示。
1.1.1低溫過熱
低溫過熱通常發生在過熱位置溫度不超過500℃(t≤500℃)的情況下,此類故障多由絕緣油老化、輕微過載或冷卻系統部分失效引起[1]。低溫過熱雖然不會立即導致變壓器的嚴重損壞,但長期運行可能加速絕緣材料的老化,影響變壓器的使用壽命。對于低溫過熱故障的診斷,常用的技術包括油中溶解氣體分析和局部放電檢測。
1.1.2中溫過熱
中溫過熱發生在過熱位置溫度大于500℃且小于等于800℃的情況下(500℃<t≤800℃),通常由較嚴重的過載運行、絕緣材料老化程度較高或冷卻系統效率顯著下降引起。
1.1.3高溫過熱
高溫過熱是指過熱位置溫度超過800℃(t>800℃)的情況,這種故障通常由嚴重的過載運行、大面積絕緣損壞或冷卻系統完全失效引起。高溫過熱會導致絕緣材料快速分解,可能引發嚴重的電氣故障甚至火災。
1.2變壓器電性故障
變壓器電性故障主要是在高電壓作用下,絕緣材料在劣化情況下發生的擊穿放電現象。從化學機理的角度來看,變壓器的電性故障與熱故障的機理基本相同,都是由于化學鍵的斷裂和重新結合所導致。然而,電性故障和熱故障在能量形式和表現特征上存在顯著差異。具體來說,在電性故障過程中,高電壓導致的電場作用會使絕緣材料中的分子鍵發生斷裂,形成自由基和離子,這些帶電粒子在電場作用下迅速運動并引發進一步的分解反應,最終導致絕緣材料的擊穿和放電。而在熱故障過程中,主要是由于過高的溫度引起絕緣材料的熱分解,導致分子結構的變化和劣化。
在不同類型的故障情況下,變壓器產生的典型故障特征成分和速率也會有所不同。在不同故障類型下,故障氣體的相對含量和生成規律也有所不同,這為變壓器故障診斷提供了重要的依據[2]。根據放電故障強度,將變壓器電性故障分為以下3類,如表2所示。
2基于機器學習的變壓器故障診斷方法
無論是熱故障還是其他常見故障,傳統的診斷方法在變壓器故障檢測中往往存在準確率低和實時性差的問題。針對這一情況,本文提出了基于機器學習的變壓器故障診斷方法,研究了K近鄰(K-NearestNeighbors,KNN)算法、決策樹(DecisionTree,DT)算法和支持向量機(SupportVectorMachine,SVM)算法3種機器學習算法在變壓器故障診斷中的應用,以提高變壓器故障診斷的準確性和實時性。
2.1K近鄰算法
KNN算法是一種簡單且直觀的監督學習算法,被廣泛用于分類和回歸任務。其基本原理是通過計算待分類樣本與訓練集中所有樣本的距離,選擇距離最近的K個樣本(鄰居),然后根據這些鄰居的類別或數值進行預測。KNN算法具有無需訓練過程、實現簡單、效果直觀的優點,但在面對高維數據或樣本量較大時,計算復雜度和存儲需求較高。為了提高效率,常使用KD樹、球樹等數據結構進行優化。
在本文中,在m個特征向量的特征矩陣可設為:
其中n維特征向量為:
對應m個樣本的標簽為:
而對于樣本點之間的距離可采取Minkowskidistance定義,則二者間的距離定義為
式中:a表示為該算法的超參數,a≥1。如果a數值處于2時,則確定歐式距離,即:
由于KNN算法在計算各特征間的距離時需要保持相同的權重,所以,為了保證每個特征的計算距離一致,必須對每個特征進行歸一化處理,以消除數據的量綱差異。
2.2決策樹算法
DT算法是一種常用的監督學習算法,適用于分類和回歸任務。它通過構建樹狀模型來進行決策,使數據可以被逐層細化并歸類。DT的每個節點代表一個特征或屬性,每個分支代表該特征的一個可能值,葉節點則代表最終的預測結果或類別。DT的構建過程涉及選擇最優特征進行數據分割,以最大程度地減少數據的不純度。
DT的優點包括易于理解和解釋、不需要數據歸一化、能夠處理多類別數據及在處理大型數據集時的高效性。然而,DT也存在一些缺點,如容易過擬合、對數據噪聲敏感及在數據維度較高時表現較差。因此,為了克服以上缺點,本次使用剪枝技術來簡化樹結構。
2.3支持向量機算法
SVM算法是一種經典的二分類機器學習算法,其核心思想是尋找一個最優超平面作為決策邊界,使決策邊界與兩類最近的樣本點之間的距離最大化,從而提高模型的泛化能力。距離決策邊界最近的這些樣本點被稱為支持向量,各樣本點到決策超平面的距離表示為d[3]。則,假設樣本點線性可分,如圖1所示。
使用n維空間中的距離計算公式,將圖1中支持向量的樣本點x到決策超平面的距離表示為
式中,為權重w的膜,b為超平面截距,可定義為
按照這一定義,可以將圖1中決策邊界上方的樣本點標記為y=1,下方的樣本點標記為y=-1,因此,所有樣本點xi與決策邊界的距離必然大于d,簡化后,可得到。綜上,結合SVM算法核心思想,列出以下有條件最優化問題:
在結合上述優化目標函數的基礎上,SVM算法的首要任務是確保決策超平面可以完全區分兩類特征樣本,然而,這樣會限制模型的泛化能力。為了解決這一問題,以及處理數據樣本的線性可分性,可以通過求解拉格朗日對偶問題來優化目標函數,轉化為以下形式:
優化后,公式大大增加了數據點線性可分概率。在SVM算法中,常用函數包括有限性核函數、多項式核函數與高斯核函數。在使用高斯核函數時,y與C作為模型超參數,可使用智能優化算法解決。
3仿真結果分析
通過利用CSO算法對這3種機器學習算法的超參數進行優化,并通過仿真實驗驗證了這些優化模型的有效性[4]。在使用CSO算法對原模型進行優化前,可借助實例化模型將訓練數據集平均劃分為5份,計算這5份驗證集的平均誤差,并輪流使用,得到的差異值與實驗數值作為實驗度函數。在仿真實驗中,分別建立了KNN算法、DT算法、SVM算法變壓器故障診斷模型,并與傳統三比值法的診斷準確率進行對比,得到F1分數對比,如表3所示。
由表3可知,基于機器學習的3種模型在故障診斷準確率和F1分數方面明顯優于傳統的三比值法。其中,DT算法模型的診斷準確率最高,比三比值法高出9.53%;在F1分數方面,3種機器學習模型均顯著提升,約提高了30%。這些數據表明,與三比值法相比,基于機器學習的3種模型在不同評價指標下均表現出更優越的故障診斷性能[5]。
4結論
本文基于機器學習算法構建了KNN算法、DT算法和SVM算法3種變壓器故障診斷模型,通過理論研究與仿真實驗,得出以下結論。為了應對傳統變壓器診斷準確率低、實時性差的問題,本文提出了一種基于機器學習的故障診斷模型。仿真實驗表明,這些模型具有較高的診斷精度和快速的診斷速度,能夠有效滿足實際工程需求。此外,針對機器學習算法在特征穩定性和提取能力方面的不足,本文采用CSO算法對3種模型進行了優化,優化后的變壓器故障診斷模型在診斷準確率和F1分數方面均有顯著提升。
參考文獻:
[1]李強,張睿智,范曉丹,等.基于特征氣體和比值準則的RAPO植物油變壓器故障診斷方法[J].高壓電器,2023,59(9):294-303.
[2]劉國柱.基于自注意力機制與1D-CNN的變壓器故障診斷方法[J/OL].重慶工商大學學報(自然科學版),1-8[2024-05-28].http://kns.cnki.net/kcms/detail/50.1155.N.20230726.1802.006.html.
[3]王爽,羅倩,唐波,等.考慮樣本類內不平衡的CHPOA-DBN變壓器故障診斷方法[J].中國電力,2023,56(10):133-144.
[4]萬可力,馬宏忠,崔佳嘉,等.基于Mel-GADF與ConvNeXt-T的變壓器鐵心松動故障診斷方法[J].電力自動化設備,2024,44(3):217-224.
[5]宋輝,苑龍祥,郭雙權.基于數據增強和特征注意力機制的灰狼優化算法-優化殘差神經網絡變壓器故障診斷方法[J].現代電力,2024,41(2):392-400.