曾冬洲,鄭宗華
(福州大學電氣工程與自動化學院,福建 福州 350108)
電力變壓器作為電力系統的關鍵樞紐設備,其工作狀態的正常與否直接影響著整個電力系統運行的安全性和可靠性。處于異常狀態的變壓器,會降低電力系統的供電可靠性甚至造成社會經濟損失。因此對變壓器的異常工作狀態及時識別,并進行狀態檢修,能夠在提高設備可靠性的同時,有效規避檢修不足及檢修過度等問題[1]。
傳統的變壓器狀態異常檢測方法主要包括局部放電檢測技術與油中氣體分析(Dissolved Gas Analysis,DGA)技術[2-4]。雖然這兩種技術在變壓器故障診斷方面應用較廣,但是也存在一定的弊端。文獻[5]中采用局部放電檢測技術對疑似異常變壓器開展局部放電檢測時,需要借助工作經驗開展局部放電定位及定量檢測工作,不僅耗時耗力,也不能對變壓器故障進行及時有效的識別,影響設備運行的可靠性。文獻[6]中利用油中氣體分析技術對變壓器異常狀態進行檢測,其缺點在于從局部放電的發生到可檢測到特征氣體往往需要較長的時間,很難捕捉到突發性故障的征跡,實時性比較差。同時,傳統的異常檢測技術主要使用變壓器油分解氣體含量、油色譜和紅紫外線等數據,未能對變壓器在線監測系統中積累的海量電氣監測數據進行有效的利用。
針對傳統變壓器異常檢測方法的不足,本文將變壓器的電壓、電流、功率等在線監測數據作為特征參量,構建一種基于主成分分析和局部離群因子算法的變壓器異常實時檢測模型,并通過具體算例分析驗證該模型對變壓器異常檢測的有效性和可行性。




針對變壓器的電氣參量數據存在特征冗余度高和數據量大導致LOF檢測算法耗時長的問題,本文提出了一種基于主成分分析的LOF檢測算法。首先對原始數據歸一化處理,然后利用主成分分析法對數據集高維特征進行降維,減小后期LOF算法的計算量,提高變壓器狀態異常點的檢測效率,最后計算出所有樣本點的局部離群因子,將離群因子大于設定閾值δ的樣本點歸為異常點。具體算法流程圖如圖1所示。

圖1 基于主成分分析的LOF檢測算法流程圖
本次實驗采用的數據來自某變電站一臺電壓等級為10kV變壓器3個月的電氣監測數據,數據采樣的間隔為15分鐘。變壓器故障數據集共含8640個有效樣本,其中包括102個狀態異常點和8538個狀態正常點,異常點占比僅為1.18%。變壓器監測系統主要監測的電氣參量包括任意時刻變壓器高壓側的三相電壓U1ca、U1ab、U1bc,低壓側的三相電壓U2a、U2b、U2c,有功功率Pa、Pb、Pc,無功功率Qa、Qb、Qc,共計12個電氣參量。
本文在實驗前對數據的預處理工作主要包括:對含有缺失值的樣本采用劃分正常和異常的方法通過各自特征屬性的均值分別進行填充。另外,為了消除各特征屬性間量綱的影響,對所有數據樣本采用零均值標準化的歸一化方法進行處理,歸一化公式如下:

式中,μ和δ分別對應于原始數據的均值和方差。
本實驗的軟件環境為 Windows10_64bit,Python 3.5,Jupyter Notebook 5.6.0。硬件環境為Intel(R)6 Core(TM)i3-3240 3.39GHz CPU,8.0GB 內存。
變壓器的異常檢測本質上是一個分類問題,即將所有樣本分成兩類:異常狀態類和正常狀態類。本次實驗采用表1中的混淆矩陣對檢測結果分別進行描述,其中TP代表變壓器狀態實際為異常,檢測的結果也是異常的樣本數;FP代表變壓器狀態實際為正常,檢測的結果卻是異常的樣本數;TN代表變壓器狀態實際為正常,檢測的結果也是正常的樣本數;FN代表變壓器狀態實際為異常,檢測的結果卻是正常的樣本數。

表1 混淆矩陣
由于變壓器數據集中的異常點占比僅為1.18%,為極不平衡數據集,不能使用傳統的準確率指標對檢測模型進行有效的評估,因為即使將所有異常點全部誤判為正常點,檢測的準確率也能達到近99%,這對變壓器異常狀態的檢測將毫無意義。因此本次實驗采用靈敏度(sensitivity,SE)和特異度(specificity,SP)的幾何均值G作為算法評估的指標,其計算公式如下:

根據式(12)可知,只有當檢測結果的靈敏度和特異度都大時,綜合指標G值才會大。G值越大,表明算法的檢測效果越好。
為了縮減數據集的冗余特征,減少檢測算法的計算量,本次實驗對數據集的特征進行主成分分析。計算各主成分貢獻率及前4個主成分的累積貢獻率,各個主成分貢獻率情況如圖2所示,從圖中可以看出,前3個主成分的累積貢獻率就可以覆蓋原始數據集99%的信息量,因此本文將原始數據集的12個電氣參量特征歸約至3個主成分特征,可以有效降低后續LOF檢測算法的運行時間,提高變壓器異常檢測的效率。

圖2 各主成分的貢獻率占比分析圖
經多次實驗測試,LOF算法中離群閾值δ在2.3~2.5之間取值時,檢測效果較好,本次實驗選定δ為2.4。另外,近鄰數k的選擇不僅影響到LOF算法檢測結果的有效性,且整體算法運行的時間也與k值呈正相關。因此為了獲得最優參數k并考量不同k值下有無主成分分析PCA對LOF算法檢測效果的影響,實驗中分別對不同k值下的LOF算法和基于主成分分析的LOF算法即PCA-LOF進行了測試,兩種算法檢測結果的幾何平均值G如圖3所示。

圖3 不同k值下LOF與PCA-LOF的幾何平均值
分析圖3可知,當LOF算法的近鄰數k取值在150以下時,主成分分析的數據降維環節對LOF算法的G值影響不大,且當k值取150時,LOF算法和PCA-LOF算法都能獲得最佳的檢測G值,分別為0.845和0.847。鑒于運行時間的考慮,包含PCA降維處理環節的LOF算法耗時更短,能夠在保證檢測G值不受影響的條件下提高變壓器異常狀態的檢測效率。
當近鄰數k值取最優值150時,PCA-LOF算法在以數據集前兩個主成分PC1與PC2為坐標軸的二維平面上的檢測結果散點圖如圖4所示。
由圖4可以看出變壓器狀態異常點基本分布在數據的邊緣區域,并且其所處位置的密度相比其他正常點位置的密度更小。
本文提出了一種基于主成分分析和局部離群因子算法的變壓器異常檢測方法,可以實現動態實時數據的異常檢測。該方法首先利用主成分分析法對變壓器故障數據集進行特征降維處理,然后通過局部離群因子算法計算所有樣本點的離群因子,最后將離群因子與設定的閾值進行比較,篩選出代表變壓器存在異常狀態的離群樣本點。實驗結果表明,本文算法對變壓器的異常狀態能進行有效的檢測,可以輔助現場工作人員及時發現存在狀態異常的變壓器,提高變壓器運行維護的效率。