,,,,,,,
(1.廣東電網有限責任公司河源供電局,廣東 河源 517000; 2. 廣東工業大學自動化學院,廣東 廣州 510006)
油中溶解氣體分析(dissolved gas analysis,DGA)利用在線監測數據對油浸式電力變壓器進行故障診斷和狀態評估,將定性的評估轉變成具體量化的數據,是一種較為成熟的評估體系。目前應用最為廣泛的油色譜分析方法是IEC三比值法[1],但是該方法的故障編碼固化,忽略邊界效應,使得診斷的準確性受到限制[2]。近年來,隨著機器學習和人工智能算法的發展,人工神經網絡[3]、模糊數學[4]、粗糙集理論[5]、云理論[6]、核函數[7]以及支持向量機[8]等計算機方法被應用到變壓器狀態評估和故障診斷中。文獻[3]充分利用BP神經網絡處理非線性樣本的能力,并與FPN網絡結構相結合,在模糊推理的基礎上,得出較好的故障診斷效果。文獻[4]考慮故障的隨機性和模糊性,利用模糊數學理論,建立了多種指標的隸屬函數。文獻[6]建立了變壓器評估的正態云模型,通過期望、熵和超熵描述狀態的不確定性,有效地實現了定性和定量之間地轉換。文獻[7]通過核函數將故障樣本的特征轉換為高維度的空間向量,放大了故障的有用特征,使聚類分析的準確性得到提高。
基于油中氣體分析的IEC三比值法因其自身的特點,目前仍然有很高的實用價值。這里采用模糊聚類算法,將三比值法的編碼模糊化,使故障特征值根據其數據特征自行分類,有效地克服了三比值法編碼固化等問題。為了防止先驗知識對故障分類數造成的誤差,利用相關矩陣的定義和圓盤定理進行特征值分析,得到最佳分類數。采用人群搜索算法對初始參數進行優化,有效地避免了早熟現象,并提高了聚類的有效性和魯棒性。
聚類分析是一種無監督學習的多元統計分析方法,目的是客觀地劃分樣本的類別,使得具有類似特征的樣本劃分到同一類,而具有不同特征的樣本劃分到不同類[9]。模糊聚類在聚類分析的基礎上引入了隸屬度的概念,用來描述樣本對類別的模糊性。模糊c均值算法(fuzzy c-means,FCM)是一種基于目標函數的聚類算法,分類數需要事先給出,然后通過聚類中心和隸屬度的迭代得出樣本的最優分類[10]。由于其算法原理清晰且收斂速度較快,FCM算法廣泛應用于各個領域。
對于n個不同的樣本X={xi},根據先驗知識得出最佳分類數為c,FCM算法通過計算類內加權誤差平方和作為目標函數[11]:
(1)
式中:U為隸屬度矩陣;uij為模糊隸屬度;V為聚類中心矩陣;m為模糊控制指數,一般取1.5~2.5,數值越小,模糊程度越低;dij為聚類中心的歐式距離。
為了求取目標函數的極值,FCM算法利用拉格朗日乘子法計算得到隸屬度和聚類中心的迭代公式分別為
(2)
(3)
FCM算法的基本步驟如下[12]:
1)設定樣本初始參數,包括分類數c、模糊控制指數m以及迭代終止閾值ε和迭代終止最大次數T;
2)確定初始的聚類中心V,并用公式(2)計算得到初始隸屬度U;
3)利用式(1)計算目標函數值,如小于給定閾值ε則算法結束,否則利用式(3)和式(2)再次迭代,直到達到迭代終止條件。
從FCM的實現步驟可以看出,FCM的聚類結果嚴重依賴于分類數c,其值過大或者過小都將使聚類結果產生很大誤差;FCM的初始聚類中心是隨機確定的,最佳聚類中心會隨之發生變化,這就給聚類分析帶來了不確定性[13];FCM采用歐氏距離方法聚類,每個樣本都是等趨勢劃分,樣本中的噪聲也根據其聚類賦隸屬度,這顯然是不合理的。下面基于以上分析,對FCM算法進行了優化。
在變壓器故障診斷中,故障的類別一般是根據專家經驗來進行估計。這種方法缺乏客觀的理論支撐,難以得出最佳的分類結果。隨著大數據時代的來臨,通過聚類有效性評估確定最佳分類數成為了研究的熱點[14]。在文獻[15]中,證明了可能性劃分系數能有效地判定聚類的有效性,當可能性系數取得最大值時,聚類效果為最佳。文獻[16]將聚類隸屬度與樣本的幾何分布結合起來,依據類內緊密、類間分離的原則進行聚類有效性分析。文獻[17]提出指標不受數據集形狀的約束,利用離散距離來評估聚類效果。但是這些指標都必須經過反復迭代,遍歷所有可能的分類數,才能確定最佳聚類結果,因此極其耗費時間,導致現有的評價標準無法應用在大多數工程項目中。文獻[18]提出了基于矩陣特征值分析的有效性指標,克服了其他有效性指標的低效性,而且得到最優分類的正確率不會降低。變壓器的故障分析屬于多維度、分類數不確定的復雜聚類分析,鑒于矩陣特征值分析的獨特優勢,故采取該方法得出最佳的聚類數。
根據相關矩陣[18]的定義及其特征值可知,特征根的大小反映了同一類樣本的相似程度。根據Gerchgorin圓盤定理[19],如果實際的最佳分類數是c個,則其L個特征值出現的情況為
λ1≥λ2≥…λc≥λc+1≈…≈λL
(4)
式中,λ1到λc是c個相對較大的特征根。
最優的分類數由于其特征根的不同,可以得到明顯不同的圓盤。按照圓盤定理,可以定義指標的最優分類數如下,即:
(5)
式中,c是在閉集合[1,L-1]內可能取得的分類數,當第1個非負的GDE(c)值出現時所對應的c,即為最優的分類數。
在FCM中,聚類的有效性對初始聚類中心有很大的依賴性。為了得到最優結果,可以選定不同的初始聚類中心啟動該算法,通過比較不同的聚類結果,得出最優解。文獻[20]利用粒子群算法(particle swarm optimization,PSO),對數據集進行全局搜索,能夠彌補FCM對初始聚類中心敏感的缺陷,但是易出現早熟現象,以致于不能全局尋優。文獻[21]提出用改進的遺傳算法(genetic algorithm,GA)來自動選取保持全局特性的聚類中心點,再利用歐式距離的判別方法進行其他點的判斷。文獻[22]將粒子群算法和遺傳算法結合起來,充分利用GA的隨機搜索能力和PSO的局部細致搜索能力。另外,還有一些智能算法及其混合算法應用在變壓器故障診斷中。雖然在一定程度上改善了聚類的結果,但是當面對復雜多維優化問題時,由于其目標函數存在著數目眾多的局部極值,導致聚類時很容易發生早熟和收斂速度慢等現象。
所采用的人群搜索算法(seeker optimization algorithm, SOA), 是一種新型的智能搜索算法[23],具有更好的魯棒性與較快的收斂性,算法的求解過程避免了早熟現象的發生,對于工程領域的復雜優化問題具有收斂精度高等特點。
SOA算法根據人的思維過程,在解空間對函數進行尋優[23]。在優化過程中,其搜尋過程可理解為在可能的解空間里,最優解的位置趨向于較優解的附近。因此,在較優的位置應該進行細致的搜索,而對于較差的位置,應該再擴大搜索范圍[24]。
3.1.1 搜索步長
SOA算法用模糊系統逼近來表征搜索的不確定性,建立目標函數和步長之間的聯系。搜索步長模糊變量表示如式(6)。
(6)
式中:x為輸入樣本;uA為隸屬度;δ、μ為隸屬函數參數。
隸屬度與函數值排列順序成正比,如式(7)所示。
uij=rand(ui,1)(j=1,2,…D)
(7)
式中:D為搜索空間的維度;uij為j維搜索空間第i個特征量的隸屬度;函數rand表征了搜索的隨機性。
搜索步長定義為
(8)
式中:αij為第j維的搜索步長;δij為高斯隸屬函數參數,其值由式(9)和式(10)確定。
(9)
(10)
式中:xmin和xmax為最小和最大目標函數的位置;ω為權值;t和tmax為當前的迭代次數和最大迭代次數。
3.1.2 搜索方向
通過人的行為分析得到第i個位置的利己方向、利他方向以及預動方向,如式(11)至式(13)所示。
(11)
(12)
(13)
通過幾何平均來確定最終搜索方向,如式(14)。
(14)
式中:φ1和φ2為[0,1]內的常數;ω是慣性權重。
3.1.3 人群搜索算法的實現
步驟1:基本參數設置。根據實際問題,設置搜尋速度、進化代數及種群規模。
步驟2:隨機設置人群搜索的開始位置。
步驟3:初始化目標函數值,并得出最優值。
步驟4:確定搜尋策略。確定步長和方向。
步驟5:位置更新。更新公式為
Δxij(t+1)=αij(t)dij(t)
(15)
xij(t+1)=xij(t)+Δxij(t+1)
(16)
步驟6:完成一次迭代,t=t+1。
步驟7:若達到終止條件,則認定為最佳位置,否則,轉至步驟3繼續迭代。
變壓器油中溶解氣體包含了運行設備的故障信息,并且測量技術比較完善,是一種成熟有效的狀態評估指標[25]。
如果變壓器內部發生故障,溫度會顯著升高,進而加速絕緣材料分解[26]。當電力變壓器發生不同類型的故障時,其產生的特征氣體含量會有所不同,但發生相同故障時產生的特征氣體會有某種相似性。利用變壓器故障特征氣體的聚集效應可以生成聚類中心,并通過其分布情況給出隸屬度,從而實現故障的分類。
對電力變壓器故障樣本進行矩陣特征值分析,求取相關矩陣及其特征值,得出最優分類數。同時為提高故障診斷精度,對FCM算法的初始聚類中心用SOA進行優化。建模流程如圖1所示。
收集了230組故障明確的變壓器故障數據,挑選其中80組作為訓練聚類中心,用文獻[27]給出的40組作為測試數據。為了得到更好的聚類中心,訓練集各故障狀態均勻分布,具體個數如表1所示。
對所收集的故障樣本求取相關矩陣和特征值,進行矩陣特征值分析,第1個非負的GDE(c)值出現的時候,c的值為6,故最優的分類數為6類,與實際情況相符。

圖1 變壓器故障診斷模型結構表1 變壓器故障樣本

故障類型訓練集測試集無故障154低能放電159高能放電156低溫過熱155中溫過熱158高溫過熱158總計8040
從收集的數據集可以看出,原始數據具有不同的數量級,為了使較小數量級的數據不被忽略,有必要對數據進行歸一化處理。
(17)

SOA優化算法的初始參數設定為:進化代數為100,種群規模為20,算法的最大隸屬度Umax=0.95,最小隸屬度Umin=0.01,權重最大值ωmax=0.9,權重最小值ωmin=0.1,模糊控制系數m=2。將訓練樣本中的數據利用SOA算法計算后得出各故障的最優聚類中心,如表2所示。適應度曲線如圖2所示。

表2 SOA最優聚類中心

圖2 SOA適應度曲線
測試集中的數據對應的故障類型如下:1—5為低溫過熱,6—13為中溫過熱,14—21為高溫過熱,22—30為低能放電,31—36為高能放電,37—40為正常。
文獻[27]利用PSO算法進行優化,得出聚類中心如表3所示,測試結果除了35無法確定結果,38得出錯誤結果外,其他的全部正確,正確率達到95%。而利用所提出的SOA進行優化,得出的結果除了2號錯誤,其他的全部正確,正確率為97.5%,高于改進的PSO算法,這是由于SOA算法對于數據的全局搜索能力要強于PSO算法,并能夠有效地避免陷入局部最優值,從而得出更優的聚類中心。兩種方法得出的部分最高隸屬度如表4所示。

表3 PSO最優聚類中心
從兩種方法的隸屬度矩陣和表4所列部分結果可以看出,所用方法在保證正確率的情況下,聚類效果有了顯著提高,這是因為SOA算法充分考慮了搜索的隨機性和模糊性,在全局性和局部性搜索性能上均優于傳統的PSO算法。
對變壓器狀態檢修過程中狀態分類和故障診斷優化進行了研究,得出如下結論:

表4 兩種方法故障診斷結果對比
1)提出了用圓盤定理和矩陣特征值分析確定狀態的最優分類數,克服了主觀因素的影響,極大地提高了故障診斷的穩定性;
2)通過模糊聚類理論,將變壓器狀態邊界模糊化,反映了故障診斷的不確定性;
3)針對模糊聚類對初始值敏感的問題,提出用SOA算法進行優化,建立了SOA-FCM模型,改善了聚類的效果,提高了故障診斷的準確性。
通過仿真實驗,驗證了所提方法的有效性。
[1] 楊廷方, 劉沛, 李景祿, 等. FCM結合IEC三比值法診斷變壓器故障[J]. 高電壓技術, 2007, 33(8):66-71.
[2] 許惠君, 王宗耀, 蘇浩益. 基于DGA的反饋云熵模型電力變壓器故障診斷方法研究[J]. 電力系統保護與控制, 2013, 41(23):115-119.
[3] 公茂法, 張言攀, 柳巖妮, 等. 基于BP網絡算法優化模糊Petri網的電力變壓器故障診斷[J]. 電力系統保護與控制, 2015, 43(3):113-117.
[4] 廖瑞金, 王謙, 駱思佳, 等. 基于模糊綜合評判的電力變壓器運行狀態評估模型[J]. 電力系統自動化, 2008, 32(3):70-75.
[5] 張晶晶, 許修樂, 丁明,等. 基于模糊層次分析法的變壓器狀態評估[J]. 電力系統保護與控制, 2017, 45(3):75-81.
[6] 張鐿議, 廖瑞金, 楊麗君, 等. 基于云理論的電力變壓器絕緣狀態評估方法[J]. 電工技術學報, 2012, 27(5):13-20.
[7] 熊浩, 孫才新, 廖瑞金, 等. 基于核可能性聚類算法和油中溶解氣體分析的電力變壓器故障診斷研究[J]. 中國電機工程學報, 2005, 25(20):162-166.
[8] 董明, 孟源源, 徐長響,等. 基于支持向量機及油中溶解氣體分析的大型電力變壓器故障診斷模型研究[J]. 中國電機工程學報, 2003, 23(7):88-92.
[9] 黃衛春, 劉建林, 熊李艷. 基于樣本-特征值加權的可能性模糊核聚類算法[J]. 計算機工程與科學, 2014, 36(1):169-176.
[10] 宋志杰, 王健. 模糊聚類和LM算法改進BP神經網絡的變壓器故障診斷[J]. 高壓電器, 2013, 49(5):54-59.
[11] 李儉, 孫才新, 陳偉根,等. 灰色聚類與模糊聚類集成診斷變壓器內部故障的方法研究[J]. 中國電機工程學報, 2003, 23(2):112-115.
[12] 陳燦. 基于粒子群算法的模糊聚類研究[D]. 桂林:廣西師范大學, 2005.
[13] 李超順, 周建中, 安學利,等. 基于加權模糊核聚類的發電機組振動故障診斷[J]. 中國電機工程學報, 2008, 28(35): 79-83.
[14] 周開樂, 楊善林, 丁帥,等. 聚類有效性研究綜述[J]. 系統工程理論與實踐, 2014, 34(9):2417-2431.
[15] 范九倫, 吳成茂. 可能性劃分系數和模糊變差相結合的聚類有效性函數[J]. 電子與信息學報, 2002, 24(8):1017-1021.
[16] Xie X L, Beni G. A Validity Measure for Fuzzy Clustering[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1991, 13(8): 841-847.
[17] Yue Shihong, Wang J, Wu T, et al. A New Separation Measure for Improving the Effectiveness of Validity Indices[J]. Information Science, 2010, 180(5): 411-423.
[18] 岳士弘, 黃媞, 王鵬龍. 基于矩陣特征值分析的模糊聚類有效性指標[J]. 天津大學學報, 2014,47(8):689-696.
[19] Watking D S. Fundamentals of Matrix Computation
[M]. USA: John Wiley & Sons, 2002.
[20] 馬葉芝, 焦彥軍, 王東升, 等. 變壓器故障診斷中溶解氣體的PSO-WFCM算法研究[J]. 高壓電器, 2014,50(1):72-76.
[21] 田質廣, 張慧芬. 基于遺傳聚類算法的油中氣體溶解氣體分析電力變壓器故障診斷[J]. 電力自動化設備, 2008,28(2):15-18.
[22] 雷浩轄, 劉念, 崔東軍, 等. 基于GA與PSO混合優化FCM聚類的變壓器故障診斷[J]. 電力系統保護與控制, 2011, 39(22):52-56.
[23] 董慧康. 基于人群搜索-支持向量機的心臟病多生理參數診斷方法研究[D]. 天津:河北工業大學, 2014.
[24] 魏立兵, 趙峰, 王思華. 基于人群搜索算法優化參數額支持向量機短期電力負荷預測[J]. 電測與儀表, 2016, 53(8): 45-49.
[25] 周健, 黃昕, 鄒劍, 等. 變壓器油中溶解氣體故障診斷的改進模糊算法[J]. 廣東電力, 2015, 28(3): 86-91.
[26] 孫才新, 郭俊峰, 廖瑞金, 等. 變壓器油中溶解氣體分析中的模糊模式多層聚類故障診斷方法的研究[J]. 中國電機工程學報, 2001, 21(2):37-41.
[27] 韓富春, 廉建鑫, 高文軍, 等. 改進PSO與模糊聚類相結合的變壓器故障診斷[J]. 電氣技術, 2011, 5(2):1-4.