徐龍舞,張英,張倩,胡克林,王明偉,張國治
(1. 貴州大學電氣工程學院,貴陽550025;2. 貴州電網有限責任公司電力科學研究院,貴陽550002; 3. 貴州電網有限責任公司凱里供電局,貴州 凱里556000;4.新能源及電網裝備安全監測湖北省工程研究中心(湖北工業大學),武漢430068)
變壓器作為電力系統中重要的電力設備,承擔著電力系統的輸配電任務。而變壓器在運行過程中難免存在潛伏性故障,一旦潛伏性故障未被發覺,故障可能會進一步擴大,從而對電力系統帶來巨大的經濟損失以及安全隱患甚至安全事故[1 - 2]。變壓器油中溶解氣體分析方法(dissolved gas analysis, DGA)是利用變壓器油中溶解氣體的信息判斷變壓器健康狀況的重要手段[3 - 6],其中,IEC三比值法以及國內三比值法等都是在動力學及熱力學的基礎上總結出來的故障診斷方法,其基本思想是利用油中溶解氣體的三對比值的編碼來判斷故障狀況。但大量的實際案例分析發現[7 - 8],三比值法存在編碼不足,編碼過于絕對等問題,從而限制了該方法的診斷效率。
近年來,各種智能算法被提出,基于這些智能算法的變壓器故障診斷方法也由此產生。這些診斷方法相比傳統方法而言,雖在一定程度上提高了變壓器的故障診斷率,但同時這些故障診斷模型都存在一定的缺陷。文獻[9]使用布谷鳥算法尋求支持向量機的最優參數建立故障診斷模型,該模型泛化能力強,收斂速度快,但模型核函數選擇困難。文獻[10]使用蝙蝠算法(BA)優化最小二乘雙支持向量機(least squares support vector machine,LS-TSVM)建立變壓器故障診斷模型,模型收斂速度快,但容易陷入局部最優。文獻[11]利用遺傳算法(genetic algorithm,GA)優化極端梯度提升(extreme gradient boosting,XGBoost)變壓器故障診斷模型的參數,有效提高了模型的診斷效果,但遺傳算法本身對初始種群具有一定的依賴性,從而限制模型的診斷能力。文獻[12]利用改進的粒子群算法優化BP神經網絡,解決了傳統BP網絡易陷入局部最優解問題,加快了算法的收斂速度,但粒子群算法本身存在著容易早熟,收斂速度慢的缺陷。
蝠鲼算法因其獨特的多樣覓食策略,而發揮了更強的尋優能力,相較粒子群算法、遺傳算法而言,更適合于工業領域求解問題。鑒于神經網絡具有較強的非線性分類能力[13 - 15],本文利用BP神經網絡建立變壓器故障診斷模型,針對傳統BP神經網絡存在容易陷入局部最優問題,本文采用蝠鲼算法強大的全局尋優能力優化BP網絡參數。針對蝠鲼算法作為元啟發式優化算法同樣依賴于初始解的性能問題。對此,本文融合了混沌理論與反向學習(opposition based learning,OBL)方法為蝠鲼算法提供一組優質的初始解,加快算法的收斂速度以及收斂性能。同時為解決應用元啟示算法尋優時,算法本身參數趨向于選擇經驗值,從而限制算法在特定問題上的尋優效果的問題,本文為提高蝠鲼算法在變壓器故障診斷問題上的能力,提出利用正交實驗法優化蝠鲼算法3種覓食策略(鏈式覓食、氣旋覓食、翻筋斗覓食)的比重,調節蝠鲼群體的全局探索和局部開發能力。經對IEC TC 10故障數據的實驗分析,驗證了本文提出的方法明顯優于傳統方法。
蝠鲼算法(manta ray foraging optimization,MRFO)是Zhao Weiguo等[16]人于2020年提出的仿生算法,其靈感來源于海洋生物蝠鲼。蝠鲼是一種體型較大的海洋生物,以大量的浮游生物為食,當蝠鲼群體在覓食時,會表現出3種奇特的覓食行為。第一種覓食策略為鏈式覓食,蝠鲼群體會依次地排成一列,這種排列方式有利于前面蝠鲼在錯過食物時,其后的蝠鲼彌補前者的過失;第二種覓食策略為旋風覓食,當蝠鲼檢測到食物的濃度非常高時,蝠鲼群體將會聚集在一起用它們的尾部與頭部呈螺旋狀相連,從而形成一個螺旋頂點,過濾后的水向上移動到水面。這會把浮游生物拉進它們張開的嘴里;第三種覓食策略為翻筋斗覓食,是不常見的覓食行為,但是極其有效的策略,當蝠鲼檢測到食物時,蝠鲼會以食物為中心做一系列的隨機、頻繁的后空翻。
蝠鲼群體3種覓食策略的數學模型分別如下。
1)鏈式覓食
i=1時,有
(1)
i=2, 3, …,N時,有
(2)

2)旋風覓食
i=1時,有
(3)
i=2, 3, …,N時,有
(4)

旋風覓食策略采用氣旋特性可以高效地開發當前最優解附近區域,可有效地尋求當前最優解附近的更優解。若將當前最優解以參數空間中的隨機位置取代,則氣旋覓食可作為參數空間的探索策略使用,此時,數學模型為:
(5)
i=1時,有
(6)
i=2,3,…,N時,有
(7)

3)翻筋斗覓食
(8)
式中S為翻筋斗范圍系數。
蝠鲼算法作為群智能算法同樣對初始種群有著較高的要求,初始種群的好壞直接影響群智能算法全局尋優的能力。傳統PSO、GA等算法利用偽隨機數生成器(pseudo-random number generators,PRNGS)生成的初始種群,造成了均勻性不足問題,當待優化的工程參數空間為高維時,缺陷進一步暴露,從而限制了算法的工程應用能力。本文為解決此問題,提出利用混沌理論獲得均勻性更高、多樣性更好的初始種群。Logistic映射具有優良的混沌效果[17],其數學表達式為:
XK+1=μ(1-XK)
(9)
式中:當K=0時,X0?{0, 0.25, 0.5, 0.75, 1};μ∈[0,4], 當μ取3.99時,Logistic映射可達到混沌效果。圖1給出了二維空間上Logistic映射迭代3 000次后的混沌效果圖,其中μ=3.99。

圖1 二維空間Logistic映射混沌效果圖Fig.1 Chaotic rendering diagram based on Logistic mapping in 2-dimensional space
為加快算法的收斂速度,同時加強尋優能力,在利用Logistic映射生成初始種群后,進一步利用反向學習策略[18 - 20](opposition based learning,OBL)篩選出N個初始種群。Logistic映射與OBL結合的多階段種群初始化算法的步驟如下:
1)利用Logistic映射生成N個體,組成原始種群N1;
2)為每個個體利用式(10)找出反向解,組成反向種群N2;
(10)

最后,將原始種群和反向種群合并,計算適應度值,選取適應度較小的前N個個體組成最終的初始種群。
傳統的蝠鲼算法的3種覓食策略之間的分配規則將鏈式覓食與氣旋覓食均分;在氣旋覓食中使用系數Coef(CCoef=t/T)與當前給定的隨機數rand進行比較決定氣旋覓食用來探索還是開發;當Coef>rand時,氣旋覓食用于開發,Coef≤rand時,氣旋覓食用于探索。氣旋覓食策略雖合理將前期時間主要用于探索,后期時間用于開發,但在整個尋優過程中探索與開發比重被迫固定,難以根據不同工程問題自主調節,限制了其應用于實際工程問題。
為解決上述問題,本文對傳統蝠鲼算法覓食策略分配規則進行如下優化:
1)引入參數R決定鏈式覓食與氣旋覓食的比重,當R=0.5時,對應未優化前的規則;當R<0.5時,鏈式覓食的比重大于氣旋覓食;當R>0.5時,氣旋覓食的比重大于鏈式覓食。
2)改進Coef, 提出C:
(11)
當C>rand, 氣旋覓食用于開發;
當C≤rand, 氣旋覓食用于探索;
圖2給出了N=0.5, 1, 2時的C的物理意義圖。

圖2 N不同取值下C的物理意義圖Fig.2 Physical meaning diagram of C under different values of N
從圖2(b)可知,Coef對應著N=1時的情形,即蝠鲼群體盲目地均勻分配開發和探索比重,對于特定的問題而言,盲目分配比重極大地限制了群體的尋優能力。而改進后的C較Coef而言,可通過N的取值,改變氣旋覓食用于探索和開發的比重,從而滿足專業問題對探索與開發的要求。
3)翻筋斗算法中S為重要參數,S的取值決定了個體在當前最優解附近的開發能力。
2.3.1 蝠鲼算法分配策略指標水平化
通過對蝠鲼算法的探索和開發分配規則進行優化,有效地提高了該算法處理任何問題的專業能力。然而R、C以及S的不同取值都將會對尋優能力產生影響。本文提出將正交實驗法應用于蝠鲼算法當中,利用正交實驗法優選蝠鲼算法分配策略參數。
利用正交實驗法可在較少試驗次數下高效獲得最佳因素水平組合[21 - 22]。在應用正交實驗法之前,需要將參數進行離散化、水平化。
1)R水平化
R取值為0到1,為連續水平因素,其數值大小決定在迭代尋優中鏈式覓食或氣旋覓食的比重。
將R分為3個水平:當R=0.25時,為水平1,此時整個參數尋優迭代中,以鏈式覓食策略為主;當R=0.5時,為水平2,鏈式覓食與氣旋覓食的比重相同;當R=0.75時,為水平3,此時以氣旋覓食為主。
2)C水平化

3)S水平化
S的取值大小決定了翻筋斗的范圍,也反映了對區域的利用程度,S的取值不同對適應度函數的解值有很大關系。將S設置為3個等級,當S=1/2時,為水平1;當S=1時,為水平2;當S=2時,為水平3。
2.3.2 正交實驗安排
通過將參數進行離散化,水平化處理后,問題轉變為三因素三水平問題,選取L9(34)正交表(見表1)進行正交實驗。
油浸式變壓器在運行過程中難免存在潛伏性故障,主要分為過熱及放電故障[23]。故障產生的能量使得變壓器油等絕緣物質發生分解,釋放出H2、CH4、C2H4、C2H2、C2H6等特征氣體,利用特征氣體的相關信息可有效地預測變壓器的故障類型[24]。

表1 L9(34)正交表Tab.1 L9(34)orthogonal table
BP神經網絡作為一種典型的神經網絡模型,被廣泛用于各個領域的分類預測問題。本文將故障釋放出的H2、CH4、C2H4、C2H2、C2H6等氣體含量的三對比值(C2H2/C2H4、CH4/H2、C2H4/C2H6)作為BP網絡的輸入,故障類別為輸出,同時加快算法收斂速度以及防止模型陷入局部最優,利用Logistic映射與反向學習融合的多階段算法、正交實驗法改進蝠鲼算法取代傳統的反向傳播法,為BP網絡模型賦予網絡權值及偏置參數,建立基于改進蝠鲼算法的故障診斷模型。
算法的完整流程如下:
1) 利用Logistic映射及反向學習(OBL)融合的多階段算法初始化種群。
2) 根據L9(34)正交表安排實驗,為MRFO算法提供R、N、S參數組合,改進MRFO算法。
3) 將變壓器故障樣本分為訓練樣本及測試樣本,利用訓練樣本及初始化種群建立BP分類模型。
4) 計算模型適應度值,若滿足要求,則記錄下此次實驗參數及實驗結果;若不滿足,返回第2點中的改進MRFO算法中進行迭代求解。
5) 利用第4點中記錄的正交實驗數據進行結果分析,確定MRFO算法參量(R、N、S)最佳取值,進而建立基于多階段算法及正交實驗法改進的MRFO-BP變壓器故障診斷模型。
6) 使用改進的MRFO-BP變壓器故障診斷模型對變壓器測試數據進行故障診斷。
算法流程圖如圖3—4所示。

圖3 多階段算法優化MRFO-BP及正交實驗法安排Fig.3 Optimization of MRFO-BP by multi-stage algorithm and arrangement of orthogonal experimental method

圖4 正交實驗結果分析及變壓器故障診斷模型建立Fig.4 Analysis of orthogonal experimental results and establishment of transformer fault diagnosis model
本文選擇IEC TC 10故障數據[25]進行實例分析,數據共118條,選取其中93條數據作為訓練數據,其余25條作為測試數據;118組變壓器數據包括高能放電、低能放電、中低溫過熱、高溫過熱、正常數據。詳細的數據分布如表2所示。

表2 訓練數據、測試數據分布Tab.2 Distribution of training data and test data
設置BP網絡的輸入層神經元為3,隱藏層層數為5,輸出層神經元為5;設置適應度函數為平均絕對誤差(mean absolute error,MAE)如式(12)所示。
(12)
利用改進的蝠鲼算法訓練網絡,其中Logistic映射與反向學習融合的多階段算法中,設置初始種群大小N為50,蝠鲼算法的迭代次數T設置為500。在對模型進行訓練時,需要對故障進行編碼,編碼結果如表3所示。

表3 故障編碼Tab.3 Fault codes
利用L9(34)正交表設置9次實驗,對應的實驗結果如表4所示。

表4 利用L9(34)正交表進行的正交實驗結果Tab.4 Orthogonal test results using the L9(34) orthogonal table

圖5 適應度值與各因素的關系圖Fig.5 Relationship between fitness value and various factors
由上述正交實驗的結果分析,繪制出適應度值與各因素的關系圖如圖5所示。
從圖5分析可知:
1)S值越大,適應度值越小,這與理論背景(S越大,個體翻筋斗的范圍越大)吻合;S=2效果最好,還應探索S更大的情況,但S越大計算機求解越復雜,迭代時間也會變長。
2)N取1時,即N取傳統蝠鲼算法參數值時,適應度值最大,進一步說明本文對傳統蝙蝠鲼算法的優化是必要,且有效的。
3)R取值為0.5時,適應度值最小,表明鏈式覓食與氣旋覓食的比重相同時最優。
4)對適應度值影響的因素主次關系由圖5和極差可知:S>N>R。從理論分析原因在于:S的值直接決定了種群在最佳值附近區域的利用能力,而N和R的值通過調節探索面積和利用面積來調節尋得最優解的能力,相對與S的影響較小。
5)綜合結果,組合:R=0.5,N=2,S=2時的適應度值最小。
基于上述正交實驗法得到的結果,得到最優蝠鲼算法參數R=0.5,N=2,S=2,其他實驗條件不變,進行了實驗。
圖6—7分別給出了蝠鲼算法參數R=0.5,N=2,S=2下的適應度收斂曲線和測試數據分類準確率。

圖6 基于改進的MRFO迭代曲線Fig.6 Iterative curve based on improved MRFO

圖7 基于改進的MRFO-BP模型分類準確率Fig.7 Classification accuracy based on improved MRFO-BP model
由圖6—7可知,在93條數據作為測試數據,改進的蝠鲼算法迭代500次后,MAE值為0.251 55,小于前9次正交實驗所得的適應度值,說明了利用正交實驗法優化后,得到了最優的解。由圖可知,訓練出的故障診斷模型在25條測試數據中診斷準確率達到84%。其中,低溫過熱5條數據診斷正確3條,高能放電數據10條數據診斷正確9條,中低溫過熱數據3條數據診斷正確2條,高溫過熱及正常數據全部診斷無誤。將本次實驗得到的結果與表4對比可知,通過正交實驗法選取的參數優化的模型準確率達到最高,說明了利用正交實驗法優化模型的方法可以顯著地提高模型的故障診斷能力,是一種積極有效的方法。
為說明本文提出的模型的有效性,本文將傳統反射傳播神經網絡(back propagation neural network,BPNN)、傳統MRFO優化BP網絡(MRFO-BP)、三比值法以及本文提出的改進MRFO-BP網絡進行了實驗結果對比,比較結果如表5所示。

表5 算法準確率對比Tab.5 Accuracy comparison of the algorithms
從表5可知,傳統BPNN診斷變壓器故障的準確率為68%,三比值法為60%,MRFO-BP為76%,本文提出的改進MRFO-BP模型準確率最高,達到84%,明顯優于其他模型,尤其相比三比值法而言,診斷率提高了24%。
為進一步說明本文算法相比其他算法更具有優勢,本文同時利用目前研究效果相對較好的蝙蝠算法(bat algorithm,BA)、粒子群算法(particle swarm optimization,PSO)優化BP網絡,建立對應的算法模型;將本文算法(改進MRFO-BP)與之對比,突出本文算法的優勢。
設置PSO算法與BA算法的種群數量為50,迭代次數設置為500,算法中的超參數選取傳統經驗值。將3種算法分別獨立運行10次,圖8給出了BA-BP、本文算法(改進MRFO-BP)、PSO-BP分別獨立運行10次的迭代曲線,圖9為3種算法10次運行結果的箱體圖。

圖8 BA-BP、PSO-BP、改進MRFO-BP的迭代曲線Fig.8 Iterative curves of BA-BP, PSO-BP and improved MRFO-BP

圖9 BA-BP、本文算法、PSO-BP的適應度箱體圖。Fig.9 Diagram of fitness boxes of BA-BP, algorithm in this paper and PSO-BP
從圖8—9可知,BA-BP算法10次實驗的適應度數據波動不大,基本都收斂性于高適應度值,適應度普遍較差,難以跳出局部最優解。在第6次獨立實驗中收斂到0.290 4,為10次實驗中的最佳適應度;PSO-BP算法的實驗結果主要分布于較高的適應度,但PSO-BP算法較BA-BP算法而言,具備了一定跳出局部最優的能力,有一定概率獲得較低的適應度值,在第4次獨立實驗中,收斂到0.268 7;而本文算法擁有最低的適應度,且10次實驗結果較為穩定,結果圍繞平均值上下均勻波動,且在第10次獨立實驗時收斂到0.251 5,為所有實驗獲得的最佳值。BA-BP、本文算法、PSO-BP 10次獨立實驗的平均適應度分別為:0.301 7、0.276 1、0.290 4。結果表明本文優化后的MRFO相比BA、PSO具有更強的全局尋優能力。
同時,BA-BP算法以及PSO-BP算法在10次獨立實驗中,僅有1次在進化迭代400次還在迭代更新,而本文算法為3次,一定程度上反映出本文所提算法較BA-BP算法和PSO-BP算法而言,杜絕了早熟、易陷入局部最優的問題。
綜上驗證,本文利用多階段算法及正交實驗法優化的MRFO-BP不易早熟,具有更強的全局尋優能力,其原因在于MRFO算法獨特的覓食策略在其他生物中是不常見的;與此同時,MRFO算法覓食策略的多樣性使其具備了更強的跳出局部最優的能力,且本文引入正交實驗法這一有力工具,使傳統MRFO算法在應用于實際工程問題時具有了更好的尋優效果。
本文提出了綜合多階段算法以及正交實驗法優化的MRFO-BP變壓器故障診斷模型,通過實驗對比和分析,得到了如下結論。
1)利用Logistic映射以及反向學習(OBL)融合的多階段算法能夠有效地為MRFO算法提供較優的一組初始解,提高算法的全局尋優能力。
2)利用正交實驗法積極有效調節傳統蝠鲼算法的探索和開發能力,從而適應各類實際工程問題。
3)與BPNN、未改進的MRFO-BP、三比值法相比,本文所提算法的準確率分別高出16%、8%和24%,同時改進后的MRFO-BP較BA-BP、PSO-BP等算法而言不易早熟,具有更強的尋優能力。