連文莉, 耿 波, 周 舟, 司剛全
(1. 國網陜西省電力公司, 陜西 西安710048;2. 西安交通大學電氣工程學院, 陜西 西安 710049)
隨著我國經濟的迅速發展,電力系統不斷朝著高電壓、大容量的方向發展,保證電力設備的安全運行越來越重要。電力變壓器作為電力系統中最關鍵的設備之一,一旦發生故障會造成大面積的停電及巨額的經濟損失[1]。因此迫切需要對變壓器的運行狀態進行實時在線監測,及時反映該設備的劣化程度,以便采取預防措施,避免停電事故發生。油中溶解氣體分析(Dissolved Gas Analysis,DGA)是早期檢測油浸式變壓器內部潛伏性故障的有效手段[2]。特征氣體是油浸式變壓器運行過程中自然老化及劣化的產物,其產生過程可大致劃分為兩個階段:①在變壓器故障早期階段,特征氣體的積累總體較為平穩,常規離線及在線DGA分析不易發現潛在增長趨勢;②在故障發生階段,特征氣體含量迅速上升,造成嚴重的運行事故。因此,分析油中溶解氣體歷史數據并對未來時刻的值進行合理預測,能夠提前判斷變壓器的狀態發展趨勢,對指導變壓器檢修工作和預防事故發生有重要的意義。
目前,油中溶解氣體預測方法主要有:REG回歸分析法(Regression, REG)、時間序列分析法[3]、灰色預測[4]、組合預測法[5]、最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)[6]等。其中,REG回歸法僅僅只能對歷史曲線進行大體趨勢擬合,不能夠給出較為準確的時刻數值;時間序列分析法的參數整定需要大量的數據輸入,在樣本較少時效果欠佳;灰色預測中,灰關聯度的計算和初始值的選取相關,且閾值變量的選取依賴主觀經驗;組合預測法根據不同權重建立綜合預測模型,曲線擬合精度較高,但預測結果缺乏信服度;LSSVM按結構風險最小化準則進行學習,能夠較好地解決小樣本、非線性等問題,但是其模型的性能過分依賴超參數的選取。
由上可知,優化LSSVM模型的參數能夠得到適用于油中溶解氣體濃度預測的優異模型。國內外學者也對LSSVM參數模型進行了一定研究:文獻[7]利用遺傳算法來對LSSVM模型進行參數尋優;文獻[8]采用蟻群算法對LSSVM參數進行固定步長搜索;文獻[9-12]采用粒子群優化算法對懲罰系數和核參數進行優化。上述方法在參數尋優過程中均有自己的優勢,同時也存在一定的問題:遺傳算法優化過程中存在不收斂現象;蟻群算法由于其固定搜索模式,可能無法得到全局最優解;粒子群算法容易陷入局部最優。
因此,本文利用自適應粒子群優化算法(Improved Self-adaptive Particle Swarm Optimization, IDPSO)尋找LSSVM參數全局最優值,基于種群的并行搜索策略特點來自適應迭代搜索,避免陷入局部最優和過程不收斂的困境,并將構建的LSSVM模型應用于變壓器油色譜參量的預測,實例分析驗證了本文方法的有效性。
將離線DGA所獲取的油中特征氣體數據按采集時間依次排列,可構成特征氣體時間序列X,具體可表示為X={x1,x2,...,xd},其中d表示時間序列長度。目標是構建模型f(x)對原始時序進行擬合,從而根據已知樣本數據對未知樣本進行預測。為實現上述目標,首先需構造模型輸入矩陣P及相應期望輸出矩陣Q。假設嵌入維度為m,則X可進一步表示為:
X={(x1,y1),...,(xd-m,yd-m)}∈(P×Q)d-m
(1)
式中,P為輸入矩陣;Q為輸出目標。
(2)
考慮運用LSSVM將上述d-m維樣本映射到高維空間,即采用非線性變換z=ψ(xi)將d-m維向量映射到l(l>>d-m),在這個高維特征空間中利用f(x)=ηψ(x)+b對其進行線性擬合,最終目標是尋找模型泛化性能與經驗風險之間的平衡點,即最小化結構風險[13,14]。
根據結構風險最小化原則,確定線性擬合參數η和b即為計算:
(3)
式中,ηTη為模型的復雜度;C為誤差懲罰系數;Remp為誤差控制函數。
LSSVM在優化目標中選擇損失函數為誤差ξi的二范數,優化問題可表示為:
(4)
約束條件:
yi[ηTφ(xi)+b]=1-ξii=1,2,...,d-m
(5)
由于η維數可能趨于無窮,直接求解minJ(ξ,η)較為困難,因此考慮通過拉格朗日變換將該問題轉換至其對偶空間,即:
(6)
式中,αi(i=1,2,...,m)為拉格朗日乘子。根據KKT優化條件:
(7)
可得:
(8)
(9)
(10)
定義核函數K(xi,yi)=ψ(xi)·ψ(yi),根據minJ(ξ,η),可將上述問題轉化為求解線性方程組:
(11)
運用最小二乘法求解上述方程組得到αi和b,得到LSSVM的預測輸出為:
(12)
式中,核函數K可選擇滿足Mercer條件的任意對稱函數。常見的核函數包括線性核函數、多項式核函數、徑向基核函數、sigmoid核函數等。本文采用sigmoid核函數,即
K(x,xi)=tanh(v(x·xi)+c)
(13)
選定核函數類型后,LSSVM算法中的ξ、C和σ即為模型最關鍵的三個參數。參數設置的好壞將直接決定著模型的復雜程度和預測效果,即訓練預測模型的關鍵在于確定所需參數的全局最優值[15-17]。
運用IDPSO求解優化問題時,每個粒子在搜索空間中的位置就代表了一個對應的解,解的優越程度用一個適應度函數衡量。每個粒子都追尋當前處于最有位置的粒子對空間進行搜索,并不斷對最優粒子進行更新,逐步向最優解靠近。IDPSO在初始化時首先在空間中隨機初始化一群粒子,包括其位置與速度。每個粒子在搜索空間時,反復更新自身搜索過程中發現的最優位置(pbesti)并逐漸向其靠攏,同時也向粒子群歷史搜索過程中發現的最優位置(gbest)匯聚。
IDPSO算法采用速度-位置搜索模式,群體中第i個粒子在M維空間的位置與速度分別定義為:
xi=(xi1,xi2,...,xiM),vi=(vi1,vi2,...,viM)。
每次迭代過程中,各粒子根據個體最優位置、全局最優位置以及前一時刻的位置與速度來調整下一時刻對應的狀態,迭代公式可表示為:
(14)
xi(t+1)=xi(t)+vi(t)
(15)
式中,xi(t)、vi(t)分別為粒子i在t時刻的位置與速度;r1與r2為[0,1]區間內的隨機數;ωi為慣性系數;c1i、c2i為學習因子,計算如下:

(16)
c1i(t)=c1i(t-1)φi(t)-1
(17)
c2i(t)=c2i(t-1)φi(t)
(18)
φi(t)=|(gbest-xl(t-1))/(pbesti-xi(t-1))|
(19)
式中,Kmax為最大迭代次數;ωinitial與ωfinal分別為慣性系數ω的設定初值與終值。
引入適應度函數用于評估當前粒子的優劣,如下:
(20)
式中,yi為目標值;f(xi)為LSSVM輸出結果。
IDPSO算法通過引入多樣性度量指標從而避免粒子群的早熟收斂問題。具體實現包括以下兩個方面:
(1)選取初始種群
初始粒子群的選取是隨機的,理想狀況下其位置應遍布整個解空間以增加搜索到全局最優解的概率。但是粒子的個數是有限的,解空間又相對較大,如果不能保證有限個粒子均勻分布在整個解空間,就加大了陷于局部最優的可能。
為此,引入平均粒距的概念,定義如下:
(21)

(2)判斷早熟收斂

(22)
式中,f為歸一化定標因子,取值如下:
(23)
適應度方差反映的是種群中粒子的聚集程度,σ2越小,則種群中粒子的聚集程度越大;反之,則聚集程度越小。當α2<β(β為某一給定的閾值)時,認為算法進入后期搜索階段,此時種群容易陷入局部最優而出現早熟收斂現象。
本文基于迭代尋優思想,將IDPSO與LSSVM相結合應用于變壓器油中溶解氣體含量預測,以達到將IDPSO不易陷入局部最優解的良好特性與LSSVM在求解凸二次優化問題速度上的優勢相結合的目的,最終實現對變壓器溶解氣體含量進行準確預測。由于LSSVM的學習精度以及泛化能力很大程度上依賴參數的選擇,因此采用IDPSO算法對其參數進行優化。
運用IDPSO算法對LSSVM的參數ξ、C和σ進行優化,每個粒子由三維參數(ξ,C,σ)決定其位置和速度,適應度函數可表示為預測精度均方差值,算法主要步驟如下:
(1)隨機初始化一群粒子,設置群體規模M、慣性權重因子的初值ωinitial與終值ωfinal以及最大迭代次數Kmax。由于ξ、C和σ的數量級不同,還需對其進行無量綱化處理。
(2)根據當前位置計算各個粒子的適應值并作比較,將各個粒子當前點設為最優位置,所有粒子中最優者設為種群最優位置。
(3)更新粒子速度和位置,產生新種群X(t)。
(4)計算X(t)各個粒子新位置的適應值,并分別與其歷史最優位置和種群的歷史最優位置作比較,若更優,則替換,否則,保持不變。
(5)檢查是否滿足尋優結束條件(達到或小于),若滿足則結束尋優,得到最優解,否則,令t=t+1,轉步驟(2)。
(6)將IDPSO尋優結果代入LSSVM,對變壓器特征參量進行預測。
基于IDPSO優化LSSVM的變壓器特征參量預測模型如圖1所示。

圖1 基于IDPSO優化LSSVM的模型構建流程圖Fig.1 Structure of LSSVM optimised by IDPSO
本部分采用陜西省電力公司提供的轄區內變壓器7種常規油中溶解氣體(H2, CH4, C2H6, C2H4, C2H2, CO, CO2)時序數據,采樣頻率為天,采樣長度為70~300不等。將原始數據集Xi(i=1,...,7)劃分為兩部分,將每組時序數據的末尾20個作為測試集Xit,前面剩余部分作為訓練集Xiv,具體劃分如表1所示。

表1 原始油中溶解氣體時序數據及其劃分Tab.1 Original time series and division results
隨后,對于每一組訓練集Xiv={x1,x2,...,xn},構造模型的輸入訓練集樣本XivT={(x1,y1),...,(xn-m,yn-m)}∈(P×Q)n-m,其中P為輸入矩陣,Q為輸出目標,m為嵌入維數。
IDPSO算法中各參數的初始化選取如下:確定粒子個數M為30,最大迭代次數Kmax為300,慣性權重系數ω線性變化范圍為[0.4,0.9],加速常數c1和c2分別為1.5和1.7。
隨后利用IDPSO對ξ、C和σ進行尋優,其中ξ和σ尋優范圍設定為[0.1,10 000],C初值設為0并進行迭代更新。隨后利用訓練數據對LSSVM預測輸出函數進行訓練。此后,采用與訓練集同樣的劃分方式對于測試集數據進行處理,并利用構造后的訓練集對模型預測性能進行測試。
在基于IDPSO優化的LSSVM預測模型中,嵌入維數m的取值也將影響最終的預測效果。若m過大,則將大幅降低訓練集樣本的數量,導致模型訓練不充分。經測試,當m超過算例所采用樣本長度的10%時,預測精度將出現一定程度的下降。相反,若m過小,將導致訓練樣本長度過短,模型無法提取時序自身的波動信息,同樣將降低模型預測的準確度??紤]到現有文獻中沒有指導該參數取值的依據,本例中通過實驗方法確定m的取值。預實驗中將m的取值范圍限制在2到訓練集長度的10%之間,重復上述訓練及預測過程,最終確定在所選時序樣本下的最優m取值為5。
圖2(a)~圖2(g)分別展示了7種特征氣體的原始時序數據、針對測試集的預測結果,以及尋優過程中粒子最優適應度f的變化情況。實驗過程均采用單步預測,即在獲取某一時刻時序樣本真實值后再對后續時序變化進行預測。圖2(a)~圖2(g)中,左欄圖中“◇”標注的序列表示原始時序,“*”標注的序列表示預測結果。由圖2可得,IDPSO -LSSVM能夠較準確地跟蹤氣體含量變化并預測其趨勢。除C2H4之外,其余尋優過程在迭代100次左右均可收斂,表明了算法的高效性。

圖2 七種氣體的預測結果及最優適應度變化曲線Fig.2 Result of prediction and best fitness curves regarding different gases
為了進一步說明本預測算法的有效性,本節將IDPSO-LSSVM的預測結果與目前普遍使用的油中溶解氣體預測方法,即ARIMA與REG回歸的預測結果進行對比。
首先,圖3(a)~圖3(g)展示了三種方法對于7種特征氣體的預測結果對比。其中,“●”標注序列為原始時序樣本,“★”、“◆”及“■”標注序列分別代表IDPSO-LSSVM、ARIMA及REG回歸的預測結果。由對比可見,IDPSO-LSSVM及ARIMA的預測精度明顯高于REG回歸,對氣體時序樣本的跟蹤效果較好。進一步而言,IDPSO-LSSVM針對大部分時序樣本的擬合效果優于ARIMA,該優勢針對C2H6預測時尤為明顯。

圖3 三種方法在不同特征氣體預測中的對比Fig.3 Comparison of results given by three methods
為進一步對三種方法預測性能進行定量對比,本節采用以下兩個指標作為預測結果評判標準,即平均絕對誤差MAE (Mean Absolute Error)與均方根誤差RMSE(Root Mean Square Error),計算方式如下:

式中,τ為預測長度,本例中取20。表2展示了IDPSO-LSSVM、ARIMA及REG回歸預測算法針對7種特征氣體的預測結果評價指標。最后也給出了各方法針對不同氣體預測結果的MAE及RMSE均值。

表2 預測結果對比Tab.2 Comparison of prediction results
由表2可見IDPSO-LSSVM針對大部分特征氣體含量的預測效果明顯優于傳統ARIMA及REG算法。在考慮MAE作為主要評價指標時,IDPSO-LSSVM在6類氣體時序樣本中的預測結果優于常用對比方法。具體而言,IDPSO-LSSVM較ARIMA的MAE及RMSE平均降低了14.67%與10.66%,且顯著優于REG回歸。
由此可見,本文提出的IDPSO-LSSVM模型具有較強的學習性能,充分利用了IDPSO自適應尋優不易陷入局部最優解的特性,使優化后的LSSVM能更為準確地分析數據的變化規律從而得到更為精確的跟蹤預測結果。
文中將自適應粒子群與最小二乘支持向量機相結合,利用粒子群算法基于種群的并行搜索策略特點來自適應迭代搜索最優的目標函數值,從而找到LSSVM核函數中的參數ξ、C和σ的最優取值,克服了應用傳統支持向量機算法進行預測時憑主觀經驗選擇參數對模型泛化能力和預測性能的影響,也避免了普通粒子群算法容易陷入局部最優解的缺陷。通過對特征氣體的預測實例可見,本文所提出算法的模式跟蹤與預測性能較好,為后續變壓器的狀態預測打下了良好的基礎。