王瑞慶,王弗雄,馬杰,肖自乾
(海南軟件職業技術學院軟件工程系,海南瓊海571400)
電價是電力市場供求平衡時形成的出清價,不僅受氣象、系統負荷、發電成本、可用發電容量、輸電網絡阻塞等客觀因素的影響,還受到市場交易規則、參與者的競價策略及其對價格的心理反映等主觀因素的影響,這些因素使得準確的電價預測較為困難。當前的預測方法主要包括通過模擬電力市場競爭規則來預測市場出清電價的長期預測方法和依據大量歷史數據建立反映電價變化規律數學模型的短期預測方法[1]。
神經網絡對非確定性、非精確性規律具有自適應能力,能夠有效地處理多變量和非線性問題[2-5]。文獻[2-3]分別使用粒子群優化和Levenberg-Marquardt訓練方法的三層前饋神經網絡對PJM和加利福尼亞電力市場的現貨電價進行了預測。文獻[4-5]指出高斯徑向基函數神經網絡比傳統神經網絡具有更快的學習速度和更好的逼近性能,更加適合于短期電價的預測。文獻[6-10]分別提出了神經網絡與模糊邏輯、Kalman濾波、支持向量機等相結合的短期電價預測方法,結果表明,混合預測方法比單獨使用神經網絡具有更好的預測效果。但由于神經網絡方法的參數調整不夠靈活,學習速度較慢,在實際應用中遇到了困難。
時間序列方法需要的歷史數據相對較少,能準確地反映歷史電價變化的連續性,比較常用的有自回歸滑動平均模型(ARMA)和帶外生解釋變量的ARMA模型(ARMAX)。文獻[11]建立了一個以負荷作為外生解釋變量的ARMAX模型,結果表明,殘差的實際分布與理論假設存在較大誤差,在一定程度上影響了電價預測的精度。文獻[12]注意到大多數電價序列均是非平穩隨機過程的特點,提出了一種基于自回歸積分滑動平均模型(ARIMA)的電價預測方法。文獻[13]注意到不同時段也是一個影響電價變動的重要因素,建立了一個基于ARMA的分時段電價預測模型,使得對價格飛升(price spikes)的預測準確度得到了較大的提高。文獻[14-15]分別建立了將誤差校正、小波變換與ARIMA相結合的電價預測模型。文獻[16]建立了一個考慮電價序列的非平穩、分時段和負荷因素的傳遞函數預測模型,進一步提高了電價預測的準確性。但這些模型均基于電價服從常方差正態分布的假設,不能有效地處理電價序列的異方差性,同時待估參數較多,難于大量應用。
本文在文獻[11]的研究基礎上,進一步分析了電力市場現貨電價的影響因素和波動規律,提出了一種采用虛擬變量和正弦函數來刻畫現貨電價序列多周期性特征的GARCH-M模型。該模型易于定階、待估參數少,可同時處理電價序列的趨勢變化、多重周期、異方差及其與負荷之間的非線性相關性,具有一定的實用價值。對PJM電力市場歷史數據的分析表明,電價分布的異方差和負荷的平方對電價的均值具有顯著的影響,電價序列具有周、半月、月、季、半年等多重周期和明顯的波動集聚效應,其殘差的理論和實際擬合程度與文獻[11]相比有較大程度的提高。
電價預測模型可以看作一個多輸入單輸出系統,輸出為當期電價,輸入為系統負荷、參與者的報價策略、燃料價格、季節、氣候等影響因素。考慮到系統負荷和電價在各個電力市場中均是公開信息,因此,本文選擇當期負荷、歷史負荷與歷史電價作為輸入,并使用時間序列分析的GARCH-M模型對這一系統進行描述。設pt表示t期的現貨電價,dt表示期殘差表示的條件方差表示歸一化殘差,則描述電價變化的多周期GARCH-M模型可表述為
i

式中,B為滯后算子;m為電價一年內的變化周期數;u、v、r、s分別為均值方程中電價、條件方差的平方根、負荷及負荷平方的滯后階數;p、q為條件方差方程中條件方差和殘差平方的滯后階數;It-1為t-1期的可用信息集;f(t)描述電價序列的趨勢和季節性變化,dwkd是一個表示周周期的虛擬變量(工作日取值為1,休息日為0)。α=(α0,α1,α2,α3,α11,…,α1m,α21,…,α2m)、γ=(γ1,…,γr)、κ=(κ1,…,κs)、φ=(φ1,…,φu)、θ=(θ1,…,θv)、β=(β0,β11,…,β1p,β21,…,β2q)為待估參數。通過使用多個正弦函數可以允許電價序列存在多個周期,每個周期的幅度和峰值位置分別由α1i和α2i描述。為保證條件異方差為正,要求β0>0,β1i,β2j≥0,坌i∈[1,p],j∈[1,q]。
通過對去趨勢和周期變化后的電價序列pt-f(t)的自相關函數和偏自相關函數的分析,可以確定u的初始取值,r和s的初始取值可以通過觀察電價序列與負荷、負荷平方的趨勢圖加以確定,p和q的取值一般不會超過2,可通過分析殘差εt的平方的自相關函數和偏自關函數加以確定。
時間序列的自相關性可以使用自相關系數進行描述。對于給定時間序列{yt},k期自相關系數ρk為
式中,n表示樣本容量;y軃表示樣本數據的算術平均值。
在給定yt-1,…,yt-k+1條件下,yt與yt-k之間的條件相關關系稱為偏自相關,可以使用偏自相關系數ρkk描述,其計算公式為

AR(p)序列的自相關函數隨滯后期的增加,呈現指數或者正弦波衰減,逐漸趨近于0,而其偏自相關函數在k>p后全都趨向于0。因此,可以根據偏自相關函數的截尾性來辨識AR(p)模型的參數p。
MA(q)序列的自相關函數在k>q后全部趨向于0,而其偏自相關函數呈指數衰減,具有拖尾性。因此,可以根據自相關函數的截尾性來辨識MA(q)模型的參數q。
若設白噪聲序列zt的概率密度函數為正態分布,則εt的條件概率密度函數為[17]
若記ξ=(α,γ,κ,φ,θ,β,ht),則εt的樣本對數似然函數可表示為

式中,n表示觀察值的個數;lt(ξ)表示t期觀察值的條件對數似然函數。通過最大化L(ξ),可以獲得模型參數ξ的估計值ξ贊。
大樣本下,條件極大似然估計值ξ贊漸近服從式(6)表示的正態分布

式中,ξ0為待估參數的真值;H為Hessian矩陣;可通過H(ξ0)≈墜L(ξ)/墜ξ墜ξ′|ξ=ξ贊估計。
殘差的真實密度函數可能并不完全符合條件正態分布,因此有必要給出ξ贊的穩健方差,以便計算其漸近有效置信區間。ξ贊的穩健方差為矩陣Ω贊的對角元素。

Nyblom統計量可用于檢驗模型的穩定性[17],Nyblom統計量WN可表示為


式中,Skt為St的第k個元素;V贊kk為V贊的第k個對角元素。
Cramer-Von Mises統計量可用于檢驗歸一化殘差zt是否符合條件正態分布。若正態分布的累積分布函數為FN(z),zt的實際累積分布函數為F(z),則Cramer-Von Mises統計量WCVM為

一般而言,電價序列預測模型是一個參數時變模型,其參數均需用最新的數據進行辯識,以便提高電價預測的準確性。本文采用平均絕對百分比誤差(MAPE)來度量模型的預測精度,其表達式為

本文的研究樣本來源于美國PJM電力市場2007年6月1日至2010年9月9日的日平均現貨電價和負荷,樣本總數為1197,日平均現貨電價如圖1所示。從圖1可以看出,該電價序列存在明顯的均值回復、尖峰跳躍、多重周期和異方差。

圖1 PJM電力市場的日平均電價序列Fig.1 The time series of mean daily spot prices on PJM electricity market
表1給出了日平均現貨電價和日平均負荷序列的描述性統計結果。從表1可看出,2個樣本的偏度系數和峰度系數都顯著異于正態,現貨電價和負荷序列均呈現明顯的右偏形態,同時具有較為明顯的尖峰胖尾特征。J-B統計量非常顯著,說明樣本期間內現貨電價和負荷的分布具有非正態性。
對樣本數據的趨勢圖及相關系數進行分析,可將多周期GARCH-M模型具體化為(m,u,v,r,s,p,q),分別取值(24,4,1,1,1,1,1),并使用極大似然法對模型參數進行估計。表2給出了剔除在95%置信水平上不顯著的參數后(截距項除外)的估計結果。

表1 樣本數據的描述性統計結果Tab.1 Descriptive statistics of the sample data

表2 多周期GARCH-M模型的估計結果Tab.2 Estimation results of multicycle GARCH-M
對表2的數據進行分析,可以得到如下結論:
1)模型的擬合精度(MAPE)6.352%與文獻[12-16]相當,遠少于文獻[12-16]的待估參數個數,在一定程度上降低了模型的復雜度,提高了模型的計算速度及其實際應用能力。
2)參數a2和a1i、a2i、i I贊(2,4,6,10,24)的t統計量均在95%置信水平上,說明電價序列存在周、半月、月、季、半年等多周期效應,且周和半年周期的峰值幅度較大。
3)當在均值方程中包含負荷平方項時,各期負荷項的系數在95%置信水平上均不顯著,表明現貨電價與負荷平方之間的相關性要強于負荷,因此應通過在均值方程中包括負荷的平方項來描述電價與負荷之間的相關關系。
4)條件異方差對現貨電價均值的影響顯著(q1=0.233 3),在保持其它決定變量不變時,當電價波動性增強時,電價上升。
5)條件方差方程中b11=0.826,表明電價序列存在較強的波動集聚現象。而b11和b21之和為0.999,接近于1,說明電價序列可能存在共積GARCH效應。
6)Cramer-Von Mises統計量0.576 4略大于99%置信限臨界值0.333,從圖2可見殘差序列存在明顯的超額峰度,這表明多周期GARCH-M模型仍不能精確地描述電價序列的真實分布。

圖2 殘差的概率密度Fig.2 Probability density of the residuals
7)各待估參數的Nyblom統計量均小于其99%置信水平臨界值0.748,但整個模型的Nyblom統計量(6.976 5)大于其99%置信水平下的臨界值5.13,表明多周期GARCH-M模型存在一定程度的不穩定性,一個可能的原因是由于電價序列存在明顯的右偏和尖峰厚尾,而這也是下一步要解決的主要問題。
在文獻[11]的研究基礎上,進一步分析了電力市場現貨電價的影響因素和波動規律,建立了一個采用虛擬變量和正弦函數來刻畫現貨電價序列多周期性特征的GARCH-M模型。該模型易于定階、待估參數少,可同時處理電價序列的趨勢變化、多重周期、異方差及其與負荷之間的非線性相關性,具有一定的實用價值。對PJM電力市場2007年6月1日至2010年9月9日的歷史數據的算例分析表明,電價分布的異方差和負荷的平方對電價均值具有顯著的影響,電價序列具有周、半月、月、季、半年等多重周期和明顯的波動集聚效應。但本文模型關于殘差符合正態分布的假設與殘差的實際分布不能精確吻合,這在一定程度上降低了模型的擬合優度,因此如何進一步改進以提高模型的擬合優度是下一步要解決的問題。
[1] 陳思杰,周浩.電力市場電價預測方法綜述[J].繼電器,2006,34(11):54-60.CHENSi-jie,ZHOUHao.Electricity price forecast method of electricity market[J].Relay,2006,34(11):54-60(in Chinese).
[2] 王立晶,劉叢.基于PSO訓練BP神經網絡的短期電價預測[J].電力科學與工程,2008,24(10):21-23.WANG Li-jing,LIU Cong.Short-term price forecasting based on PSO train BP neural network[J].Electric Power Scienceand Engineering,2008,24(10):21-23(in Chinese).
[3] CATALAO J P S,MARIANO SJ P S,MENDES V M F,et al.Short-term electricity prices forecasting in a competitive market:a neural network approach[J].Electric Power System Research,2007,77(10):1297-1304.
[4] GUO J J,PETER B L.Selecting input factors for clusters of Gaussian radial basis function networks to improve market clearing price prediction[J].IEEE Trans on Power Systems,2003,18(2):665-672.
[5] 翁陳宇,陳維榮,羅小安.基于相似搜索和RBF神經網絡的短期電價預測[J].電力科學與工程,2007,23(1):9-11.WENG Chen-yu,CHEN Wei-rong,LUO Xiao-an.Shortterm electricity price forecasting based on analogue search and RBF neural network[J].Electric Power Science and Engineering,2007,23(10):9-11(in Chinese).
[6] HONG Y Y,HSIAO C Y.Locational marginal price forecastingin deregulated electricity marketsusingartificial intelli-gence[J].IEE Proc on Gener Transm.Distrib,2002,149(5):621-626.
[7] CLAUDIA P R,GEORGE J A.Energy price forecasting in the Ontario competitive power system market[J].IEEE Trans on Power Systems,2004,19(1):366-374.
[8] ZHANG Li,PETER B L.Neural network-based market clearing price prediction and confidence interval estimation with an improved extended kalman filter method[J].IEEE Trans on Power Systems,2005,20(1):59-66.
[9] AMJADY N.Day-ahead price forecasting of electricity markets by a new fuzzy neural network[J].IEEE Trans on Power Systems,2006,21(2):887-986.
[10]FAN S,MAO C,CHEN L.Next-day electricity price forecasting using a hybrid network[J].IEE Proc on Gener Transm Distrib,2007,1(1):176-182.
[11]王瑞慶,季文天.基于有偏t分布ARMAX模型的短期電價預測[J].電網與清潔能源,2011,27(2):19-23.WANG Rui-qing,JI Wen-tian.Short-term electricity price forecasting based on ARMAX model with skewed student-t distribution[J].Power System and Clean Energy,2011,27(2):19-23(in Chinese).
[12]CONTRERAS J,ESPINOLA R,NOGALES F J,et al.ARIMA models to predict next-day electricity prices[J].IEEETrans on Power Systems,2003,18(3):1014-1020.
[13]CUARESMA JC,HLOUSKOVA J,KOSSMEIER S,et al.Forecasting electricity spot-prices using linear univariate time-seriesmodels[J].Applied Energy,2004,77(1):87-106.
[14]周明,嚴正,倪以信,等.含誤差預測校正的ARIMA電價預測新方法[J].中國電機工程學報,2004,24(12):63-68.ZHOUMing,YANZheng,NIYi-xin,et al.A novel ARIMA approach on electricity price forecasting with the improvement of predicted error[J].Proceedings of the CSEE,2004,24(12):63-68(in Chinese).
[15]CONEJOAJ,PLAZSAMA,ESPINOLAR,etal.Day-ahead electricity price forecasting using the wavelet transform and ARIMAmodels[J].IEEETranson Power Systems,2005,20(2):1035-1042.
[16]陳友,王 ,李渝曾.一種用于短期電價預測的分時段時間序列傳遞函數模型[J].電力系統保護與控制,2008,36(16):1-4.CHEN You,WANG Xian,LI Yu-zeng.Electricity price forecasting based on transfer function models for perioddecoupled time series[J].Power System Protection and Control,2008,36(16):1-4(in Chinese).
[17]NYBLOM J.Testing for the constancy of parameters over time[J].Journal of the American Statistical Association,1989,84(405):223-230.