呂維港, 王 輝*, 周子揚, 汪怡秀, 邾玢鑫
(1.三峽大學電氣與新能源學院, 宜昌 443002; 2.三峽大學湖北省微電網工程技術研究中心, 宜昌 443002)
近幾年大量清潔能源并入電網,影響了電價的走勢,給電價預測帶來前所未有的挑戰(zhàn)[1-2]。如何提高此類情況下的電價預測精度已成為重點待解決的問題。現在學界前沿的研究中,一般采用集成方法(即集成多種模型的預測結果)來提高精確度,但在高比例風電的場景下應重點分析風電并網給電價帶來的影響。針對此類情況,現重點研究了高比例風電接入情況下如何改進電價預測模型。
常見的電價預測方法主要分為時間序列預測、人工神經網絡預測和統計學習預測三大類,由于電價是標準的時間序列,因此時間序列預測方法是應用最為廣泛的模型[3-4]。經典的時間序列模型主要有ARIMAX(auto-regressive integrated moving average models with exogenous input)、GARCH(generalized autoregressive conditional heteroskedasticity model)[5],以這些模型為基礎與其他模型進行有機結合形成了大量的組合模型[6-7]。隨著神經網絡的不斷發(fā)展,各種神經網絡模型也成為電價預測的主流模型[8],常用的有BP神經網絡(BP neural network, BPNN)、循環(huán)神經網絡(recurrent neural network, RNN)、長短期記憶(long-short term memory, LSTM)等。統計學習預測法作為經典預測方法也被廣泛應用在電價預測領域,其中應用最多的算法是支持向量機(support vector machine, SVM),其本質是以統計學習為基礎然后求解二次規(guī)劃問題的方法。統計學習預測法的最大優(yōu)點在于它很難陷入局部極大值和極小值,容易得到全局最優(yōu)解。雖然電價預測的模型很多,但大多都只是應用于一般情況,很少有針對高比例風電下的電力市場電價預測研究。
如今大量研究表明電價在短時間尺度下具有明顯的周期性規(guī)律,所以在搭建模型時應重點考慮其輸入數據的時序性,而LSTM模型恰好能滿足這些需求,能夠從歷史數據中有效的挖掘出數據的規(guī)律信息,解決長時間序列的梯度消失與梯度爆炸的問題,與其他深度學習方法相比表現出非常優(yōu)秀的預測性能[9-10]。同時注意力機制(Attention)的出現能夠讓LSTM模型更好地抓住原始數據中的重點信息,提高模型訓練效果。
基于上述考慮,現構建LSTM-Attention電價預測模型,根據最大信息系數[11](maximal in formation coefficient, MIC)來分析此類場景下各影響因素與電價的相關性,同時結合高比例風電接入的特點提出一個新的輸入特征變量,該特征變量能夠有效代表風電與負荷共同對電價的影響程度。最后,通過北歐電力市場實時數據進行算例仿真,驗證所提出方案的合理性,以期為清潔能源參與市場競爭和電價調整提供理論基礎。
最大信息系數(MIC),是一種優(yōu)秀的數據關聯性的計算方式,用來衡量兩個數據之間的關聯程度,具有普適性、公平性和對稱性[12],且魯棒性高,穩(wěn)健性好,不受到異常值的影響,相比于傳統的相關性算法更能體現屬性之間的關聯程度[13]。
假設存在一個包含某種相關性的二元數據集D,將這個二元數據劃分為x列、y行,然后計算劃分后的網格G中每個單元的概率,得到數據集在網格上的概率分布,這樣就求得兩變量的最大互信息。轉化x、y軸的劃分方向后運用上述方法同樣求得一個最大互信息,將兩個最大互信息歸一化后進行比較,較大的一個即為該二元數據集的MIC值,計算公式為
I*[D(x,y)]=maxI(D丨G)
(1)

(2)

(3)
式中:n為數據集D中總點數;B(n)為網格G劃分的相關約束,一般B(n)取n0.6;M(D)為數據集D的特征矩陣;I與I*分別為互信息與最大互信息;F為數據集D的MIC值,取值范圍為[0,1],其值越接近1代表兩屬性之間相關性越強。
電價、負荷與風能數據來源于北歐電力市場DK1的2020年7月12日—9月12日的歷史市場數據[14]。共采集63 d的數據,對每一日的電價、風能與負荷數據進行MIC相關性分析。
設Li={li(1),li(2),…,li(24)}的負荷序列,其中l(wèi)i(t)為第i天第t個采樣值,采樣間隔為1 h。同理Wi為第i天的風能序列,Pi為第i天的電價序列。計算每一日的Pi與Li、Pi與Wi的相關性,計算結果顯示Pi與Li的MIC>0.5的共有45 d,約占總天數的71.4%,平均每天的MIC為0.57。Pi與Wi的MIC>0.4的共有43 d,約占總天數的68.3%,平均每天的MIC為0.47。結果表明無論是電價與負荷還是電價與風能之間都有著明顯的弱相關性,但也存在某天相關性極低的現象,即MIC值小于0.3,這與風電出力的不確定性相關。圖1為該地區(qū)2020年7月11—12日的電價、負荷與風能曲線。
從圖1中可以看出電價的變化趨勢與負荷的變化趨勢大致相同,與風電出力的變化趨勢大致相反,所以電價數據的變化趨勢受風電出力與負荷共同影響。當負荷與風電出力對電價的變化趨勢影響相互沖突時,電價會主要受到變化趨勢較大的一方影響。
為了探究電價的周期性強度,以當前電價序列為參照分析過去時刻電價序列對當前電價序列的影響,以此來挖掘電價序列之間的規(guī)律信息。
圖2給出了北歐DK1電力市場2020年7月17日的電價序列Pi與以前各時刻電價序列的相關性,其中t-1表示向前擴展1 h后的電價序列,t-2表示向前擴展了2 h后的電價序列,一直到向前擴展了一周后的電價序列(t-168)。從圖2可以看出,DK1電力市場電價數據著明顯的周期性,在t-24,t-48,t-72,t-96,t-168的MIC相關系數都較高,體現了DK1電力市場電價序列明顯的日周期性。在t-110~t-158時刻其MIC相關系數顯著降低,一定程度上表明DK1電力市場周末節(jié)假日期間影響電價的因素增加。滯后7 d左右后的電價序列與當前電價序列MIC值較高,表明DK1電力市場電價數據的周周期性也比較突出。

圖2 歷史電價與當前電價的相關性曲線Fig.1 Correlation curve between historical electricity price and current electricity price
針對高比例風電接入的情況,考慮到風電的接入會改變負荷構成特性,對風電出力與負荷數據進行融合處理。以往的研究表明,風電出力與負荷的比值(風荷比)是影響含高比例風電的電力市場電價的重要因素,從嚴格的數學角度來講也就是說風荷比與電價有著很強的相關性,以風荷比作為輸入特征變量的電價預測模型已經取得了良好的成果[15]。但從相關性的角度來講,風電出力W的m次方與負荷L的n次方相乘后得到的變量不一定在m、n取1、-1時才與電價有著最大的相關性。為了探究其中的規(guī)律,在此提出一個特征變量WL,W、L、P分別為預測日前一周的風能序列、負荷序列和電價序列,m、n為常數,滿足WL與P的MIC值最大。
WL=WmLn
(4)
式(4)中:m、n為指數。
圖3給出了以m的值、n的值、WL與P的MIC值為坐標的三維圖,結合實際情況考慮m、n取值范圍均為-2~2。從圖3中可以看出MIC值是關于原點對稱的,m與n同號時,MIC值都較低;m與n異號時,MIC值顯著提高,當m=1.3、n=-0.5或m=-1.3、n=0.5時WL與P的MIC值最大,均為0.57,風荷比(m=1,n=-1)的MIC值為0.49。而P單獨與L、W的MIC值僅為0.43、0.31。

圖3 MIC三維曲線圖Fig.3 MIC 3D curve
m=1.3,n=-0.5(或m=-1.3,n=0.5)時MIC值最大意味著此時WL與P的相關性最強。m、n只有在異號時才有著明顯的相關性,說明風電出力序列與負荷序列是一組相互制約的關系,結果顯示m的絕對值大于n的絕對值說明這種關系中風電出力對電價的貢獻度大于負荷對電價的貢獻度,這與1.2節(jié)的分析相符合。
經過計算得到的一組改進的特征變量WL相比單獨考慮負荷或風能而言對電價的影響更大,能夠代表風電出力與負荷共同對電價的影響程度。 但需要注意的是,m、n的值并不固定,W、L、P均為預測日前一周的數據,所以每次進行日前預測時都需要重新計算m、n的值。
通過以上分析,重點選擇WL作為模型額外輸入變量,驗證是否能夠增加模型預測精度。
為了解決RNN對久遠的輸入信息可能會遺忘的問題,Hochreiter等[16]在RNN結構中加入了門控機構,得到了一個對輸入信息具有挑選能力的神經網絡結構LSTM,LSTM能夠選擇性地對輸入信息進行記錄或遺忘,解決了RNN訓練過程中梯度消失和梯度爆炸問題,LSTM的結構如圖4所示。工作方式如下。

圖4 LSTM單元結構Fig.4 LSTM cell structure
(1)LSTM遺忘門:
ft=σ(Wfxt+Ufht-1+bf)
(5)
(2)LSTM輸入門:
it=σ(Wixt+Uiht-1+bi)
(6)

(7)
(3)記憶單元:

(8)
(4)LSTM輸出門:
ot=σ(Woxt+Uoht-1+bo)
(9)
ht=ottanh(Ct)
(10)

Attention機制也叫注意力機制,其作用是將注意力集中在某些地方,本質是對數據進行權重值分配,權重越大代表對整個模型的影響越大,從而實現對重要信息重點關注。Attention機制與LSTM神經網絡結合能夠打破傳統編碼-解碼器在編碼過程中使用固定長度向量的限制,保留 LSTM 編碼器的中間狀態(tài),通過訓練模型來對這些中間狀態(tài)進行選擇性學習,使得預測模型能夠判斷各時刻輸入信息的重要程度,提高模型的訓練效果[17-18],結構如圖5所示。

x1,x2,…,xL為原始數據的輸入;LSTM層的輸出H1,H2,…,HL作為Attention層的輸入;a1,a2,…,aL為當前的注意力權重值;V為結合了注意力權重的最終向量;Softmax函數將預測結果歸一化圖5 Attention機制結構Fig.5 Attention mechanism structure
計算匹配得分與注意力權重值:
(11)

(12)


(13)
經過LSTM-Attention后得到的向量V既包含了整個數據的時序信息,又能將注意力集中在重點信息上。
為了研究所提出特征變量對模型預測精度的影響,選擇多組不同的輸入參數構建多種預測模型,模型輸出為預測日24個電價序列。考慮到外送電有自己單獨的購售電量交易形式,本模型適用于外送電量低或者無外送電量的電力市場。
2.3.1 輸入模型A
本模型為不考慮額外的輸入變量的模型,將作為比較分析的基準,其中風電、負荷、電價實時數據作為模型訓練學習的基礎數據,平均值數據可以使得模型預測值向平均值附近聚攏,避免出現較大誤差,有效提高模型整體預測值,日型與時間指示能使模型更高效地學習數據中的規(guī)律信息,包含以下輸入變量:①日型指示,即周日的“1”,星期一的“2”等;②小時指示,即“1”,“2”,…,“24”;③預測日預測的風能W(h);④預測日前7天每個小時的平均風能Wav(h);⑤預測日預測的負荷L(h);⑥預測日前7天每個小時的平均負荷Lav(h);⑦預測日前7天每個小時的平均電價Pav(h);⑧預測日前7天的歷史電價數據Pt-1-Pt-168。
2.3.2 模型B
本模型為充分考慮各種輸入變量的模型,在模型A基礎上加入了預測日每個小時的WL序列 (m、n計算過程見1.4節(jié)),理論上其預測效果最好。
2.3.3 模型C
本模型在模型A的基礎上額外考慮預測日每個小時的風荷比W1L-1作為輸入變量,目的是與模型B進行對比,驗證所提出特征變量WL的有效性。
考慮到模型的輸入數據太多,計算量大且耗時長,最終預測效果也不好,故對原始輸入數據進行主成分分析(principal component analysis,PCA)進行降維處理[19-20]。PCA是一種常見的數據分析方式,常用于高維數據的降維,可用于提取數據的主要特征分量,現運用PCA將原始輸入數據降維成48維數據,總貢獻度高達0.98。
原則上來講設置的LSTM層越多,模型的非線性擬合效果越好,但LSTM層的增多會大大增大訓練時間,并且容易產生過擬合現象。通過增大LSTM層來測試電價預測效果,如表1所示,在網絡層為5層時模型預測精度最小,考慮到從2層LSTM結構增加到5層時預測精度僅略微減小,訓練所需時間卻極大提升,因此采用兩層的LSTM神經網絡結構,第一層設置的神經元個數為128,第二層設置的神經元個數為64。誤差值采用平均絕對誤差(mean absolute error,MAE)與均方根誤差(root mean error,RMSE)。

表1 不同訓練層數的預測結果Table 1 Prediction results of different training layer
平均絕對誤差(MAE):

(14)
均方根誤差(RMSE):

(15)
式中:yi為電價的真實值;fi為電價的預測值;n為預測樣本數目。
為了確定LSTM神經網絡的時間步長k,對比模型B在不同k值下的誤差,如表2所示。

表2 不同時間步長下的MAE與RMSETable 2 MAE and RMSE under different time steps
根據實驗結果最終選取時間步長k=3,即將通過主成分分析降維后的48維數據分為三組16維數據,構建的預測模型如圖6所示。

圖6 LSTM-Attention預測模型Fig.6 LSTM-Attention prediction model
以北歐DK1電力市場2020年3月5日—9月5日的日前電價、負荷和風電出力為數據集,取前5個月數據為訓練集,最后1個月數據為測試集。然后分別采用LSTM與LSTM-ATTENTION算法預測2020年9月6—12日的日前市場電價,通過實驗比較不同輸入特征下的電價預測效果,如表3所示。

表3 不同輸入下模型的預測誤差Table 3 Model prediction error under different input
從表3可以看出,不管哪種算法,模型B的誤差最小,且引入ATTENTION機制后模型的預測精度均有效提高。采用LSTM-ATTENTION算法的模型B與模型A相比MAE降低了19.7%,RMSE降低了18.3%,體現了本文中所提出的特征變量的重要性、與模型C相比MAE降低了6.1%,RMSE降低了6.2%,這說明在深度學習中采用本文中方法得到的特征變量相比風荷比而言更能體現電價的特征,提高預測精度。
圖7給出LSTM-ATTENTION預測曲線,可以看出三種模型的預測偏差主要體現在電價的波峰和波谷區(qū)域,主要出現在22:00—04:00,這是因為這一時間段處于用電低谷期,特征變量WL的值較大。相比較而言模型B對于電價峰值區(qū)域的預測值最為接近,說明所提出的特征變量能夠有效預測電價的峰值,總體來看模型B的擬合效果也最好。

圖7 LSTM-ATTENTION預測曲線Fig.7 LSTM-attention prediction curve
為了充分說明本方法的有效性與普適性,除了LSTM-ATTENTION與LSTM外還分別與基于BP、RNN、SVM和經典ARIMAX算法的預測模型進行實驗對比,RNN模型的超參數設置與前述LSTM神經網絡的超參數設置相同,SVM的核函數為徑向基函數(radical basis function,RBF)。同樣以丹麥DK1電力市場2020年3月5日—9月5日的前5個月數據為訓練集,最后1個月數據為測試集,預測9月6—12日的日前市場電價,實驗結果如表4所示。

表4 不同算法下模型的預測誤差Table 4 Model prediction error under different algorithms
通過對比表3和表4可以發(fā)現,采用LSTM-ATTENTION算法后的誤差明顯低于采用BP、SVM等常見算法的誤差,體現。RNN、SVM、BP、ARIMAX算法采用模型B輸入特征與采用模型C輸入特征相比,MAE分別降低了6.0%、5.5%、7.4%、6.1%,RMSE分別降低了5.7%、5.2%、6.6%、8.6%,說明在各種經典算法下,所提出的特征變量WL相比風荷比而言更能提高高比例風電情況下模型的預測精度。采用模型B輸入特征時,其誤差指標均顯著低于采用模型A輸入特征的誤差指標,MAE分別降低了14.9%、18.8%、19.3%,20.1%、RMSE分別降低了15.1%、15.3%、19.7%,19.2%,說明本文中所提出的特征變量具有較好的普適性,對各種常用的預測模型預測精度都有較明顯的提升,提高了模型的魯棒性和穩(wěn)定性。
為了進一步檢驗模型性能,取2019年12月6日至2020年6月6日數據訓練模型,采用LSTM-Attention算法預測北歐DK2電力市場2020年6月7日—7月4日共4周的電價數據, DK2市場與DK1市場相似,都有著很高的風電滲透率,誤差對比如表5所示,預測曲線如圖8所示。

表5 DK2市場預測誤差對比Table 5 Comparison of DK2 market forecast error

圖8 DK2市場預測曲線Fig.8 DK2 market forecast curve
結果顯示,DK2電力市場四周的預測誤差中模型B的誤差值均最小,進一步說明了本文所提出方法的普適性。
提出了一種融合了風電出力與負荷數據的特征變量,代表風電出力與負荷對電價的共同影響程度,提高了模型預測精度,并構建LSTM-Attention模型進行了驗證,主要結論如下。
(1)采用MIC方法確定了當前時刻電價與歷史電價、歷史負荷、歷史風電出力之間存在較強的相關性,電價預測時應作為重點因素予以考慮。
(2)提出的特征變量相比風荷比而言與電價的相關性更強,更能體現風電出力與負荷共同對電價的影響程度,提升了短期電價預測的精度,并且具有很高的普適性。
(3)充分挖掘了電價與各影響因素之間的規(guī)律,具有較好的魯棒性和泛化能力。