張 娜 薛靖飛 張 晶
(1.內蒙古工業大學 內蒙古 呼和浩特 010008;2. 內蒙古華能呼倫貝爾公司東海拉爾發電廠 內蒙古 海拉爾 021008)
隨著光伏發電技術的迅速發展,光伏發電在電力系統中的比重逐年增加。2018年全世界新增光伏裝機總量超過100GW,2019年新增121GW,到2019年底,光伏裝機總容量已達到了626GW。但光伏的間歇性、隨機性問題更為凸顯,為了更好地接入光伏,對其進行準確地預測是目前最為基礎的工作之一。
光伏發電前景良好,世界各國都進行了對其預測的研究。早在2005年世博會上,日本就展示了NTT Facilities公司的光伏發電預測技術預測330KW光伏發電項目[1]。我國對光伏發電輸出功率的預測起步較晚,但也取得了良好的進展。如寧夏供電公司的光伏發電項目,中國電力科學研究院和湖北省氣象部門合作并開發的光伏發電輸出功率預測系統等。對國內外的研究方法進行總結,可以發現目前對于光伏輸出功率預測的方法基本可以分為時間序列法[2]、人工智能法[3]、物理模型參數法等。時間序列法運算速度快,但若天氣情況改變,預測精度就不高;人工智能法建模方便,但部分方法容易陷入局部最優,影響預測精度;物理模型參數法建模過程復雜,參數評估困難。本文選取時間序列法進行預測,為了避免數據變化對模型的影響,采用相似日的方法對模型輸入樣本進行改進,利用選取樣本前后預測結果進行比較,驗證本文所提方法的有效性。
1.1 自回歸移動平均模型(ARIMA)
自回歸移動平均模型的簡稱是ARIMA模型,全稱是Autoregressive Integrated Moving Average Model。是美國學者金肯和波克斯于1970年提出的[4]。ARIMA模型的基本思想:首先將預測對象按照時間經過的順序排列數據,并作為一個隨機序列來處理;其次基于時間序列的自相關分析,選擇出適當的參數,用數學模型近似描述這個序列;最后確定了模型后,就可以利用模型和過去的數據去預測未來的數據。ARIMA模型不僅考慮了數據的變化對時間序列的依賴,還考慮在數據變化過程中各種隨機擾動的干涉。這是近年來使用最廣泛的方法之一。
ARIMA是ARMA(自回歸滑動平均模型)的擴展模型。ARMA可以用于平穩時間序列建模預測,由自回歸模型和滑動平均模型為基礎混合而成。
自回歸模型AR(p)可以用如下公式表示:
Xt=φtxt-1+φ2xt-2+……+φnxt-n+εt
(1)
滑動平均模型MA(q)可以用如下公式表示:
Xt=εt-θ1εt-1-θ2εt-2-…-θnεt-n
(2)
ARMA(p,q)模型可以用如下公式表示:
Xt=φ1xt-1+φ2xt-2+…+φnxt-n+εt
-θ1εt-1-…-θnεt-n
(3)
其中φi為自回歸參數;θj為滑動平均參數;
εt為高斯白噪聲。
當q為零時ARMA模型就退化為AR模型,當p為零時ARMA模型就退化為MA模型。
ARIMA(p,d,q)模型是ARMA模型的一種擴展,“d”表示差分的階數。可以用于非平穩時間序列數據建模預測,可以表示為:
(4)
當d=0時ARIMA模型就退化為ARMA模型。
1.2 相似日選取
光伏發電出力和太陽輻射量密切相關,氣候又直接影響太陽輻射量,因此以太陽輻射量為依據通過歐式距離公式把樣本數據分為2種基本的天氣類別,晴天與陰天,然后分別建模預測。
1.3 預測誤差
本文利用平均絕對百分比誤差MAPE來作為模型的評價指標,MAPE的計算公式為:
(5)
式子中:N為樣本數;Sn為真實值;Yn為預測值。
1.4 模型預測流程
ARIMA模型預測主要分為建模和預測兩個步驟。選取相似日樣本構建ARIMA模型,模型的建立流程,如圖1所示:

圖1 ARIMA模型的建立
2.1 晴天預測過程及結果分析
2.1.1樣本數據平穩化
本數據為內蒙某光伏電站2019/01/01-2019/06/30的光伏出力數據,時間間隔為15min。選取其中部分樣本作為測試數據。首先對樣本數據進行ACF與PACF檢驗,自相關函數(ACF)是把一個序列之中的數據互相對比,結果代表了同一序列之中不同值的相關性。偏自相關函數(PACF)是除去中間變量的干擾后,兩個變量之間的相關程度[5]。由于篇幅原因,僅顯示晴天情況下測試數據的情況,如圖2、圖3所示:

圖2 ACF檢驗

圖3 PACF檢驗
根據圖2和圖3分析,可以看出數據不穩定,不符合ARIMA模型的要求,需要對數據進行差分處理。對不穩定的數據進行n階差分能得到穩定的數據,但差分過多會導致數據的流失,所以這里先進行一次差分,查分后與差分前數據對比,如圖4所示:

圖4 一次差分數據與原數據對比
對一次差分數據進行ACF與PACF檢驗,如圖5、圖6所示:

圖5 一次差分數據ACF檢驗

圖6 一次差分數據PACF檢驗
一次差分數據ACF與PACF在延遲幾階之后趨于穩定,符合平穩性要求。并對差分數據進行ADF檢驗和KPSS檢驗,得到ADF =1,KPSS =0,通過檢驗。
2.1.2 模型的定階和建立
根據圖5和圖6分析,一次差分數據的ACF與PACF在延遲10階后趨于穩定,符合ARIMA模型的要求。
ARIMA(p,d,q)模型中的d為1,先假設p,q最大為10,然后在p(1-10),q(1-10)范圍內,根據AIC選取適當的階數。AIC(信息準則,即Akaike information criterion),是判斷模型擬合優良的一種常用標準。在一般的情況下,AIC的計算公式為:
AIC=2*K-2ln9(L)
(6)
式中:K是參數的數量,L是似然函數。
表1為挑選出的幾種AIC最小的模型。

表1 晴天ARIMA模型pq值的選擇
根據AIC準則選取出最適當的階數p為10,
q為8。建立ARIMA(10,1,8)模型,并用前21天晴天光伏功率數據訓練模型,所得模型為:
yt-0.2583yt-1+0.1520yt-2+0.8517yt-4+0.6257yt-3+0.4986yt-5+0.2457yt-6-0.8433yt-7-0.2490yt-8
-0.0831yt-9-0.0609yt-10=εt-0.0131εt-1-0.1399εt-2-0.5599εt-3-0.6156εt-4-0.3034εt-5-0.2258εt-6
+0.8682εt-7-0.0106εt-8
對ARIMA(10,1,8)模型進行殘差檢驗,符合要求,并對晴天預測日的光伏發電輸出功率進行預測。
2.1.3預測結果
預測出來的數據進行反差分得到結果。如圖7所示:

圖7 相似日樣本晴天光伏發電預測結果
為了對預測效果進行比對,本節采用沒有相似日時的樣本進行預測,預測結果如圖8所示:

圖8 未相似日樣本晴天光伏發電預測結果
從圖7和圖8可以清楚的看出基于相似日的時間序列預測精度較高,利用平均絕對百分比誤差MAPE來作為模型的評價指標,可算出未采用相似日樣本的MAPE的值為18.12%,而采用相似日樣本的預測誤差為7.77%。
2.2 陰天情況下出力預測過程及結果分析
過程同上,對數據進行平穩性檢驗,對不平穩的數據進行差分,直到平穩為止,然后根據AIC準則(Akaike information criterion)對ARIMA(p,1,q)模型定階。表2為挑選出的幾種AIC最小的模型。根據AIC準則選取出最適當的階數p為5,q為9。建立ARIMA(5,1,9)模型,所得模型為:

表2 陰天ARIMA模型pq值的選擇
yt-1.0467yt-1+0.1548yt-2+0.4277yt-3+0.6883yt-4+0.5684yt-5yt-1.0467yt-1-0.5148yt-2+0.4277yt-3
+0.6883yt-4+0.5684yt-5=εt+0.0117εt-1-0.5890εt-2
-0.8420εt-3-0.0516εt-4+0.2379εt-5+0.5471εt-6
-0.1145εt-7-0.1868εt-8-0.0128εt-9
對ARIMA(5,1,9)模型進行殘差檢驗,符合要求,對預測日為陰天類型的光伏發電輸出功率進行預測。預測出來的數據進行反差分得到結果。如圖9所示:

圖9 相似日樣本陰天光伏發電預測結果
同樣,為了說明相似日的有效性,對陰天情況未采用相似日樣本進行預測,結果如圖10所示:

圖10 未相似日樣本陰天光伏發電預測結果
通過兩圖對比,相似日樣本下的預測模型精度較高。通過式5計算出陰天的預測結果誤差MPAE為19.54%,而采用相似日樣本后陰天預測結果誤差為8.19%,由此可見經過相似日選取的樣本數據預測結果更加準確。
為了驗證時間序列ARIMA模型的有效性,本文采用灰色模型[6]與之進行對比。結果如圖11所示。由于篇幅有限,僅顯示陰天情況下的預測結果。

圖11 灰色模型光伏發電預測結果
經過計算灰色模型預測結果的誤差為27.73%;所以最終選用ARIMA模型預測更加準確。
本文采用基于時間序列對光伏輸出功率進行預測,可得到以下結論:
(1)采用相似日樣本,可有效提升預測精度。
(2)采用ARIMA模型對光伏出力預測較灰色模型預測精度高。
(3)基于時間序列的ARIMA模型能對光伏出力進行有效預測。