徐 萌
(國能智深控制技術有限公司,北京 102211)
太陽能具有間歇性、不確定性等特點,并受多種氣象環境因素影響。為了實現光伏發電的大規模并網,應對其發電功率變化趨勢做出較為準確的預測。綜合考慮多方面因素,減少光伏發電預測各關鍵環節的誤差,提高預測的精準度,增強光伏發電的可控性是當前新能源發電領域所面臨的重要挑戰之一。
光伏發電功率預測按照預測的時間長度可分為中長期預測、短期預測、超短期預測,分別預測1個月~1年、4小時~3天和數分鐘~4 h的光伏功率[1]。其中,光伏發電功率短期預測的時間尺度對于電網調度具有重要的實際意義,且能達到較高的預測準確度。因此,光伏發電功率短期預測的研究成為新能源發電研究的熱點之一。
光伏發電輸出功率的預測方法分為物理方法、統計方法及綜合方法。其中多數研究采用的是統計方法或者以統計方法為主的綜合方法。文獻[2]提出了一種結合深度信念網絡(DBN)與Takagi-Sugen(T-S)模糊時變權重組合的光伏功率方法,利用DBN模型彌補了T-S模糊篩選輸入變量時帶來的精度損失問題,利用遺傳算法(GA)賦予時變權重,提高了超短期預測準確性,不適用于短期功率預測。文獻[3]利用最小二乘濾波識別時間序列數據中的突變,建立了基于最小二乘濾波-肖維勒準則的光伏功率異常數據識別模型,剔除異常數據并提高訓練模型的準確度,但對于氣象因素導致的規律性數據缺失較為敏感。文獻[4]提出了相似日理論和一種結合縱橫交叉算法與改進的高斯過程回歸算法(CSO-WGPR),通過聚類的方法,構建相似日集合,再采用改進的高斯過程回歸模型減小異常數據對預測結果的影響,但對于非典型氣象預測日效果相對較差。文獻[5]提出了一種季節自回歸積分滑動平均(SARIMA)方法與支持向量機(SVM)方法結合的預測思路,并用于一個20 kW的光伏發電站實際預測中,2種算法均針對光伏功率數據展開,并未解決預測日氣象數據獲取滯后的問題。文獻[6]提出一種基于經驗小波變換和粒子群算法的組合預測方法,將利用灰色關聯分析聚合的相似日集合分解為高、中、低不同的頻率子模態,該方法對超短期預測具備可行性與實用性,但不適合短期預測的要求。文獻[7]介紹了一種基于奇異譜分析(SSA)和K均值的時延特性-反向傳播(TD-BP)神經網絡超短期光伏功率預測方法,通過SSA的分解及重構,提取時間序列中的趨勢,并利用K均值聚類法將天氣樣本聚類,該方法同樣為超短期預測而設計,不適合短期功率預測。文獻[8]使用小波降噪的方法處理光伏功率的歷史曲線,并使用灰色關聯分析方法篩選強相關的氣象條件因素,建立基于雙向長短期記憶網絡(BLSTM)與隨機森林的短期光伏發電功率預測模型,得到了較好的預測效果,但存在與文獻[5]類似的氣象數據預測的問題。文獻[9]采用改進麻雀搜索算法與SVM方法預測短期的光伏發電功率,采用自適應t分布增強麻雀搜索算法的種群多樣性,提高了預測的準確度,但該方法的季節特性明顯,針對秋冬季的效果明顯優于春夏季。文獻[10]提出一種結合灰色關聯分析和GeoMAN模型的光伏發電功率短期預測方法,利用解碼器提取輸入變量的時間特性,融合晴空指數和數值天氣預報實現功率預測,該方法要求被預測地區具有多個光伏電站以供空間相關性分析,對被預測的對象要求較高。文獻[11]提出了基于改進果蠅算法的太陽輻照度預測方法,能夠檢測出太陽能照度光線實值且發現長度更大,可與光伏發電功率預測相結合。文獻[12]設計了基于粒子群優化-反向(PSO-BP)神經網絡的光伏功率預測方法,針對BP神經網絡模型收斂慢、易陷入局部最優值的問題,配合PSO方法優化初始參數。同時,在預測方法理論方面,文獻[13-16]也對預測方法和應用進行了研究。
為解決預測目標日的氣象數據獲取滯后的問題,本文利用相關性分析法選擇與光伏功率相關的氣象數據種類,用時間序列方法預測電站所在區域的氣象數據,得到光伏發電現場更為準確的氣息信息預測值,并利用改進的SVM算法對光伏功率預測建模。
在光伏發電的各個影響因素中,輻照度是最為重要的因素[17]。輻照度包括總輻照度、直射輻照度、散射輻照度等。除此之外,溫度、濕度等氣象因素也與光伏發電功率相關。本文采用時間序列方法,對預測范圍內的氣象信息進行預測,獲得所求區間的氣象信息數值,避免天氣預報對光伏電站所在的具體位置的預報不準確。然后釆用SVM方法對氣象信息和光伏輸出功率的關系建模,代入所求區間的氣象數據預測值,即可得到所求區間光伏功率的預測值。
為了降低輸入數據的維度,減少無關變量或低相關度變量對預測結果的干擾,在選取SVM的輸入數據時,采用相關性分析的方法,篩選與光伏功率強相關的氣象信息變量。常用的分析手段包括相關性分析法、主成分分析法等。
光伏電站及其配套的氣象信息檢測平臺在運行過程中不斷積累數據,通過對其挖掘分析,能夠歸納各個氣象參數與光伏輸出功率的相關性,進而利用主成分分析將眾多的輸入變量整合成少數幾個主成分變量,更清楚地觀察到各個氣象參數作用于光伏輸出功率的途徑[18]。
1.1.1 相關性分析
通過相關性分析能夠衡量2個變量間的線性相關程度,以皮爾遜相關系數為例,其定義為2個變量的協方差除以2個變量的標準差的商,即:
ρX,Y=corr(X,Y)=

(1)
且有:

(2)
根據數學定義可知,其取值在-1~1之間,且數值越大表示相關性越強。
1.1.2 主成分分析
各種氣象參數之間存在互相的關聯,其作用于光伏功率輸出的路徑不是獨立的。借助主成分分析,能夠將冗余的氣象信息轉化為一組線性無關的組合變量,實現數據的降維。與光伏功率相關的氣象因素包括輻照度(總輻照度、直射輻照度、散射輻照度)、溫濕度(環境與光伏組件)、露點、風速(瞬時風速、平均風速)、透光率和反射率等。
對于上述光伏功率相關的氣象參數,基于參考電站長時間運行產生的大量數據,可獲得主成分的劃分。主成分劃分的一種方法是將上述氣象參數分為輻照度分量和溫濕度分量等,并獲得每個分量中每種氣象信息的組合關系。
時間序列的數據挖掘方法包括指數平滑法(ES),又可進一步詳細分為一次、二次、三次指數平滑法[19]。該方法可以理解為一種特殊的加權平均法,按照離目標點越近的數據權重越大的原則,將氣象信息按指數遞減的規律分配權重,越接近預測目標的數據權重越大,反之權重越小。
三次指數平滑法對非線性變化的氣象信息數據具有較好的預測效果,第t+T分鐘的太陽輻照度預測值為
Yt+T=at+btT+ctT2
(3)
式中:T為預測周期;Yt+T為基準時間第t分鐘,預測周期T分鐘的太陽輻照度預測值;at,bt,ct均為平滑系數。
其中平滑系數為

(4)
利用時間序列方法中的三次指數平滑法,可由目標日前幾日的輻照度、溫度等氣象信息得到目標日的所需氣象信息。
時間序列法常用于對光伏功率數據的直接處理,而非預測氣象數據。先對氣象數據的先行預測為光伏功率的預測提供了輸入。同時,與該地區的氣象預報相比,時間序列方法更能夠對應光伏電站現場的氣象條件,提高預測的準確度,解決預測目標日氣象數據獲取滯后的問題。
支持向量機是一種二分類模型,是定義在特征空間上的間隔最大的線性分類器,根據結構風險最小化準則,對于高維非線性樣本具有較好的效果。支持向量機將計算過程轉化為一個二次型尋優的問題,一定程度上避免了神經網絡算法容易陷入局部最小值的問題[20]。
支持向量機的思想基于統計學習理論,通過建立一個分類超平面作為決策曲面,使得正例和反例之間的隔離邊緣最大化,近似實現結構風險最小化。具有通用性高、魯棒性好及簡單有效等優點。核函數是支持向量機理論的關鍵,包括線性核函數、多項式核函數、兩層感知器核函數等等多種形式。
支持向量機的優化問題可轉化為調整參數使式(5)最小的問題[21]:

(5)

需要滿足的約束條件如下:

(6)
式中:b為閾值;Φ(x)為從輸入空間到高維空間的非線性映射。
上述問題可轉化為最大化二次型求解問題,即:

(7)
需要滿足:

(8)
綜上,回歸方程可表示為

(9)


(10)
式中:K為核函數;δ為核函數寬度。
以輻照度、溫度、濕度等氣象信息作為輸入,光伏功率作為輸出,訓練SVM模型。再將利用三次指數平滑法預測到的目標日輻照度、溫度等氣象數據作為輸入,可由SVM模型得到輸出,也即目標日的預測功率。
目前,我國的太陽輻照度檢測的站點比較少,使得很多論文研究數據源只能選擇距離較近的光伏發電站和氣象信息檢測站,這無疑為試驗結果帶來了誤差,且目前也沒有類似溫度預報的、較完善的輻照度預報系統。因此,很多研究只能以輻照度的真實值代替預報值來進行光伏功率的預測。這樣的研究方法雖然準確性比較高,但存在不能用于實踐的問題。
針對上述問題,本研究構建了一套光伏發電系統以及配套的能夠檢測環境因素,包括太陽總輻照度、散射輻照度、溫濕度等多種氣象信息的氣象監測站。2套系統彼此配合,測得的氣象數據與光伏發電功率數據彼此對應性好。試驗系統如圖1所示,測量儀器的類型及特性如表1所示。

圖1 氣象信息監測站及光伏發電試驗平臺

表1 試驗平臺測量儀表及參數
結合上述方法與實際情況,可構建基于MA-SVM模型的光伏功率預測方法。結合歷史數據庫中各時刻的氣象數據與光伏功率的關系訓練支持向量機回歸模型,再利用時間序列方法預測出目標日的氣象信息,代入支持向量機回歸模型,可預測得到目標日的光伏功率預測值。結合時間序列預測方法、支持向量機回歸方法的優勢和特點,建立如圖2所示的預測過程。

圖2 基于時間序列和支持向量機方法的光伏功率預測流程圖
選取2021年10月8日為目標日,總體較為晴朗,符合常見的晴天模型,詳細的氣象數據如表2所示。

表2 目標日的氣象條件分析
目標日氣象發電條件在上午10點左右達到峰值,之后逐漸穩定,在14點左右發電條件下降,光伏功率隨之降低。
其氣象參數變化趨勢如圖3所示。其中圖3(a)~圖3(c)分別表示風速、輻照度、濕度的變化趨勢。
定義氣象參數并經計算,氣象信息與光伏功率的相關性如表3所示。

圖3 目標日氣象信息變化趨勢圖

表3 氣象信息與光伏功率相關性
在主成分分析中,選取特征根大于1的成分作為主成分。經計算,其表達式分別為
F1=0.032X1-0.067X2-0.135X3+0.478X4+0.349X5+0.215X6+0.032X7+0.104X8+0.032X9+0.023X10+0.076X11
(11)
F2=0.223X1+0.557X2+0.401X3-0.043X4-0.109X5+0.252X6-0.057X7+0.224X8+0.078X9+0.042X10-0.057X11
(12)
F3=0.026X1-0.105X2+0.034X3+0.107X4+0.134X5+0.107X6-0.126X7+0.301X8+0.345X9+0.062X10+0.008X11
(13)
F4=-0.143X1-0.032X2+0.028X3-0.073X4+0.124X5-0.137X6+0.353X7+0.331X8+0.001X9+0.365X10+0.489X11
(14)
根據每個表達式中占據主要成分的變量,可對其分類如下:
F1中占據主要成分的是各種輻照度(總輻照度、散射輻照度、直射輻照度),即主要表達輻照度對光伏發電功率的影響。
F2中占據主要成分的是露點、濕度因素,因此該主成分反映了濕度相關因素對光伏發電功率的影響作用。
F3中占據主要成分的是組件溫度、環境溫度等因素,因此該主成分主要反映了溫度對光伏發電功率的影響。同時也能看出溫度而輻照度二者的相關性。
F4中占據主成分的是其他因素(反射率、透光率、平均風速、瞬間風速等)。
對2021年10月1日~10月7日的輻照度、溫度等氣象數據預處理,去除極端值并標準化后,利用三次平滑算法,對氣象信息進行時間序列預測,得到目標日的氣象數據,這將作為SVM模型的預測輸入值。
3.3.1 模型建立及參數選擇
構建基于支持向量機模型的回歸模型是預測光伏發電功率的基礎。每組數據包括輸入數據及其對應時刻的輸出數據,各組數據組合形成數據矩陣,再對其標準化。輸入數據為氣象信息數據,具體包括輻照度、溫濕度、環境風速等信息,輸出數據為光伏功率。輸入輸出數據保持時間上的一致,每一分鐘設置一個采樣點。
選擇K-Fold Cross Validation的交叉驗證方法,將訓練數據集分組,并對懲罰參數c與核函數參數g進行選擇。經過計算,c和g分別取0.342 77和2.218 87。
3.3.2 回歸擬合
基于參數c與g構建支持向量機模型,經過訓練擬合,效果如圖4所示。可見訓練得到了良好的擬合效果。

圖4 回歸分析中擬合效果圖
經過擬合過程即得到訓練后的模型,可用于光伏功率的預測。按照前文所述過程進行預測,并對預測誤差進行如下分析。
可采用均方根誤差(RMSE)作為衡量誤差的評價指標,其定義如下:

(15)
式中:n為變量個數;Xobs,i和Xmodel,i分別為實際值和預測值。
預測過程主要包括2個階段,即氣象信息預測階段和支持向量機預測階段,分別進行誤差的分析。
以露點和溫度為例,氣象信息預測階段的預測效果和誤差如圖5所示。

圖5 目標日露點、溫度的真實值與時間序列預測值對比
假定氣象信息預測階段是完全準確的,也即向SVM模型代入真實的氣象數據,由此得到的光伏功率預測值的誤差為支持向量機光伏功率預測階段的誤差。綜合各階段的誤差,分析如表4所示。

表4 各階段誤差分析
完整預測流程的預測效果如圖6所示。

圖6 預測值與真實值對比圖
對比光伏發電功率的測量值和預測值,結合上文的分析能夠發現,時間序列方法可對目標日的各種氣象信息進行預測,作為支持向量機模型的輸入。再由支持向量機回歸模型求得目標日光伏發電功率,說明了預測方法的有效性。
此外,將春夏和冬季典型日以及陰天典型日作為預測對象,驗證預測算法,其結果如圖7所示,圖7(a)~圖7(d)分別為春夏和冬季以及陰天典型日的功率預測結果。

圖7 春夏冬季及陰天典型日功率預測結果
春夏冬季及陰天4個典型日的功率預測誤差如表5所示。

表5 典型日預測誤差 kW
為進一步驗證本文所提MA-SVM算法的有效性,將本文的相關結果與相似研究及其他實現類似功能的預測算法進行比較。比較指標在RMSE的基礎上增加了平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)、最大偏差δMAX,其結果對比如表6所示。

表6 光伏功率預測誤差對比
通過對比多種算法的集中誤差評價指標,可以發現,MA-SVM方法具有較為明顯的優勢。
本文通過建立完整的預測流程以及應用實際的試驗平臺驗證,得到了一種有效的光伏功率短期預測方法。
(1) 采用實際試驗平臺釆集的輻照度等氣象數據對相同地點的光伏發電平臺的功率進行預測,釆用三次指數平滑法對目標日的氣象信息進行預測,克服了類似的研究中輻照度數據與光伏功率不匹配的問題,解決了之前研究中采用真實的輻照度進行功率預測中的偽準確性問題,提高了預測的準確性與實用性。
(2) 氣象條件變化的整體循環周期是一年,通過長期的運行,可以獲得不同季節、不同氣候條件的氣象因素與輸出功率的對應關系,隨著數據庫的擴充,預測的準確性將不斷提高。