李嘉宇,王東風,張 妍
(華北電力大學 控制與計算機工程學院,河北 保定 071003)
近年來,風能作為一種清潔的可再生能源,引起了全世界的廣泛關注,風力發電已成為最具發展前景的新能源發電方式之一。隨著風力發電技術的發展,風速自身的隨機性和間歇性對電網調度的影響越來越大。準確的風速預測結果可有效降低風電功率的不確定性,保障電網的經濟、安全、穩定運行。
現有的風速預測方法主要分為物理方法和統計方法。物理方法是基于天氣預報數據,考慮風場地形起伏程度等因素進行預測的方法[1]。物理方法無需大量的歷史數據即可獲得較高精度的預測結果,但建模和求解的過程復雜,通常被用于新建風電場的中長期風速預測。統計方法則利用歷史數據進行建模,通過分析輸入和輸出的映射關系來獲取預測結果[2]。相比于物理方法,雖然統計方法應用于中長期風速預測時的精度較低,但其在建立模型時無須考慮復雜的地形及氣候條件,結構簡單、容易建模。在現有的風速預測方法中,大部分方法集中于統計方法。統計方法還可進一步分為時間序列法[3]和人工智能法[4],這兩種方法在短期風速預測中均得到了廣泛的應用。文獻[5]構建了卷積神經網絡(Convolutional Neural Network,CNN)和雙向門控循環單元(Bidirectional Gated Recurrent Unit,BGRU)結合的預測模型,其預測精度優于傳統的預測模型。文獻[6]提出了一種新型的混合預測模型,通過多目標優化算法對回聲狀態網絡(Echo State Network,ESN)模型進行優化,保證了預測的穩定性和準確性,具有很大的應用潛力。文獻[7]提出了一種基于長短期記憶網絡(Long Short Term Memory,LSTM)的超短期風速預測模型,針對不同情況下的風速具有較好的適應性。現有研究在建立風速預測的統計模型時均未對所構建模型的輸入變量進行詳細研究。由于輸入變量在類型上的差異會影響到風速預測的精度[8],并且針對大多數統計模型而言,如果將具有相似特征和變化趨勢的數據作為變量輸入,統計模型的訓練難度將會明顯降低[6]。
為此,提出一種基于灰色關聯分析(Grey Relation Analysis,GRA)的短期風速預測方法。該方法以風速序列為基準,對采集到的氣象數據進行灰色關聯分析,并根據所得到的關聯分析結果,選擇構建LSTM 模型的輸入變量進行訓練,計算得出風速的預測結果。
GRA 是一種多因素統計的算法,其基本思想是通過確定參考數據列和若干個比較數據列之間幾何曲線的相似程度來判斷其聯系程度是否緊密。通過GRA,可分析系統中各因素間的聯系,確定各因素之間相對關聯性的強弱,其具體計算步驟如下:
1)確定分析數列。
確定反映系統行為特征的參考數列Y 及對應的比較數列矩陣X 為:

式中:Y(k)為數列Y在第k個時刻的值;n 為系統總采集點數;Xik為數列矩陣X 的第i 個特征在第k 個時刻的值。
2)變量無量綱化。
由于系統中各特征數列中數據的量綱通常是不同的,一般在計算關聯度之前,先將步驟1)參考數列與比較數列矩陣X 中各元素進行無量綱化處理,得到無量綱的參考數列Y′與比較數列矩陣X′。

3)計算關聯系數ξi,計算公式為:

式中:ξi(k)為對數列Y′(k)在第k 個時刻的關聯系數;P 為分辨系數,通常情況下取0.5。
4)計算關聯度ri。

LSTM 模型是Hochreiter 和Schmidhuber 提出的一種時間周期網絡,已在預測領域得到了廣泛的應用。LSTM 有著類似遞歸神經網絡(Recursive Neural Network,RNN)的鏈式結構,利用給定的輸入和輸出數據對模型進行訓練,可以在有限樣本的條件下得到風速預測的結果。LSTM 模型的結構如圖1 所示。

圖1 LSTM 結構
圖1 中,最左側的遺忘門用來查看模型的當前輸入和當前輸出,然后為單元格的每個數字輸出0~1 的數字,其中1 表示完全保留,0 表示完全刪除,具體公式為

式中:ft為t 時刻模型通過遺忘門后所得到的輸出;Wf、bf分別為遺忘門對應的權重和偏置;ht-1為上一個細胞的輸出;xt為當前細胞的輸入;σ 為通過將細胞的當前輸入值xt收斂到[0,1],從而加強LSTM 網絡對xt特征識別度的Sigmoid 函數,該函數的具體表達式為

隨后需要決定有多少新的信息加入細胞中,這一部分的工作由輸入門和狀態單元來完成,具體公式為:

式中:it為t 時刻模型通過輸入門后所得到的輸出;Wg、bg分別為輸入門對應的權重和偏置;為t 時刻需要更新的備選內容;Wc、bc分別為狀態單元對應的權重和偏置。此時可通過式(12)來更新狀態單元Ct的值,并通過輸出門確定模型的最終輸出ht。

式中:ot為t 時刻模型通過輸出門后所得到的輸出;Wo、bo分別為輸出門對應的權重和偏置。
LSTM 模型具有較強的非線性擬合能力,但針對風速預測而言,LSTM 模型不能完全分析出風速與其他氣象影響因素之間的非線性和趨勢相關性。此外,在可再生能源行業長期數據有限的情況下,需要合理選擇模型的輸入變量,以保證LSTM 模型的訓練效果。
為此,構建GRA-LSTM 模型,該模型基于風速的歷史數據以及GRA 算法確定最優輸入變量,模型可具體描述為

式中:W(t+1),W(t+2),…,W(t+m)分別為t+1,t+2,…,t+m 時刻的預測風速;W(t),W(t-1),…,W(t-n)為t 時刻及其前n 個時刻的風速序列;x(t),x(t-1),…,x(t-n)為t 時刻及其前n 個時刻通過GRA 模型確定的對風速影響較大的其他氣象影響因素序列;F(x)為LSTM 模型。GRA-LSTM 詳細流程如圖2所示。

圖2 GRA-LSTM 方法流程
以美國能源部太陽能輻射研究實驗室Golden站點2019 年1—3 月的實測數據為例,對算法的有效性進行驗證。數據包含種風速、溫度、壓強、云層厚度、相對濕度、風向及露點7 種數值天氣預報的信息,數據采樣間隔為10 min。
為研究不同輸入變量對風速預測模型預測結果的影響,選擇風速序列作為基準序列,并對其他6 項氣象影響因素進行灰色關聯分析,所得到的結果如表1 所示。

表1 風速序列影響因子關聯度
由表1 可以看出,影響因子與風速序列的關聯程度從高到低依次為風向、相對濕度、溫度、露點、壓強和云層厚度。其中,風向和相對濕度的關聯度明顯高于其他氣象因子,且兩者的關聯度數值十分相近,分別為0.649 和0.648。其他氣象因子的關聯度相比于風向和相對濕度二者有明顯降低,且除云層厚度的關聯度為0.367 外,其他氣象因子之間的關聯度相差較小。
此外,在樣本數據有限的前提條件下,輸入變量維度的增加會導致LSTM 模型的訓練不夠充分,進而降低最終的預測精度;而輸入變量的維度過低又會導致模型對數據特征的提取不夠充分而使預測結果出現欠擬合的狀態。因此,在綜合考慮上述因素和試驗結果的條件下,選定風速、風向和相對濕度3 種因素為輸入變量的LSTM 模型作為本文所提出算法的對應模型,用于驗證其預測性能。
為了確保試驗變量的唯一性,除所提出的算法模型之外,將氣象因素兩兩組合并加上風速序列作為各LSTM 模型的輸入變量,以確保所有模型輸入變量的數量均為3。隨后分別訓練LSTM 模型,并與風速、風向和相對濕度作為輸入變量的LSTM 模型的預測結果進行對比。選擇2019-03-31 作為預測日,通過當日的實際風速與不同輸入變量情況下模型的預測風速進行對比,以驗證所提算法的有效性,預測的時間間隔為10 min。
在得到風速預測的結果后,常用均方根誤差RMSE、誤差平方和SSE來估計風速預測模型的性能,定義為:

式中:yi為i 時刻風速實際值;為i 時刻風速預測值;m 為系統總采集點數。
其中,RMSE對數值較大的誤差更為敏感,SSE則是不同風速序列預測點的絕對誤差之和[9],通過這兩種指標可綜合評價模型的預測性能,各模型的試驗結果如表2 和圖3 所示。

表2 同風速下不同其他輸入變量模型的誤差指標值

圖3 同風速下不同其他輸入變量模型的誤差曲線分布
由表2 和圖3 可知,所提算法確定的輸入變量所構建的模型兩種誤差指標RMSE和SSE均為最小值,分別為1.023 和150.698,并且在誤差曲線圖中每點的縱坐標更靠近0,說明該預測模型具有更小的誤差和更高的預測精度,證明了本文所提出算法的有效性。
在構建LSTM 模型時,輸入變量類型的差異會影響到最終的預測結果。試驗結果表明,以風速參考數據序列,對風向、相對濕度等氣象因素進行灰色關聯分析,可確定模型最優輸入變量的類型,并有效提高模型的預測精度。
在試驗數據充足且各氣象因素的關聯度相差不大時,難以確定作為模型輸入變量的氣象因素的數量,這是本文所提出方法的不足之處。
在之后的研究中,將基于此方法進行更加深入的研究,尋找同時確定模型最優輸入變量的類型和數量的方法,以最大限度地提高風速預測的精度。