祁 樂,唐 健,江 平,鄭芳雯,劉德志
(1.廣西電網電力調度控制中心,廣西 南寧 530023;2.北京心知科技有限公司,北京 100102)
隨著海上風電制造、安裝、并網成本的逐步下降,海上風電開發不斷向深海拓展,預計中國海上風電累計裝機容量將在2025年達到2 500萬kW[1]。海上風電場裝機規模大、風能質量高,但因海上存在風流熱效應和放大的尾流效應等,且海上風電功率預測技術發展較晚,故海上風電功率預測一般以陸上風電模型為基準,并結合海上特征加以改進,相關研究證明該做法切實可行[2]。
傳統的風功率預測方法可分為物理模型、統計模型和將二者結合的方法[3]。隨著氣象數值模式性能的提高,目前主流采用結合法,即使用機器學習方法對數值天氣預報(Numerical Weather Prediction,NWP)風速預測結果進行誤差訂正后處理,得到較為準確的風速,并基于優化后的風速進行風電功率預測[4]。
通過引入多位置NWP 信息,可有效避免出現單位置NWP 無法準確描述風電場氣象信息的問題,提高預測精度[5-6]。文獻[7]同時考慮多位置NWP 與非典型氣象特征,基于最大相關-最小冗余原則和主成分分析進行特征選擇,減少整體冗余性,有效降低了預測模型的訓練時間。此外,考慮風機數據的時間相關性,用聚類分析方法生成不同天氣類型數據,針對不同天氣類型進行NWP 數據訂正后處理,能進一步提升預報能力[8]。文獻[9]考慮功率變化趨勢,獲取更優的性能,可在一定程度上解決功率波動大的問題,即爬坡問題。然而上述研究只針對風電場的單一風速,缺乏對大型風電場內部差異的充分考慮,沒有利用機組各風機的歷史信息。
機組分類是研究大型風電場發電規律的重要手段,相關研究也表明基于風電場機組分類的功率輸出模型能有效代表實際功率輸出情況,可降低功率建模過程的復雜度和時間[10]。近年來,考慮機組分類的短期功率預測的研究表明,風電場內不同風機受地形、尾流、湍流影響而差異明顯,基于機組分類的功率預測優于單一風速的功率預測[11-13]。但遺憾的是,此類研究均僅簡單對機組的所有子類進行功率預測建模,并采用疊加法對將預測功率累加求和,受到各個子類預測精度的影響,模型誤差累計造成其精度偏低。
綜上所述,提出一種考慮多NWP 和機組分類的功率預測校正模型,基于多NWP 信息和單一風速進行風速訂正后處理,并通過理想功率曲線,生成初始預測功率。然后基于層次聚類[14],將風電場內風力發電機組分類成若干代表組,生成若干組預測風速;通過正則化極限學習機(Regularized Extreme Learning Machine,RELM)建立代表預報風速與初始預測功率殘差的關系,最終校正初始預測功率。通過算例分析,所提出的模型能有機結合多NWP 和機組內部信息,有效避免極端誤報,提高考核天的準確率,減少短期功率預測考核電量。
建立的海上風電功率模型主要由初步預測功率模型和考慮機組分類的校正模型兩部分組成。
初步預測功率模型采用經典的兩步法,首先使用物理模型和統計模型結合的方法預測風速,為了考慮多位置的NWP信息,采用適合處理高維樣本的極限梯度提升樹(Extreme Gradient Boosting,XGBoost)模型作為統計學模型,然后將訂正后的NWP 預測風速代入理想功率曲線(曲線由風機信息所得),得到初始預測功率。
為引入風場內部差異信息,基于層次聚類將機組S 臺風機風速分類為G 組,生成G 組子類平均風速,經訂正后處理模塊生成G 組預測風速,作為RELM 模型的輸入,模擬初始預測功率與實際觀測功率的差值,最終校正初始預測功率。
如圖1所示,設置3組實驗。

圖1 風功率預測流程
1)單一風速:將風電場平均風速作為優化目標,經XGBoost 模型得優化預報風速,代入理想功率曲線,得預測功率P1。
2)機組分類:基于層次聚類,將S 臺風機分為G組,分別以G 組平均風速作為優化目標,得G 組優化預報風速W,代入理想功率曲線得各組預測功率,累加得風電場預測功率P2。
3)RELM 校正:設預測功率P1與真實功率的差距為殘差D,以D 為優化目標,W 為RELM 模型輸入,預測殘差與P1之和即為最終預測功率P3。
為覆蓋風電場更大范圍、涵蓋各種地形,應選取風電場周邊典型4~9 個位置的NWP 的氣象數據,每個位置包含4 個高度層的經向風、緯向風、溫度、濕度、氣壓等5 個參數信息,即每個時刻最多含180 維數據。NWP 為未來72 h 預報數據,每天進行一次更新,時間分辨率插值至15 min。
對機組分類時,層次聚類法無須先驗地指定子類的個數。相較k 點均值中心法kmeans、模糊C 點均值中心法(Fuzzy C Means,FCM)等方法,可添加約束,調整子類的個數。基于此,采用層次聚類法中的凝聚法,采用自底向上策略,輸入數據機組內所有風機的相似性度量向量矩陣,逐步合并相似距離相近的風機為一類,直至將所有風機聚為一個大類。具體流程為:
1)設N 為樣本數,M 為風機數,選取同一時間段參與并網的M1臺風機,構建N×M1階矩陣;
2)基于歐式距離、皮爾遜相關系數、熵相關系數,計算M1個風機兩兩間的相似性度量矩陣。
3)利用離差平方和法[15]計算不通類之間的距離d,每縮小一類,離差平方和SX就要增大,選擇使SX增加最小的兩類合并,如式(1)所示。

4)若類的個數不等于1,則重復執行步驟3),否則執行步驟5)。
5)保證類內的風機數不超過總風機數一半,取子類個數的最大值。
6)計算聚類評判標準指數[16],確定計算相似性度量的方法。
設Y 為歷史功率,X 為歷史氣象數據,則上述提及相似度距離公式為:
①歐式距離DXY為

式中:xi、yi分別為樣本i的氣象數據和功率數據。
②皮爾遜相關系數ρXY為

③熵相關系數IXY為

式中:H(X)為X 的信息熵;H(X,Y)為X、Y 聯合熵;I(X;Y)為互信息,表示X 和Y 之間共享信息量的多少。信息熵和聯合熵分別定義為:

式中:p(·)為落入區間的頻率;MX、Np分別為X、Y 升序排列等分的子區間的個數,對于等分區間個數可參考式(7)。

④另外,聚類評價標準選取基于標準差指數(Standard Deviation Based Index,STDI)ISTD,其定義為類間距離與類內距離之比,如式(8)所示,其值越大代表聚類效果越好。

式中:ck為第k類的質心;為所有樣本的質心;xi為第k類中的第i個樣本;nk為第k類中所有樣本數。
NWP 作為輸入特征,經XGBoost 模型后獲得預測風速,而預測風速的準確性是預測功率是否準確的關鍵。XGBoost 為梯度提升樹(Gradient Boosting,GBoost)算法的改良版本,Boosting 屬于串行的集成方法,第t 個弱學習器優化學習前t-1 個學習器的殘差部分,逐步引入學習器而最大化地降低目標函數,進而得到一個強學習器。由于多NWP 數據具有多維(180 個)特征,XGBoost 構建學習器時會對特征采樣,并添加正則項,防止過擬合,同時訓練速度快,十分適合NWP風速訂正后處理[17]。
XGBoost 算法以CART 回歸樹為弱學習器,預測函數輸出y′為

式中:gt(·)為CART回歸樹;xi為輸入特征,i=1,…,N;T 為XGBoost 超參數,指共有T 個弱學習器;F 為搜索空間。
正則化目標函數為

式中:yi為真值樣本,i=1,…,N;J 為葉子節點的個數;ω為各葉子節點權重,δ、γ、λ為超參數。
則訓練過程如下:
1)對所有樣本,初始化一顆CART 樹,同時得預測輸出g0為

式中:c為預測輸出集合
2)對所有樣本計算負梯度rti為

3)利用負梯度,擬合一顆CART回歸樹,得到第t顆回歸樹,其對應的葉子節點區域為Rtj,j=1,2,…,J。其中J為回歸樹t的葉子節點的個數。
4)對葉子區域j=1,2,…,J,計算最佳擬合值ctj為

5)經T輪更新得強學習器,最終預測輸出為

國家能源局規定,所有并網運行的風電場須每日定時向電網調度機構提供次日00:00—24:00 發電功率曲線,稱為日前功率預測,屬短期功率預測范疇。評價標準如式(17)—式(18)所示。

式中:Ad為日前準確率;Qd為日前考核電量;n為一天的預測個數(一般取96,即預測時間分辨率為15 min);PMi為i 時刻的實際功率;PPi為i 時刻的日前功率預測值;CAP為風電場可用容量;PN為風電場裝機容量。
對于長時間(nd天),其評價函數為準確率ACC和考核電量QCE,計算公式為:

式中:Adi為第i天日前準確率;Qdi為第i天日前考核電量。
相較于傳統神經網絡,極限學習機(Extreme Learning Machine,ELM)具有結構簡單、學習能力好、泛化能力強等優點。如圖2,RELM 網絡在傳統ELM 模型的基礎上引入正則化系數,可一定程度上提高功率預測模型的精度[18]。

圖2 RELM結構
風電場各風機風速進行機組分類后,經XGBoost模型得多組子類的預測風速,視該若干組風速為風電場內的差異特征,作為RELM 模型的輸入。同時由初步功率預測模型獲取預測功率計算預測功率與實際功率之差,將功率殘差作為RELM 模型的學習目標,預測需校正的功率,獲得最終的預測功率。
設xa為“機組分類”實驗的預報風速,d′為“單一風速”實驗的預測功率與真實功率的殘差,f 為激活函數,則RELM的輸出函數為:

式中:ωi和βi分別為輸入、輸出向量與第i 個隱含層神經元之間的連接權值;bi為第i 個隱含層神經元對應的偏置值,L為隱含層個數。
將式(21)寫成矩陣形式,有:

式中:β為輸出向量與隱含層神經元之間的連接權值向量;D′為殘差矩陣;H為激活函數矩陣。
引入正則項,得RELM的目標函數為

隨機確定輸入權值矩陣ω 以及偏置向量b,由式(23)—式(25)可得最優輸出權值矩陣為

式中:I為單位矩陣。
根據初始預測功率P1與最優殘差預報,得最終預測功率P3為

對浙江某海上風電場開展研究,其中有效試驗數據為2019-07-10至2020-04-24期間的實測風速、功率數據,采樣周期為15 min。該場站如圖3 所示,處于近海區域,北部臨近我國第一大群島,西部為大陸架,海面糙率變化各向異質,故選擇周邊9個NWP信息(NWP1—NWP 3 為群島位置)作為初步預測模型的輸入特征,剔除風電場內嚴重缺數的風機后,本研究共篩選59 臺風機數據進行研究,圖3 中鏤空圓點為風機所在位置。

圖3 風場風機排布與周圍NWP位置
計算59 臺風機2019 年風速數據的3 種相似性度量,并將不同的度量矩陣進行層次聚類,對聚類結果計算STDI評判標準值,如表1所示。

表1 不同聚類下的STDI值
由表1 可知皮爾遜相關系數為最優聚類的相似性度量,基于皮爾遜相關系數的聚類結果如圖4 所示,最終機組分類成4 類,每一類分布情況如圖5 所示,最終獲得4組子類平均風速及其累計功率。

圖4 基于皮爾遜相關系數的聚類結果

圖5 不同機組子類的分布
采用2019 年數據作為初步預測功率模型的訓練數據,將2020-01-01至2020-03-01的數據同時作為初步功率模型的驗證數據和校正模型訓練數據,并利用2020-03-01 至2020-03-24 的數據對RELM模型進行參數調優,最終以2020-03-25至2020-04-24的數據驗證模型的功率預測效果。
“單一風速”實驗將風電場平均風速v0作為初步預測功率模型的輸入,記為A0 組。“機組分類”實驗將4 組子類(A1、A2、A3、A4)平均風速作為初步預測功率模型的輸入。最后“單一風速”所得預測功率經校正模型,得“RELM 校正”實驗的最終預測功率。
機組分類后,經XGBoost 的預測風速結果見表2。由于組內信息較為一致,各項評價指標較“單一風速”的風速預測結果要好,各類內的風速規律更容易被模型學習出來。由圖6 可見,各子類的預報風速存在差異,在所選取的樣本點中,同一時刻預報風速差異可達3~4 m/s。由此可知,風電場內存在差異信息,可利用該信息進行預測功率校正。

表2 風速模擬結果評價指標

圖6 四組子類預測風速對比
3 組實驗功率預測結果對比如表3 所示,在訓練集(為初步預測功率模型的測試集)中,“機組分類”預測功率較優,考核電量QCE下降5.36%,可見提高預測風速的準確性能有效提高預測功率的精度。經校正模型后,“REML 校正”模型長期準確率ACC有略微提升,而考核電量QCE有明顯下降,相較“單一風速”下降19.24%。

表3 不同實驗的功率模擬結果對比
由于“單一風速”實驗沒有考慮風電場內部差異,導致個別天會極端誤報,由此產生較大的考核電量。選取4月1日和4月13日典型考核天分析,如表4 所示。可知“REML 校正”可利用各機組的差異信息,有效提高預測功率的準確性,提升幅度可達3.59%。

表4 選取天的功率模擬結果情況
由此表明,對于大規模風電場內部差異信息的利用有助于提高功率模型精度,避免極端誤報,保證功率預測的穩定性,從而降低運行成本。
考慮多位置NWP 數據構建初始功率預測模型,風電短期功率預測結果準確度較高,結果顯示機組分類的預測功率略優于單一風速。
引入機組內部差異信息,考慮機組分類的RELM 校正預測功率,有效改善極端誤報情況,降低了風電場功率預測偏差考核電量,能有效降低風電場運營成本。