馮蕭飛, 劉韜文, 李彬, 蘇盛*
(1. 長沙理工大學電氣與信息工程學院, 長沙 410114; 2. 國網湖南省電力有限公司, 長沙 410114)
近年來,中國電力系統中風電接入規模不斷提升,“十四五”規劃下,全國2022—2025年新增風電裝機量預計約為300 GW,風電在中國發展十分迅速[1]。然而風電的間歇性和不確定性對電網的有功功率平衡具有極高的威脅。一方面,風電場出力受天氣的影響,極易發生波動劇烈的功率爬坡事件,風機驟然切出易造成電網功率缺額,頻率失穩,甚至大規模甩負荷[2-3]。另一方面,近年來極端天氣如熱帶風暴、氣旋、鋒面、暴雨、陣風等情況多發,風機出力不確定性進一步提升。風電爬坡事件已在世界范圍內對各國電網的運行安全及經濟穩定造成了程度不一的破壞[4-5]。2008年2月26日,美國德克薩斯州風電場有功出力在15 min內從170 MW下降到0,電網被迫切除了1 150 MW的負荷,整個電網頻率降低至59.85 Hz。風電爬坡事件的有效判斷以及風機出力的精準預測,一方面有助于為電網調度人員提供先驗信息,安排合理的調度策略,維護電網的安全穩定運行。另一方面也能夠靈活調整其他能源發電機組出力,降低調控負擔,提高電網運行經濟效益[6-8]。
目前關于風電爬坡事件的辨識預測研究主要著眼于分析一段時間內風電出力變化特性,基于功率變化幅度,變化速率等傳統特征進行辨識[9],然而風電場運行條件復雜多變,風電爬坡也并不僅僅只有上、下爬坡兩種場景,傳統的風電爬坡判定閾值難以適用,辨識精度較差。近年來利用數據挖掘算法和時序預測模型間接判斷預測區間中的風電爬坡事件表現出較高的潛力,根據數據來源,預測方法又可劃分為統計模型預測方法及物理模型預測方法[10]。其中,物理模型預測方法基于數值天氣預報(numerical weather prediction,NWP)的預測數據對風電出力進行預測[11]。文獻[12]對比了不同NWP模型的預測效果以及組合預測效果,發現NWP模型組合使用能夠獲得更高的預測精度;文獻[13]通過相似性從而對預測數據進行修正,結合歷史數據預測風電出力,修正之后的預測精度顯著提升;統計模型預測方法則是利用天氣和風電歷史數據所表現的特征或組合特性對風機出力進行預測。文獻[14]建立基于神經網絡的區間預測模型,估計每一個預測點的概率分布,能夠提供更加豐富的不確定信息,便于決策者的調度。
然而人為設定的模型參數來自經驗總結,并不能開發出模型的最優性能,有必要對模型參數組合優化進行研究討論,進一步提升模型預測性能。綜上所述,現基于歷史風電功率數據,分析不同爬坡場景下的風機出力變化特性,提出基于滑動窗雙邊CUSUM(cumulative sum)的風電爬坡事件檢測方法,進而建立貝葉斯優化的LSTM(long short term memory)深度學習模型,討論經參數優化后模型的性能提升,并在預測區間中對所提風電爬坡事件識別方法進行驗證。
通常情況下,爬坡事件是指風力發電機組的出力在短時間內出現大幅度變化,在這一過程中功率的變化幅度超過電力系統控制策略的調節能力,由于常規火電機組的出力爬坡能力十分有限,難以應對風電短時爬坡帶來的功率劇烈變化,將會引發功率不平衡,嚴重時甚至導致系統頻率的異常波動以及甩負荷,將這一過程稱之為一次爬坡事件。
電力系統中機組爬坡率通常按照每分鐘調整出力最大值占額定容量的比例計算,單位為%/min,即分鐘級功率變化量同機組裝機容量的比例。其中,水電機組是最快的,可以達到50%/min~100%/min;燃氣機組也比較快,可以達到20%/min。極端天氣下風機出力爬坡速率甚至可以達到70%/min,出力的不可控性對系統中其他機組的調度產生極大的壓力。尤其是在風電裝機容量不斷擴大,并網規模不斷提升的過程中,風電出力的波動程度對電網的影響進一步到達一個新的高度。
爬坡事件中主要關注3個關鍵的特征:爬坡方向,爬坡幅度變化ΔP以及爬坡持續時間Δt。后兩者可歸納為爬坡速率R=ΔP/Δt,反映一段時間內風機出力變化的快慢。文獻[15]提出,當1 h內整個風電場的輸出功率變化幅度大于裝機容量的15%時,即可判斷發生了確定的爬坡事件。基于上述特征量,文獻[16]中通過給定時間間隔和變化閾值對爬坡事件進行了數學定義。
(1)認為若(t,t+Δt)時間段首末端功率之差的絕對值超過閾值,則發生爬坡事件,末端功率大于首端功率則為上爬坡事件,反之則是下爬坡事件。
|Pt+Δt-Pt|>Ps
(1)
式(1)中:Pt+Δt為末端功率;Pt為首端功率;Ps為功率差閾值。
(2)認為若(t,t+Δt)時間段內功率最大值和最小值之差超過閾值,則發生爬坡事件,最大值發生時刻落后于最小值發生時刻,則為上爬坡事件,反之則是下爬坡事件。
max[P(t,t+Δt)]-min[P(t,t+Δt)]>PsM
(2)
式(2)中:max[P(t,t+Δt)]、min[P(t,t+Δt)]為區間內功率最大、最小值;PsM為最值差閾值。
(3)認為若(t,t+Δt)時間段內爬坡率超過給定閾值,則發生爬坡事件,爬坡率為增大方向,則發生上爬坡事件,反之則是下爬坡事件。
(3)
式(3)中:Psk為爬坡率閾值。
上述定義雖一定程度上描述了爬坡事件,但時間間隔Δt及變化閾值Ps的設定是影響爬坡事件識別準確率的關鍵因素。若時間間隔過大,閾值設定過高則易發生漏報;時間間隔過窄,閾值設定過低則易發生誤報。由于風電出力的波動性和不確定性,僅選擇區間內某些時刻的出力進行計算判斷亦會丟失區間內的功率波動信息,也缺乏對時序之間功率波動的關聯特征提取。
目前爬坡事件的數學定義尚未形成統一標準,因為爬坡事件的確認涉及不同地域環境,不同天氣狀況下,廠站的運行條件不同,設備運行工況也存在一定差異。不同區域各能源機組配置方案的差異也導致了系統功率爬坡能力的不同,當發生爬坡事件時應對能力也不一致,需要對風電爬坡數據進行更加深入的討論,提取符合所在局部電網安全運行需求的爬坡事件特征[17-18]。
為進一步研究爬坡事件發生時風電出力變化特征,提取有效辨識爬坡事件的貼切特征量,本文將風電爬坡事件細分為快速爬坡,逐步爬坡,連續反向爬坡3個典型場景。
所用歷史風電出力變化數據來自南方某地區站點序列為09136的風電場,該風電場裝機容量為20 MW,該數據集記錄了此風電場2004年1月1日至2007年1月1日的風電出力監測數據,數據采集間隔為10 min。
如圖1所示,風機出力在09:20—10:20時段內大幅上升,從低發躍升至接近滿發,小時功率變化量超過裝機容量的80%,發生快速上爬坡事件,爬坡事件持續時間極短而該時段風電場輸出電量猛然增大,對電網將形成強烈沖擊,同時系統負荷需求并無顯著變化,電網需要臨時退出大量其他能源機組來保證系統功率平衡。

圖1 風機快速爬坡功率變化曲線Fig.1 Wind power curve of fast ramping event
4月22日14:00—18:00,風機從停機狀態開始工作,機組出力持續提升直至接近滿發,功率小時變化值超過裝機容量40%,爬坡持續時間較長,雖對電網有一定的沖擊,但是相較于快速爬坡事件,留下了更多的時間裕度來進行機組調度,如圖2所示。

圖2 風機逐步爬坡功率變化曲線Fig.2 Wind power curve of gradual ramping event
如圖3所示,2月26日22:00至次日13:00,風機出力在短時間內進行了連續多次的上爬坡事件和下爬坡事件,并在中間狀態(切出或接近滿發)保持近1 h以上,近滿發狀態持續時間較切出狀態更長,期間風速始終處于較高的水平,并偶爾超過風電機組切出極限導致停機。與單一的快速爬坡場景不同,功率的劇烈波動將引起電網頻率的異常波動,對系統中機組的靈活啟停能力有更高要求,不利于系統調度人員及時調整機組出力任務。

圖3 風機連續反復爬坡功率變化曲線Fig.3 Wind power curve of repeated ramping event
結合上述對于風電爬坡事件不同場景風機出力的變化特征的分析討論,可以發現目前的爬坡定義以及爬坡特征的提取較為淺薄。僅考慮某一設定時間段內功率變化并不符合爬坡事件中功率的實際變化情況,爬坡可能在一個較長的時間過程中逐步式的出現,也可能在一定時間范圍內不斷反復,不同時間段的風機出力之間的存在較強的聯系,現有的爬坡事件檢測方法存在較大的信息盲區,誤報和漏保率均較高,難為調度人員提供可靠指導。
為避免常規爬坡定義中采取固定時間段計算功率異常變化時存在的參數擇優困難以及信息丟失等問題,現通過滑動窗的檢測方法,逐時刻提取窗內功率變化的特征,并結合CUSUM,對爬坡事件的發生進一步確認。期望深入挖掘區間內的功率變化,并增強區間之間的特征耦合能力,把握更加豐富的爬坡事件信息。
基于滑動窗的雙邊CUSUM算法是一種有效的事件檢測方法,設定合適的參數,能夠根據輸入的時間序列信號自動檢測其中的狀態變化,邏輯簡單,抗干擾能力強。
如圖4所示,基于風電出力時間序列P={p(k),k=6,7,…,K}內定義參考窗wm和爬坡檢測窗wn,爬坡檢測窗鄰后于參考窗,為保證窗口內功率變化之間的耦合程度,參考窗和爬坡檢測窗具有一定長度的重合部分。

圖4 雙邊滑動窗檢測爬坡事件模型Fig.4 Ramp event detection model of CUSUM algorithm
窗口長度分別為m、n,重合長度為x。考慮風電爬坡場景特性及風電出力采集間隔,設置參考窗長度m為4,爬坡檢測窗長度n為4,重合長度x為2。計算兩個窗口的功率均值Mm、Mn,計算公式為
(4)
(5)
式中:k為開始計算均值的采樣點,位于爬坡檢測窗的末端時刻。
中國對于并網風電爬坡率通常要求在裝機容量PN<150 MW時,最大功率變化10 min內不超過33%PN,1 min內不超過10%PN;PN>150 MW時,最大功率變化10 min內不超過50 MW,1 min內不超過15 MW。由此可見,不同裝機容量的風電場,其功率最大值與功率最小值數值差距差異極大,閾值設定過程中若單純考慮幅值變化量,則算法泛化性將變得極差。因此應當對風機出力數據進行預處理,計算輸出功率占裝機容量的百分比大小,從而將判斷幅值變化量轉變為判斷百分比變化量,增強檢測方法的泛化性。進一步計算k點位置參考窗和爬坡檢測窗的均值之差占參考窗計算均值的百分比Dk作為爬坡事件判斷的特征量,計算公式為
(6)
風電爬坡事件分為上爬坡和下爬坡事件,需要分別考慮特征量在判斷爬坡事件以及爬坡方向時的參數設定,由于均值計算特性,滑動窗求均值的方法對于時間序列數值的增大敏感,相對的當數值減小時,計算均值下降的較為緩慢。
經過數據分析,當特征量為正且兩窗口差值超過參考窗計算均值的33%時,可認為該時刻爬坡檢測窗末端位置發生了確定的上爬坡。而當特征量為負且兩窗口差值超過參考窗計算均值的10%時,認為該時刻爬坡檢測窗末端位置發生了確定的下爬坡事件。
關于爬坡持續時間的檢測,根據上述風電爬坡場景分析,快速爬坡事件爬坡持續時間較短,為10 min級,逐步爬坡事件持續時間稍長,通常是30 min級。因此進一步通過累加器的方式,統計爬坡事件持續時間。
(7)
(8)
風電爬坡事件間接檢測方法主要是通過時序預測模型計算未來一定時間內的風機出力變化,進而判斷預測區間的爬坡情況。模型選擇以及參數調優對于預測精度以及進一步的事件判斷準確度具有關鍵影響。本文研究采用LSTM時序預測模型預測未來12 h內的風機出力變化,并研究貝葉斯優化計算更加合適可靠的模型超參數組合所帶來的模型效果提升。
長短期記憶神經網絡(LSTM)是基于循環神經網絡(recurrent neural networks,RNN)的改進模型,十分擅長處理具有長期依賴關系的時間序列,能夠有效克服RNN在處理超長序列數據時由于長期依賴的誤差傳遞,造成的梯度消失或梯度爆炸問題。因此對于序列前后存在強烈耦合關系的爬坡功率時序數據有更強大的注意力和特征提取能力[19-22]。
LSTM神經網絡的基本單元如圖5所示,其包含一個輸入層,一個輸出層以及若干隱藏層。不同于單一神經網絡,隱含層中包含交互的記憶單元,存儲狀態信息,并沿時間軸傳遞。記憶單元中放置三個門控制信息的傳遞,分別是輸入門、輸出門和遺忘門[7]。

圖5 LSTM單元結構Fig.5 Unit structure of LSTM

與通常所用的網格搜索或隨機搜索等調參方式通過窮舉來尋找最優參數的方式不同,貝葉斯優化算法(Byesian optimation,BO)考慮采集模型訓練過程中每一次參數設定及取得的結果,通過設計高效的代理函數和采集函數計算得到下一次測試的參數組合,不斷循環迭代,在有限的時間中找到一個相對不錯的模型參數組合。
貝葉斯優化過程如圖6所示,優化模型的具體步驟如下。
步驟1采樣一些參數組合X={x1,x2,…,xk},計算目標函數值observation(X)如MAE、RMSE等,初始化一個代理函數的先驗分布objective.fn(·)。
步驟2計算采集函數值acquisition.fn(·),選取使得本次迭代過程中采集函數值最大的參數組合xmax。
步驟3使用新的參數組合計算目標函數值,并更新代理函數,得到其后驗分布。
步驟4使用得到的后驗分布作為先驗分布,重復步驟2~步驟4,直至最大迭代次數。
常用的代理函數有高斯過程,Tree Parzer Estimator和概率隨機森林,采集函數包括置信上界函數,概率改進函數和期望改進函數(expected improvement,EI)。現采用高斯過程作為代理目標函數的概率模型,此模型能夠生成多維高斯分布,足夠模擬任何目標函數,并采用EI函數作為采樣函數在最可能出現全局最優解的區域(開發)和還未取樣的區域(探索)進行采樣,來獲得模型最優超參數組合。
LSTM模型的超參數有很多種,人為選擇的參數組合基于經驗設定,并不一定能夠反映模型參數組合對于研究對象的適用性。本文使用貝葉斯優化對LSTM網絡的超參數進行優化,提高預測準確度[23-26]。主要對于LSTM網絡的隱含層層數,隱含層神經單元數,以及學習率和正則化系數進行優化,優化超參數的具體信息如表1所示。

表1 LSTM模型待優化超參數信息Table 1 Operating status of LSTM
貝葉斯優化的LSTM網絡模型結構流程圖如圖7所示,經過貝葉斯優化后,LSTM超參數組合在數學上更加具有可解釋性,在當前研究對象上具有更好的模型性能[27-30]。

圖7 貝葉斯優化的LSTM模型流程圖Fig.7 Flowchart of LSTM based bayesian optimization
為展現經過貝葉斯優化后的LSTM神經網絡在短期風電功率數據預測領域的表現以及對模型預測能力的優化效果,以LSTM預測模型作為參考,比較二者之間的差異優劣。同時,為驗證本文所提爬坡事件檢測方法的有效性,以混淆矩陣為指標,進行多次檢測實驗,統計并分析實驗數據來評估該檢測方法的性能。
選擇均方根誤差RMSE、平均絕對誤差MAE作為主要指標來評價LSTM模型的預測精度和性能,其表達式為
(9)
(10)

選擇混淆矩陣延伸得到的精度評價指標準確率(Accuracy)、精確度(Precision)、召回率(TPR)以及F1為主要指標對所提風電爬坡事件檢測方法進行評估,其具體表達式為
(11)
(12)
(13)
(14)
式中:TP為檢測結果為真陽數,即樣本實際是爬坡事件、事件檢測結果也是爬坡事件;TN為檢測結果為真陰數,即樣本實際不是爬坡事件、事件檢測結果也不是爬坡事件;FP為檢測結果為假陽數,即樣本實際不是爬坡事件、事件檢測結果卻是爬坡事件;FN為檢測結果為假陰數,即樣本實際是爬坡事件、事件檢測結果卻不是爬坡事件。
本次仿真基于MATLAB仿真平臺實現,仿真數據選擇1.3節中所提2004—2007年的某風電場出力數據。其中,2006年5月18—19日,強臺風“珍珠”接近中國廣東地區并登錄汕頭南澳島,期間對該地區風電場產生極大影響,導致風電爬坡事件。以臺風“珍珠”經過之前的歷史數據作為模型訓練的數據集,來對5月18—19日臺風過境下的風機出力進行預測。其中歷史數據按8∶2的比例分割為訓練集和測試集。
純LSTM時序預測模型隱含層層數設置為1,隱含層中神經網絡單元個數為192個,初始學習率為0.005,正則化系數設置為1.316 4×10-9,最大迭代次數設置為120次;基于貝葉斯優化的LSTM耦合模型最大優化迭代次數設置為30次,LSTM訓練過程中epoch設置為40次,以經過訓練后的模型對目標區間內的風電出力進行預測驗證模型性能。
預測區間內,實測風電出力和LSTM模型預測結果以及經過貝葉斯優化后的LSTM模型預測結果如圖8所示,評價指標計算結果如表2所示。

表2 模型預測結果對比Table 2 Comparison of model forecasting results

圖8 風機功率預測結果Fig.8 Result of wind power forecasting
經過訓練,模型對于短期風電功率輸出預測均具有較強的性能,有效捕捉并預測了風電的爬坡特征;但即使LSTM模型經過了120次迭代訓練,其預測精度仍顯著低于LSTM-BO模型,貝葉斯優化的LSTM模型的RMSE和MAE相較于LSTM模型分別提升了17.1%和42.5%。最終所得LSTM模型最優超參數組合如表3所示。

表3 LSTM-BO所得最優超參數組合Table 3 Optimal hyperparameter combination of LSTM-BO
取2005年1月1日至2007年1月1日的風電出力數據進行實驗,以24 h為區間長度,選擇50個包含爬坡事件的異常風電出力區間以及50個不包含爬坡事件的正常風電出力區間,用所提方法進行爬坡事件檢測。統計檢測結果的正確和錯誤。同時,以這些判斷區間的前三個月風電出力數據作為訓練集,分別訓練LSTM時序預測模型并進行貝葉斯優化,得到這些判斷區間內風機出力預測數據,進一步用所提方法進行爬坡事件檢測。統計檢測結果的正確和錯誤。
觀測數據和預測數據的爬坡事件檢測結果如圖9所示,其評價指標計算結果如表4所示。

表4 爬坡事件檢測精度Table 4 Precision of ramp events detection

圖9 爬坡樣本檢測結果Fig.9 Results of ramp events detection
在對爬坡事件的識別過程中,所提爬坡事件檢測方法對于判斷區間內的爬坡事件具有良好的效果,在所選樣本集中爬坡事件檢測準確度達到98%,僅有個別區間內的爬坡事件檢測失敗,經分析認為是當爬坡速率較小時爬坡事件檢測方法難以有效提取到爬坡特征,因此對于逐步爬坡事件,所提方法的有效性略有不足。而對于樣本集中不含爬坡事件的區間進行檢測時,所提方法能夠全部識別,精確度達到100%,表現出極低的誤報率,使得檢測結果的可靠性得到保障。在預測區間中,由于模型預測誤差,對爬坡事件檢測方法產生了一定影響,所提方法的準確度有所降低,但仍然在所選樣本集中達到了95%,且依然能夠完全識別不含爬坡事件的樣本。
風電異常爬坡事件是影響電力系統穩定運行的不定時炸彈,隨著風電規模的擴張,新能源并網進程的推進,更加合適精準的爬坡事件檢測方法是電力系統及時做出應對的關鍵。針對目前爬坡事件定義和檢測方法的不足,提出了基于滑動窗的爬坡事件識別方法,并基于某地區風電場的風電功率數據使用貝葉斯優化的LSTM時序預測模型得到預測數據進行檢測方法驗證,得出如下結論。
(1)分析南方某風電場歷史風電出力數據,將風電爬坡分為快速爬坡,逐步爬坡,連續反向爬坡3種場景,并研究其風電出力功率變化特性。
(2)基于滑動窗分別設置參考窗和爬坡檢測窗,計算爬坡檢測窗與參考窗均值之差占參考窗均值百分比并作為爬坡特征量,并建立累加機制,得到爬坡事件持續時間。所提方法可有效識別爬坡事件,且能夠判斷上、下爬坡事件。
(3)采用貝葉斯優化算法,計算LSTM時序預測模型在風電出力功率預測中的最優超參數組合,提高短期風電出力預測精度。
(4)采用所提方法分別在觀測數據和預測數據中進行爬坡事件檢測,有效驗證了所提方法在存在一定偏差的預測數據中的檢測性能,為電網調度提供先驗指導。
風電爬坡事件與天氣系統特定事件的發生密切相關,而天氣事件的影響往往是由局部擴散到大范圍區域的多個風電場,多風電場出力的爬坡特性可能與單風電場存在明顯差異,未來仍需要結合區域風電出力開展進一步的研究分析。