













摘 要:針對傳統風電場景生成方法未充分利用風電功率的預測誤差,以及未合理考慮風電序列時間相關性的問題,提出了一種基于LSTM-CGAN(LongShort-Term MemoryConditionalGenerativeAdversarialNetwork)的風電場景生成方法。該方法在條件生成對抗網絡模型的訓練過程中引入了符合風電預測誤差分布的隨機噪聲,同時使用深度長短期記憶網絡搭建條件生成對抗網絡的生成器和判別器。算例結果表明,所提方法生成的場景集對風電真實場景的覆蓋率能夠保持在98%以上,刻畫風電的不確定性也不會過于保守,能夠更好地學習到風電序列的時間相關性。
關鍵詞:風電;誤差擬合;長短期記憶網絡;條件生成對抗網絡
中圖分類號:TP399 文獻標志碼:A
0 引言(Introduction)
場景生成通過生成多個風電預測場景來描述風電的不確定性,是電力系統隨機優化調度中的重要環節。場景生成方法主要分為統計學方法和深度學習方法。統計學方法主要有蒙特卡洛抽樣法[1]、馬爾可夫鏈法[2]和Copula函數法[3];深度學習方法主要有基于CGAN的場景生成方法[4-7]。統計學方法無法充分考慮風電序列的時空相關性和其他的未知性關系,而基于CGAN的場景生成方法是使用卷積神經網絡搭建網絡模型。風電序列具有較強的時間相關性,而卷積神經網絡常用于對空間相關性特征的建模,相比之下,LSTM 網絡則常用于對時序特征的建模[8]。同時,現有CGAN方法都是采用高斯白噪聲來訓練模型,而不同的隨機噪聲分布會對模型所生成的樣本質量產生顯著影響[9]。基于此,本文提出了一種基于LSTM-CGAN的風電場景生成方法。該方法使用深度LSTM網絡構建CGAN的生成器與判別器,以風電功率日前預測值作為CGAN的條件變量,并且在模型的訓練過程中引入了基于風電預測誤差擬合的隨機噪聲。
1 風電功率預測誤差擬合(Windpowerpredictionerrorfitting)
1.1 數據來源與數據預處理
本文選用的數據集為比利時官方公布的2019年1月1日至2023年6月30日的風電運行數據。該數據集涵蓋了風電功率日前預測值和實際風電功率,為深入分析風電特性提供了堅實基礎。數據集中風電場的最大裝機容量為2786.25MW,數據采樣間隔為15min。在誤差擬合之前,首先需要對數據集進行清洗,去除空值和偏差過大的數據;其次根據公式(1)計算出風電功率的預測誤差,其公式如下:
θ=~P-P (1)
其中:~P 為實際功率,P 為預測功率。
1.2 誤差擬合
風電功率預測誤差擬合模型主要分為參數擬合模型和非參數擬合模型兩類。當擬合數據的概率分布形式為已知時,使用參數擬合模型較為方便且擬合精度較高,而非參數擬合模型的擬合結果完全由數據驅動,不會因為選擇概率分布模型不當而出現較大的擬合誤差。常用的參數擬合模型有正態分布、tlocation分布、拉普拉斯分布及Beta分布,常用的非參數擬合模型有核密度估計。
本文分別采用以上5種模型對數據集中前4年的風電預測誤差數據進行擬合。引入評價指標I 評估預測誤差擬合的精度[10],其公式如下:
其中:δ 為風電預測誤差數據的頻率分布直方圖的區間寬度,D為區間數,qd 為直方圖中第d 個區間的中心位置對應的擬合概率密度函數值,?d 為第d 個區間的高度。I 越小,表示通過擬合得到的概率密度值qd 和原始數據實際的概率密度值?d越接近,即誤差擬合的效果越好。各種擬合方法對應評價指標I 的計算結果如表1所示。由表1可知,核密度估計法的擬合效果更好,因此本文提出的LSTM-CGAN模型選擇的風電預測誤差擬合方法為核密度估計法。
2 基于LSTM-CGAN的場景生成模型(ScenariogenerationmodelbasedonLSTM-CGAN)
為了使CGAN能夠更好地學習到風電序列的時間相關性,本文使用深度LSTM構建CGAN的生成器與判別器,生成器和判別器都堆疊了多個LSTM 層,將上一個LSTM 層各時間點的隱藏狀態輸出作為下一層網絡的輸入。為了加快模型的訓練速度并提高其泛化能力,在模型中添加了歸一化層。由于本文中的LSTM-CGAN模型使用了梯度懲罰項,因此無法使用批歸一化,所以使用層歸一化代替。為了使模型能夠更好地利用風電功率的預測誤差信息,本文使用符合風電預測誤差分布的隨機噪聲代替傳統模型中的高斯白噪聲,首先使用核密度估計法對風電歷史數據的風電預測誤差進行擬合,其次根據擬合得到的函數生成隨機噪聲用于模型的訓練與后續風電初始場景的生成。為了使模型能夠更好地提取風電預測功率所攜帶的風電原始信息,本文基于LSTM-CGAN的風電場景生成模型使用風電的日前預測值作為條件變量c。LSTM-CGAN模型生成器的網絡結構如圖1所示,判別器的網絡結構如圖2所示。
根據上述分析,將基于誤差擬合的隨機噪聲和風電功率日前預測值拼接起來作為生成器的輸入;將生成器生成的樣本和風電功率真實值分別與風電功率日前預測值拼接起來作為判別器的輸入。拼接后得到生成器和判別器輸入數據的結構如圖3所示,其中c 為條件變量值,即風電功率日前預測值;P 分別表示對應的隨機噪聲z、生成樣本x'及真實樣本x 的值。
參考ZANG等[11]提出的模型,將LSTM 隱藏狀態的維度設置為128,LSTM的層數設置為4,每批次的訓練數據設置為32。由圖3可知,生成器與判別器的輸入數據的維度都是(2,96),因此將生成器與判別器中的第一個LSTM 層的輸入特征維度設置為2,在經過第一個LSTM 層之后,輸出的數據維度變為(128,96),而網絡中的層歸一化層不會改變數據的維度,因此將第二至第四個LSTM層的輸入特征維度都設置為128。對于層歸一化層,由于每批次的訓練數據都設置為32,因此歸一化維度設置為(32,128,96)。在生成器中,最后一個LSTM層的輸出數據的維度(128,96)與所需要的風電場景數據維度(1,96)不一致,因此在LSTM層后面加入一個全連接層,輸入維度設置為128,輸出維度設置為1。在判別器中,最后一個LSTM層的輸出數據的維度(128,96)與所需要的判別值維度(1,1)不一致,因此在LSTM 層后面加入一個全連接層,輸入維度設置為128×96,輸出維度設置為1。本文模型生成器網絡的具體參數如表2所示,判別器網絡具體參數如表3所示。
3 算例分析(Casestudyanalysis)
3.1 算例概況
算例選用本文“1.1”小節中介紹的數據集,數據集中包括風電功率的日前預測值和實際值,以2019年1月1日至2022年12月31日的風電數據作為訓練集,以2023年1月31日至6月30日的風電數據作為測試集。經過清洗后,訓練集的數據共有139868條,測試集的數據共有17276條,以連續的96條數據作為1d的樣本,共選擇訓練集數據1456d、測試集數據151d(2023年1月1日至2023年5月31日)。
3.2 場景生成與方法對比
分別采用本文提出的LSTM-CGAN方法、使用高斯白噪聲訓練的LSTM-CGAN方法(G-LSTM-CGAN)、基于CGAN的風電場景生成方法[4]、蒙特卡洛法[1]及馬爾科夫鏈法[2]生成測試集中151d的風電場景集,每天生成500個風電場景,給出2023年2月19日LSTM-CGAN方法生成的風電場景集(圖4)。由圖4可以看出,本文提出的LSTM-CGAN方法生成的風電場景集能夠較好地覆蓋風電的真實場景,生成場景的變化趨勢與真實場景一致,說明該方法能夠有效地生成風電場景。
為了進一步驗證本文提出的場景生成方法的有效性,分別使用自相關系數(AutocorrelationCoefficient,ACC)、功率區間寬度(PowerIntervalWidth,PIW)、誤差分數(Errorscore,Es)、覆蓋率(Coveragerate,Cr)及差異分數(Variogramscore,Vs)評估各場景方法生成風電場景集的質量[12]。
LSTM-CGAN、G-LSTM-CGAN、基于CGAN的風電場景生成方法[4]、蒙特卡洛法[1]及馬爾科夫鏈法[2]生成的場景集與實際風電序列的自相關系數箱型圖如圖5所示。箱型圖描述的是各方法生成風電場景集自相關系數的分布,圖中的“·”為真實風電序列對應的自相關系數,“+”表示異常值。由圖5可以看出,蒙特卡洛法生成的場景集的自相關系數與真實風電序列的自相關系數相差較大,因此以上基于蒙特卡洛的場景生成方法生成的場景無法描述真實風電序列的時間相關性;而其他4種場景生成方法生成的場景集的自相關系數分布都能涵蓋真實風電序列的自相關系數,而且兩者的變化趨勢一致;在這4種方法中,LSTM-CGAN方法生成的風電場景集自相關系數的中位數與真實風電序列的自相關系數最接近,而且異常值最少,因此LSTM-CGAN方法能更穩定有效地學習到風電序列的時序相關性;同時,LSTM-CGAN方法與G-LSTM-CGAN方法的自相關系數異常值相較于CGAN 方法更少,說明使用LSTM網絡來搭建CGAN模型的生成器與判別器,能夠使模型更好地學習風電序列的時間相關性。
為了避免單一樣本驗證的不嚴謹性,使用功率區間寬度、誤差分數、覆蓋率及差異分數對測試集中所有的樣本進行泛化驗證。首先使用以上各種場景生成方法來生成測試集中5個月的風電場景集,然后計算其所對應的評估指標。2023年1月至2023年5月各評估指標平均值如圖6所示。從圖6中可以看出,相較于其他的場景生成方法,基于CGAN的風電場景生成方法生成的場景集的覆蓋率較低,而其他4種場景生成方法生成的場景集都能夠較好地覆蓋風電的真實場景;G-LSTMCGAN方法、蒙特卡洛法和馬爾科夫鏈法生成的場景集的功率區間寬度和誤差分數比基于CGAN 的風電場景生成方法和LSTM-CGAN方法的大,說明相較于G-LSTM-CGAN方法、蒙特卡洛法和馬爾科夫鏈法,LSTM-CGAN方法和基于CGAN的風電場景生成方法生成的風電場景與風電真實場景更加接近;LSTM-CGAN方法的差異分數相較于其他4種場景生成方法更低,說明LSTM-CGAN方法生成的風電場景與風電實際場景的變化趨勢的相似度最高。
綜上所述,相較于其他4種場景生成方法,LSTM-CGAN生成的風電場景集能夠較好地覆蓋風電的真實場景,刻畫風電的不確定性也不會過于保守,能夠更好地學習到風電出力序列的時序相關性,證明LSTM-CGAN能夠更加準確、有效地描述風力發電的不確定性。
4 結論(Conclusion)
本文提出了一種基于生成對抗網絡的風電場景集生成方法,該方法使用核密度估計法進行風電功率預測誤差擬合,以風電日前預測值作為條件變量,使用LSTM 網絡構建CGAN模型的生成器和判別器,算例驗證了本文所提方法的有效性和準確性,具體結論如下。
(1)采用深度LSTM網絡構建模型的生成器和判別器,使模型能夠更好地學習風力發電序列的時間相關性,生成的風電場景集相較于傳統的CGAN模型更加符合風電出力特征。
(2)相較于蒙特卡洛法和馬爾可夫鏈法等基于統計學建模的風電場景生成方法,本文提出的LSTM-CGAN生成的風電場景集與風電真實場景更加接近。
(3)相比于高斯白噪聲,符合風電功率預測誤差分布的隨機噪聲可以更好地模擬真實的誤差情況,從而使生成的場景更加真實和可信。通過在訓練中引入這種預測誤差分布,可以提高生成的風電場景與風電真實場景之間的相似度,從而提高模型所生成風電場景的質量。
參考文獻(References)
[1]車兵,李軒,鄭建勇,等.基于LHS與BR的風電出力場景分析研究[J].電力工程技術,2020,39(6):213-219.
[2]辛闊,馬騫,許琴,等.基于月份劃分與指定日類型的風電出力序列場景生成方法[J].電力系統自動化,2023,47 (15):151-161.
[3]LINSF,LIUCT,SHENY W,etal.Stochasticplanningofintegratedenergysystemviafrank-copulafunctionandscenarioreduction[J].IEEEtransactionsonsmartgrid,2022,13(1):202-212.
[4]董驍翀,孫英云,蒲天驕.基于條件生成對抗網絡的可再生能源日前場景生成方法[J].中國電機工程學報,2020,40 (17):5527-5535.
[5]ZHANGXR,LIDL,FUXQ.AnovelWassersteingenerativeadversarialnetworkforstochasticwindpoweroutputscenariogeneration[J].IETrenewablepowergeneration,2024,18(16):3731-3742.
[6]LIH,YUHY,LIUZJ,etal.Long-termscenariogenerationofrenewableenergygenerationusingattention-basedconditionalgenerativeadversarialnetworks[J].Energyconversionandeconomics,2024,5(1):15-27.
[7]黃越輝,孫亞南,李馳,等.基于條件生成對抗網絡的多區域風電短期出力場景生成方法[J].電網技術,2023,47 (1):63-77.
[8]董驍翀,張姝,李燁,等.電力系統中時序場景生成和約簡方法研究綜述[J].電網技術,2023,47(2):709-721.
[9]李洪均,李超波,張士兵.噪聲穩健性的卡方生成對抗網絡[J].通信學報,2020,41(3):33-44.
[10]黃莉莎.基于風電多場景的電力系統調度研究[D].徐州:中國礦業大學,2022.
[11]ZANGHX,XURQ,CHENGLL,etal.ResidentialloadforecastingbasedonLSTMfusingself-attentionmechanismwithpooling[J].Energy,2021,229:120682.
[12]王小飛,胡志堅,仉夢林,等.短期風功率場景質量的評估框架構建研究[J].電網技術,2017,41(5):1583-1589.
作者簡介:
劉鵬飛(2000-),男(漢族),邵陽,碩士生。研究領域:控制工程。
李 瑤(1993-),女(漢族),遵義,工程師,碩士。研究領域:電
李捍東(1966-),男(漢族),遵義,教授,碩士。研究領域:計算
基金項目:國家自然科學基金(52167007)