李 濱,蒙旭光,白曉清
(廣西電力系統(tǒng)最優(yōu)化與節(jié)能技術重點實驗室(廣西大學電氣工程學院),南寧 530004)
我國在2020年9月明確提出2030年實現(xiàn)“碳達峰”、2060年實現(xiàn)“碳中和”的目標。大力發(fā)展可再生能源是減少碳排放、實現(xiàn)雙碳目標的重要舉措[1-2]。然而風電波動性大、隨機性強[3],調(diào)控性能差,不利于在電力市場競價。因此,如何在風電不確定性強的條件下提高風電有功功率調(diào)節(jié)的精度和穩(wěn)定性,對實現(xiàn)“雙碳”目標、提高風電的市場競爭力具有重要意義。
儲能是提升電力系統(tǒng)調(diào)節(jié)能力、支撐新型電力系統(tǒng)建設的重要手段之一,亦用于提高風電場的調(diào)控能力[4-6],但目前儲能成本過高、容量受限。采用什么樣的控制策略能有效提高儲能的利用率及經(jīng)濟性,使風電場具有和傳統(tǒng)機組相媲美的調(diào)節(jié)特性,成為當前研究熱點。目前風儲控制策略主要分為兩類。第1 類是局部過程控制策略,主要包括PID控制[7]、經(jīng)驗模式分解[8-9]、模糊控制[10]、離散傅里葉變化[11]等。此類控制策略簡單直接,能夠快速地對控制誤差做出反應;但是,此類策略容易造成儲能系統(tǒng)的過充過放,導致儲能容量無法滿足后續(xù)控制時段的要求,控制精度會有所下降,影響風儲系統(tǒng)最終的控制效果與經(jīng)濟性[12]。第2類是過程型控制策略,通過以風儲系統(tǒng)的經(jīng)濟性為目標,對整個控制時段效果進行優(yōu)化建模,求解得到各個控制時段的儲能出力,能有效地提高風儲控制的精度和經(jīng)濟性[12-13]。但是,風電場運行環(huán)境復雜多樣,優(yōu)化模型可能會出現(xiàn)不收斂的情況,很難保證能夠?qū)崟r、動態(tài)地得到有效的控制結果。如果在優(yōu)化模型不收斂的時段采用比例積分PI(proportion integration)控制,則在一定程度上能提高控制的穩(wěn)定性。
近年來,深度學習技術在電力系統(tǒng)中取得了很好的應用效果[14-17]。深度學習模型能夠從海量的原始數(shù)據(jù)中挖掘出其蘊含的抽象特征,在分類和預測問題中得到了很好的應用[18-19]。在新能源發(fā)電領域,基于深度學習的控制策略將兩種儲能控制策略結合,提高了控制的穩(wěn)定性。文獻[20]針對傳統(tǒng)電網(wǎng)調(diào)度方法的不足,提出了一種基于深度強化學習的儲能系統(tǒng)控制策略,實現(xiàn)了風光儲系統(tǒng)調(diào)度的協(xié)調(diào)性與經(jīng)濟性;文獻[21]利用深度學習提取風電場歷史數(shù)據(jù)中輸入與出力之間的非線性關系,提出了一種基于堆疊降噪自動編碼器SDAE(stacked denoising auto encoder)的風電功率預測WPP(wind power prediction)深度學習方法,并通過仿真驗證了此方法的有效性。已有研究表明,在風儲系統(tǒng)調(diào)度以及AGC控制方面,對于處理不確定性問題,深度學習比數(shù)學優(yōu)化模型更具優(yōu)越性[22-23]。在風儲系統(tǒng)控制方面,文獻[24]通過深度強化學習模型捕捉風力發(fā)電與電價之間的不確定性關系,提高了風儲控制系統(tǒng)的經(jīng)濟性。以上研究表明,在風電場運行工況不確定性較高的情況下,深度學習對風儲聯(lián)合控制策略研究具有適用性和先進性。
風電功率具有一定的時序性。在眾多神經(jīng)網(wǎng)絡中,長短時記憶LSTM(long short-term memory)通過獨特的門結構設計,解決了長序列訓練過程中的梯度消失和梯度爆炸問題,從而能夠很好地提取時間序列數(shù)據(jù)的特征,因此被廣泛地用于處理時間序列的問題[25]。但是LSTM只能對時間序列數(shù)據(jù)進行單向處理,即根據(jù)過去的信息來預測當前的輸出。然而,在有些問題中當前的輸出與過去和未來的輸入狀態(tài)都有關。例如,在風儲控制系統(tǒng)中,當前時刻的儲能出力除了要考慮之前的風電場以及儲能狀態(tài)以外,還要保證儲能在后續(xù)的控制時段中能夠進行有效地控制,避免儲能出現(xiàn)過充過放的現(xiàn)象。文獻[26]將Bi-LSTM應用于新能源電網(wǎng)短期負荷預測中取得了不錯的效果,證明Bi-LSTM能夠更好地捕捉雙向時間序列之間的關系。因此,為了避免LSTM單向處理可能造成的信息缺失,本文使用Bi-LSTM 提取出超前滾動優(yōu)化控制策略EPOCS(enhanced processing optimization control strategy)和PI控制后的風電場出力和儲能出力間的不確定性關系。
本文提出了一種基于雙向長短時記憶Bi-LSTM(bidirectional long short-term memory)循環(huán)神經(jīng)網(wǎng)絡的風儲系統(tǒng)實時控制策略。利用PI和滾動優(yōu)化的方法對風儲系統(tǒng)進行控制,在每一個控制時段中選擇控制性能更加優(yōu)良的控制策略,獲得控制后的數(shù)據(jù),構建訓練數(shù)據(jù)集;通過Bi-LSTM來提取數(shù)據(jù)間的雙向時間信息,從而學習到特征因素與儲能充放電狀態(tài)之間的聯(lián)系,獲得儲能控制量。最后,通過對真實風電場數(shù)據(jù)進行仿真,驗證本文所提方法的有效性。
風儲聯(lián)合控制的基本過程如圖1 所示。首先根據(jù)風電機組實際出力數(shù)據(jù)PA、儲能荷電狀態(tài)SOC 、計劃值PP等數(shù)據(jù)計算調(diào)節(jié)功率,并根據(jù)設置的死區(qū)判斷儲能是否動作。若判斷需要儲能出力,則最后輸出儲能調(diào)節(jié)功率PR。

圖1 風儲聯(lián)合控制的基本過程Fig.1 Basic process of wind-storage combined control
為確保大規(guī)模風電安全高效并入南方電網(wǎng)運行,規(guī)定并網(wǎng)風電有功功率調(diào)節(jié)能力要滿足南方電網(wǎng)新能源場站并網(wǎng)管理的要求。同時,為了提高風電的競爭力,需要將風力發(fā)電計劃的考核要求提升到與常規(guī)機組相同的水平。根據(jù)南方能源監(jiān)管局針對常規(guī)發(fā)電機組印發(fā)的《南方區(qū)域發(fā)電廠并網(wǎng)運行管理實施細則(2020 版)》[27],為了保障電力系統(tǒng)安全運行,規(guī)定每15 min 進行一次考核,要求常規(guī)并網(wǎng)機組的電量偏差率不超過±2.5%。
南方電網(wǎng)新能源場站并網(wǎng)管理對風電場有功功率調(diào)節(jié)性能要求以及常規(guī)機組并網(wǎng)的考核要求如表1所示。

表1 風電與常規(guī)機組并網(wǎng)有功功率要求對比Tab.1 Comparison of grid-connected active power requirements between wind power and conventional units
從表1可以看出,南方電網(wǎng)對風電場有功出力的調(diào)節(jié)精度和響應速度都做了較高的要求,除此之外,還需要風電場具備較強的電壓和頻率適應能力。
本文根據(jù)以上要求以及兩個細則對火電機組的考核標準,提出一種風電有功功率輸出偏差評價標準,該標準分為以下兩個部分。
(1)K1為每個考核時段每分鐘控制偏差的平均值,定義公式為
式中:Ccap為風電場開機容量;PPi、PAi為采樣點i時刻風電場的計劃值和實際值;n為采樣點個數(shù)。
(2)K2為15 min的最大偏差限制,定義公式為
式中,max(PEi?15~(i+1)?15) 為每15 min控制偏差最大值。
K1標準為每min 一個考核點,全天1 440 個考核點;K2標準為每15 min一個考核點,全天96個考核點。對于每個考核點,合格標準如下:
(1)K1≤2%;
(2)K2≤10%。
深度學習模型可以利用隱含層的非線性變換挖掘數(shù)據(jù)的底層特征,形成抽象且易于區(qū)分的高層特征,因此擁有優(yōu)異的特征表達能力、強大的函數(shù)擬合能力以及泛化能力[28]。本文所提控制策略在生成訓練數(shù)據(jù)集時,主要采用滾動優(yōu)化方法得到儲能控制指令,該控制策略主要考慮考核時間段過去的風電數(shù)據(jù)以及未來的預測數(shù)據(jù),具有明顯的雙向時間序列性質(zhì)。為了更好地獲得輸入數(shù)據(jù)和儲能調(diào)節(jié)量的映射關系,所選的框架應能夠很好地反映兩者在雙向時間序列上的關系。
Bi-LSTM由兩個結構相同、方向相反的LSTM組成,其單層結構如圖2所示。圖中yk(k= 1,2,3,4) 為雙向處理后隱藏層的最后輸出,為逆序隱藏層輸出,為正序隱藏層輸出,xk(k= 1,2,3,4)為輸入。其基本思想是輸入數(shù)據(jù)經(jīng)過正序、逆序兩個方向的LSTM 處理后,最終的輸出是兩個方向處理結果的拼接。Bi-LSTM 模型的輸出包含了輸入數(shù)據(jù)完整的過去和未來的信息,而且在訓練過程中權值共享,在不增加數(shù)據(jù)量的同時,保證了其泛化能力[26],因此本文提出的深度學習控制策略選擇Bi-LSTM循環(huán)神經(jīng)網(wǎng)絡作為學習框架。

圖2 Bi-LSTM 結構Fig.2 Bi-LSTM structure
2.2.1 模型構建
PI 控制和基于優(yōu)化理論的風儲聯(lián)合控制策略的控制流程分為兩個環(huán)節(jié)。第1 環(huán)節(jié)是判斷儲能動作類型,兩種控制策略都是將風電場和儲能的相關數(shù)據(jù)輸入,通過計算判斷儲能應該進行什么樣的操作,只有當前控制偏差在死區(qū)之外時,需要儲能進行充放電調(diào)節(jié),否則儲能不動作。第2環(huán)節(jié)是對儲能充放電具體數(shù)值進行計算,在已經(jīng)判斷出需要儲能出力調(diào)節(jié)的情況下,利用第1環(huán)節(jié)得到的數(shù)據(jù)確定儲能的調(diào)節(jié)功率。
本文提出的風儲聯(lián)合控制模型將3 個已訓練完成的Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡來實現(xiàn)上述環(huán)節(jié)中的判斷和計算功能,得到一種新的風儲聯(lián)合控制策略:第1 環(huán)節(jié)的功能是區(qū)分儲能的動作狀態(tài),即充電、放電和不動作3 種,使用1 個三分類網(wǎng)絡來實現(xiàn);第2環(huán)節(jié)的功能是計算儲能充放電功率的具體數(shù)值,使用2 個回歸網(wǎng)絡來實現(xiàn)。基于Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡的風儲控制具體流程如圖3所示,圖中T0、T1、T2為時間序列;WPP 為風電預測功率;SOC 為儲能荷電狀態(tài);LSTM 為單向長短時記憶網(wǎng)絡;PR為儲能系統(tǒng)輸出;0、-1、1分別代表儲能不動作、充電、放電狀態(tài);Softmax為激活函數(shù)。

圖3 基于Bi-LSTM 的風儲控制流程Fig.3 Process of wind-storage control based on Bi-LSTM
2.2.2 選擇網(wǎng)絡輸入、輸出變量
利用PI控制和優(yōu)化控制生成數(shù)據(jù)集時,使用的是風電場實際出力值PA、計劃值PP、風電預測功率、過去時段的儲能出力值4 個輸入,優(yōu)化控制以懲罰電量最少為首要目標、以電池吞吐量最少為次要目標,通過求解器求解優(yōu)化模型得到該時段滿足以上目標的儲能出力值。前3 個輸入屬于反映采樣時刻風電場出力狀態(tài)的特征變量,與采樣時刻風電場實際運行情況相關,第4個輸入則反映了儲能過去時段的出力狀況。在選擇神經(jīng)網(wǎng)絡的輸入變量時,為盡可能地反映采樣時刻風儲聯(lián)合系統(tǒng)的真實運行狀態(tài),本文選擇數(shù)據(jù)集的輸入變量為風電場實際出力值、計劃值、預測值以及儲能過去時段的SOC ,網(wǎng)絡特征值數(shù)量為4。
3 個Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡的輸入變量相同,但由于不同網(wǎng)絡實現(xiàn)的功能不同,所選取的輸出變量也不同。充放電回歸網(wǎng)絡選取對應的儲能充放電功率數(shù)值作為輸出變量;分類網(wǎng)絡的輸出變量為儲能動作狀態(tài)的離散變量,即-1、0、1,分別代表充電、不動作和放電。
3.1.1 生成數(shù)據(jù)集
在獲取儲能動作數(shù)據(jù)時,大多數(shù)考核時間段使用的是優(yōu)化控制后的儲能動作值,只有少部分優(yōu)化算法不收斂的時段采用PI 控制的值。不同的考核時段代表不同的風電場運行狀況,選擇控制性能更優(yōu)的控制策略對風儲系統(tǒng)進行控制,所得到的儲能控制指令中就蘊含了優(yōu)化控制和PI 控制策略的優(yōu)秀控制特性。
3.1.2 變量標準化
對于連續(xù)數(shù)據(jù),如PA、PP、風電預測功率和儲能SOC 這4 類輸入變量和回歸網(wǎng)絡中作為輸出變量的儲能調(diào)節(jié)功率,均采用Z-score標準化的方法處理,其轉(zhuǎn)化公式為
式中:X為標準化后的值;x為待標準化的值;μ、σ為特征變量的均值和標準差。
對于離散數(shù)據(jù),采用獨熱編碼(one-hot encoding)處理。儲能充電、不動作、放電狀態(tài)值分別為-1、0、1,編碼后分別對應100、010、001。
3.1.3 生成有監(jiān)督學習數(shù)據(jù)集
Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡訓練所需要數(shù)據(jù)類型是三維的有監(jiān)督學習數(shù)據(jù),在數(shù)據(jù)預處理后需要用序列長度× 特征大小的滑動窗口(sliding window)在時間序列數(shù)據(jù)中框出一個二維數(shù)據(jù)并進行疊加得到三維數(shù)據(jù)。根據(jù)訓練數(shù)據(jù),本文所取的滑動窗口規(guī)格為151 × 4 。
分類網(wǎng)絡的訓練數(shù)據(jù)集是以預處理后的儲能狀態(tài)為標簽的三維數(shù)據(jù)集,而充放電回歸網(wǎng)絡訓練數(shù)據(jù)集則是以對應的充放電功率數(shù)值為標簽的三維數(shù)據(jù)集。分類網(wǎng)絡和充、放電回歸網(wǎng)絡分別使用3個不同的三維數(shù)據(jù)集。
3.2.1 網(wǎng)絡結構以及超參數(shù)設置
本文提出的Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡的結構主要分為輸入層、隱藏層和輸出層。其中輸入層的數(shù)據(jù)輸入大小為151 × 4 ,隱藏層共有4層,每層含有1個Bi-LSTM 層、1 個Dropout 層和1 個激活函數(shù)。對于分類網(wǎng)絡,其輸出層輸出的序列長度為3,激活函數(shù)為Softmax;對于回歸網(wǎng)絡,其輸出為儲能動作值,長度為1,故其輸出層可以是一個神經(jīng)元數(shù)為1 的全連接層。具體超參數(shù)設置如表2所示。

表2 神經(jīng)網(wǎng)絡超參數(shù)設置Tab.2 Setting of hyperparameters of neural network
3.2.2 網(wǎng)絡訓練流程
3個Bi-LSTM循環(huán)神經(jīng)網(wǎng)絡的數(shù)據(jù)處理與訓練流程主要如下。
(1)數(shù)據(jù)預處理:分別對3 個網(wǎng)絡輸入輸出進行標準化以及編碼處理。
(2)數(shù)據(jù)采樣:用大小為151 × 4 窗口對預處理之后的時序數(shù)據(jù)進行滑動采樣,將其以n× 151 × 4的形式進行儲存。
(3)劃分訓練集和測試集:將數(shù)據(jù)采樣后得到的三維數(shù)據(jù)集按7∶3 的比例劃分為訓練集和測試集,并將訓練集的輸入數(shù)據(jù)輸入到Bi-LSTM循環(huán)神經(jīng)網(wǎng)絡中,經(jīng)過網(wǎng)絡黑箱計算后得到預測值。
(4)更新參數(shù):根據(jù)預測值和訓練集標簽的計算得到訓練集損失,并經(jīng)過一次反向傳播BPTT(back propagation through time)計算后,更新循環(huán)神經(jīng)網(wǎng)絡中的參數(shù)。
(5)評估網(wǎng)絡性能:將測試集數(shù)據(jù)代入未完成訓練的Bi-LSTM循環(huán)神經(jīng)網(wǎng)絡中得到測試集損失,通過與訓練集損失進行對比,若出現(xiàn)過擬合或者欠擬合的現(xiàn)象,則需要進行網(wǎng)絡結構或者超參數(shù)的調(diào)整。通過以上步驟的反復訓練,最終得到3 個Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡,組成基于Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡的風儲聯(lián)合控制模型,則可進行下一步的仿真控制。
具體訓練流程如圖4所示。

圖4 Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡訓練流程Fig.4 Training process of Bi-LSTM recurrent neural network
3.2.3 基于Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡的風儲聯(lián)合控制流程
本文提出的基于Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡的風儲聯(lián)合控制流程通過使用3 個已經(jīng)訓練好的Bi-LSTM循環(huán)神經(jīng)網(wǎng)絡,分別實現(xiàn)儲能動作狀態(tài)分類、儲能充電和放電功率回歸計算的功能,具體控制流程如下。
首先通過儲能狀態(tài)分類網(wǎng)絡判斷當前儲能是否要進行充放電操作,使得風電場有功功率出力能有效跟蹤計劃值。對每個采樣點進行一次控制計算,將判斷時刻的相關數(shù)據(jù)按照Bi-LSTM循環(huán)神經(jīng)網(wǎng)絡輸入的要求組成原始數(shù)據(jù),并按式(3)進行標準化處理,變量的平均值和方差為訓練網(wǎng)絡時計算所得。將處理過后的數(shù)據(jù)輸入判斷狀態(tài)網(wǎng)絡中,得到儲能控制狀態(tài)的長度為3的獨熱編碼,經(jīng)過解碼后,最終得到儲能的3種控制狀態(tài),即-1、0和1。若輸出為0,即判斷儲能無需調(diào)節(jié);若輸出為-1(1),則判斷儲能需要采取充(放)電調(diào)節(jié)。
回歸網(wǎng)絡用于計算儲能充放電狀態(tài)下的調(diào)節(jié)功率值。若分類網(wǎng)絡輸出1,則判斷儲能進行放電操作,此時將輸入狀態(tài)分類網(wǎng)絡的樣本再次輸入到放電功率回歸網(wǎng)絡中進行計算,將網(wǎng)絡輸出進行反標準化處理后得到最終的儲能放電功率數(shù)值。
本文所提網(wǎng)絡訓練框架采用TensorFlow,硬件平臺為Intel Core i7-10700F CPU 以及一塊AMD Radeon R5 430 GPU。
本文數(shù)據(jù)來源于某100 MW風力發(fā)電場真實歷史數(shù)據(jù),為了盡可能地反映真實風電場的運行工況,從2018 年上半年的運行數(shù)據(jù)中取33 d的數(shù)據(jù),共3 168 個考核時段,采樣周期為2 s,全天共計43 200個采樣點。按照第3.1節(jié)生成所需的訓練數(shù)據(jù),將其中23 d 共2 208 個考核時段作為訓練集,10 d共960個考核時段作為驗證集。EPOCS所使用的數(shù)據(jù)以及儲能參數(shù)參照文獻[9],PI控制的系數(shù)根據(jù)控制偏差動態(tài)設置。
為了驗證基于Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡的風儲控制策略的有效性,分別用PI、EPOCS以及基于Bi-LSTM、LSTM、雙向門控單元Bi-GRU(bidirectional gated recurrent unit)循環(huán)神經(jīng)網(wǎng)絡對2019年上半年的31 d的風電場數(shù)據(jù)進行仿真控制。
表3、表4展現(xiàn)了5種控制策略下的風儲出力效果以及儲能出力情況對比。表中各項指標分別為均方根誤差(RMSE)、考核電量(KD)、受考核時段(KS)、受考核率(考核合格時段與全天考核時段的比值,KSH)、儲能調(diào)節(jié)電量(TD)、調(diào)節(jié)電量占比(儲能調(diào)節(jié)電量與全天輸出電量比值,TDB)。

表3 風儲出力控制效果對比Tab.3 Comparison of control effects on wind-storage output

表4 儲能調(diào)節(jié)情況Tab.4 Storage regulation
由表3可以看出5種控制策略都有效降低了風電場的考核電量,提高了風儲聯(lián)合系統(tǒng)的跟蹤計劃能力。但是基于Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡的控制效果最為優(yōu)異,能夠?qū)L儲系統(tǒng)控制偏差控制在較小的范圍內(nèi),平均誤差只有0.8%,控制精度較高,且受考核率只有10.58%(本文受考核率為受考核時段與總的考核時段的比值),將風電場的考核電量由原來的3 466.69 MW·h降到了36.73 MW·h。由表4可以看出基于Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡的風儲控制策略儲能平均調(diào)節(jié)電量最少只有150.74 MW·h,各項儲能調(diào)節(jié)情況都優(yōu)于另外兩種神經(jīng)網(wǎng)絡和PI控制;雖然EPOCS的充放電次數(shù)最少,但是由于在某些時候算法出現(xiàn)不收斂的情況,儲能動作偏差較大,因此調(diào)節(jié)電量反而比基于Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡風儲控制策略的多。通過2 個表格可以看出基于Bi-LSTM循環(huán)神經(jīng)網(wǎng)絡的風儲控制策略有著較好的控制精度且穩(wěn)定性好,比另外4種控制策略更能適應風電場的運行工況。
表5 展現(xiàn)了各個控制策略考核結果,從表中可以看出基于Bi-LSTM循環(huán)神經(jīng)網(wǎng)絡控制的2種考核指標百分之百合格率天數(shù)最多,都超過了其他4種控制策略,表明了基于Bi-LSTM循環(huán)神經(jīng)網(wǎng)絡的控制策略相比于另外4種控制策略控制效果更好、更穩(wěn)定。

表5 5 種控制策略考核結果Tab.5 Assessment results of five control strategies
取某日控制效果分析,該日風電場實際出力和計劃值之間的均方根誤差為10.43%,全天輸出電量為1 154.37 MW·h。圖5展示了5種控制策略下,風電功率出力曲線以及控制偏差曲線,表6為風儲系統(tǒng)控制效果對比。表中,ABS_MAX 為最大出力偏差絕對值,KDB 為考核電量與全文輸出電量的比值。由圖5和表6可知,5種控制策略均能有效地跟蹤計劃出力曲線,但是基于Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡的控制效果最好,控制精度最高,而且考核電量占比僅有0.15%。說明基于Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡的控制策略具有較強的適應風電場出力不確定性的能力,能夠在風電出力突變的時候也能很好地進行儲能跟蹤調(diào)節(jié)。

表6 風儲系統(tǒng)控制效果對比Tab.6 Comparison of control effects on wind-storage system


圖5 5 種控制策略下風電場出力情況Fig.5 Wind farm output under five control strategies
表7為5種控制策略的儲能系統(tǒng)調(diào)節(jié)情況。由表7 可知,基于Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡的控制策略儲能調(diào)節(jié)表現(xiàn)最為優(yōu)秀。

表7 單日儲能調(diào)節(jié)情況Tab.7 Daily energy storage regulation
當前,儲能成本仍然居高不下,因此需要評估風儲系統(tǒng)的收益水平。本文采用的儲能系統(tǒng)經(jīng)濟評價方式參考文獻[12]。
根據(jù)31 d仿真結果,假定風電場的年利用小時數(shù)為2 300 h,使用雨流計數(shù)法[28]評估儲能電池壽命,確定儲能更換次數(shù)。根據(jù)儲能系統(tǒng)壽命計算結果可知,PI 控制需要更換2 次儲能設備,而其他控制策略需要更換1 次設備。具體儲能系統(tǒng)經(jīng)濟性情況如表8所示。

表8 儲能系統(tǒng)經(jīng)濟性計算結果Tab.8 Calculation results of economic performance of energy storage system
如表8所示,在整個運行周期內(nèi),基于Bi-LSTM循環(huán)神經(jīng)網(wǎng)絡的控制策略能夠在降低考核電量的同時,盡可能地減少電池的吞吐量,從而延長儲能壽命,控制策略在20 a 內(nèi)的收益率達到22.42%,在5種控制策略中經(jīng)濟效益最高。
綜上所述,本文所提深度學習控制策略能夠?qū)崟r、快速地得到風儲控制結果,并且在多種運行工況下都能兼顧實時性、穩(wěn)定性和準確性,同時能夠保證風儲系統(tǒng)的經(jīng)濟性。
本文以Bi-LSTM循環(huán)神經(jīng)網(wǎng)絡為基礎,利用其分類以及回歸計算的功能構建風儲控制策略深度學習模型,并提出一種基于Bi-LSTM循環(huán)神經(jīng)網(wǎng)絡的數(shù)據(jù)驅(qū)動型風儲實時控制策略,是一種將大量風儲相關數(shù)據(jù)進行信息的整合和提煉,并在此基礎上經(jīng)過訓練和擬合形成的決策模型。結合仿真分析可以得到以下結論。
(1)本文所提控制策略能夠適應風電場復雜多變的運行工況,能夠?qū)崟r、快速地得到風儲控制結果,有效地提高風儲控制精度,減少懲罰電量,提高風儲系統(tǒng)的經(jīng)濟性。
(2)通過對5 種控制策略各種指標的對比,驗證了本文所提基于Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡的數(shù)據(jù)驅(qū)動型風儲實時控制策略的穩(wěn)定性和優(yōu)越性。
由表5 可知,盡管基于Bi-LSTM 循環(huán)神經(jīng)網(wǎng)絡的控制策略提高了考核合格點數(shù),但在仿真中某些考核時段仍會出現(xiàn)不合格的現(xiàn)象,這是因為訓練數(shù)據(jù)無法完全覆蓋風電場運行狀況。后續(xù)可以用其他控制策略,如DFT,修正考核不合格時段的儲能調(diào)節(jié)指令,并加入到原有的訓練集中。將數(shù)據(jù)集不斷豐富,再經(jīng)過對網(wǎng)絡的反復訓練,使本文所提控制策略更加成熟穩(wěn)健。