曹錦陽,劉 夢,李嘉錚,孫博寧,蒲梓寧,何再雨,吳鳳嬌
(1.西北農林科技大學 水利與建筑工程學院,陜西 楊凌 712100;2.北京科東電力控制系統有限責任公司,北京 100000)
近年來,以風電、光電為代表的可再生能源發展迅速,極大地緩解了我國能源壓力。由于風光具有間歇性、隨機性等缺陷,輸出功率不易控制,給電網有功、無功平衡調度帶來困難。如何提高風光發電利用率,減小風光發電對電網安全穩定的影響,是迫切需要解決的問題。
抽水蓄能作為一種儲能技術,具有靈活啟停、爬坡率高等優點,與風光發電配合,可顯著降低對電網波動性的影響[1]。文獻[2]建立以聯合運行系統發電并網收益最大和向外部電網輸出功率最平滑為優化目標的風光抽水蓄能電站聯合運行模型,利用MSSA(Multi-objective Salp Swarm Algorithm)對模型進行多目標優化求解,并在同等條件下與單獨考慮聯合運行系統發電并網收益最大或向外部電網輸出功率最平滑的單目標下優化結果進行對比。文獻[3]考慮多種不確定性,包括風能、太陽能輸出、負載變化、發電機故障以及風光抽水蓄能系統的供應和儲備,將不確定性分為連續和離散。建立容量中斷概率表和制定儲備與可靠性指標負荷損失概率之間的關系。采用可調魯棒優化方法來處理離散和連續的不確定性,提出應對多重不確定性和傳輸約束的方法,可以在經濟的程度上保證系統的可靠性。文獻[4]以最小的風光能減排為目標,考慮風光發電機組和抽水蓄能發電機組的運行約束,建立了協調調度模型,為制定風光伏抽水蓄能協調調度輸出方案提供理論依據。文獻[5]將綜合系統的投入成本作為目標函數,分析了風光抽水蓄能的基本約束條件,提出一種自適應模糊粒子群優化算法來求解單目標約束優化問題。文獻[6]介紹了一個利用統計方法和神經網絡方法,設計了一個多神經網絡的數據融合算法來預測未來一年逐小時的風速發電量數據。利用張北、內蒙地區兩風電場的數據進行訓練和測試,最終預測結果平均絕對誤差小,預測模型效果較好。文獻[7]介紹了針對影響風電中長期預測的氣象、地理等因素眾多且復雜,及無法解決長期依賴時間序列的問題,提出一種基于多維特征融合網絡和長短期記憶的預測方法。目前,對于風光抽蓄聯合優化運行內容的研究理論基礎較為成熟,但模型實際操作的可行性、誤差大小還有待提高。
本文基于風光發電的天然互補性,以及抽水蓄能的靈活性特點,針對風光發電輸出功率并網不穩定問題提出了風、光和抽蓄聯合運行的優化模型。最后對光伏風電輸出功率數據進行訓練優化,得到最終的發電目標,使最終出力均勻。此模型可用于擬建抽水蓄能電站地區,籌建時根據該地區風電光電出力確定抽水蓄能電站發電功率參數。風電與光伏發電聯合抽水蓄能的優化運行可以實現輸出功率穩定,對緩解風力發電和光伏發電的功率波動帶來的影響,提高風光這種清潔能源的利用效率,以及電網的穩定性和經濟性具有十分重要的意義。
光伏發電前期投資成本低,建設速度快,后期維護簡單。但受光照條件、溫度和氣候影響,輸出具有間歇性和波動性的缺陷[8-9]。
在裝機容量、建筑面積相同情況下,平面單軸光伏發電跟蹤系統比固定光伏支架系統發電效率高20%~25%。因此本文采用單軸追蹤方式下的數據。由于單個電池電壓只有0.5V~0.7V,所以光伏電池由大量電池串聯而成。
物理表達式為:
(1)
式中:I為光伏電池板的電流;U為光伏電池板的電壓;Iph為光伏電池板的光生電流;RS為等效串聯電阻;I0為飽和電流;m為波爾茲量常數;q為電荷量;T為溫度;n為二極管常數。
由于并聯等效電阻較大,不考慮等效并聯電阻,串聯得到的等效電阻可以忽略。設Isc=Iph,可得光伏輸出功率:
(2)
(3)
(4)
式中:Uoc為開路電壓;Isc為短路電流;Um為最大電壓;Im為最大電流;ppv為輸出功率。
RF(Random Forest)分類模型構建過程的主要步驟如下:
(1)利用Bootstrap進行重采樣:采樣過程利用Bootstrap法,設初始的訓練樣本集合為T,進行隨機地、有放回地L次抽樣,抽樣得到L個樣本子集,這些樣本子集用于訓練決策樹每個子集的樣本數量相同,將其表示為{T1,T2,…,TL},在進行抽樣時,一個子集St(t∈1,2,…,L)中,不含有某一樣本的概率P為:
(5)
當L→∞時,有:
(6)
未被抽中的約38%的樣本數據稱為袋外數據,在生成每一棵決策樹時,都可以同時計算得到一個袋外樣本OOB(out of bag)誤差估計,將所得到的所有的OOB誤差估計取平均值,從而得到RF的泛化誤差估計。
(2) 構建決策樹:決策樹的構建用到了CART算法,將得到的決策樹組合成一個隨機森林。利用隨機子空間的思想,從m個特征變量中,進行隨機地等概率地抽取,從而得到d個子變量,并組成分裂特征的變量子集,根據基尼系數值最小原則,在其中選出一個最優的分裂特征變量,利用相應的最優分裂值對該節點進行分裂,進行遞歸法建樹,結束的標志是每一個特征變量都被用作分裂節點,重復進行上述過程共N次,最終建立N棵決策樹,從而組合成為一個隨機森林[10]。其中定義一個Gini系數:
(7)
式中:di表示當前所選的特征變量;k為特征變量;pk為樣本點屬于第k類的概率。
特征的重要性評估是通過Gini系數得出的,通過計算每個特征的重要性評分,可以識別并去除不相關的特征,從而提高模型的準確性。
(3) 投票表決階段:對于所輸入的樣本集,這些決策樹共同構成了一個隨機森林,每個決策樹都相應有一個分類結果,對其結果進行投票,將投票結果為最多的類別選作最終決策,相應公式如下:
(8)
式中:Y(x)表示的是測試樣本最終分類結果;yn(x)=i表示的是第n棵決策樹的輸出為i;λ為表達式的個數;z表示的是類別的數量。
本文進行短期預測,同時考慮其受云層運動等影響可能會發生突變,因此太陽輻射度分為地表水平輻射,直接輻射和散射輻射三個方面。本文構建樣本表示為:Xi={xti,xdi,xzi,xsi},即{i時刻的環境溫度,i時刻的地表水平輻射,i時刻的直接輻射,i時刻的散射輻射}。
通過羲和能源大數據平臺獲得2022年5月18日00∶00至6月16日00∶00逐小時環境溫度、地表水平輻射、直接輻射、散射輻射和輸出功率數據(如圖1)。其中環境溫度指高地面約1.5 m~2.0 m處百葉箱中的溫度;地表水平輻射指地表水平方向獲得的太陽輻射;直接輻射指垂直于太陽能方向的直接輻射;散射輻射指太陽光在穿過大氣層到達地面過程中通過云、空氣中氣體分子以及塵埃等產生散射,最后通過漫射到達地球表面的輻射能。

圖1 環境溫度、地表水平輻射、直接輻射、散射輻射、輸出功率參數曲線
可見,在這一個月內每天的發電功率呈一定規律,在中午附近達到高峰,兩邊呈下降趨勢。用這一個月內時間點的數據作為訓練集代入程序,結合被預測當日的環境溫度、地表水平輻射、直接輻射、散射輻射,即可得出預測的輸出功率,如圖2所示。

圖2 功率預測
光伏功率預測誤差客觀存在且不可避免,究其原因主要是云層的劇烈變化所引起的光伏功率曲線的波動,所以待預測日的類型是影響誤差分布的主要因素。隨機森林算法的性能高度依賴于隨機性,因此可以通過改進隨機化過程來減少誤差,本文采用了RandStream 類,可以創建隨機數流,來有效減少誤差。一般來說,子樹的數量越多,誤差就越小,預測的準確性也越穩定,但是同時也會延長計算時間,所以在綜合誤差性能和速度上,本文選擇的子模型數量為800。
選取平均絕對值誤差(MAE),均方根誤差(RMSE)和相關系數(R)用于評估預測模型的預測性能和數據特征。其中MAE和RMSE越小,表明預測結果的精確度越高,R值越接近于1,說明預測功率值與實際功率值線性關系越高,表明預測功率曲線與實際功率曲線趨勢越接近。
將提出的預測模型與DP-決策樹、DP-Bagging、DP-Boosting三種經典方法進行了比較分析[11],結果如表1所示。

表1 預測性能比較
本文方法的MAE與RMSE誤差指標均低于其他三種方法,同時相關系數最大,由此驗證了該模型在短期光伏功率預測中具有較高的預測精度和良好的適應性。
風能具有不確定、波動、低密度能量等特點。隨著風力發電的迅猛發展,風電在電網中的比例不斷增加,當其并網功率占電網總功率比例超過一定量時,并網的風電會對電力系統的安全穩定以及電能質量產生影響,嚴重時可能會導致系統失去穩定[12]。
本文選擇陜西北部經度109.39°、緯度35.32°某風場數據研究風電場輸入對功率輸出的影響。風機型號為GoldWind-GW_1.5_70(輪轂高度為70 m,裝機容量為1.5 MW),數據選取2022年5月18日00∶00至6月16日00∶00逐小時的數據,四個輸入參數分別為氣壓、地面風速、風向、風速,輸出參數為輸出功率。
由風電場數據曲線(見圖3)可知在氣壓變化幅度增大的同時,地面風速變化也變大,該時間段平均地面風速約為3.4 m/s,地面冷空氣較為活躍,風速較大。由該風電場參數曲線對比可知,最大發電量為1.19 MW,最小發電量為0,其波動性與間歇性明顯,不確定性強,使得接入電網的風電對電網造成較大沖擊,大規模接入更會影響電網系統的可靠性和電能質量,這使得風電站不得不棄風,造成了能源浪費。為了解決上述問題,就要實現風力發電功率合理精確預測,將風電站、光電站與抽水蓄能電站聯合運行,利用抽水蓄能“削峰填谷”作用,將具有一定波動性、質量不高的風電轉換為比較穩定的、質量較高的電能,從而減少風、光能源的浪費,提高發電的效率。本文探討如何將風電、光電與抽水蓄能電站聯合運行并優化,實現其發電效率提升。

圖3 風電場氣壓、地面風速、風向、風機輪轂風速參數曲線
本文利用卷積神經網絡(Convolutional Neural Networks,CNN)預測風力機組的輸出功率,基本結構如下。
(1) 輸入層
輸入層可以處理多維數據,同時對輸入數據進行歸一化標準化后,有利于提升卷積神經網絡的學習效率。本文輸入層為二維數據,類似于一個4*698大小的圖像,輸入數據為風機轉軸處的風速、風向、地面風速和氣壓四個參數,訓練集占比85%,剩下15%用于測試。
(2) 隱含層
其中卷積層對輸入的數據進行特征提取,卷積層的內部包含很多卷積核,每個卷積核都有權重系數和偏差量。其內部每個神經元都與上一層中位置接近區域的其他多個神經元相連,輸出的每個神經元與輸入進行局部連接,利用連接權值與局部輸入加權求和再加上偏置值從而得到該神經元輸入值,該過程等同于卷積過程[13-14]。
卷積層的參數包括:卷積核大小、填充以及步長,三個參數共同決定了卷積層最終輸出特征圖的尺寸大小,是CNN的超參數。卷積核大小可以為小于輸入圖像尺寸的任意值,其越大,可提取的輸入特征情況越復雜。卷積步長表示卷積核相鄰兩次掃過特征圖時相鄰位置的距離,因為本文輸入數據較小,故卷積步長設為1,卷積核會逐個掃過特征圖的元素,有利于特征的準確提取 。考慮本文輸入數據為4*698大小,為了更加準確提取,本文卷積核大小選為3*3,數量為32,為了不丟棄原圖信息以及保持特征圖的大小與原圖一致,同時保持邊緣信息,讓更深層的layer的input依舊保持有足夠大的信息量,填充方式設定為相同填充,通過加入padding函數來實現。加入激勵函數以協助表達復雜特征,本文選用計算簡單,導數恒定,具有稀疏性的非飽和激活函數ReLU激勵函數。
全連接層是隱含層的最后部分,其作用是向其它的全連接層傳遞信號,可以對提取的數字特征進行相應的非線性組合,也就是利用現有的高階的特征完成相應的學習目標。本文全連接層神經元個數為2,長度取值為32。
(3) 輸出層
本文因為輸出只有一個,故輸出層神經元設置為1。
通過風機發電功率歷史數據對模型進行訓練,訓練最大迭代次數是20次,批處理樣本為16,學習率(控制梯度下降的速度)為0.005,梯度閾值為1,同時使用ValidationData函數防止過度擬合。在訓練數據時,加入Adam函數對隨機梯度下降算法進行一定的擴展,其作用是計算梯度的一階矩估計以及二階矩估計,因此可以為不同的參數設計不同的獨立的自適應的學習率。圖4為模型訓練實際數據與測試數據結果對比。據圖分析,測試數據較接近實際數據,預測整體效果良好。

圖4 CNN模型測試結果與真實值比較
本文選取4個指標用于評估預測模型的預測性能和數據特征,包括平均絕對值誤差(MAE)、平均絕對值誤差百分比(MAPE)、均方根誤差(RMSE)和相關系數(R)。其中MAE和RMSE越小,表明預測結果精確度越高。
預測數據的主要來源是天氣預報和風電場的實際測試得到的數據,受氣象地理等諸多不確定條件影響,地面風速、輪轂處風速以及風向的變化都非常復雜,具有很強的隨機性,因此預測誤差無法避免。并且由于梯度會逐漸地衰減,誤差的強度會乘上權重后相應的向后傳播,這將導致強度衰減,因此導致CNN預測時出現誤差。CNN模型測試誤差大致在0.04以內,相對誤差在0.9以內,誤差較小,模型預測精度較高。訓練過程共迭代740次,隨著訓練輪數的增加和訓練誤差的降低,風電功率預測模型的特性不斷接近實際功率的變化特性,從而實現功率的預測。
為驗證模型的預測性能,選取了四種預測模型做對比,將提出的預測模型與GRU、Arima、SVM、LSTM四種經典方法進行比較分析[15],結果如表2所示。

表2 預測性能比較
本文方法的MAE與RMSE誤差指標均低于其他四種方法,同時相關系數為0.9969,由此驗證了此模型在短期風電功率預測任務中較高的預測精度和良好的適應性。
本文研究在抽水蓄能電站參數未確定的條件下,以無約束條件的優化算法,結合風光電的預測結果,選用容錯率較高的BP神經網絡,對抽水蓄能電站的短期出力進行預測。
本模型為單目標優化模型,考慮系統出力在以一個月為尺度的時間段內出力均勻、波動最小為目標,建立目標函數。
(9)

此目標函數表示了時間尺度內系統出力的波動性,函數值越小,表示系統出力越均勻,其出力曲線越接近光滑直線。
以某地歷史上每年某個月的風光預測出力數據,求和取平均值即Pav,作為某地該月的系統平均出力。
(10)

以Pav作為該月的系統平均出力,可以保證該月內抽水蓄能電站用電發電近似相等,實現抽蓄平衡。

(11)
式中:當Yt為正數時,抽水蓄能電站放水發電;當Yt為負數時,抽水蓄能電站抽水耗電。
(1) 輸入層
以該代表月為例,采用小時為單位,共計2 091組數據。選擇前300組數據用來構建模型,采用比例70%的訓練集以及30%的測試集,剩余的數據作為檢驗模型的依據。對數據進行歸一化處理從而將原數據映射到選擇的區間。本模型歸一化范圍為[-1,1]。
(2) 隱含層
隱含層的節點個數對于識別率的影響不大,但為了避免節點個數過多導致運算量增加的問題,本模型選擇雙隱含層結構,節點個數第一層為10,第二層為20。神經網絡訓練的目標誤差是模型是否結束的判斷條件之一,當目標誤差到達設定值時,停止迭代,得到最終的BP神經網絡模型。本模型設置目標誤差為1×10-6。綜合考慮網絡收斂以及識別效果,將學習率設置為默認值0.1。激勵函數主要有三個,分別為tansig、logsig、purelin。purelin函數是輸出層的默認函數,即線性傳遞函數。tansig只是在logsig的基礎上進行拉伸平移操作。在該模型的建立中,輸入層到第一隱含層使用tansig,第一隱含層到第二隱含層使用logsig,第二隱含層到輸出層使用purelin。LM算法首先是一種非線性規劃方法;其次其主要用于無約束的多維非線性規劃問題;根據實際模擬效果分析,發現數據通過LM算法可以得到更為合理的模擬結果。故模型選擇利用LM算法作為訓練的激勵函數。
(3) 輸出層
最大代數是模型是否結束的判斷條件之二,當迭代次數達到最大代數時,停止迭代,得到最終的BP神經網絡模型。本模型設置最大代數為1 000。
數據集劃分為訓練集、驗證集和測試集,訓練集、驗證集用來進行網絡的訓練和驗證,測試集用前者訓練所得的模型進行預測,并與期望值比較,至模型達到誤差及擬合優度容許范圍之內,使得目標函數接近最小值,模型訓練完成。
此模型的最小單位為1 h,也可根據需要自行構建更高或更低級的時間模型。據此模型結果,可對當地擬建的抽水蓄能電站參數進行設定和評估,例如爬坡率、最大出力等。
本文采用誤差逆向傳播的BP神經網絡對優化模型進行求解。
(1) 結構組成
輸入層包含風電功率和光電功率參數,通過具有10個節點的第一隱含層、具有20個節點的第二隱含層,輸出層即可得到抽水蓄能發電功率[16]。
(2) 訓練結果分析
根據系統自動生成得到最終訓練結束的各種參數。該模型迭代10次結束訓練,訓練結束時,誤差達到8.16×10-8,符合原定的1×10-6。
圖5選用MSE(均方誤差)來分析模型的訓練構建過程,依次為訓練集過程、驗證集訓練過程、測試集訓練過程。由這三條曲線走向與對比效果可以看出,三條曲線走勢基本重合,該模型對該種情況預測具有一定代表性。
通過訓練集、驗證集、測試集及全集等四個集合模型的擬合訓練,訓練集的效果良好,擬合的相關系數達到1,該BP神經網絡具有良好的模擬預測性能。
(3) 預測數據的進一步驗證
通過前300個數據作為構建模型所需要的數據,剩余數據進一步驗證模型的預測效果。
(4) 預測數據的評估
抽水蓄能電站的預測數據如圖6。橫坐標代表數據的時間序號,縱坐標代表抽水蓄能電站的BP神經網絡預測出力(正值代表放水發電,負值代表蓄水耗電)。可以看出,圖像大體呈波浪形,發電段和蓄能段時間分布均勻。周期約23.69 h。在午后13∶00—16∶00時風光發電功率總和達到低谷,而抽水蓄能電站發電達到高峰;在午夜1∶00—3∶00時風光發電功率總和達到高峰,而抽水蓄能電站發電達到低谷,符合日調節抽水蓄能電站一般發電規律。最大爬坡速率47.6%/h,低于一般水輪機組爬坡速率峰值,故可驗證聯合系統建模的正確性。

圖6 抽水蓄能電站出力圖
預測數據集的均方根誤差(RMSE)為0.020,平均絕對百分誤差為1.02%,誤差較小,模型預測精度較高。
選擇已經建立好的模型集合,并調出其中的預測數據,見圖7。橫坐標代表數據的時間序號,縱坐標代表聯合系統的總預測出力。可以看出,風電、光電、抽水蓄能的總輸出功率接近我們在模型建立時期望的42.27%。

圖7 聯合系統總出力圖
利用隨機森林預測光伏發電輸出功率,利用環境溫度,地表水平輻射,直接輻射和散射輻射四個參數進行功率預測,一天最大輸出功率在中午,夜間輸出功率為0,預測與實際數據誤差在可控范圍。
通過卷積神經網絡算法以風電機組的輸出功率為目標進行預測,綜合考慮地面風速、風機輪轂中心風速、風向以及氣壓,預測誤差小,預測模型較為準確。
利用風力發電、光伏發電與抽水蓄能發電的互補性,建立風光抽蓄聯合優化運行模型,通過BP神經網絡對風力發電和光伏發電輸出功率聯合進行優化,得到最終穩定的發電目標以及抽水蓄能出力數據。模型預測誤差小,預測速度快,操作簡單,聯合優化運行消除了風、光發電功率的波動性造成的并網困難的問題,使得輸出功率更加平穩可利用,減少了資源的浪費,并且可為擬建以及已有抽水蓄能電站出力參數的確定提供參考。