宿鳳明,孫財新,李端開
(國家電投集團電站運營技術(北京)有限公司,北京 102209)
風電場輸出功率的波動對電網運行影響較大,準確的短期風電場功率預測能夠幫助電網合理制定調度計劃,保證電能質量,減少系統的備用容量,降低電力系統運行成本[1]。但由于風資源具有很強的隨機性、不穩定性和間歇性,精準的風電場短期輸出功率預測具有一定難度。
近些年對短期風功率預測研究的多集中于統計方法,其包含時間序列法[2-3]、持續法[4]、卡爾曼濾波法[5]、混合模型[6-7]以及神經網絡方法[8-11]。其中神經網絡法基于數據驅動,不必關心輸入輸出之間的聯系,學習大量的輸入輸出模式映射關系,從而達到需要的預測結果。
理論上來講,神經網絡方法可以進行準確的預測,因而近些年有很多使用機器學習方法預測風功率的研究。但是,神經網絡預測的精度受到輸入參數、神經元數量、目標函數、激活函數、訓練方式等因素的影響,因而近些年部分研究者將精力投入到提高預測精度上來。文獻 [12] 為提高精神網絡預測精度,應用粒子群優化算法來改進神經網絡的預測模型,經過與未改進的模型計算結果相比,改進的預測精度更高;文獻[13]在BP神經網絡的基礎上研究了徑向神經網絡進行微電網的風功率預測,并取得有效的改進。這些方法主要是基于訓練方式、網絡結構的優化,并未提及實際神經網絡訓練過程中比較有效的是輸入參數、激活函數、目標函數在風功率預測中的選擇與優化。同時,神經網絡各個因素間關聯緊密,基于一個因素進行神經網絡預測精度的改進較為有限。
基于此,本文通過分析輸入參數、選擇激活函數、目標函數、訓練更新方式,經過合適的數據預處理后進行短期分功率預測,后由河南某風場的實測數據進行計算及結果分析。
本文采用三層神經網絡結構,采用梯度下降算法學習優化,反向傳播方式調整權值和閾值,選取交叉信息熵作為目標函數,采用sigmoid函數作為激活函數。三層神經網絡的輸入層的輸入節點與輸入變量數量相同,只有1個輸出節點。隱藏層節點個數參考文獻[14]研究結果,采用2N+1個隱藏節點,其中N為輸入節點。
將選定數據預處理后的數據作為神經網絡的輸入值,輸入層、隱藏層、輸出層的每層輸入輸出關系為
(1)
式中ai——第i個神經元的輸出;
zi——第i的神經元的計算結果;
wij——本層第i個神經元與第j個輸入的連接權值;
xj——本神經元的第j個輸入;
bi——第i個神經元的偏差值;

由于運用sigmoid函數作為激活函數時,使用平方誤差函數作為目標函數會在sigmoid函數計算結果接近于1和0時發生飽和,為提高收斂速率本文選用交叉信息熵作為目標函數
(2)
式中a——某神經元計算輸出;
y——某神經元實際輸出;
c——目標函數;
n——神經元輸出個數;
i——第i個神經元輸出。
則某神經元目標函數相對于權重和閾值的偏導數為
(3)
(4)
神經元權重與節點更新如下
(5)
(6)
式中w′——更新后的權重;
w——更新前的權重;
b′——更新后的偏差值;
b——更新前的偏差值;
η——學習率;
x——神經元輸入。
由此可見,交叉信息熵作為目標函數時權重和閾值學習的快慢取決于a-y即輸出誤差,誤差大時,其更新多學習速率快,誤差小時,學習較慢。
風力發電機組從風輪吸收的功率為[15-16]
(7)
式中p——輸出功率;
V——風速;
ρ——空氣密度,其主要影響因素為環境的溫度與壓力;
A——掃風面積,其主要影響因素由風電機組葉片半徑、來風風向以及風電機組偏航角度,其中葉片半徑為固定值;
cp——風機風能利用系數的影響因素。
風電機組一般控制偏航角度跟蹤來風風向,以使其時刻正面迎風。在實際運行過程中,風電機組很難實現準確對風且各風電機組具有一定的隨機性。這是由于:(1)機艙、測風塔測量儀表的測量存在誤差隨應用時間增大而出現偏差;(2)風電機組本身控制系統存在差異,在偏航系統跟蹤來風風向時存在一定的差異;(3)偏航系統的動作存在一定的滯后,難以完全實現實時跟蹤,在風況復雜時對風具有一定的隨機性。
對于變漿距風電機組,cp是關于槳距角β的函數,在一定的葉尖速比下,β=0°時cp值最大,隨著槳距角β逐漸增大cp明顯地減小。漿距角β對風電機組輸出功率的影響主要體現在風力發電機組的最大風能追蹤區、恒轉速區、恒功率區三種運行工況中。最大風能追蹤區風速處于切入風速以上,發電機未達到額定轉速,要求漿距角β=0°以實行最大風能追蹤控制的變速運行。恒轉速區發電機已達到額定轉速而風速未達到額定值,隨風速上升功率仍增大,此時對轉速進行控制而槳距角β仍為零。恒功率區時風速達到額定風速,隨著風速的增大,需在轉速控制的基礎上增加功率控制,調節槳距角β,使輸出功率不超過額定值。由此可見,漿距角的控制對數據功率影響較大。同時在實際風電機組運行過程中上述對漿距角要求的實現有一定的差異。其主要原因是:(1)風電機組葉片在安裝時很難保證角度完全準確,且各風電機組的安裝差異具有隨機性,該種情況導致在各種工況下風機輸出功率均有一定偏差,且該偏差具有個性化和隨機性的特點;(2)風電機組在控制漿距角跟蹤時,其控制執行具有一定的滯后,致使在風況復雜的時候其很難按照上述控制要求跟蹤。
由上述分析可知,風功率輸出受風速影響最大,預測時風速必須計入;環境溫度、壓力影響空氣密度,預測時應計入;來流風速和風機的偏航角度直接反應風機的對風狀況,對功率輸出影響較大,預測時應計入;風機的漿距角反應了同一風速下風機的風能利用能力,對功率輸出也具有較大影響應計入。
為驗證上述分析,本文將設計三種情況來研究風機本身因素對功率預測的影響:
(1)僅考慮風資源參數:風速、風向、溫度等;(2)考慮風資源參數和偏航角度:風速、風向、溫度、偏航角度等;(3)考慮風資源參數、偏航角度和漿距角:風速、風向、溫度、機艙角度、漿距角等。
為提高神經網絡的學習效率、學習精度,防止部分神經元的過飽和,需對獲取的數據進行預處理,剔除空缺值、壞值等錯誤數據,進行數據的歸一化。其中風向、偏航等歸一化通過分別取正弦值和余弦值,換算到[-1,1]區間;風向、溫度等的歸一化采用最大最小值方式[17]。
預測的結果評價采用標準均方根誤差NRMSE(Normalized Root Mean Square Error)和平均絕對誤差MAE(Mean Absolute Error)兩個指標[18]
(8)
(9)
式中ppre——風場功率預測值;
ptru——風場功率實際測量值;
pe——所有預測風機的額定功率;
n——預測數據的個數。
本研究以河南某風場10臺1.5 MW風機為研究對象。河南是北方冷空氣南下和夏季風北上的通道,冷暖氣團的交替會呈現季風氣候的特征,季節性變化規律較明顯,春季普遍多大風且風況復雜[19]。因此選取2016年1~3月共3個月的數據進行研究,其中1月、2月的數據用于學習,3月數據用于預測。
本研究設計的三種情況來分析各因素對功率預測的影響。
(1)僅考慮風資源參數,即風速、風向、溫度等參數。根據建立的模型,導入參數計算后,其曲線預測結果如圖1所示;

圖1 僅包含風資源參數預測圖
(2)考慮風資源參數和偏航角度影響:即風速、風向、溫度、機艙角度等參數,曲線預測結果如圖2所示;

圖2 含風資源參數、偏航角度參數預測圖
(3)考慮風資源參數、偏航角度和漿距角的影響,即風速、風向、溫度、機艙角度、漿距角等參數,曲線預測結果如圖3所示。

圖3 含風資源參數、偏航角度、漿距角等參數預測圖
對比三個預測曲線可以得出:從預測模擬曲線與實際發電量的擬合度上,含有風資源參數、偏航角度和漿距角三個方面參數的預測結果比含有風資源參數和偏航角度兩方面參數的預測結果要好,含有風資源參數和偏航角度兩方面參數的預測結果要比只考慮風資源參數的預測結果要好。
對比三個散點圖可以得出:從預測功率值與實測功率值的線性關系上,含有風資源參數、偏航角度和漿距角三個方面參數的預測結果值好于僅包含風資源參數的預測結果,但風資源參數、偏航角度和漿距角三個方面參數的預測結果與含有風資源參數和偏航角度預測結果相差不大。從離散度上看,含有風資源參數、偏航角度和漿距角三個方面參數的預測結果比含有風資源參數和偏航角度兩方面參數的預測結果要好,含有風資源參數和偏航角度兩方面參數的預測結果要比只考慮風資源參數的預測結果要好。
由于在使用神經網絡進行預測時,除了選用合適的激活函數、使用合適的目標函數、使用合適的優化函數等方法提高預測精度外,選擇獨立、與預測結果具有相關性的輸入參數也是提高預測精度的主要方法之一。在本研究中,(1)由于偏航系統在實際運行過程中,不同風機在同一風向時可能存在不同的迎風角度,繼而導致其發電量不同,在神經網絡的輸入參數中計入偏航角度后,使神經網絡在進行學習的過程中將風機在實際運行過程中由迎風角度不同引起的發電量偏差考慮入內,從而提高精度。(2)由于不同的風機在同一風速下,可能存在不同的漿距角而導致發電量不同,在神經網絡的輸入參數中計入漿距角后,使神經網絡的學習考慮了風場內風機在實際運行過程中該部分差異,從而使得這些因素導致的發電量影響也被神經網絡學習到,從而提高精度。
經計算,三種情況的NRMSE、MAE整體預測結果如表1所示。
可以看出,僅使用風資源參數計算時的NRMSE和MAE均為最大, NRMSE約為8.58%,MAE超過900 kW;包含風資源參數、偏航角度時的NRMSE和MAE居中,其NRMSE為5.99%,較僅含風資源參數時下降16.7%,MAE約為650 kW,相較下降28.3%;包含了資源、偏航、變漿等參數的情況精度最高,其NRMSE僅有3.20%,較僅含風資源時下降62.7%,MAE小于360 kW,較僅含風資源時下降60.6%。
表1三種情況誤差統計對比表

模型NRMSE/[%]MAE/kW僅包含風資源參數8.58909.42含風資源參數、偏航角度參數5.99651.79含風資源參數、偏航角度、漿距角等參數3.20357.82
本研究與文獻[8]的研究進行了對比,文獻[8]是在輸入參數為風速、風向正弦和余弦值以及溫度,采用三層網絡結構,隱層節點數為2N+1,采用兩個月數據預測得到的NRMSE為7.93%,與本研究在僅包含風資源參數且網絡結構相同的情況下所得的NRMSE為8.58%與之相近,但本研究在考慮偏航角度和漿距角等參數后的預測結果明顯優于文獻[8]的預測結果。主要原因如上所述,本文方法在預測時考慮了風機在實際運行過程中偏航角和漿距角的影響。
(1)采用神經網絡的模型能很好地對風場短時輸出功率進行預測,其在僅含風資源參數,含風資源參數和偏航角度,含風資源參數、偏航角度、漿距角三種預測模型中,包含風資源、偏航角度、漿距角的預測模型預測精度最高,含風資源、偏航角度的居中。
(2)偏航角度、漿距角對風電場短期功率具有一定影響,在進行功率預測時,不僅要考慮風電機組輸出功率的共性影響因素如風速、風向、溫度,還應考慮到風電機組輸出功率的個性化影響因素,如偏航角度、漿距角等,以進一步提升預測精度。
本文的研究中未考慮軸系效率、風機狀態等對發電功率預測的影響,需進一步進行研究。