王雅蘭,田 野,楊麗華
(1.國網湖北省電力有限公司營銷服務中心(計量中心),湖北 武漢 430077;2.國網湖北省電力有限公司電力科學研究院,湖北 武漢 430077)
近年來,我國風力發電發展迅速,截止2020年全國風電裝機容量已達2.815億千瓦[1]。隨著“2030碳達峰、2060碳中和”奮斗目標的提出,風電、光伏等可再生能源將迎來進一步快速發展[2]。風力發電主要由風速、風向、氣壓、溫度、濕度等自然條件決定,具有間歇性、波動性、隨機性的特點。大規模風電并網對電網的安全穩定運行帶來挑戰[3-4]。
現有風電超短期功率預測方法可分物理方法與統計方法[5-8]。其中前者基于風力發電的物理原理,建立風速-功率物理模型,以數值天氣預報中風速預測值為模型輸入得到預測值。此類方法過分依賴時空分辨率不高的數值天氣預報數據而難以得到精確預測結果。后者以建立相關氣象特征與功率時序的線性或非線性映射為主要手段,因具有較好的預測精度而得到廣泛應用。隨著風電場站信息采集系統的普及與完善,風電功率預測通過氣象預報數據、風電場歷史運行數據、風電場運行狀態數據等海量參數,預測風電出力變化趨勢[9]。具體地,文獻[10]提出一種結合卷積神經網絡和門控循環單元的超短期風電預測模型,一定程度提高了風電預測精度,但其缺乏對參數的優選策略,對海量特征參數缺乏分辨能力而影響預測精度;文獻[11]提出一種基于改進長期循環卷積神經網絡的預測模型,提高了風電預測精度,為本文提取優選特征提高預測精度提供思路。文獻[12]提出一種結合交叉局部異常因子和注意力機制的超短期風電功率預測方法,但該方法采用傳統LSTM神經網絡算法,運算效率有所欠缺。文獻[13]提出一種具有一定自適應能力的超短期風電功率預測方法,增加了預測模型的實用性,但該方法缺乏對相關因素多樣化性的考慮導致預測精度欠佳。綜上所述,超短期風電預測已取得了一定的成果,但隨著海量數據信息的采集與匯總,如何提取強相關性特征數據時序以提升模型預測精度是亟需解決的主要問題。
本文提出一種基于雙重注意力機制-CNNGRU(Dual Attention-CNNGRU,DA-CNNGRU)的超短期風電場功率預測方法。具體地,首先,利用CNN-GRU神經網絡算法精確預測超短期風電功率;接著采用特征Attention機制提取歷史數據與輸入特征之間的影響程度;進而采用時序Attention機制提取強相關性關鍵時間節點的歷史信息;最后得到精確預測結果。
基于雙重注意力機制與CNNGRU的超短期風電功率預測方法流程如下:
1)利用數據清洗技術[14-16]定位零值、壞值等非正常數值,并以局部均值進行填充,最大程度降低異常數值引起的預測結果不穩定。

圖1 基于雙重注意力機制與CNN-GRU的超短期風電功率預測方法流程圖Fig.1 Flow chart of ultra-short-term wind power prediction method based on DA-CNNGRU
2)為了避免數據量綱多樣性引起不必要的數值問題,對海量特征數據組成的輸入特征矩陣元素歸一化處理。
3)為提取數據矩陣中相對獨立的特征序列間相關特性并兼顧時序特性,構建CNN-GRU混合模型。
4)為了量化分析并提取歷史數據與輸入特征之間的影響程度,同時綜合考慮強相關性關鍵時間節點的歷史信息,提出一種特征-時序雙重Attention機制。
將海量數據清洗以后得到的優質數據矩陣數據進行MinMaxScaler歸一化處理,利用CNN網絡提取矩陣空間特性,并將CNN網絡輸出的特征向量作為GRU神經網絡的輸入。為提高CNNGRU預測精度,引入注意力機制。在輸入側,引入特征注意力機制對輸入變量自適應分配權重系數。在輸出側,充分利用時序數據之間的關聯性,在時間維度引入注意力機制得到光伏輸出功率時間序列之間的依賴關系。
CNN網絡作為一種前饋式神經網絡,一維-CNN(Conv1D)能夠提取時間序列組成的數據矩陣的相應特征[17-18]。本文在此選用窗寬為ts的定時間窗以步長1截取數據矩陣,使用雙層Conv1D卷積層對所選取矩陣進行特征向量提取,具體建模方法見文獻[19]。
為了更好地克服傳統RNN所普遍存在的梯度消失的問題,本文采用門控循環單元神經網絡(GRU)作為處理CNN所得特征向量的點預測算法[20]。GRU是LSTM網絡的一個簡化變體,屬于門控循環神經網絡家族。GRU中的更新門是由LSTM網絡中的遺忘門和輸入門合并而成,模型架構更為簡單,在保證模型預測精度的同時減少了計算量和訓練時間。
LSTM有輸出門,遺忘門和輸出門,而GRU則只包含更新門和重置門,減少了參數的訓練。更新門控制前一時刻的狀態信息保留到當前狀態中的程度,值越大表示前一時刻的狀態信息保留越多。重置門控制當前狀態與先前的信息結合的程度,值越小說明忽略的信息越多。

圖2 GRU神經元Fig.2 GRU neuron


本文提出的DA-CNNGRU混合神經網絡具體輸入輸出與網絡具體構建結構如圖3所示。

圖3 DA-CNNGRU混網絡結構圖Fig.3 DA-CNNGRU hybrid network structure diagram
注意力機制是一種模仿人類視覺注意力的模型,其主要借鑒了人腦在特定環境下會將注意力“聚焦”于某些地方,而忽略了其他部分的特點,從而對關鍵部分給予更多關注,而對非關鍵部分則可適當忽略。該機制的核心操作是一系列權重參數,從序列中了解每個元素的重要性,并合并這些元素成為注意特征向量。Attention機制框架圖如圖4所示。
由圖4可以看出,輸入的數據結構看作是i個特征,T時長的數據矩陣。這時在其中一個輸入序列中給定一個元素Query,接著計算出Query與各key值之間的相關性,從而得出每個key對應的value權重系數值,接著將value權重系數進行加權求和得到最終的Attention數值。

圖4 Attention機制框架圖Fig.4 Framework diagram of Attention mechanism
針對海量數據下強相關性特征參數提取難度較大,以及在長時間尺度下難以聚焦與待預測時段匹配的歷史數據時序時段,因此有必要提出一種兼顧特征間與時間尺度兩方面的注意力機制,以提升模型的預測泛化性能。
令輸入的氣溫、氣壓、10 m風速、30 m風速、50 m風速、70 m風速、輪轂處風速等相關氣象特征時序序列如下式:

展開后具體如下矩陣所示:


而為了得到每一個相關氣象特征變量與當前時刻的風電功率的內在關聯程度,需采用特征注意力機制編碼特征量化權重。將t時刻的相關氣象特征因素輸入到注意力機制,結合上一時刻t-1的隱層單元輸出ht-1與記憶單元信息st-1,計算當前時刻每個氣象特征對應的注意力權重,量化權重計算方法如下:

式(7)中,Vf、Wf、Uf為注意力機制為注意力感知權重矩陣;bf為相應的偏置項。

由上述運算可知,通過特征注意力機制可以自適應提取輸入的關聯氣象特征矩陣。通過特征注意力機制,輸入GRU網絡的輸入不再是原始特征矩陣的基于CNN網絡提取所得的特征向量。通過注意力機制充分考慮了輸入氣象特征與輸出功率時序的關聯特性,增強了模型對輸出功率強相關因素的提取能力,從而提高模型預測精度。
由于風力發電功率輸出情況受到歷史時序狀態的影響較大,不同時刻的功率時序與特征時序狀態對風電場功率輸出的影長程度是不同的。而為了充分考慮某一歷史時刻對當前預測結果的影響程度,在此提出一種基于時間尺度的注意力機制。用以提升模型自適應處理歷史狀態信息,強化強相關性歷史時序對待預測時段的影響力。

圖5 時序注意力機制Fig.5 Timing attention mechanism
時序注意力機制以各歷史信息的最后一層隱層狀態作為輸入,分析其與當前待預測時段的關聯性,并賦予其影響力權值。


式(9)-式(12)中,score為評分函數;αt,i為歷史輸入的隱藏層狀態對當前輸入的注意力權重;ct是中間向量;h?t表示最終輸出的當前時刻的隱藏層狀態值。
本實驗選取中國西北某風電場數據作為實驗樣本。本實驗數據和信息包括該風電場2020年全年功率輸出以及10 m風速、30 m風速、50 m風速70 m風速、輪轂處風速、氣溫等氣象參數。具體特征指標如表1所示。

表1 樣本數據特征指標Table 1 Characteristic indicators of data
上述數據的采樣時間間隔均為15 min。
本文通過均方根誤差(Root Mean Square Error,RMSE)與平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)評價算法預測精度。具體計算公式如下:

式(13)、式(14)中,Xp為待預測時序;Xq為預測時序。
在預測結果對比中,如果模型預測性能較優,則體現為RMSE與MAPE越小。
本文利用Python平臺中的Keras框架構建基于CNNGRU模型的風電功率超短期預測模型。預測模型初始化參數為:模型網絡隱藏層節點個數和權重學習速率由IGWO算法確定,模型迭代次數為15,采用Sigmoid函數作為GRU模型的激活函數。
模型的原始訓練集數據范圍為2020年各季度前兩個月的數據,測試集分別為各訓練集范圍之后的一天。為了觀察較長時間范圍內的預測效果,對2020年各季度數據進行了為期1個月的短期滾動預測,預測時間窗為24 h,即提前一天預測未來24 h的點。為驗證本文算法的有效性與性能優越性,分別采用ARIMA[21]、GRU[22]、CNNGRU[10]及DA-CNNGRU對某一天風電功率進行預測,各算法預測結果如表2所示,不同方法預測結果曲線對比如圖6所示。

表2 算法預測結果對比Table 2 Comparison of prediction results

圖6 預測結果對比圖Fig.6 Comparison of prediction results
由圖6中曲線與預測誤差對比可得,DACNNGRU算法可更深入解決RNN普遍存在的梯度消失問題。由于提出一種基于雙重Attention機制的特征權重規劃策略,提升了時序數據在通道尺度與時間尺度上的特征提取能力,有助于提高預測精度。GRU算法以特征序列和歷史功率為輸入,其自主提取輸入特征能力較差,且在模型訓練中存在梯度不穩定等問題,因此效果較差。ARIMA模型只依據歷史功率時序進行預測,缺乏考慮多種因素的影響,因此導致預測誤差較大。
本文所提出的DA-CNNGRU算法預測性能綜合表現最優,對比次優的CNNGRU算法預測結果的RMSE分別降低25.3%,表明了引入雙重Attention機制的必要性。
本文針對海量數據難以提取強相關性特征時序段的問題,提出一種基于雙重注意力機制結合CNNGRU的預測方法。與現有文獻相比,本文所提方法通過CNN結合GRU混合神經網絡方法,提升了預測模型在時空尺度上特征提取能力;通過提出一種包括特征、時序的雙重注意力機制,在通道尺度、時間尺度上提升模型訓練的泛化性能,顯著提升了模型預測性能。
綜上,本文所提出的預測方法具有良好的預測精度,且具有良好的泛化性能,可滿足“超短期預測”的實際工程要求。
本文未考慮預測模型在極端天氣下對風電功率的影響,后續研究工作將針對極端天氣下的分鐘級功率變化特征,進一步研究分鐘級功率預測方法。