趙 艷,呂干云,趙 力
(1. 南京工程學院電力工程學院,江蘇 南京 211167; 2. 東南大學信息科學與工程學院,江蘇 南京 210018)
風能作為一種儲備量巨大的清潔能源,不僅能夠滿足我國龐大的能源需求,還能夠減少對環境的污染,促進社會進步。隨著風力發電技術的不斷革新,風力發電在2021年成為我國火電、水力發電之后的第三大能源。但是由于風的高隨機性與間歇性特性,因此風電在電網并入過程中會影響電網的供需平衡。而風電的功率預測恰好能夠降低風電并網帶來的供需平衡問題,當傳統的供電平衡預警方法無法支持正常的預警任務時,提出簡單高效的供需平衡性預警方法成為保障風力發電機組安全運行的關鍵技術。
文獻[3]方法通過聚類算法將風電功率以波動為單位進行聚類劃分,提取功率的波動曲線;使用引力搜索算法對反向神經網絡進行優化處理,并基于功率的波動誤差,獲取功率的映射關系,建立預測模型完成風電功率短期預測,從而實現風電的供需平衡預警。該方法由于未能對風電數據進行具體分析,導致該方法不能有效地預測出風電實際功率。文獻[4]方法依據非線性方法降維處理氣象指標;使用聚類算法對風電數據進行組合并劃分類別;通過天氣類型,利用支持向量機建立功率預測模型,并通過該模型實現風電功率預測,完成風電供需平衡預警。該方法在建立預測模型時存在較大誤差,因此該方法的預測誤差大。文獻[5]方法依據似然估計法獲取自回歸模型估計參數;基于風電的波動性厚尾效應對自回歸模型進行厚尾展開,轉換模型參數完成模型優化;最后通過優化的轉換自回歸模型完成風電功率預測,實現風電供需平衡性預警。該方法在模型轉換過程中存在偏差,導致該方法的預警性能差。
為解決上述短期風電供需平衡性預警過程中存在的問題,提出基于大數據的短期風電供需平衡性預警方法。
在對風電進行短期功率預測前,需要在大數據理論下對風電數據進行分析。
基于上述分析結果,使用隨機森林方法對風電數據進行相似度計算,首先建立一個決策分類器(,),且=1,2,…,。依據風電數據構建隨機森林。設定隨機森林的決策樹數量為,隨機變量標記,風電數據為。隨機森林的構建過程如下:
1)基于隨機抽樣法隨機抽取風電數據,取出即放回,如此重復直至抽取出個數據,建立個分類回歸樹。
2)設定抽取的數據參數為,將每一棵回歸樹節點數據特征設定成形式,當≤時,計算回歸樹中各個數據特征的信息分量,依據計算結果選取最強節點。
3)不添加閾值限制,令各個樹可以自由生長。
4)隨機選取個數據集建立隨機森林,并通過該森林對風電數據進行分類處理,生成種結果,并從中選取最優分類結果。
基于上述構建的隨機森林,建立隨機森林模型,對風電大數據的相似性進行具體分析。在隨機森林模型里,若風電數據中兩個數據位于同一節點,那么二者之間的相似度為1,若二者不處于同一節點,則相似度為0。分析構建的模型,獲取風電數據的相似度矩陣Pr。
首先對風電數據進行初始化,通過分析結果獲取矩陣Pr,對數據進行辨別,分析數據是否處于同一樹葉節點。根據上述過程,依次對決策樹進行計算,通過對結果的累加,完成森林樹的總數量計算。
依據計算出的森林樹總數量,對相似度矩陣Pr中的元素進行篩選,獲取新的相似度矩陣Pr。
過程中,由于Pr是一個對稱正維矩陣,因此需要將風電數據樣本在矩陣行列的相似度設定成Pr(,),數據集的隨機模型設定成={1,2,…,}形式,數據的節點位置標記,的節點位置標記,對數據與的相似度進行計算,結果如下式所示

(1)
式中,相似因子標記,樣本數據在行列的相似度標記Pr(,)形式,隨機森林中的樹木數量標記為,常數為。
具體流程如下:
1)對風電數據進行訓練,獲取數據樣本數據集,并基于隨機森林方法建立隨機森林模型。
2)將分析的數據樣本與待測樣本進行組合,并作為輸入變量輸入進模型中進行分析,獲取二者的相似度。
3)建立矩陣,對計算結果進行累積處理,獲取相似度平均值。
最后通過計算的數據相似度,對結果大于等于1的數據進行剔除處理。
由于風電發電機組數據為多源得到輸入變量,頻率之間存在差距,因此需要對風電機組的采樣頻率進行統一處理。多源變量的量綱會影響數據的差異,因此要使用-歸一方法對風電的功率以及風速進行歸一化處理,過程如下式所示

(2)
式中,實際測量值標記形式,測量最小值標記形式、最大值標記形式,歸一化值用′表示。
通過風電數據的歸一化處理結果,將極限學習機與自適應灰度模型進行結合,建立風電功率的混合預測模型,通過對風電功率的預測,完成短期風電的供需平衡性預警。
基于風電的歸一化大數據環境,使用遺傳搜索算法對學習機的核參數以及懲罰因子進行優化處理。
首先設定極限學習機的變量核參數為,懲罰因子標記形式,為規避學習機的局限性,將變量核參數以及懲罰因子映射至遺傳種群中,作為種群的染色體,設定均方根誤差為適應度函數,結果如下式所示

(3)
式中,功率預測模型的預測輸出用()表示,期望功率輸出用()表示,均方誤差標記形式,適應度函數標記,數據數量為,迭代次數標記。
基于-算法對種群進行選擇、交叉以及變異等處理,搜索學習機核參數的最佳染色體,過程如下
1)初始化種群。
通過線性插值法對風電數據進行計算,隨機生成初始化種群,過程如下式所示
=[,,…,]
(4)
式中,種群中第個染色體標記,種群規模標記。
2)解碼染色體
對獲取的染色體進行解碼處理,獲取學習機核參數以及懲罰因子,并將其代入模型中進行訓練。
3)計算種群適應度
將上述兩個參數的訓練結果放入測試模型里,依據式(3)對種群以及個體的適應度進行計算。
4)獲取新種群
在計算出的適應度中,選取最佳的個體數據,作為遺傳數據,通過輪盤算法計算數據的遺傳概率,經過交叉處理后形成新的種群。
5)種群進化
設定一個固定閾值,若計算出的遺傳概率小于該閾值,則跳至流程(3)繼續進行計算,若大于該閾值,進化終止,生成新種群。
6)獲取最優參數
對更新的種群進行解碼處理,獲取最佳的核參數以及懲罰因子。
基于自適應的灰度模型,可計算出風電功率與其它影響因素之間的關聯系數。首先通過均值化方法對風電數據進行量綱處理,過程如下式所示

(5)
式中,數據的參考序列標記()形式,待測序列標記()形式,風電數據集中第個數據標記,常數標記成形式,迭代次數為。
基于上述結果,完成風電數據關聯系數的計算,結果如下式所示
()=

(6)
式中,數據在時間上的關聯系數標記(),參考序列歷史數據標記()形式,比較序列標記()形式,分辨系數用標記。
由于參考序列與比較序列在不同的時間點存在不同的關聯系數,因此要將各個時間的關聯系數進行整合,建立整體的關聯系數。過程如下式所示

(7)
式中,最終的風電數據整體關聯系數標記形式。
最后通過計算出的關聯系數,對風電數據進行排序處理,數值越大關聯程度越高,預測價值越大。
基于上述優化的學習機參數以及數據的關聯系數,建立風電功率的混合預測模型,具體步驟如下:
1)計算關聯系數
使用灰色關聯法對不同季節的風電功率與風向、氣象等歷史數據進行計算,獲取風電數據的關聯系數,找出影響風電功率輸出的最大因素。
2)尋找最大輸入因素
利用自適應灰色模型完成最大影響因素的預測,并將預測結果作為最大輸入因素。
3)選取最佳決策參數
通過-算法訓練歷史風電數據,優化學習機核參數以及懲罰因子,選定最佳決策元素。
5)性能分析
選擇平均絕對誤差指標對預測結果進行評價處理,分析預測性能。
風電功率預測模型具體結構如圖1所示。

圖1 風電功率預測模型具體結構圖
最后依據該功率預測模型實現對風電短期功率的預測,從而完成風電并網的供需平衡性預警。
分別采用基于大數據的短期風電供需平衡性預警方法(本文所提方法)、基于功率波動過程的風電功率短期預測及誤差修正(文獻[3]方法)、基于時序數據動態天氣劃分的短期風電功率預測方法(文獻[4]方法)進行測試;
風電功率短期預測方法作為風電供需平衡性預警過程中關鍵的一部分,風電功率在預測過程中,預測效果的優劣、誤差的大小都會對預警性能帶來影響,基于上述三種方法進行風電供需平衡性預警,對預警過程中風電功率預測效果、預測誤差以及預警性能進行測試。
1)風電功率預測效果測試
風電功率的短期預測效果的優劣能夠直接對風電供需平衡性預警性能產生影響,采用本文所提方法、文獻[3]方法以及文獻[4]方法進行風電供需平衡性預警時,對三種方法的風電功率預測效果進行檢測,檢測結果如圖2所示。

圖2 不同方法的風電功率預測效果測試結果
分析圖2可知,本文所提方法預測出的風電功率與實際風電功率相接近,而文獻[3]方法與文獻[4]方預測出的風電功率與實際風電功率之間存在較大差距。在測試初期,文獻[3]方法與文獻[4]測試出的風電功率與實際風電功率之間差距較低,但是隨著預測時間的增加,二者與實際風電功率之間差距拉大,且文獻[3]方法測試結果優于文獻[4]方法測試結果。由于本文所提方法在進行風電供需平衡性預警前,對風電大數據進行了具體分析,因此本文所提方法在進行風電供需平衡預警時,風電短期功率預測效果與實際功率值相接近。
2)誤差測試
適應度函數的大小能夠直觀地體現出風電功率預測誤差的高低,適應度值越大預測時的誤差越小,反之則越大?;谏鲜鲲L電功率短期預測效果測試結果,對本文所提方法、文獻[3]方法以及文獻[4]方法的適應度函數進行測試,測試結果如圖3所示。

圖3 不同方法的預測誤差測試結果
分析圖3可知,檢測次數的增加會降低風電數據的適應度函數值。在測試次數為100時,本文所提方法的適應度值測試結果與文獻[3]方法以及文獻[4]方法的適應度值測試結果相接近,無明顯差距,但是隨著測試次數的增加,三種方法的測試結果逐漸出現差距,本文所提方法測試出的風電數據適應度值明顯高于其它兩種方法,文獻[3]方法測試結果略低于本文所提方法,文獻[4]方法檢測結果不理想。由此可知,本文所提方法在進行風電功率預測時的預測誤差小于其它兩種方法。
3)預警性能
依據上述兩部分的實驗結果,采用本文所提方法、文獻[3]方法以及文獻[4]方法進行風電供需平衡性預警時,對三種方法的預警性能進行測試,測試結果如表1所示。

表1 不同方法的預警性能測試結果
分析表1可知,本文所提方法的功率預測準確性、誤報率以及預警及時程度均高于其它兩種方法,而文獻[3]所提方法雖然也能成功預警,但是該方法的準確率以及誤報率均不及本文所提方法,文獻[4]方法的預警性能最差。
綜上所述,本文所提方法在進行風電供需平衡性預警時,能夠預測出風電短期功率,預測誤差小、預警性能好。
近年來,隨著風力發電技術的快速發展,風力風電能源的發展愈加受到重視。針對傳統風電供需平衡性預警方法中存在的問題,提出基于大數據的短期風電供需平衡性預警方法。全面分析風電數據,并歸一化處理風電數據;結合極限學習機與自適應灰度模型,建立風電功率的混合預測模型,通過對風電功率的預測,完成短期風電的供需平衡性預警。該方法由于在優化學習機參數時存在些許問題,今后會針對該項問題繼續優化該方法。