李穎智,王維慶,王海云
(新疆大學可再生能源發電與并網控制教育部工程技術研究中心,新疆 烏魯木齊830047)
我國鼓勵發展鄰近負荷中心的分散式風力發電,對分散式風電機組的風速進行超短期預測,便于電網調度,減輕分散式風機并網對電網造成的不利影響[1-3]。
為提升風速預測準確度,削弱風速特性帶來的影響,文獻[4]采用經驗模態分解(empirical mode decomposition,EMD)與支持向量機(support vector machine,SVM)進行預測,EMD-SVM預測時準確度高、誤差低;采用集合經驗模態分解法(ensemble empirical mode decomposition,EEMD)進行數據處理,降低模型混頻的概率,增強模型的自適應性[5-6];文獻[7]采用自適應白噪聲的完備總體經驗模態分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)進行預測,進一步提升了模型的魯棒性。
為削減高頻分量對預測的影響,降低預測數據復雜程度,文獻[8]將風速預處理后的高頻分量IMF1舍去,對剩余IMF分量進行預測。但直接舍去高頻分量會導致數據信息缺失,進而影響預測準確度。因此,文獻[9]對得到的高頻IMF進行第二次分解,提升預測準確度。
針對最小二乘支持向量機(least squares support vector machine,LSSVM)模型預測效果受參數c,g影響較大的問題,本文采用均方差作為蝴蝶優化算法(butterfly optimization algorithm,BOA)改進LSSVM模型的適應度函數,提升LSSVM模型的預測精度。
綜上,首先采用CEEMDAN將實測風速數據進行兩次分解,充分挖掘數據信息,然后使用BOA改進LSSVM,提升風速預測模型精度。最后使用BOA-LSSVM組合模型進行風速預測。通過分析七種預測模型誤差,驗證基于CEEMDAN二次分解的BOA-LSSVM風速預測模型具有更好的預測效果。
模態分解是處理歷史數據,獲取數據蘊涵信息的一種數據處理方法。采用EMD模型進行數據處理時,雖然提升了數據的準確性,卻不能忽視其具有混頻的弊端[4]。EEMD對數據進行處理時,雖可通過增添的白噪聲增強模型的自適應性,提升預測準確性,但有概率產生虛假分量[5-6]。采用CEEMDAN對風速數據進行處理時,在分解過程中增添了有限次數的自適應高斯白噪聲,改進EMD模態混疊的缺陷與EEMD導致的虛假分量的弊端。與此同時,相較于采用VMD算法進行第二次分解,CEEMDAN算法通過添加自適應白噪聲,可以避免出現因VMD沒有預設好合適的分解次數K,致使分解的IMF出現間斷情況[7]。因此,本文采用CEEMDAN對歷史風速數據進行二次分解。
CEEMDAN算法的運行過程如下:
1)對信號S(t)+ε0ni(t)重復運行N次分解運算過程,得到IMF1:

(1)
2)運算出的首個余量信號:

(2)
3)對信號r1(t)+ε1E1(ni(t))進行運算,得到IMF2

(3)
4)計算第l個殘余信號,l=2,…,L

(4)
5)反復運算步驟3),得出第l+1個IMF

(5)
6)重復運算步驟4)和5),原始信號最終分解為

(6)
排列熵(permutation entropy,PE)不僅對數據波動感知敏銳,能夠降低不確定性估計,還具有運算簡易,不易受噪聲干擾的特點。通過PE衡量IMF的隨機程度時,PE數值越高表明IMF越隨機混亂[10-13]。根據PE的特性可知,若IMF的PE值近似,則表明分解得到的IMF內部混雜程度類似。本文采用PE量化各IMF的隨機程度,對比各IMF的PE數值,將混雜程度相近的IMF進行重構,并采用CEEMDAN進行第二次分解。
排列熵算法運行過程如下:
1)對序列{s(n),n=1,2,…,N}重構,得到重構矩陣D:

(7)
式中:m—嵌入維數;τ—延遲時間
2)對各個重構向量進行升序排序
s[j+(kj1-1)τ]≤s[j+(kj2-1)τ]≤…
≤s[j+(kjm-1)τ]
(8)
若s[j+(kj1-1)τ]=s[j+(kj2-1)τ],則比較所在列的kj1,kj2,若kj1 3)重構后得到矩陣S(i)={j1,j2j3,…,jm},式中m=1,2,3,…,N且N≤m!。故有m!種符號序列。 4)序列s(n)的PE為 (9) 式中:Pj—每種序列出現概率。 2.2.1 支持向量機算法 SVM是一種適用于歷史樣本數目較少且泛化能力好的預測算法[14]。SVM算法函數模型推導過程具體如下 (10) (11) 2.2.2 最小二乘支持向量機 最小二乘支持向量機將SVM模型中的不等式約束優化為等式約束,提升了模型的運行效率[15-16] LSSVM的約束及優化目標的函數模型為 (12) LSSVM的Lagrange函數 b+ξi-yi} (13) 通過對式(13)中的ω,b,ξ,a,求偏導,消去ω和ξ,得到的LSSVM預測模型為 (14) SVM共有四種不同的核函數,RBF核函數在SVM中使用次數最頻繁,相較于其它幾種核函數,RBF待優化的參數少,適用范圍廣。因此,本文選取的核函數K(x,xi)為RBF核函數。本文選取的核函數K(x,xi)定義為 (15) 2.2.3 蝴蝶優化算法 BOA受蝴蝶尋找食物和尋覓配偶的行為啟發,通過模擬蝴蝶搜尋氣味的習性,提出了蝴蝶優化算法[16]。BOA算法大范圍的全局搜索和密集局部搜索兩種搜索方式組成。全局搜索是指蝴蝶嗅到香味時,指定位置靠近的行為。局部搜索是指蝴蝶覺察不到附近存在氣味后,進行隨機移動搜尋的行為。BOA通過上述兩種搜尋方式向目標進行移動尋優。BOA尋優過程如下: 蝴蝶產生香味公式如下 (16) 式中:c—感官因子;I—刺激強度;a—冪指數。 通過切換概率p,實現BOA搜尋方法的轉變。 全局搜索公式如下 (17) 局部搜索公式如下 (18) 2.2.4 BOA優化LSSVM 針對LSSVM的存在預測效果易受c,g參數影響的問題,本文將均方差作為參數c,g尋優的適應度函數。通過BOA對LSSVM的c,g進行尋優處理,進一步提升LSSVM對風速的預測準確度,適應度函數為: (19) 蝴蝶優化算法優化過程見圖1。 圖1 BOA算法流程圖 本文采用均方根誤差(RMSE)、平均絕對誤差(MAE)、均方誤差(MSE)對預測模型準確性進行對比研究。 (20) (21) (22) Step 1:采用CEEMDAN將風速的實測數據分解為IMF。 Step 2:計算各IMF的排列熵,量化各IMF的隨機程度、復雜程度。 Step 3:對熵值進行對比研究,選出熵值大的分量,采用CEEMDAN對其進行第二次分解,降低其隨機性。 Step 4:通過排列熵量化第二次分量的復雜程度,根據排列熵數值高低對所有IMF分量執行IMF合并操作,以此減輕由IMF數量增加,導致計算時間延長的壓力。 Step 5:使用BOA-LSSVM預測合并后的IMF,得出風速預測結果。 Step 6:累加各BOA-LSSVM風速預測結果。 圖2 預測模型流程圖 選取2019年8月25日至9月5日新疆某風電場的實測風速數據,進行超短期風速預測。數據每10分鐘進行一次采樣。對采集數據的異常點進行排除后,選取前1653個實測風速數據用于訓練,后30個實測風速數據用于對比研究,通過仿真驗證所提模型的可行性。 圖3 原始風速序列 使用CEEMDAN處理風速數據,得到的各IMF為圖4所示。 圖4 CEEMDAN分解結果圖 為了降低因數據隨機程度高導致的預測誤差,采用PE量化各IMF的隨機程度,計算出的各模態分量的排列熵值見表1。 表1 CEEMDAN獲得的各模態分量的排列熵值 根據表1可知,CEEMDAN分解得出的分量1與分量2排列熵熵值最高,隨著分解次數的增加,分量的排列熵熵值逐步降低。二次分解過程具體過程如下:首先,選取第一次分解中PE遠高于其它IMF的IMF1與IMF2進行數據相加;其次,采用CEEMDAN對重構的IMF數據進行第二次處理;最后,計算得出第二次分解各IMF的PE數值,兩次分解獲得的IMF排列熵見圖5。 圖5 各分量排列熵 通過圖5可知,隨著原始風速數據的分解,各IMF分量的PE的隨機性逐步降低,并且CEEMDAN第一次分解與CEEMDAN二次分解獲得的IMF中部分分量的PE值相近。 為提升BOA優化LSSVM模型的運行效率,減少預測誤差,采用熵值相近原則對熵值相近的IMF進行重構[6]。選擇將第一次分解得到的IMF3-5與第二次分解得到的IMF1-5重構為S1;將首次分解得到的IMF6-7與第二次分解得到的IMF6-8重構為S2;S3由第一次分解得到的IMF8-10、殘余信號R與第二次分解得到的IMF9-11構成;S4由第二次分解的殘余信號R2構成。 本文采用基于CEEMDAN兩次分解的BOA優化LSSVM模型進行超短期風速預測。為了證明本文模型的有效性,將基于CEEMDAN兩次分解的BOA-LSSVM方法的預測結果與采用另外六種方法求出的預測值進行對比,七種模型風速預測結果見圖6,七種模型的誤差對比見表2。 表2 七種預測模型風速預測結果誤差 圖6 七種模型風速預測結果 通過對比研究誤差對以上七種風速預測模型的進行評估: 對比使用EMD、EEMD、CEEMDAN三種數據處理方法時,發現使用CEEMDAN獲得的RMSE、MAE、MSE均是最小,驗證本文所用分解方法的合理性; 通過對比CEEMDAN-BOA-LSSVM與未經優化的CEEMDAN-LSSVM風速預測的誤差可知,采用BOA優化后的預測誤差RMSE降低0.0639、MAE減小了0.0847,MSE誤差減少了5.37%,驗證采用BOA優化LSSVM能夠改善模型,提升預測精確度。 根據本文與CEEMDAN-BOA-LSSVN的預測曲線,以及表2的誤差數據可知,使用相同方法對同一組風速實測數據進行預測時,二次分解后再預測的RMSE、MAE、MSE都優于僅進一次分解的預測誤差值。相較于CEEMDAN-BOA-LSSVM的誤差,本文方法的RMSE降低了0.1423、MAE減少了0.1409、MSE減少了9.04%。 通過仿真驗證可知,本文所提模型在上述七種模型中預測誤差最小,預測效果最好,取得的擬合效果最佳,可以提升風速預測的準確度。 本文基于CEEMDAN對風速進行兩次處理再通過BOA-LSSVM對風速進行超短期預測,通過對比預測數據與實測數據誤差,得出以下結論: 1)通過排列熵對序列的隨機性進行評估,識別需進行二次分解的序列。對數據進行兩次分解,能夠降低數據的隨機程度,提升預測結果的準確性。 2)將均方差作為優化支持向量機的適應度函數,解決了LSSVM參數尋優效率低的問題,進一步提升預測結果有效性。 3)通過對比七種預測模型的預測結果,證明本文所提的預測模型進行風速預測的可行性。提高分散式風機的風速預測準確度,對提升分散式風機能源的利用率有重要意義。
2.2 最小二乘支持向量機及其參數優化










2.3 誤差評估



3 基于CEEMDAN兩次分解的BOA-LSSVM預測方法

4 實例

4.1 風速數據分解

4.2 分解數據處理


4.3 風速預測及模型結果分析


5 結論