石亞欣
(華北電力大學 控制與計算機工程學院,北京102206)
風能是一種清潔的,無污染的,可再生能源,在未來的電能供應中它的地位將越來越重要[1~2]。風電出力特性不同于常規電源,它具有隨機性、波動性的特點,造成風功率預測精度較低。正如文獻[3]所描述的:風功率是和風速有關的函數,功率預測一般是通過風速預測推斷而來的。一般情況下,風速預測根據實際的應用可以分為:短期風速預測,中期風速預測以及長期風速預測。短期風速預測主要用于電網的控制;中期風速預測主要用于機組的運行維護計劃或檢修,可優化電廠調度;長期風速預測主要應用于風能的管理分布。
實際中,許多數據驅動建模已經應用在風速預測方面,主要有依據統計學原理的卡爾漫濾波器[4]、貝葉斯理論等,或者是依據智能算法的神經網絡和模糊模型等,但是它們都有各自的不足之處。本文采用了最小二乘支持向量機對短周期風速預測建立了模型,在減小預測誤差方面有很大的改善,系統的動態性能有了提高。
對于短時期的風速預測,一般情況下每間隔10 min 采樣一次數據。盡管風的產生是非常復雜的且依賴許多的因素,但短時間間隔的采樣對于描述風速的動態特性是可行的。風速的時間序列模型[5]為

從這個時間序列模型可以看出,未來某一個時刻風速僅僅依賴于歷史風速數據。事實上,預測可以分為一個周期的預測,即估計10 min 以后的風速;和多個周期的預測,即可以估計未來20,30,40,…,min 后的風速。理論上的風速預測模型結構如圖1 所示。將每一個周期的預測值和前幾個周期的實際值作為輸入,迭代進行預測。
一個周期的風速預測表達式可以由(2)式來描述:采樣周期為T,被預測的下一時刻的風速依賴于前M 個周期測得的風速值。

圖1 風速預測模型結構圖

式中:模型預測函數f ()表示的是觀測值和預測值之間的關系;M 是模型的階數,M 的值決定了采用多少先前時刻的風速值來預測下一時刻的值,預測過程如圖1 所示。
多個周期風速預測的目的是估計y(t + MT)(K >0)的值。這主要是依賴于實際觀測到的風速值y(t-T),…,y(t -MT)和估計的風速值y^(t +sT)(0≤s <K)。可以用式(3)來描述:

實際中,風速預測的核心問題是找到風速的動態特性表達式(2)和(3)。如果沒有風速的動態關系,預測函數f()將不知道如何去估計下一時刻的風速。
1988 年S.Mallat 從空間概念方面形象地說明了多分辨分析特性,并給出了信號分解不同頻率通道的算法及重構算法[6]。
假設c0為待分解的離散信號,根據分解算法的原理,有

式中:j=0 -J,其中J 為最大的分層數;H 為低通濾波器;G 為高通濾波器;cj和dj為分解后的低頻信號和高頻信號,是原始信號在不同頻段上的成分。最終將待分解信號c0分解為d1,d2,…,dJ和cJ。
支持向量機是由Vapnik 領導的AT&TBell 實驗室研究小組在1995 年提出的一種新的非常有潛力的分類技術。支持向量機是一種基于統計學習理論的模式識別方法,主要應用于模式識別、非線性分類和回歸等領域。它是建立在VC 維理論和結構化風險最小的原則基礎上的,具有學習速度快、泛化性好的特點,能夠較好地解決小樣本、非線性、高維數和局部極小點等實際問題,被認為是神經網絡的替代方法[7]。
最小二乘支持向量機是標準支持向量機的深化和提高,主要表現在:首先在優化目標函數中,LS-SVM 是輸出誤差的2 范數被最小化,而SVM 中是對誤差的1 范數最小化;其次,在SVM 中約束是非線性的,LS-SVM 的優化問題的約束是等式約束,這使得LS-SVM 只需要解決一個線性系統問題,而不是一個二次規劃問題,這極大地簡化了問題的求解,能夠快速得到最終的決策函數,提高學習效率。
給定訓練數據集

利用高維特征空間的線性函數來集合樣本集:

式中:φ (x)為從輸入空間到高維特征空間的非線性映射;w 為特征空間權系數向量;b 為偏置。
損失函數定義為:

根據結構風險最小化原理,LS-SVM 法回歸問題可以表示為如下優化問題:

式中:C 為調節參數。
引入拉格朗日函數,優化問題可變為:

ak為拉格朗日乘子,根據KKT 條件可得:

消去w 和e 可以得到如下方程組:

利用最小二乘法求解方程組,得到a 和b,可以得到LS-SVM 的最后表達式為:

從上面的推導可以看出,只有參數γ 是待選的,這比標準支持向量機法待選的參數少,不再需要指定收斂判據的精度。所以,LS-SVM 算法運行簡單,速度快,精度高。
常用的核函數有[8]:
(1)高斯徑向基(Gaussian Radial Basis)核函數,即:

(2)多項式(Polynomial)核函數,即:

(3)Sigmoid 核函數,即:

(4)線性核函數,即:

由于RBF 核函數具有較寬的收斂域,可實現非線性映射任意分布的樣本到高維空間,能有效地控制回歸問題,此外核值γ 在有效范圍變動時,不會使空間復雜度變大,使得LS-SVM 的優化問題易實現,因此,選用了RBF 核函數。
評估預測風速與真實風速之間的誤差,驗證模型的準確性。通過幾種不同類型的誤差來評價模型的有效性,誤差e 定義為式 (17),均方差RMSE 定義為式(18),絕對誤差MAE 定義為式(19),絕對百分比MAPE 誤差定義為式(20)。

y(k)是實際測得的風速,y^(k)是采用最小二乘支持向量機模型預測得到的風速值,L 是樣本總數。
下面使用的短期風速數據為某風電場在每10 min 記錄1 次的風速數據序列,按時間順序分別選用前1 000 個觀測點的記錄數據作為訓練樣本,其后的100 個觀測點作為測試樣本,原始樣本風速數據圖如圖2 所示。

圖2 原始風速數據
首先,采用db4 小波基對該原始風速時間序列進行4 級分解,對分解后所得到的低頻逼近信號a4(k)(趨勢項)與各個高頻細節信號di(k)分別進行小波的單支重構,得到a4與di(k)(i=1,2,3,4),原始風速時間序列及4 層小波分解如圖3。

圖3 小波分解細節分量和近似分量時域波形
在預測過程中,模型的階數根據經驗確定為3 階。對分解后的高頻序列和低頻序列分別進行LS-SVM 預測,并將預測結果合成,如圖4 ~5 所示。實驗中主要對4 個不同時期的風速進行了預測,即10 min,20 min,30 min,40 min。下面分析了前兩個周期的預測結果,并與簡單的SVM 方法(圖6,7)做了對比。
WD-LSSVM 預測模型的各項誤差指標如表1所示。

圖4 WD-LSSVM 提前1 個周期預測結果
通過上述仿真結果可以看出,最小二乘支持向量機模型的預測效果很好。隨著預測周期的增加,各項誤差不斷增大,但整體而言預測結果和實際風速基本一致,驗證了最小二乘支持向量機的有效性和可行性。

圖5 WD-LSSVM 提前2 個周期預測結果

圖6 SVM 提前1 個周期預測結果

表1 WD-LSSVM 不同周期的誤差

圖7 SVM 提前2 個周期預測結果
通過LS-SVM 的風速預測模型對風速進行周期性的預測,將每一步的預測值和前幾步的實際值作為輸入,迭代預測,在短時間的周期內模型的預測結果與實際值基本一致,誤差維持在一定范圍內。準確的風速預測可以實現最大風能的捕獲,充分利用風資源,對于功率的預測也有很大的幫助。最小二乘支持向量機的回歸算法在風速預測中得到了很好的應用,也驗證了模型的準確性,對具體數據的仿真證明了最小二乘支持向量機模型的有效性。
[1]郭鵬.雙自回歸滑動平均模型風速預測研究[J].現代電力,2009,26 (6):66-69.
[2]鄒文,丁巧林,楊宏.基于Mycielski 算法的風電場風速預測[J].電力科學與工程,2011,27 (3):1-4.
[3]Damousis I G.A fuzzy model for wind speed prediction andpower generation in wind parks using spatial correlation[J].IEEE Trans.Energy Convers,2004,19 (2):352-361.
[4]Louka P et al.Improvements in wind speed forecasts for wind power prediction purposes using Kalman filtering[J].J.Wind Eng.Ind.Aerodyn,2008 ,96 (12):2348-2362.
[5]Geng Zhang,HanXiong Li,Min Gan.Design a wind speed prediction model using probabilistic fuzzy system [J].J.IEEE Transactions on Indudustrial Ingormatics,2012,8(4):819-820.
[6]羅文,王莉娜.風場短期風速預測研究[J].電工技術學報,2011,26 (7):78-74.
[7]林勇剛,李偉,崔寶玲.基于SVR 增量學習算法變槳距風力機系統在線辨識[J].太陽能學報,2006,27(3):223-227.
[8]朱樹先,張仁杰.支持向量機核函數選的研究[J].科學技術與工程,2008,8 (6):4513-4516.