胡 倩,陳紅坤,孫志達(武漢大學電氣工程學院,武漢 430072)
風電場短期風速的集成學習預測模型
胡 倩,陳紅坤,孫志達
(武漢大學電氣工程學院,武漢 430072)
準確的風電場風速預測對含大規模風電的電力系統安全穩定運行具有重要意義。針對時間序列法、卡爾曼濾波法、神經網絡法等單一預測模型預測精度不高的問題,引入集成學習的分析方法,提出了一種基于Adaboost算法改進的支持向量機(SVM)短期風速預測方法。該算法使用多個SVM模型通過加權累加得到最終輸出,彌補了單一預測模型的缺陷。同時引入隸屬度函數,通過賦予歷史數據樣本不同的權重來突出不同時間樣本在預測模型中的差異性。以內蒙古風電場的實際采集數據為算例進行測試,結果表明模型預測精度顯著提高,為實現更準確的在線短期風速預測提供了可能。
短期風速預測;集成學習;動態權重;隸屬度函數;支持向量機
隨著能源問題和環境問題的日益突出,風能作為重要和最成熟的可再生能源技術,因其蘊藏量豐富、可再生、分布廣、無污染等特性,成為可再生能源發展的重要方向。但隨著風電比例的增加,風能具有的隨機性、間歇性給電力系統的安全穩定和調度控制帶來了很大的困難。如果能對風電場風速和風電功率進行準確預測,不僅有利于電力系統的運行和控制,還能降低旋轉備用容量,有效提高電網接納風電的能力[1-2]。
目前風電場短期風速的預測方法主要可以分為物理模型預測和統計學模型預測。物理預測方法主要是基于數值天氣預報和考慮地理環境影響的物理建模,其模型復雜,計算難度大;統計預測方法主要有時間序列法、卡爾曼濾波法、神經網絡法、支持向量機等數學方法和智能算法[3-6],其中應用最廣泛的是神經網絡和支持向量機理論。支持向量機理論與傳統神經網絡方法相比,具有學習速度快、泛化能力強等優點,在性能上明顯優于神經網絡,因此在時間序列預測中具有更廣泛的應用。但單一的支持向量機預測模型易受核函數和參數影響,當大規模風電接入系統時,其預測精度仍無法滿足要求。
針對以上問題,本文引入集成學習的研究思路,提出使用Adaboost算法來改進單一的支持向量機預測模型,并引入隸屬度函數來改善預測中的隨機性因素對預測結果的影響。通過算例分析,驗證了經Adaboost算法和隸屬度函數改進后的支持向量機預測模型在短期風速預測中的預測精度顯著提高。
Adaboost算法[7-8]是Freund和Schapire在Boosting算法的基礎上經過改進得到的一種機器學習方法,能有效提升算法性能,常用于解決分類和回歸問題。目前該算法已經運用到電力系統負荷預測、交通量預測,得到了不錯的預測效果。
Adaboost算法的主要思想是針對某一訓練集,通過調整該訓練集中樣本的權重來訓練不同的弱學習器;然后將這些弱學習器通過加權疊加的方式組合起來形成一個更強的學習器,使學習誤差得到有效降低。算法的主要步驟是給定一個訓練集,初始時訓練集中的每個樣本都具有相同的權重,在此樣本分布下訓練得到一個基本學習器G1(x)。然后通過比較學習器對訓練集的預測誤差來調整樣本分布,對誤差較大的樣本賦予更高的權重,預測誤差小的樣本則降低其權重,這樣將預測精度低的樣本凸顯出來。同時,根據預測誤差情況給予學習器一個權重ω1,表示該學習器的重要程度,預測精度越高權重越大。在新得到的樣本分布下,再進行學習得到第2個基本學習器G2(x)及其權重ω2。以此類推,經過T次迭代,可得到T個基本學習器及其對應權重ωt。最后將各個基本學習器按權重ωt累加起來,得到最終的強學習器,計算公式為

支持向量機[9-10]是一種建立在VC維(Vapnik-Chervonenks dimension)理論和結構風險最小原則基礎上的分類方法和回歸工具,具有學習速度快、泛化性好的特點,能夠較好地解決小樣本、非線性、高維數和局部極小點等實際問題。最小二乘支持向量機LS-SVM(least squares support vector machine)用等式約束代替標準SVM算法中的不等式約束,將求解二次規劃問題轉化為求解線性方程組,降低了運算復雜度,提高了計算速度。
支持向量機的基本原理是通過非線性轉換將輸入向量由低維空間映射到高維空間,使低維空間的非線性問題轉換為高維空間的線性問題。在這個空間中結合結構風險最小原理構造回歸函數,并引入空間核函數巧妙地代替高維空間中的向量內積值,使計算得到簡化。
假設給定訓練數據(xi,yi)(i=1,2,…,n),xi∈Rd,d為R空間的維數,yi∈R。通過核空間映射函數φ(x)將訓練數據從低維空間映射到高維空間中去,其線性函數集合為

式中:w為權向量,w∈Rk;b為常數,b∈R。
最小二乘支持向量機的目標優化函數及約束條件分別為

式中:ξi為松弛因子,ξi≥0;c為懲罰參數。建立Lagrange方程,即

式中,ai為Lagrange乘子。
根據KTT優化條件可得

從而有

從而,上述的優化問題可簡化為求解線性方程組,其線性方程組為

式中:I為n×n的單位陣;e為元素為1的n×1單位列向量。其中,a=[a1,a2,…,an]T;y=[y1,y2,…,yn]T;G=[(x1)T,(x2)T,…,(xn)T]
根據Mercer條件,定義核函數為

式(8)中的K(xi,xj)是最為常用的高斯徑向基核函數,表示為

將式(9)代入式(7),得

解上述線性方程求出a和b,從而得到LSSVM非線性回歸函數為

本文以SVM算法作為Adaboost算法的基本學習器,對采樣后的各訓練子集進行學習,得到相應的基本學習器,然后將這些基本學習器組合起來得到最終的預測模型。基于Adaboost的SVM模型的預測流程如圖1所示。

圖1 模型預測流程Fig.1 Flow chart of model prediction
當采用SVM算法進行預測時,近期的數據樣本往往比遠期的數據樣本能提供更多的信息。因此在建立模型時就要考慮增強近期數據樣本的影響而減弱遠期數據樣本的影響。本文提出以隸屬度函數來表征數據樣本的重要性。隸屬度函數以時間為自變量,表達形式為

本文通過隸屬度函數來確定Adaboost算法的樣本初始分布,預測模型的具體步驟如下。
步驟1 給定訓練集并確定訓練算法,即
(x1,y1),(x2,y2),…,(xn,yn),xi∈X,yi∈Y,X和Y表示樣本空間。
步驟2 初始化N個樣本的權值,置樣本初始權重ω為

步驟3 對于t=1~T進行迭代。
(1)在訓練樣本的概率分布下,訓練弱學習器Gt(x);
(2)計算弱學習器在當前樣本分布下的誤差率εt,計算公式為

式中,μ為衡量預測精度的閾值。
(3)計算αt,計算公式為

(4)置ωt(i)×βt→ωt(i),并歸一化ωt(i)。其中

(5)置t+1→t。
步驟4 輸出結果為

4.1 預測誤差指標選取
本文采用均方誤差MSE(mean squared error)和平均相對誤差MRE(mean relative error)來衡量預測結果,其定義分別為

式中:y(i)為實際值;y?(i)為預測值;N為預測樣本個數。
4.2 循環次數T T的選取
本文通過模型的預測誤差來確定最佳循環次數T。對Adaboost算法每一次循環得到的基本學習器Gt(x),通過加權累加得到強學習器G(x)。計算G(x)的預測誤差,當預測誤差開始增加時停止循環。將對應的循環次數作為最終T值,則此時的模型輸出具有最小預測誤差,能有效避免過學習。
4.3 風速預測實驗
本文使用內蒙古某風電場在2007年某一時間段每1 h記錄1次的風速數據序列,按時間順序分別選用前396個觀測點的記錄數據作為訓練樣本,其后的24個觀測點作為測試樣本,采用Matlab仿真平臺進行分析。
圖2給出了本文預測模型和最小二乘支持向量機對風速序列進行預測的結果。將2個模型的預測結果進行對比。由圖可觀察到,引入Adaboost算法和隸屬度函數后,模型能更好地預測實際風速序列的變化趨勢,預測滯后現象得到大幅度改善,對風速突變點的預測能力也有所增強。

圖2 Adaboost改進前后模型的風速預測結果Fig.2 Model prediction results with and without Adaboost algorithm improved
表1列出了本文方法、LS-SVM法及時間序列法3種預測方法的預測精度。通過計算發現:采用時間序列法和LS-SVM法進行風速預測時,預測的平均相對誤差為30.82%和23.75%。而利用Adaboost改進后的預測方法進行風速預測時,平均相對誤差降為10.32%,其預測精度大大提高,充分驗證了本文方法的可行性和有效性。

表1 3種預測模型的誤差比較Tab.1 Prediction errors between three forecasting models
針對單一支持向量回歸模型易受自身參數和數據隨機性的影響造成預測精度不高的問題,本文采用集成學習的分析方法,提出基于Adaboost算法和隸屬度函數改進的SVM短期風速預測模型,通過合并多個基本學習器的輸出以產生更精確的預測結果。同時采用隸屬度函數對每個樣本設置不同的權重,賦予近期數據樣本較大權重來提高其在預測模型中重要性。仿真結果顯示本文提出的預測模型預測精度較單一的SVM預測模型有顯著提高,預測滯后效應得到有效改善,為實現更精確的短期在線風速預測提供了可能。
[1]尹明,王成山,葛旭波(Yin Ming,Wang Chengshan,Ge Xubo).風電并網經濟技術評價研究綜述(Review of economic-technical assessment of wind power integration)[J].電力系統及其自動化學報(Proceedings of the CSU-EPSA),2010,22(5):102-108.
[2]Lange B,Rohrig K,Ernst B,et al.Wind power prediction in Germany-Recent advances and future challenges[C]// European Wind Energy Conference and Exhibition.Athens,Greece,2006:1810-1817.
[3]Ma Lei,Luan Shiyan,Jiang Chuanwen,et al.A review on the forecasting of wind speed and generated power[J].Renewable and Sustainable Energy Reviews,2009,13(4):915-920.
[4]丁明,張立軍,吳義純(Ding Ming,Zhang Lijun,Wu Yichun).基于時間序列分析的風電場風速預測模型(Wind speed forecast model for wind farms based on time series analysis)[J].電力自動化設備(Electric Power Automation Equipment),2005,25(8):32-34.
[5]楊秀嬡,肖洋,陳樹勇(Yang Xiuyuan,Xiao Yang,Chen Shuyong).風電場風速和發電功率預測研究(Wind speed and generated power forecasting in wind farm)[J].中國電機工程學報(Proceedings of the CSEE),2005,25(11):1-5.
[6]羅文,王莉娜(Luo Wen,Wang Lina).風場短期風速預測研究(Short-term wind speed forecasting for wind farm)[J].電工技術學報(Transactions of China Electrotechnical Society),2011,26(7):68-74.
[7]Freund Y,Schapire R E.A decision-theoretic generalization of on-line learning and an application to boosting[J].Journal of Computer and System Sciences,1997,55(1):119-139.
[8]MATLAB中文論壇.MATLAB神經網絡30個案例分析[M].北京:北京航空航天大學出版社,2010.
[9]Vapnik V.The Nature of Statistical Learning Theory[M].New York:Springer-Verlag,1995.
[10]Suykens J A K,de Brabanter J,Lukas L,et al.Weighted least squares support vector machines:Robustness and sparse approximation[J].Neurocomputing,2002,48(1/2/ 3/4):85-105.
An Ensemble Learning Predictive Model for Short-term Wind Speed Forecasting
HU Qian,CHEN Hongkun,SUN Zhida
(School of Electrical Engineering,Wuhan University,Wuhan 430072,China)
Accurate wind speed prediction is important for safe and stable operation of power systems with large-scale interconnection of wind power.For a single time series prediction method,such as Kalman filtering,neural network models,the prediction accuracy is not high,this paper proposes an ensemble learning predictive model based on Adaboost algorithm and support vector machine(SVM)method for short-term wind forecasting.The algorithm utilizes multiple SVM models to obtain the final output by a weighted cumulative,to make up for the shortcomings of a single forecast model.While with the introduction of membership function,historical data have been given different weights to highlight the difference in the prediction model.Treating wind farms in Mongolia region as a example,the results indicate that the proposed method significantly enhances the accuracy and to make a more accurate short-term wind forecasting online possible.
short-term wind speed forecasting;ensemble learning;dynamic weighting;membership function;support vector machine
TM835
A
1003-8930(2016)01-0001-04
10.3969/j.issn.1003-8930.2016.01.001
2014-07-22;
2014-08-27
國家重點基礎研究發展計劃(973計劃)資助項目(2012CB215200)
胡 倩(1990—),女,碩士研究生,研究方向為新能源接入、電力系統運行控制。Email:huqian.1990@hotmail.com
陳紅坤(1966—),男,博士,教授,研究方向為電力系統運行與控制、新能源接入。Email:chkinsz@163.com
孫志達(1991—),男,碩士研究生,研究方向為電力系統規劃、新能源接入。Email:304153295@qq.com