潘學萍,史宇偉,張弛
(河海大學能源與電氣學院,南京210098)
雙加權最小二乘支持向量機的短期風速預測
潘學萍,史宇偉,張弛
(河海大學能源與電氣學院,南京210098)
提出了雙加權最小二乘支持向量機的短期風速預測方法。考慮到離預測點越遠的歷史風速數據對預測值的影響越弱,對訓練樣本中輸入向量數據進行第1次加權,以體現不同元素對預測影響的差異。同時為區分訓練樣本的差異性,降低異常樣本的干擾,對訓練樣本進行第2次加權。對雙加權后的訓練樣本,采用加權最小二乘支持向量機模型進行預測,降低了對異常點的敏感度,實現了對不同樣本的區別對待。根據某實測風速數據進行了風速預測,結果表明,所提方法能提高風速預測精度。
風速預測;雙加權方法;加權最小二乘支持向量機;短期預測
風電作為當前發展最快的可再生能源發電形式,得到了世界各國的廣泛重視[1]。對風電場風速或風電功率的準確預測,可以減少電力系統的運行成本和旋轉備用,提高風電穿透功率極限,增強風電場在電力市場中的競爭能力[2]。由于風速的隨機性和間歇性,準確預測風速難度較大[3]。
目前已有的風速預測方法可分為基于物理模型的方法和基于歷史數據的預測方法兩大類。物理模型法采用天氣預報數據進行預測,由于氣象預報數據更新頻率低,適用于中期風速預測[4];基于歷史數據的預測方法主要有空間相關法[5]、時間序列法[6]、人工神經網絡法[7]、支持向量機(SVM)法[8]等。空間相關法需要考慮風電場以及與之相近的幾個地點的風速時間序列,對歷史數據要求很高;時間序列法基于歷史數據建模,通過模型識別、參數估計和模型檢驗等過程得到預測模型,適用于短期風速預測,但這種方法在氣候變化較大時,預測精度不理想;人工神經網絡具有自學習、自組織和自適應性,可以逼近任意復雜的非線性映射,但存在著隱層神經元個數難以確定、算法收斂速度慢以及容易陷入局部最小等問題。
SVM方法通過非線性核函數,將輸入樣本空間映射到高維線性特征空間,能夠處理高度非線性映射問題,在預測中得到了廣泛應用[9,10]。最小二乘支持向量機(LS-SVM)方法作為傳統SVM方法的擴展[11],用等式約束代替傳統SVM方法中的不等式約束,降低了計算的復雜度,具有更快的求解速度和穩定性[12]。
但LS-SVM建模時,所有訓練樣本都被平等對待,而實際工程中的許多不確定性因素使得不同樣本對預測模型的貢獻程度不一樣。為區分樣本的差異,有學者提出了加權LS-SVM[13]算法,根據樣本的不同,賦予各組樣本不同的權值。風速具有隨機性、波動性等特點,不同歷史風速數據存在差異性,離預測點越遠的歷史風速數據對預測值影響越小,因此,對訓練樣本進行加權以體現時間因素的影響。本文提出了基于雙加權最小二乘支持向量機的短期風速預測模型,即對訓練樣本中數據進行第1次加權,再對訓練樣本進行第2次加權,運用加權最小二乘支持向量機算法進行預測,以提高風速的預測精度。
給定風速訓練樣本集{xi,yi},i=1,2,…,N,其中:N為樣本數;xi為輸入向量,包含n個元素;yi為訓練樣本集中的風速輸出值。則SVM的回歸模型為

式中:φ(xi)為非線性映射函數;ω為權重向量;b為偏差量。LS-SVM方法的目標函數為

式中:ξi為估計誤差;C為懲罰系數。
約束條件為

文獻[14]指出,如對每個樣本賦予相同的懲罰系數C,即把所有樣本都同等對待,必然會受到異常樣本的影響,從而產生誤差。由于風速的隨機性、波動性特點,相同權值的風速樣本參與訓練必然會影響預測的精度。加權LS-SVM模型引入樣本權值來區分不同樣本在訓練過程中的重要程度。該方法為每個樣本引入權值wi,生成加權后的樣本集{xi,yi,wi}。則式(2)的目標函數變為

結合式(3)建立的拉格朗日方程為

式中,ai為拉格朗日乘子,最優解應滿足


式中:y=[y1,y2,…,yN]T;E=[1,1,…,1]T;ω=[ω1,ω2,…,ωN]T;a=[a1,a2,…,aN]T;Ωij=K(xi,xj)=φ(xi)Tφ(xj)。K(xi,xj)為核函數,采用RBF核函數[12],即
將式(6)可轉化為求解線性方程[14],即

式中,σ為核參數。
根據式(7)求得a和b后,根據LS-SVM回歸模型可得風速預測表達式為

式中,x為測試樣本中的輸入向量。
2.1 輸入向量的加權
文獻[15,16]指出,離風速輸出值越近的風速,對輸出值的影響越大。為了體現樣本中不同時刻的風速對預測值的影響,文中采用灰色關聯度[17]法對輸入向量進行了加權處理。具體步驟如下。
步驟1輸入向量xi中的第j個元素xji和yi的關聯系數εji定義為

式中,ρ為分辨系數,通常取值0.5。則灰色關聯度rj表示為

步驟2根據該灰色關聯度得到輸入向量中各元素的權重μj,即

步驟3將輸入向量各元素乘以對應的權值,生成新的風速訓練樣本集{xi′,yi}。
2.2 訓練樣本的加權
在SVM和LS-SVM的訓練過程中,平等對待每一個樣本必然會導致過學習現象[14]。在風速預測中,由于風速的隨機性、不確定性以及隨季節變化等特點,不同樣本對預測模型的貢獻程度不同。因此,需要對不同樣本加以區別對待。
在風速預測中,考慮到訓練樣本中近期樣本對預測的參考作用較大,遠期樣本對預測的參考作用較小。又考慮到所建模型進行預測的目的,與預測樣本相似度越高的訓練樣本,其重要程度應越大。綜合考慮樣本的時間因素和相似度因素,各個訓練樣本的權值wi為

式中:wT,i為只考慮時間因素的訓練樣本權值;wD,i為只考慮相似度因素的訓練樣本權值;r為常數,0≤r≤1,用來調節時間因素和相似度因素的權重。
由于離預測樣本時間越近的訓練樣本越重要,權值wT,i采用線性遞增表示為

式中,β為離預測樣本最遠的初始權值,0≤β≤1。
對于訓練樣本與預測樣本的相似度權值wDi,本文采用歐氏距離來度量,訓練樣本輸入向量xi′和預測輸入向量x^i′的歐氏距離為

與預測樣本歐氏距離最大的訓練樣本權值為β′,與預測樣本歐氏距離最小的訓練樣本權值為1。其他訓練樣本的歐氏距離可通過類似式(15)的線性表達式獲得。訓練樣本權值根據歐氏距離的大小確定。
2.3 加權LS-SVM模型參數選擇
對加權LS-SVM模型中懲罰系數C和核參數σ的選取,本文采用文獻[18]中的改進粒子群方法進行尋優。具體方法為:在標準粒子群算法基礎上,為提高算法局部尋優能力,加快收斂速度,選取適應度較大的50%種群以概率pc與粒子經過的最好位置進行交叉操作。同時,為避免陷入局部最優解,引入變異操作,使粒子以概率pm進行變異,提高算法的全局尋優能力。最后對預測結果進行反歸一化處理,得到最終風速預測結果。
2.4 雙加權LS-SVM方法的短期風速的預測流程
雙加權LS-SVM方法的風速預測流程如圖1所示。

圖1 雙加權LS-SVM模型預測流程Fig.1Flow chart of double weighted LS-SVM forecasting
風速時間序列的歸一化,將原始風速序列經過線性變化至[0,1]區間,計算公式為

式中,z*為歸一化后的數值。預測結果必須進行反歸一化,即

式中:z^*為歸一化后的預測值;z^為最終的預測值。
為評估風速預測精度,本文采用平均絕對誤差EMAE和平均絕對百分比誤差EMAPE來表示,即

式中:zi為實際風速;z^i為預測風速;m為預測值的個數。
選取某風電場1 a的實測風速數據,采樣時間間隔為1 h,分別對當年4個季節中的某一天(本文選為03-16、06-16、09-16、12-16)的24個風速值進行預測。對各個預測日,選取該預測日之前一定數量的風速值作為訓練數據,建立風速預測模型,進行提前1 h預測。
一年中3月、6月、9月、12月風速時間序列如圖2所示。

圖2 風速序列Fig.2Wind speed series
3.1 訓練樣本大小對預測精度的影響
在風速預測中,訓練樣本的大小對于模型的預測精度有很大的影響。如果用于建模的風速訓練數據太少,則不足以反映風速的全部信息。由于風速受季節影響大,太多的訓練數據會包含更多的異常數據,并且大大增加了運算時間[15]。表1列出了歷史樣本數據分別為120、360、480、800、1200、182 4 h時,LS-SVM模型的預測精度。

表1 樣本大小對預測精度的影響Tab.1Effects of training data on forecasting errors
由表1可以看出,訓練大小會影響風速的預測精度。風速預測誤差隨樣本增大總體呈下降趨勢。由此得出,較大的樣本能增加風速預測的精度,但由于訓練樣本中存在著一些分布規律差異較大的風速數據,對預測模型的作用不大甚至產生不利的影響。
3.2 基于雙加權LS-SVM的風速預測
由表1可知,800個訓練樣本數據已經能較準確地建立各月的風速預測模型,因此選取對應預測日之前的800個風速數據作為訓練數據,預測03-16、06-16、09-16、12-16的風速值。
以預測03-16的風速值為例,根據經驗法,本文取輸入向量維數n=4,求出輸入向量中4個元素的權值向量μ=(0.2344,0.2433,0.2526,0.2697)。根據式(13)得出各個訓練樣本對應的權值,其中β、β′和r的選取依靠多次試驗得到,本文取β= 0.6、β′=0.6、r=0.45。懲罰參數C和核參數σ的選取,采用改進的粒子群算法尋優,交叉概率pc取0.8,變異概率pm取0.15,得到最優參數C= 180.21,σ=2.23。把得到的03-16的風速預測值與相同訓練數據下SVM和LS-SVM的預測結果進行比較,如圖3所示。
同上,可得出06-16、09-16、12-16的風速預測值。并采用式(18)和式(19)對各預測方法在所有預測日上的誤差結果進行分析,如表2所示。
從表2可以看出,LS-SVM方法的預測精度略高于SVM方法;輸入向量加權的LS-SVM預測精度高于LS-SVM方法;雙加權的LS-SVM預測方法的預測精度最高。本算例中,本文提出的方法平均絕對百分比誤差能達到8.01%~18.33%,取得比較滿意的預測效果。

圖303 -16的預測結果Fig.3Forecasting results on March 16

表2 預測誤差Tab.2Error comparison by different methods
由于風速具有較強的隨機性、波動性等特點,訓練樣本大小對預測精度有著直接的影響。文中算例表明在大部分情況下,增加訓練樣本數目可提高模型的預測精度。
訓練樣本中離輸出值越近的風速對預測結果影響越大。為了體現樣本中不同時刻的風速對預測值的影響,文中對輸入樣本進行了第1次加權處理。算例表明,采用樣本輸入向量加權后的LSSVM模型,其預測精度要高于預測LS-SVM方法。如采用同時對訓練樣本進行加權的雙加權LSSVM模型,其預測精度高于單一加權的LS-SVM方法。由此說明采用本文提出的雙加權LS-SVM模型,能提高短期風速的預測精度。
[1]尹明,王成山,葛旭波(Yin Ming,Wang Chengshan,Ge Xubo).風電并網經濟技術評價研究綜述(Review of economic technical assessment of wind power integration)[J].電力系統及其自動化學報(Proceedings of the CSUEPSA),2010,22(5):102-108.
[2]戴浪,黃守道,黃科元,等(Dai Lang,Huang Shoudao,Huang Keyuan,et al).風電場風速的神經網絡組合預測模型(Combination forecasting model based on neural net
works for wind speed in wind farm)[J].電力系統及其自動化學報(Proceedings of the CSU-EPSA),2011,23(4):27-31.
[3]楊秀媛,肖洋,陳樹勇(Yang Xiuyuan,Xiao Yang,Chen Shuyong).風電場風速和發電功率預測研究(Wind speed and generated power forecasting in wind farm)[J].中國電機工程學報(Proceedings of the CSEE),2005,25(11):1-5.
[4]Soman S S,Zareipour H,Malik O,et al.A review of wind power and wind speed forecasting methods with different time horizons[C]//North American Power Symposium,Arlington,USA:2010.
[5]李文良,衛志農,孫國強,等(Li Wenliang,Wei Zhinong,Sun Guoqiang,et al).基于改進空間相關法和徑向基神經網絡的風電場短期風速分時預測模型(Multi-interval wind speed forecast model based on improved spatial correlation and RBF neural network)[J].電力自動化設備(Electric Power Automation Equipment),2009,29(6):89-92.
[6]Gao Shan,He Yu,Chen Hao.Wind speed forecast for wind farms based on ARMA-ARCH model[C]//International Conference on Sustainable Power Generation and Supply,Nanjing,China:2009.
[7]Kariniotakis G N,Stavrakakis G S,Nogaret E F.Wind power forecasting using advanced neural network models [J].IEEE Trans on Energy Conversion,1996,11(4):762-767.
[8]楊洪,古世甫,崔明東,等(Yang Hong,Gu Shifu,Cui Mingdong,et al).基于遺傳優化的最小二乘支持向量機風電場風速短期預測(Forecast of short-term wind speed in wind farms based on GA optimized LS-SVM)[J].電力系統保護與控制(Power System Protection and Control),2011,39(11):44-48,61.
[9]張智晟,馬龍,孫雅明(Zhang Zhisheng,Ma Long,SunYaming).混沌理論和支持向量機結合的負荷預測模型(Load forecasting model using chaos theory and support vector machine)[J].電力系統及其自動化學報(Proceedings of the CSU-EPSA),2008,20(6):31-35.
[10]Mohandes M A,Halawani T O,Rehman S,et al.Support vector machines for wind speed prediction[J].Renewable Energy,2004,29(6):939-947.
[11]肖先勇,葛嘉,何德勝(Xiao Xianyong,Ge Jia,He Desheng).基于支持向量機的中長期電力負荷組合預測(Combination method of mid-long term load forecasting based on support vector machine)[J].電力系統及其自動化學報(Proceedings of the CSU-EPSA),2008,20(1):84-88.
[12]曾杰,張華(Zeng Jie,Zhang Hua).基于最小二乘支持向量機的風速預測模型(A wind speed forecasting model based on least squares support vector machine)[J].電網技術(Power System Technology),2009,33(18):144-147.
[13]Suykens J A K,De Brabanter J,Lukas L,et al.Weighted least squares support vector machines:robustness and sparse approximation[J].Neurocomputing,2002,48(1-4):85-105.
[14]吳青,劉三陽,杜喆(Wu Qing,Liu Sanyang,Du Zhe).回歸型模糊最小二乘支持向量機(Fuzzy least square support vector machines for regression)[J].西安電子科技大學學報(Journal of Xidian University),2007,34(5):773-778.
[15]韓爽,楊勇平,劉永前(Han Shuang,Yang Yongping,Liu Yongqian).三種方法在風速預測中的應用研究(Application study of three methods in wind speed prediction)[J].華北電力大學學報(Journal of North China Electric Power University),2008,35(5):57-61.
[16]Sideratos G,Hatziargyriou N D.An advanced statistical method for wind power forecasting[J].IEEE Trans on Power Systems,2007,22(1):258-265.
[17]譚學端,鄧聚龍(Tan Xuerui,Deng Julong).灰色關聯分析:多因素統計分析新方法(Grey connected analysis:a new method of multifactor statistical analysis)[J].統計研究(Statistical Research),1995,12(3):46-48.
[18]伍鐵斌,陽春華,孫備,等(Wu Tiebin,Yang Chunhua,Sun Bei,et al).灰色模糊LSSVM預測模型在鋅凈化除鈷中的應用(Grey fuzzy-LSSVM forecasting model and its application in cobalt removal from zinc electrolyte)[J].中國有色金屬學報(The Chinese Journal of Nonferrous Metals),2012,22(8):2382-2386.
Short-term Wind Speed Forecast Based on Double Weighted Least Squares Support Vector Machine Algorithm
PAN Xue-ping,SHI Yu-wei,ZHANG Chi
(College of Energy and Electrical Engineering,Hohai University,Nanjing 210098,China)
Double weighted least squares support vector machine algorithm for short-term wind speed forecast is proposed in this paper.The training data are weighted firstly to reflect the effects of different data on the predicting value. The training samples are weighted again to distinguish the difference of training samples,which can reduce the influence of abnormal sample.With the double weighted training sample,the weighted least squares support vector machine(LS-SVM)algorithm is used to predict the hourly wind speed.The proposed method improves the sparse characteristic of LS-SVM and reduces the sensitivity of abnormal points.The prediction results show that the proposed method can improve the prediction accuracy.
wind speed forecast;double weighted method;weighted least squares support vector machine;shortterm forecast
TK81
A
1003-8930(2014)01-0013-05
潘學萍(1972—),女,博士,副教授,研究方向為電力系統分析與控制。Email:xueping_pan@163.com
2013-08-26;
2013-09-30
國家自然科學基金項目(51207045)
史宇偉(1988—),男,碩士研究生,研究方向為風電場短期風速預測。Email:shiyuwei007@hotmail.com
張弛(1988—),男,碩士研究生,研究方向為風電場分群。Email:sw249161768@163.com