平善明 趙玲玲 蘇小紅


文章編號: 2095-2163(2018)03-0240-04中圖分類號: 文獻標志碼: A
摘要: 關鍵詞: (School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China)
Abstract: With the depletion of fossil energy, renewable energy such as wind power is in development in recent years. Due to the intermittence and variability of wind speed, wind power generation is also intermittent and unstable, and wind power integration in electrical power systems will do harm to the electrical power systems. Accurate short-term wind speed forecasting could be a guide to wind farm management. Using machine learning method to predict wind speed is popular, and it creates residual sequence. If it is not a white noise, information could be extracted from it, which could lead to a two-layer model. Experimental results show compared with single-layer machine learning method such as SVR(Support Vector Machine), RVM(Relevance Vector Machine), the proposed method in this paper is efficiently improved.
Key words:
作者簡介:
收稿日期: 引言
由于化石能源儲量有限,而需求不斷增加,化石能源面臨著枯竭的困境。同時,由于化石能源引起的氣候變暖以及環境污染問題也日益嚴重,對生態系統、社會經濟以及人類健康均構成嚴重威脅。相較于化石能源,太陽能和風能等綠色可再生能源有許多優勢,發揮著越來越重要的作用。2016年結束后,全球風力發電裝機容量已達到486.7 GW。
由于風本身的不穩定性等問題,風力發電具有波動性和間歇性,風電入網將對電力系統造成危害,阻礙了風能的進一步發展。隨著風力發電在電力供應中所占比例越來越大,這一問題愈加突出。目前,解決該問題的重要方向就是對未來的風電輸出進行預測。短期預測的結果能夠為電網的合理調度、機組組合操作以及在合適階段對風機實施維護提供基礎、及重要依據[1]。
根據預測過程使用數據的不同,風速預測可以分為兩類。一類是用歷史風速數據預測未來的風速,另一類是使用更多種類的數據進行風速預測,如壓力、溫度、濕度等。本次研究只使用風速的歷史數據,后續研究將探討使用更多種類的數據預測風速,可以預期,更多種類的數據將帶來更好的預測結果,因為其中包含了更多的信息。
根據建模原理的不同,短期風速預測方法可分為物理方法、統計方法和學習方法三大類。具體來說,物理方法使用數值天氣預報[2]預測風速。統計方法基于隨機過程理論和數理統計方法對風速序列的統計規律進行分析[3]。持續法是最簡單的統計方法,通過使用當前風速作為風速的預測,隨著預報時間的增加其性能迅速降低,但在短期風速預測中,其效果尚可,因此通常被用來作為衡量其他模型性能的一個基準方法。學習方法是利用機器學習方法實現數據建模,如人工神經網絡(Artificial Neural Network,ANN)[4-7]、支持向量機(Support Vector Machine,SVM)[8-11]等,通常這些機器學習模型都是非線性模型。
目前,人工神經網絡和支持向量機的應用正日趨廣闊。研究可知,支持向量機在解決小樣本、非線性和高維模式識別方面占據獨特優勢,受到眾多研究者的推崇與青睞。但卻也呈現出一些內在缺陷,例如,其效果高度依賴于超參數的調整,只能使用梅西核函數,不能給出分類的概率等不足。而相關向量機(Relevance Vector Machine,RVM)[12]是一個基于貝葉斯框架的稀疏概率模型,是機器學習領域中的研究熱點。與其他機器學習算法相比,具有更強的非線性映射能力與泛化能力。因此,正逐漸普及應用于各個領域的設計研發中。
在本文中,使用一個基于相關向量機和殘差分析的雙層模型預測下一時刻的風速。過程中使用相關向量機作為第一層進行風速預測,用另一種方法來處理殘差,作為第二層,最后將這兩層組合在一起,得到最終結果。第二層使用的方法不是確定的,因而研究建立了多種不同的模型來探索不同方法的性能。
1技術設計方法
1.1相關向量機
綜上論述可知,與支持向量機存在的方案缺陷不同,Tipping提出了相關向量機的方法,就充分改善了支持向量機的性能不足,且已取得了良好運行實效。
對于輸入向量{xn}Nn=1 和目標向量{tn}Nn=1,使用訓練集,可以學習得到一個模型。該模型能夠刻畫輸入和輸出的關系,因此,可使用這個模型來對從未見過的輸入x進行預測得到t。假設p(t|x)服從高斯分布N(t|y(x),σ2),并且對于一個給定的x,這個分布的均值可以被y(x)建模,y(x)的數學定義如式(1)所示:y(x)=∑Nn=1wnK(x, xn)+w0(1)其中,wn是權重,K(·,·)是核函數。這和支持向量機是相同的。
數據集的似然函數可以寫成公式(2),如下所示:p(t|w,σ2)=(2πσ2)-N/2exp{-12σ2‖t-Φw‖2}(2)其中,t=(t1,…,tN),w=(w0,…,wN),Φ是N×(N+1)維的矩陣,數學定義是 Φnm=K(xn,xm-1),Φn1=1。
模型參數可以通過最大化這個似然函數來得到,但是這通常會導致嚴重的過擬合。為此,在權重上定義一個自動相關決策機制高斯先驗如公式(3)所示:p(w|α)=∏Ni=0N(wi|0, α-1i)(3)其中,α是N+1維的超參數。
通過貝葉斯法則,可以得到權重的后驗概率,計算公式如下:p(w|t, α, σ2)=(2π)-(N+1)/2|Σ|-1/2·
exp{-12(w-μ)TΣ-1(w-μ)}(4)
Σ=(ΦTBΦ+A)-1(5)
μ=ΣΦTBt(6)其中,A=diag(α0,α1,…,αN), B=σ-2IN。
將權重帶入,推導得到超參數的邊際似然函數,其數學表述如下:
p(t|α,σ2)=(2π)-N/2|B-1+ΦA-1ΦT|-1/2·
exp{-12tT(B-1+ΦA-1ΦT)-1t}(7)
最大化公式(7)就可以得到α和σ2的值,但是最大化公式(7)不能以封閉形式得到,所以就采取了一種實用程序的方法。在實踐中,研究發現很多αi會趨向于無窮,根據公式(4),p(wi|t,α, σ2)就會無限趨近于0,對于剩下的權重不趨于0的向量,則稱其為相關向量。
1.2提出的模型
有很多原因導致單一模型不能準確預測風速,研究人員正在轉向到使用復合模型對風速進行預測。構造復合模型的方法多種多樣,如先將信號分解,并展開預測后再將結果組合在一起。但在實際中發現,使用單一模型對風速進行預測時,如果其性能較差,那么仍有信息存留在殘差里。殘差也是一個未知的序列,通過深入分析可以獲得更多的信息,從而使預測臻至理想。同時,使用LBQ(Ljung-Box-Pierce Q-Test)檢驗來測定殘差是否為白噪聲:如果不是白噪聲,就使用機器學習的方法來預測殘差,然后結合這2次預測的結果,就可以得到最終的預測;如果是白噪聲,就使用模型一的結果作為最終預測。模型的結構流程如圖1所示。
圖1中的2個模型可以是各種機器學習模型。本文構建了4個兩層預測模型,分別是RVR-RVR、RVR-SVR、SVR-RVR和SVR-SVR,并針對不同模型的性能給出了研究對照。
2實驗
2.1數據
本文研究使用從美國國家數據浮標中心[13]檢索到的風速數據,這些監測站點都位于美國。實驗中使用了2個數據集,屬于不同的位置。一個是在夏威夷北部的51 000站,另一個是位于普利茅斯島西南部的42 060站,這2個監測站都在海洋里。數據集中的物理量包括WDIR、WSPD、GDR和GST。WDIR是每10 min的平均風向,使用從正北開始的順時針角度度量;WSPD是每10 min的平均風速,單位是m/s。GDR和GST數據值多為99或999,這意味著數據丟失了,所以可利用的數據只有風向和風速。如果考慮風速,這是風速矢量預測的問題。但是,這里首先不考慮風速,而只研究標量風速預測的問題,因此,待研究的數據是風速序列。
過程中,對每個位置選擇5段數據進行實驗。每段數據被劃分成2部分:90%用于訓練,10%用于測試。在訓練集中有5 400個樣本,在測試集中有600個樣本。預測下一時刻的風速,即10 min后的風速。
2.2實驗結果
在訓練RVR和SVR時,使用網格搜索法提高泛化能力和避免過度擬合。在測試時,使用均方根誤差(RMSE)度量模型性能。這些模型在2個位置的預測誤差分別可見表1和表2。為了使分析簡單,進一步計算每個模型在所有組實驗中的平均相對誤差,可見表3。
3分析
從表1和表2可以看到,RVM和SVR的結果大部分時候是類似的,在某些情況下,RVM比SVR好。從表3則可以看出,單層模型中,RVM比SVR好。RVM-RVM和RVM-SVR性能最好,兩層模型都優于單層模型。
3結束語
在本文中,設計提出了一個兩層模型來預測短期風速,通過從殘差中提取信息,以提高風速預測的準確性。論文研究了4個兩層模型和2個單層模型,根據RMSE對這些模型進行了比較,并可推得結論如下:
(1)RVM-RVM和RVM-SVR性能最好。
(2)RVM優于SVR。
(3)從平均意義上來說,兩層模型好于單層模型。
本文只使用了歷史風速數據進行預測,在后續研究中,將使用更多數據如氣溫、氣壓和濕度等氣象信息,以及其它站點的數據,共同預測某一個站點未來的風速,旨在從這些數據中挖掘出更多信息,從而對風速做出更為科學、準確的預測。
參考文獻
[1] LOWERY C, O'MALLEY M. Impact of wind forecast error statistics upon unit commitment[J]. IEEE Transactions on Sustainable Energy, 2012, 3(4): 760-768.
[2] CASSOLA F, BURLANDO M. Wind speed and wind energy forecast through Kalman filtering of numerical weather prediction model output[J]. Applied energy, 2012, 99: 154-166.
[3] CADENAS E, RIVERA W. Wind speed forecasting in three different regions of Mexico, using a hybrid ARIMA–ANN model[J]. Renewable Energy, 2010, 35(12): 2732-2738.
[4] AKINCI T C. Short term wind speed forecasting with ANN in Batman, Turkey[J]. Elektronika ir Elektrotechnika, 2015, 107(1): 41-45.
[5] WANG Jianzhong, HU Jianming, MA Kailiang, et al. A self-adaptive hybrid approach for wind speed forecasting[J]. Renewable Energy, 2015, 78: 374-385.
[6] YOUSEFI M, HOOSHYAR D, YOUSEFI M, et al. An artificial neural network hybrid with wavelet transform for short-term wind speed forecasting: A preliminary case study[C]//Science in Information Technology (ICSITech), 2015 International Conference on. Yogyakarta, Indonesia:IEEE, 2015: 95-99.
[7] SHUKUR O B, LEE M H. Daily wind speed forecasting through hybrid KF-ANN model based on ARIMA[J]. Renewable Energy, 2015, 76: 637-647.
[8] MOHANDES M A, HALAWANI T O, REHMAN S, et al. Support vector machines for wind speed prediction[J]. Renewable Energy, 2004, 29(6): 939-947.
[9] ZHOU Junyi, SHI Jing, LI Gong. Fine tuning support vector machines for short-term wind speed forecasting[J]. Energy Conversion and Management, 2011, 52(4): 1990-1998.
[10]DU Ying, LU Jiping, LI Qing, et al. Short-term wind speed forecasting of wind farm based on least square-support vector machine[J]. Power System Technology, 2008, 32(15): 62-66.
[11]LIU Da, NIU Dongxiao, WANG Hui, et al. Short-term wind speed forecasting using wavelet transform and support vector machines optimized by genetic algorithm[J]. Renewable Energy, 2014, 62: 592-597.
[12]MICHAEL E. Sparse Bayesian learning and the relevance vector machine[J]. Journal of machine learning research, 2001, 1(3): 211-244.
[13]National Data Buoy Center. Historical Data [EB/OL]. [2017-12-05]. http://www.ndbc.noaa.gov.(上接第239頁)