孫志剛, 翟瑋星, 李偉倫, 衛志農
(1.南通供電公司, 南通 226006; 2.河海大學能源與電氣學院, 南京 210098)
基于EMD和相關向量機的短期負荷預測①
孫志剛1, 翟瑋星2, 李偉倫1, 衛志農2
(1.南通供電公司, 南通 226006; 2.河海大學能源與電氣學院, 南京 210098)
為提高電力負荷預測的準確性,提出一種基于經驗模態分解EMD(empirical mode decomposition)與相關向量機RVM(relevant vector machine)的短期負荷預測方法。該方法利用EMD將目標負荷序列分解為若干個不同頻率的固有模態分量IMF(intrinsic mode function),通過分析各個分量的特征規律,構造不同的RVM模型對各分量分別進行預測,再將各分量預測值通過RVM組合得到最終預測值。仿真結果表明,通過EMD分解,預測效果有顯著改善,而RVM模型較之BP神經網絡模型與SVM模型具有更高的預測精度。
經驗模態分解; 相關向量機; 固有模態分量; 短期負荷預測
電力負荷預測是電力系統調度、用電、計劃、規劃等管理部門的重要工作之一[1]。短期負荷預測是負荷預測的重要組成部分,它對于機組最優組合、經濟調度、最優潮流、電力市場交易等都有著重要的意義。負荷預測精度越高,越有利于提高發電設備的利用率和經濟調度的有效性[2]。
短期負荷預測的研究已有很長歷史,國內外的許多專家、學者在預測理論和方法方面作了大量的研究工作,取得了卓有成效的進展[2]。現有的預測方法主要有時間序列法[3]、人工神經網絡法[4]、支持向量機法[5]及小波分析法[6]等。而其中的小波分析法是通過小波變換,將負荷分解到不同的尺度頻率分量上,然后根據各個尺度上負荷波動的方式,選用不同的預測方法進行預測。
由于小波變換的變尺度分析能力及對局部時間區間信息的“顯微”能力,使其在負荷預測及電力系統其他方面的研究中都有廣泛的應用。但是小波變換本質上是窗口可調的傅里葉變換,它并沒有擺脫傅里葉分析的局限,不能用于處理非線性問題,且在計算過程中需要人為地選擇小波基和分解尺度,主觀因素對分解結果影響較大。
鑒于此,本文應用了一種新的時頻分析方法,即經驗模態分解(EMD)方法[7],該方法是由Huang在1998年提出的Hilbert-Huang變換中的核心部分。EMD本質上是對一個信號進行平穩化處理,其結果是將信號中不同尺度的波動或趨勢逐級分解開來,產生一系列具有不同特征尺度的數據序列,每一個序列即為一個IMF分量[8]。EMD方法較之小波變換及其他信號處理方法都有更高的分辨率及很強的非線性處理能力,因此越來越多地引起國內外學者的關注和研究[8,9]。
由于負荷的隨機因素太多,非線性極強,通過EMD分解可以得到平穩的IMF分量。對各分量進行分析研究,就可以選擇合適的預測模型進行分別預測。文獻[10]采用支持向量機SVM(support vector machine)對各IMF分量進行分別預測,然后將各分量預測值輸入到新的SVM中得到最終的預測值。文獻[11]則采用相匹配的BP(back propagation)神經網絡分別預測,然后通過自適應線性神經網絡組合得到最終的預測值。
相關向量機(RVM)是由Tipping提出的基于總體貝葉斯框架下的稀疏概率模型,是近來機器學習領域的研究熱點之一。相關向量機不僅擁有支持相量機(SVM)的工作性能,同時具有一些SVM所不具備的優點,如RVM的核函數K不必滿足Mercer條件;RVM在權系數之上引進了超參數,從而大大降低了計算的復雜度等。
因此,本文嘗試用RVM對EMD分解得到的各IMF分量分別進行預測,然后再用RVM將所有分量預測結果組合得到最終的預測值。算例結果表明,基于該方法的短期負荷預測可以有效的提高預測精度。
1.1 經驗模態分解方法
首先對固有模態函數(IMF)做一個簡要描述。直觀上,固有模態函數具有相同的極值點和過零點數目,且都對稱的服從于局部零均值。一個固有模態函數必須滿足以下兩個條件:一是在整個數據序列中,極值點的個數與過零點的個數必須相等或最多相差不多于一個;二是在任意時刻點,由極大值點定義的上包絡線和由極小值點定義的下包絡線的平均值為零[7]?;谝陨蠈MF的定義,EMD分解算法如下[7]。
步驟1確定待處理序列x(t)的所有極大值點序列和極小值點序列。用三次樣條插值方法分別擬合極大值序列與極小值序列,得到x(t)的上包絡線vmax(t)和下包絡線vmin(t)。
步驟2求出上下包絡線的均值包絡線m1(t),即

(1)
并計算x(t)與m1(t)之差
h1(t)=x(t)-m1(t)
(2)
步驟3判斷h1(t)是否滿足IMF的兩個條件,若滿足,則h1(t)為第一個IMF;若不滿足,則將h1(t)視為新的待處理序列,重復步驟1和步驟2k次,得到
h1k=h1(k-1)-m1k
(3)
使得h1k(t)滿足IMF的條件,記c1(t)=h1k(t),則c1(t)為x(t)的第一個IMF。
步驟4將r1(t)=x(t)-c1(t)作為新的待處理序列,重復以上步驟,得到n個IMF,當r(t)變成常數或單調函數,不能再從中提取滿足IMF的分量時,分解過程結束。這樣原始序列x(t)就可以表示為
(4)
1.2 相關向量機預測方法
支持向量機在電力系統負荷預測中已經得到了較為成功的應用,但也存在不足之處,主要表現在其支持向量個數仍顯較多,這一方面可能造成過擬合,另一方面則增加了計算時間;SVM的核函數必須滿足Mercer條件,且懲罰因子需要人為設定,其對結果有很大影響。這些不足使得支持向量機在實際應用中仍受到一定限制。相關向量機作為總體貝葉斯框架下的概率模型,正好能彌補這些不足,這對于實際問題的解決是有很大幫助的。以下簡要介紹RVM的基本理論[12]。
(5)
式中:w為權參數向量,w=(w0,w1,…,wN);ξn為獨立同分布的零均值高斯噪聲,其方差為σ2;φi(x)為非線性基函數,φi(x)≡K(x,xi),K(·)為核函數。


(6)
式中:t=(t1,…,tN)T;Φ=[φ(x1),φ(x2),…,φ(xN)]T,φ(xN)=[1,K(xn,x1),K(xn,x2),…,K(xn,xN)]T。
由于模型中存在較多參數,采用最大似然估計由式(6)得到的w和σ2容易導致過擬合,為此,采用稀疏貝葉斯原理對w賦予零均值高斯先驗分布得

(7)
其中α為N+1維超參數向量。這樣,每一個權重就單獨地對應一個超參數,從而控制先驗分布對各參數的影響,以確保相關向量模型的稀疏性。
以上在定義了先驗概率分布及似然分布以后,根據貝葉斯原理,就可以求得所有未知參數的后驗概率分布為

exp{-(w-μ)TΣ-1(w-μ)}
(8)
其中,后驗協方差矩陣為
Σ=(σ-2ΦTΦ+A)-1
μ=σ-2ΣΦTt
A=diag(α0,α1,…,αN)
為了確定模型權值,首先需要得出超參數的最佳值,可以通過迭代算法求得,即
(9)

(10)
式中:μi為第i個后驗平均權;Nii為后驗協方差矩陣第i個對角元素;N為樣本數據個數。
若給定新的輸入值x,則相應輸出的概率分布服從高斯分布,即

(11)
其中的預測均值為y*=μTφ(x*),則y*即可作為t*的預測值。
2.1 負荷序列的經驗模態分解與分析
2.1.1 負荷序列分解
電力系統負荷序列是一種典型的具有周期性、隨機性和趨勢性的非平穩時間序列,通過EMD分解,可以得到若干個不同頻率的平穩的IMF,從這些若干個不同的IMF可以更明顯地看出原負荷序列的周期性、隨機性和趨勢性。文獻[13]通過對日用電量進行經驗模態分解,來挖掘負荷特性及因素的影響作用。本文則試圖對連續日的負荷曲線進行分解分析,以求得到其內在的固有特性。
圖1為某地區2009年夏季8月1日到8月15日連續15 d(小時負荷曲線)共360個數據點的負荷序列及其分解得到的IMF分量及余項。由圖可以看出該地區電力系統負荷序列經EMD分解后自適應地解析出5個IMF分量和一個趨勢項,所有的IMF按從高頻到低頻的順序排列。

圖1 原始負荷及EMD分解分量
2.1.2 各IMF特征分析
為了對各IMF建立有效的預測模型,本文主要從周期性及與溫度的相關性方面分析各IMF的不同特征。與文獻[13]相同,本文也采用文獻[14]提供的方法計算各IMF的平均周期。溫度指標一般為日最大、最小、平均溫度,與小時負荷對應的逐時溫度變化數據較難獲得,因此本文將上述15 d的IMF分量仍然按天排列,并選取同一時刻不同日的各IMF分量與日最大溫度、日最小溫度、日平均溫度進行相關性分析。分析結果如表1所示。

表1 各IMF特性分析表
對于周期性分析,由表1的計算結果,IMF1的平均周期約為5 h,這與一天內工作時間與休息時間用電規律差異有關,反映了該分量在一天內的波動情況,但其規律性不明顯,具有一定的隨機性;IMF2的平均周期為12 h,反映了由于生活生產規律所引起的用電差異,該分量已具有較為明顯的周期性;IMF3~IMF5的周期幅度較大,分別為一天、一周和兩周,它們波動平滑,周期性明顯,反映了以天為單位的負荷的周期性變化。余項則反映了負荷序列的整體走向。
與溫度的相關性分析,由表1可以看出,溫度指標中日最高溫度與各分量的相關性最強,這說明夏季最高溫度對負荷的影響較為明顯。而日最高溫度又與IMF1和IMF2的相關性最強。這是由于IMF1和IMF2反映的都是負荷在一天內的變化特性,這種一天內的負荷變化會受到溫度的影響。IMF3-IMF5及余項與溫度的相關性相對較低,這說明負荷較為規律的周期性變化受溫度的影響較小。當然不同時刻點的IMF分量與溫度的相關系數不盡相同,但表征的相關性程度都是一致的。
2.2RVM預測模型的建立
2.2.1 RVM模型輸入變量的確定
RVM預測模型采用多輸入、單輸出的一步預測方法對一天24點負荷分別建立模型進行預測。
根據各IMF分量的不同特性,選擇適合各分量的輸入變量建立預測模型,可以有效提高預測精度。依據第2.1節中對各分解分量的分析,表2列出了各個分量預測模型的輸入變量。其中y(t,d)表示預測第d天第t時刻的負荷,x的表示含義與y類似,T(d)表示第d天的最高溫度,D表示第d天的日類型。

表2 各分量預測模型的輸入變量
對于隨機分量,其平均周期為5 h,因此輸入變量中包含預測日前一天的前5 h負荷數據。對于節假日,可以選擇上一個節假日對應的前5 h的負荷,由于隨機分量反映的是一天內負荷的變化情況,其受到溫度及日類型的影響,因此輸入變量中亦包含預測日的日最高溫度及日類型。
周期分量IMF2既反映了負荷在一天內的變化規律,又包含較為清晰的周期性,且與溫度及日類型的相關性較強,因此輸入變量中即包含與預測時刻相領近的負荷點(為方便起見,仍選擇前5 h的負荷),又包含相同時刻不同日的負荷和日最高溫度及日類型。周期分量IMF3~IMF5的周期性較為明顯,都是以一天為最小單位周期變化,因此輸入變量選擇連續7 d同一時刻的負荷數據。
余項的趨勢性較為顯著,因此輸入變量選擇連續多日的相同時刻負荷數據即可,本文選擇連續10 d對應時刻點的數據。
2.2.2 RVM模型參變量的確定
本文選用徑向基RBF(radial basis function)核函數作為RVM模型的核函數。而RVM預測模型中超參數α通過訓練可以自適應得到最優值,無需人為確定,但是為了保證RVM模型的最優性,核函數的寬度δ2的確定至關重要,因此為了避免人為確定帶來的主觀性,本文采用遺傳算法來分別獲得每個RVM模型的最優參數值,選取平均絕對百分誤差MAPE(mean absolute percentage error)作為算法的評價函數,其計算式為
(12)

2.3 基于EMD與RVM的短期負荷預測模型
通過以上EMD分解及RVM預測模型的建立,可以得到本文所提的基于EMD-RVM的短期負荷預測模型,如圖2所示。

圖2 EMD-RVM短期負荷預測模型
為了驗證算法的有效性,本文以江蘇省南通市2009年5月1日~8月6日的負荷數據及氣溫、日類型作為訓練樣本,預測8月7日全天24點的負荷值。預測誤差采用如式(12)的平均絕對百分比誤差MAPE。
本文采用BP神經網絡方法、SVM方法及RVM方法對未分解的原始負荷序列及經過分解后的負荷序列分別建立預測模型,預測MAPE如表3所示,為便于觀察,圖3僅畫出RVM及EMD-RVM模型的預測結果。由表3可以看出,對于未進行分解的情況,機器學習方法的預測效果明顯好于神經網絡方法。在機器學習方法中,RVM的預測效果也要好于SVM,且通過統計,SVM模型中支持向量的個數為63個,而RVM模型中相關向量的個數僅為19個,RVM模型更加稀疏。經過EMD分解后,各方法的預測精度均有不同程度的提高,分別為0.71%、0.65%和0.83%,其中EMD-RVM提高的幅度也略為占優。圖3能夠清晰地顯示經過EMD分解后預測效果的改善情況,特別對于負荷極大值及附近的時刻點,EMD-RVM模型能夠更好地反映負荷局部特征,提高預測精度。
表3各預測模型的MAPE
Tab.3MAPEofeachmodel%

模型未分解EMD分解BP3.282.57SVM2.461.81RVM2.091.32

圖3 RVM及EMD-RVM預測結果
本文提出了基于經驗模態分解與相關向量機的短期負荷預測模型。利用EMD自適應地將非平穩的負荷序列分解為不同尺度的IMF分量,根據各分量的不同特征,分別建立RVM模型進行預測,最后再用RVM對分量預測結果進行組合得到最終的預測結果,仿真結果表明,RVM模型較之BP神經網絡與SVM模型,預測精度有較為明顯提高,且模型更為稀疏。而通過EMD分解后,各方法的預測精度能夠進一步提高,且EMD-RVM提高的幅度也更大。
[1] 牛東曉,曹樹華,盧建昌,等.電力負荷預測技術及其應用[M].2版.北京:中國電力出版社,2009.
[2] 康重慶,夏清,劉梅.電力系統負荷預測[M].北京:中國電力出版社,2007.
[3] Yang Hong-Tzer, Huang Chao-Ming. New short-term load forecasting approach using self-organizing fuzzy ARMAX models[J].IEEE Trans on Power Systems,1998,13(1):217-225.
[4] 李林川,夏道止,楊振平,等(Li Linchuan, Xia Daozhi, Yang Zhenping,etal). 應用人工神經網絡進行短期負荷預測(Short-term load forecasting using artificial neural network)[J].電力系統及其自動化學報(Proceedings of the CSU-EPSA),1994,6(3):33-41.
[5] 李云飛,黃彥全,蔣功連(Li Yunfei, Huang Yanquan, Jiang Gonglian).基于PCA-SVM的電力系統短期負荷預測(Short-term load forecasting based on PCA-SVM)[J].電力系統及其自動化學報(Proceedings of the CSU-EPSA),2007,19(5):66-70.
[6] 宋超,黃民翔,葉劍斌(Song Chao, Huang Mingxiang, Ye Jianbin).小波分析方法在電力系統短期負荷預測中的應用(The application and problems of wavelets used in short-term power load forecasting)[J].電力系統及其自動化學報(Proceedings of the CSU-EPSA),2002,14(3):8-12.
[7] Huang N E, Shen Z, Long S R. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].The Royal Society, 1998, (454):903-995.
[8] 高磊(Gao Lei).HHT理論在電力系統中的應用研究(Research on the Application of HHT Theory to Power System)[D]. 吉林:東北電力大學電氣工程學院(Jilin: School,Electrical Engineering of Northeast Dianli University),2006.
[9] Robertson H J, Soraghan J J,Idzikowski C,etal. EMD and PCA for the prediction of sleep apnoea: a comparative study[C]∥IEEE International Symposium on Signal Processing and Information Technology, Cairo, Egypt: 2007.
[10]祝志慧,孫云蓮,季宇(Zhu Zhihui, Sun Yunlian, Ji Yu).基于EMD和SVM的短期負荷預測(Short-term load forecasting based on EMD and SVM)[J].高電壓技術(High Voltage Engineering),2007,33(5):118-122.
[11]鄭艷秋(Zheng Yanqiu).基于經驗模式分解和神經網絡的短期電力負荷預測方法研究(Research on Short-Term Power Load Forecasting Based on Empirical Mode Decomposition and Artificial Neural Network)[D].重慶:重慶大學電氣工程學院(Chongqing: College of Electrical Engineering,Chongqing University),2009.
[12]Tipping M E. Sparse Bayesian learning and the relevance vector machine[J].Journal of Machine Learning Research ,2001,1(3):211-244.
[13]牛東曉,李媛媛,乞建勛,等(Niu Dongxiao, Li Yuanyuan, Qi Jianxun,etal).基于經驗模式分解與因素影響的負荷分析方法(A novel approach for load analysis based on empirical mode decomposition and influencing factors)[J].中國電機工程學報(Proceedings of the CSEE),2008,28(16):96-102.
[14]梁強,范英,魏一鳴(Liang Qiang, Fan Ying, Wei Yiming).基于小波分析的石油價格長期趨勢預測方法及其實證研究(A long-term trend forecasting approach for oil price based on wavelet analysis)[J].中國管理科學(Chinese Journal of Management Science),2005,13(1):30-36.
Short-TermLoadForecastingBasedonEMDandRVM
SUN Zhi-gang1, ZHAI Wei-xing2, LI Wei-lun1, WEI Zhi-nong2
(1.Nantong Power Supply Company,Nantong 226006, China; 2.School of Energy and Electrical, Hohai University, Nanjing 210098, China)
In order to improve the accuracy of power system load forecasting,a load forecasting model based on empirical mode decomposition(EMD)and relevant vector machine(RVM)is proposed.Using the EMD,this method decomposed the target load sequence into a number of different frequency components of the intrinsic mode function(IMF).By analyzing the characteristics of various components of the law,different models to forecast each component separately were consturcted using RVM,and then these forecasting results of each IMF are combined with RVM to obtain final forecasting result.The simulation results show that the predictive validity based on decomposition by EMD has been improved significantly,and RVM method has higher precision and greater generalization ability than SVM method and the BP neural network method.
empirical mode decomposition(EMD); relevant vector machine(RVM); intrinsic mode function(IMF); short-term load forecasting
2010-04-15
2010-08-30
TM715
A
1003-8930(2011)01-0092-06
孫志剛(1977-),男,工程師,研究方向為電網規劃。Email:szg2035@sina.com 翟瑋星(1985-),男,碩士研究生,研究方向為電力系統負荷預測。Email:zwx-zwx1985@tom.com 李偉倫(1977-),男,工程師,研究方向為電網規劃。Email:lwl267@hotmail.com 衛志農(1962-),男,博士,教授,博士生導師,研究方向為電力系統運行、分析與控制和輸配電自動化等。Email:wzn_nj@263.net