李響,黎燦兵,曹一家,李龍,程子霞,呂素
(1.鄭州大學電氣工程學院,鄭州 450001;2.湖南大學電氣與信息工程學院,長沙 410082;3.鄭州航空工業管理學院機電工程學院,鄭州 450015)
短期負荷預測的解耦決策樹新算法
李響1,3,黎燦兵2,曹一家2,李龍2,程子霞1,呂素1
(1.鄭州大學電氣工程學院,鄭州 450001;2.湖南大學電氣與信息工程學院,長沙 410082;3.鄭州航空工業管理學院機電工程學院,鄭州 450015)
短期負荷預測是電力系統調度的重要工作之一,但影響因素眾多,完全由算法形成決策樹易誤判。為提高精度,結合決策樹和解耦法將負荷預測分解為標幺曲線和平均負荷預測,根據不同預測條件分別對預測日的標幺曲線和平均負荷形成決策樹,決策樹前兩層由實際經驗指定,其余節點自動形成。充分考慮影響負荷的不同因素,越重要的影響因素越靠近決策樹上層,能適應各種情況下的負荷預測。在我國北方某市的實際應用表明,該法預測精度較高。
短期負荷預測;決策樹;解耦;標幺曲線;平均負荷
短期負荷預測是指預測未來數日不同時間段的負荷,是電力系統調度的基礎工作[1,2]。目前短期負荷預測常用的方法主要包括以下幾種:時間序列法、回歸分析法[3,4]、數據挖掘法[5,6]、支持向量機法[7,8]、專家系統法、人工神經網絡法[9~11]等。大量文獻針對各種方法的特點和適應性結合負荷預測的特點,針對性的進行了眾多改進。例如文獻[12]提出解耦法,將短期負荷預測分為平均負荷預測和標幺曲線預測兩個問題,分開處理可更準確地考慮不同因素的影響。文獻[13]介紹了決策樹是一種通過比較事物屬性的信息增益來提煉相關信息的有效方法,并介紹了它在短期電力負荷預測中的應用;文獻[14]將決策樹與專家系統相結合;文獻[15]提出屬性-值對的二次信息增益優化算法,通過對熵閾值的設定采用預剪枝技術克服ID3(interative dicremiser version3)算法對噪音敏感缺陷;文獻[16]引入了信息理論來研究和處理負荷變化的不確定性,提出了基于最大信息熵原理的短期負荷預測綜合模型。決策樹方法引入短期負荷預測中,有效地提高短期負荷預測方法的適應性,已被廣泛證明是提高負荷預測精度、結果可信度的有效工具。
雖然以上方法均已在各自領域取得了相應的比較豐碩的研究成果,但影響負荷變化的隨機因素眾多且規律不同,負荷受相關因素影響的規律不斷變化,不同地區呈現不同的負荷變化規律,因此,短期負荷預測仍然是電力系統研究的難點、熱點問題,同時隨著智能電網建設,大量間歇性電源并網,負荷預測進一步受到廣泛重視[17]。
本文提出基于解耦決策樹的短期負荷預測新算法,并對決策樹的形成方法進行了改進,進一步提高算法的適應性,有利于提高負荷預測準確率。
解耦是將短期負荷預測問題分解為標幺曲線和平均負荷的分析預測兩個內容。標幺曲線反應負荷變化形狀,是指當天各時段負荷除以當天平均負荷后得到的無量綱標準化曲線;平均負荷代表了負荷水平[18]。由于標幺曲線和平均負荷受相關因素影響的規律不同,因此,分開處理能得到更高的準確率。基于解耦決策樹短期負荷預測流程如圖1所示。

圖1 基于解耦決策樹短期負荷預測流程Fig.1Flow chart of short-term load forecasting based on decoupling mechanism and decision tree
首先將歷史數據(氣象、負荷數據)進行預處理,利用這些數據形成標幺曲線預測決策樹和平均負荷預測決策樹,然后結合預測日的實時數據分別選取標幺曲線和平均負荷的相似日,最后利用相似日的數據進行短期負荷預測,分別考慮平均負荷和曲線形狀,能夠有效提高預測精度。
在各種決策樹學習算法中,ID3算法最具影響,該算法選擇信息增益最大的屬性作為測試屬性,但偏向于多值屬性[19,20]。為避免在構建決策樹的過程中ID3算法忽視一些屬性的位置合理性所帶來的預測偏差,本文在構建決策樹時指定前兩層、其他層由ID3算法自動形成,針對平均負荷及標幺曲線分別形成決策樹的新負荷預測方法。
2.1 基本思路
在進行電力系統負荷預測時,需要考慮眾多影響因素:如日類型、氣溫、濕度、風速、降雨量、氣壓等;由于ID3算法偏向于多值屬性,因此會忽視一些屬性在決策樹上的位置合理性。而以上因素對負荷預測精確度的影響各不相同,所以對負荷影響越大的因素(即主導因素),應越靠近決策樹頂層。如果主導因素選擇錯誤,就會影響相似日的選取,從而影響預測精度[21]。
ID3算法的基本原理:設S是n個數據樣本的集合,將樣本集劃分為m個不同的類Ci(i=1,2,…,m),每個類Ci含有ni個樣本,則S劃分為m個類的信息熵或期望信息為

式中,pi為S中的樣本屬于第i類Ci的概率,pi=ni/n。
Sv是S中屬性A的值為v的樣本子集,即Sv= {s∈S|A(s)=v},選擇A導致的信息熵為

式中,E(Sv)為Sv中的樣本劃分到各個類的信息熵。
A相對S的信息增益為

文獻[22]提出了基于信息熵的多因素權重分配方法并驗證了其可行性。文獻[23]以保定市負荷與氣象數據為例,得出了日類型的權重值最大,即日類型對負荷影響最大,這也符合我國的實際情況,因為正常日的負荷模型具有按工作日和休息日呈周期性變化,節假日不同。如采用ID3算法自動生成決策樹,在修剪的過程中會自動修剪數據上影響較小但實際影響較大的因素,并誤將風速或者氣溫作為主導因素,則可能把不同日期劃分到了同一片樹葉下,但它們的負荷并不相似。
為了避免在構建決策樹時錯誤選擇主導因素所帶來的誤差,本文進行了如下改進。
(1)正常日和特殊日電力負荷變化規律完全不同,故在決策樹劃分中將正常日和特殊日作為決策樹的第1層。
(2)由于同一地區不同月份的氣候狀況相差很大,整個社會的用電特征也有很大不同:比如在中國大部分地區,1、2月份低溫季節,溫度和濕度較低,表現為濕冷天氣;整個5月份氣溫逐漸升高,負荷水平呈現出一個逐步上升的趨勢,為一個負荷上升沿;9月份和5月份正好相反,負荷水平呈現出一個逐步下降的趨勢,為一個負荷下降沿。故把月份作為決策樹的第2層(即正常日的下一層);由于不同地區在節假日時負荷成分、大小變化都有各自的特點,所以將每個節假日劃為第2層(即特殊日的下一層)。
(3)綜合氣溫、濕度等氣象因素利用ID3算法在第2層各個節點下面自動形成決策樹的其他節點,劃分至不同的節點進行預測。
需要說明的是,前兩層的特殊日和月份的節點可由用戶根據當地實際情況選取。
經過改進后的決策樹頂層節點模型如圖2所示。

圖2 決策樹頂層節點模型Fig.2Model of the top leave node of decision tree
2.2 平均負荷預測的決策樹
平均負荷預測決策樹用于預測待預測日的平均負荷,在構建標幺曲線的決策樹預測模型時的步驟如下。
步驟1按圖2所示指定決策樹前兩層,第1層節點為正常日和特殊日,第2層的節點可指定為月份和節假日,第2層節點的選取可以由用戶結合當地氣象等具體情況自定義。
步驟2對第2層的每個節點在歷史負荷數據中選取樣本數據,為了保證分類規則的正確率,要選取最近幾年的歷史數據,根據計算得出歷史日負荷數據平均負荷為

式中:Pav為日平均負荷;Pi為一天的第i次采樣所得負荷數據;n為一天所采樣的負荷數據次數,一般每間隔15 min采樣一次,一天共采樣96次,如果工作人員下午5∶00進行預測的話,則n取68。
步驟3將歷史日平均負荷與氣象數據隨機分為多組,選取任一組做為訓練集,其他組作為測試集進行交叉驗證,利用ID3算法自動形成平均負荷預測決策樹第2層各個節點以下的其他節點,形成平均負荷預測決策樹。
做平均負荷預測時,充分考慮日類型、歷史日與預測日之間的時間間隔、氣溫等因素,對各個歷史日與待預測日進行相似度評價,評價方法可隨著新的影響因素的出現進行修訂,將各個歷史日按照相似程度高低進行排序,并賦以權重系數。同時考慮歷史日與待預測日之間的比例關系,以保證預測值符合發展規律。
平均負荷預測模型為

式中:P為待預測日的平均負荷;ri為待預測日比歷史日高出的比例;α為平均負荷曲線平滑系數,取值區間為(0,1),αi為α的i次方,表示歷史負荷的權重呈指數衰減,防止較大幅度修正導致較大誤差;n為評價相似度中取最為相似的前n天。
2.3 標幺曲線預測的決策樹
已有的決策樹形成方法往往用歷史負荷的有名值作為形成決策樹的樣本集,本文將歷史數據標幺化后再以這些標幺值來構建決策樹。構建標幺曲線預測的決策樹模型的步驟如下。
步驟1按圖2所示指定決策樹前兩層。
步驟2選取最近幾年的歷史負荷數據作為樣本數據,將歷史日負荷數據進行標幺化,計算公式為

式中,Pi*為一天第i次采樣所得負荷數據標幺值。
步驟3將歷史日標幺曲線與氣象數據隨機分為多組,利用ID3算法自動形成平均負荷預測決策樹第2層各個節點以下的其他節點,交叉驗證后形成標幺曲線預測決策樹模型。
標幺曲線決策樹預測模型的基本思想可概括如下:
(1)將歷史數據的標幺值作為形成決策樹的樣本集和預測待預測日標幺曲線的歷史值;
(2)按照與預測日的相似程度高低,對各歷史日進行排序;
(3)考慮平滑系數,將歷史日的標幺值按照一定的權重系數進行加權平均,相似度低,歷史日標幺曲線的權重系數小,相似度高,權重系數大。
標幺曲線預測的模型為

式中:B為待預測日的標幺曲線;β為標幺曲線平滑系數,性質同α;m表示歷史日個數。
2.4 負荷預測
根據待預測日的平均負荷P及標幺曲線B,則得出預測日的負荷預測值P′為

平均負荷的穩定性往往低于標幺曲線的穩定性,平均負荷波動會影響曲線預測精度及其潛在規律,采用解耦決策樹法可以避免平均負荷對曲線形狀預測的不利影響,從而提高預測精度。
本解耦決策樹算法用JAVA程序實現,并對北方某城市2004—2008年的負荷進行了預測,年平均準確率均超過95%。
3.1 公共參數及意義
在算法中使用的參數應該用變量統一表示管理,減少程序代碼中的冗余代碼,可以把這些參數提供給預測函數接口,可以從調用預測函數時傳進來,也可以進一步用其他人工智能方法自動根據一個地區的負荷數據特性自動確定這些參數。算法中的公共參數及其意義如表1所示。
3.2 決策樹模型
依據本算法,所建立的決策樹如圖3所示,決策樹中節點數字所代表的含義如表2所示。以節點211為例說明其含義:節點211是節點21的一個分支,節點21是節點2的一個分支,表示1、2月份,節點2表示正常日。預測日劃分到節點211意味著預測日若屬于1、2月份的正常日,當最低氣溫大于低溫門檻(對應表1中的5℃),則不用考慮溫度的影響。
由于ID3算法偏向于多值屬性,而影響決策樹的因素眾多,單純采用ID3算法自動形成難免出現誤判,為了防止在決策樹上層的主導因素誤判所帶來的影響,故在決策樹形成過程中人工指定前兩層。

表1 公共參數的處理Tab.1Processing of common parameters

圖3 決策樹模型Fig.3Model of decision tree
以預測2006年10月1日(國慶節)負荷為例說明。當天的濕度為25%,平均溫度為19.775℃,最高溫度為29℃,最低溫度為14℃。若ID3算法自動形成決策樹,會選擇2006年9月30日為相似日,因為該天的氣象數據為:濕度為25%,平均溫度為20.896℃,最高溫度為27℃,最低溫度為16.7℃,與當天的氣象數據較為相似,作出的負荷預測曲線如圖4所示。因10月1日為節假日,而9月30日為工作日,電力負荷變化規律差異較大,故預測精度不高。采用解耦決策樹算法預測曲線如圖4所示,預測準確率為99.8%。
3.32008 年1月份短期負荷預測準確率統計表
對北方某城市2008年1月份做短期負荷預測,信息日取96點時,平均準確率為97.54%,每日預測精度見表3。

表2 節點編號的含義Tab.2Meaning of node numbers

圖4 兩種決策樹形成方法的負荷預測準確度比較Fig.4Load forecasting precision comparison of two kinds of the decision trees conformations
3.4 特殊日預測舉例
2008年春節為2008年2月7日,預測準確率為97.93%。預測結果如圖5所示。
3.5 正常日預測舉例
以2008年3月17日為例,預測準確率為98.31%,預測結果如圖6所示。

表3 2008年1月預測準確率Tab.3Precision rate of the load forecasting in January,2008%

圖5 2008年2月7日的預測曲線和歷史曲線Fig.5Predication curve and historical curve on February 7th,2008

圖6 2008年3月17日的預測曲線和負荷曲線Fig.6Predication curve and historical curve on March 17th,2008
本文提出的基于解耦決策樹的短期負荷預測新算法將解耦法與決策樹相結合,針對平均負荷和標幺曲線的變化規律分別采用不同的決策樹對負荷進行預測。實際負荷預測工作表明,各地負荷均受日類型和月份的影響較大,故在決策樹形成的過程中采用人工和ID3算法相結合的方法,人工指定決策樹的前兩層,而以下若干層采用ID3算法形成。這種人工與ID3算法相結合的處理方式,既保證了算法的準確性,又保證了算法的適應性。
利用該算法對北方某城市2008年的負荷數據進行虛擬預測的結果表明了該算法能夠有效地克服在決策樹頂層由于偏向于多值屬性而忽略主導因素的缺點,并能夠解決預測中試圖僅用單一方法對所有情況進行預測、調整數以適應一個地區的負荷特性、一些日期準確率升高的同時另外一些日期準確率卻下降了的矛盾,有效地提高了預測方法的合理性和預測準確率。決策樹作為人工智能的基本框架,對于提高負荷預測的合理性和精確度具有重大意義。
[1]康重慶,夏清,張伯明(Kang Chongqing,Xia Qing,Zhang Boming).電力系統負荷預測研究綜述與發展方向的探討(Review of power system load forecasting and its development)[J].電力系統自動化(Automation of Electric Power Systems),2004,28(17):1-11.
[2]康重慶,夏清,胡左浩,等(Kang Chongqing,Xia Qing,Hu Zuohao,et al).電力市場中預測問題的新內涵(New connotation of forecasting issues in electricity market)[J].電力系統自動化(Automation of Electric Power Systems),2004,28(18):1-6.
[3]康重慶,周安石,王鵬,等(Kang Chongqing,Zhou Anshi,Wang Peng,et al).短期負荷預測中實時氣象因素的影響分析及其處理策略(Impact analysis of hourly weather factors in short-term load forecasting and its processing strategy)[J].中國電機工程學報(Proceedings of the CSEE),2006,30(7):5-10.
[4]汪峰,于爾鏗,閻承山,等(Wang Feng,Yu Erkeng,Yan Chengshan,et al).基于因素影響的電力系統短期負荷預報方法的研究(Study of short-term load forecasting based on influencing factors)[J].中國電機工程學報(Proceedings of the CSEE),1999,19(8):54-58.
[5]朱六璋,袁林,黃太貴(Zhu Liuzhang,Yuan Lin,Huang Taigui).短期負荷預測的實用數據挖掘模型(Applied data mining models for short-term load forecasting)[J].電力系統自動化(Automation of Electric Power Systems),2004,28(3):49-52.
[6]劉敦楠,何光宇(Liu Dunnan,He Guangyu).數據挖掘與非正常日的負荷預測(Data mining and short-term load forecasting for abnormal days)[J].電力系統自動化(Automation of Electric Power Systems),2004,28(3):53-57.
[7]李元誠,方廷健,于爾鏗(Li Yuancheng,Fang Tingjian,Yu Erkeng).短期負荷預測的支持向量機方法研究(Study of support vector machines for short-term load forecasting)[J].中國電機工程學報(Proceedings of the CSEE),2003,23(6):55-59.
[8]王奔,冷北雪,張喜海,等(Wang Ben,Leng Beixue,Zhang Xihai,et al).支持向量機在短期負荷預測中的應用概況(Application profiles of support vector machine in short-term load forecastting)[J].電力系統及其自動化學報(Proceedings of the CSU-EPSA),2011,23(4):115-121.
[9]張志晟,段曉燕,李偉婕,等(Zhang Zhisheng,Duan Xiaoyan,Li Weijie,et al).優化動態遞歸小波神經網絡短期負荷預測模型(Short-term load forecasting model based on optimized dynamic recurrent wavelet neural network)[J].電力系統及其自動化學報(Proceedings of the CSU-EPSA),2009,21(5):30-35.
[10]尤勇,盛萬興,王孫安(You Yong,Sheng Wanxing,Wang Sun′an).基于人工免疫網絡的短期負荷預測模型(Short-term load forecasting using artificial immune network)[J].中國電機工程學報(Proceedings of the CSEE),2003,23(3):26-29,98.
[11]周佃民,管曉宏,孫婕,等(Zhou Dianmin,Guan Xiaohong,Sun Jie,et al).基于神經網絡的電力系統短期負荷預測研究(A short-term load forecasting system based on BP artificial neural network)[J].電網技術(Power System Technology),2002,26(2):10-13,18.
[12]黎燦兵,劉梅,單業才,等(Li Canbing,Liu Mei,Shan Yecai,et al).基于解耦機制的小地區短期負荷預測方法(Short-term load forecasting method of small region based on decoupling mechanism)[J].電網技術(Power System Technology),2008,32(5):87-92.
[13]葛宏偉,楊靜非(Ge Hongwei,Yang Jingfei).決策樹在短期電力負荷預測中的應用(Application of decision tree on short-term load forecasting)[J].華中電力(Central China Electric Power),2009,22(1):15-18.
[14]于希寧,牛成林,李建強(Yu Xining,Niu Chenglin,Li Jianqiang).基于決策樹和專家系統的短期電力負荷預測系統(Electric load forecast based on decision tree and expert system)[J].華北電力大學學報(Journal of North China Electric Power University),2005,32(5):57-61.
[15]栗然,劉宇,黎靜華,等(Li Ran,Liu Yu,Li Jinghua,et al).基于改進決策樹算法的日特征負荷預測研究(Study on the daily characteristic load forecasting based on the optimizied algorithm of decision tree)[J].中國電機工程學報(Proceedings of the CSEE),2005,25(23):36-41.
[16]朱成騏,孫宏斌,張伯明(Zhu Chengqi,Sun Hongbin,Zhang Boming).基于最大信息熵原理的短期負荷預測綜合模型(A combined model for short term load forecasting based on maximum entropy principle)[J].中國電機工程學報(Proceedings of the CSEE),2005,25(19):1-6.
[17]胡子珩,劉順桂,邱利斌,等(Hu Ziyan,Liu Shungui,Qiu Libin,et al).深圳電網智能化自動運行短期負荷預測系統(An auto-operating intelligent short-term load forecasting system for Shenzhen power network)[J].電網技術(Power System Technology),2005,29(23):74-79.
[18]莫維仁,張伯明,孫宏斌,等(Mo Weiren,Zhang Boming,Sun Hongbin,et al).短期負荷預測中選擇相似日的探討(Method to select similar days for short-term load forecasting)[J].清華大學學報:自然科學版(Journal of Tsinghua University:ScienceandTechnology),2004,44(1):106-109.
[19]翟俊海,張素芳,王熙照(Zhai Junhai,Zhang Sufang,Wang Xizhao).關于ID3算法的最優性證明(Verification on optimal ID3 algorithm)[J].河北大學學報:自然科學版(Journal of Hebei University:Natural Science Edition),2006,26(5):547-550,556.
[20]邵峰晶,于忠清.數據挖掘原理及算法[M].北京:中國水利水電出版社,2003.
[21]黎燦兵,李曉輝,趙瑞,等(Li Canbin,Li Xiaohui,Zhao Rui,et al).電力短期負荷預測相似日選取算法(A novel algorithm of selecting similar days for short-term power load forecasting)[J].電力系統自動化(Automation of Electric Power Systems),2008,32(9):69-73.
[22]黃定軒(Huang Dingxuan).基于客觀信息熵的多因素權重分配方法(Means of weights allocation with multi-factors based on impersonal message entropy)[J].系統工程理論方法應用(Systems Engneering-Theory Methodolgy Applications),2003,12(4):321-324.
[23]栗然,曹磊,李莉,等(Li Ran,Cao Lei,Li Li,et al).影響電力系統短期負荷預測因素的權重分析方法(Analysis for weights allocation with influence factors in power system short-term load forecasting)[J].華北電力大學學報(Journal of North China Electric Power University),2007,34(5):32-37.
New Algorithm of Short-term Load Forecasting According to Decision Tree and Decoupling
LI Xiang1,3,LI Can-bing2,CAO Yi-jia2,LI Long1,CHENG Zi-xia1,Lü Su1
(1.School of Electrical Engineering,Zhengzhou University,Zhengzhou 450001,China;2.College of Electrical and Information Engineering,Hunan University,Changsha 410082,China;3.School of Mechatronics Engineering,Zhengzhou Institute of Aeroncuctional InclustryMangement,Zhengzhou 450015,China)
Short-term load forecasting is an important foundational work for the power system dispatching.Because there were many influence factors,it was easy to produce misjudgment if the form of decision tree depended entirely on a algorithm.A new algorithm for load forecasting according to decision tree and decoupling was proposed.Short-term load forecasting was divided into the per unit curve forecasting and average load forecasting to improve precision.A new method of decision tree was raised.The layers before of decision tree were designated according to experience,and the rest was formed automatically.According to different forecasting conditions,it formed the decision trees of per unit curve forecasting and average load forecasting respectively with different forecasting formulas.The new algorithm took fully into account the discipline of different factors that influenced power load and the more important factors were near the top of tree,so it was suitable for short term load forecasting in all circumstances.The practical application in one northern city shows that this method has a higher forecast precision.
short-term load forecasting;decision tree;decoupling;the per unit curve;average load
TM715
A
1003-8930(2013)03-0013-07
李響(1979—),男,碩士研究生,講師,研究方向為負荷預測。Email:nomad0729@163.com
2012-03-28;
2012-05-17
國家高技術研究發展計劃(863計劃)項目(011AA050203);國家自然科學基金項目(51107036)
黎燦兵(1979—),男,副教授,博士生導師,研究方向為電力系統綜合節能、電網分析與控制。Email:licanbing@139.com
曹一家(1969—),男,教授,博士生導師,研究方向為電力系統穩定與控制、信息技術在電力系統中的應用等。Email:yjcao@hnu.edu.cn