宋藝航 冷媛 陳政 林慶文



摘要:文章基于貝葉斯聚類方法,對某地市30個用電行業(yè)2008年1月到2015年10月的月度用電序列進行K-Means聚類分析,結(jié)果表明,前三個類別的行業(yè)涵蓋了用電占比最高的10個主要用電行業(yè),該三個類別的行業(yè)總用電量占全社會用電量約80%,最后基于ARIMA、神經(jīng)網(wǎng)絡(luò)、灰色預(yù)測模型對主要行業(yè)類別的用電量進行測試。
關(guān)鍵詞:月度用電量;用電量預(yù)測;神經(jīng)網(wǎng)絡(luò);ARIMA;灰色預(yù)測系統(tǒng) 文獻標識碼:A
中圖分類號:TM715 文章編號:1009-2374(2017)01-0190-03 DOI:10.13535/j.cnki.11-4406/n.2017.01.090
1 概述
常用的電力系統(tǒng)負荷預(yù)測方法包括人工神經(jīng)網(wǎng)絡(luò)法、回歸分析法和時間序列分析法等,但影響用電量的因素尤其是經(jīng)濟因素是復(fù)雜多變的,僅僅依靠某單一因素來對用電量進行預(yù)測具有很大局限性。
參考文獻[4]和參考文獻[5]介紹了人工神經(jīng)網(wǎng)絡(luò)法在負荷預(yù)測中的應(yīng)用,其原理是利用訓(xùn)練函數(shù)調(diào)整網(wǎng)絡(luò)中的權(quán)值與閥值,最終擬合數(shù)據(jù)樣本函數(shù)。該方法的缺點在于無法給出明確且具有實質(zhì)意義的模型表達式,同時其預(yù)測結(jié)果對初始值等因素較為敏感。回歸分析法是負荷預(yù)測的一種重要方法,采用該方法所建立的模型的數(shù)學(xué)意義明確,數(shù)理性較強。由于該方法是基于長期穩(wěn)定的回歸關(guān)系而建立的預(yù)測模型,其短期預(yù)測精度在一定程度上受到限制,且該方法經(jīng)常無法避免偽回歸問題,其模型可能無法真實地表示負荷的變化趨勢。
聚類分析已經(jīng)滲入到圖像處理、行業(yè)研究、預(yù)警體系等每個領(lǐng)域。針對神經(jīng)網(wǎng)絡(luò)的局限性,有許多學(xué)者把聚類分析和神經(jīng)網(wǎng)絡(luò)相結(jié)合,劉興杰等利用模糊粗糙集與聚類方法,對模型輸入?yún)?shù)進行優(yōu)化,對訓(xùn)練樣本實現(xiàn)優(yōu)選,從而有效地提高了華北地區(qū)某風電場的風速預(yù)測。代倩等在光伏系統(tǒng)短期無輻照度發(fā)電預(yù)測過程中,采用自組織特征映射由云量預(yù)報信息對天氣類型聚類識別,繼而對各天氣類型采用相應(yīng)的預(yù)測網(wǎng)絡(luò),避免了單神經(jīng)網(wǎng)絡(luò)的過擬合問題。
本研究將參照以上方法,通過對某地市行業(yè)用電大數(shù)據(jù)進行分析挖掘,提出基于用電量的預(yù)測和行業(yè)分類方法,并識別出關(guān)鍵用電行業(yè),為進一步的行業(yè)用電預(yù)測及后續(xù)研究奠定基礎(chǔ)。最后,針對以自回歸移動平均(Autoregressive Moving Average,ARMA)法為代表的時間序列分析法能夠提高短期負荷預(yù)測的準確度,對于某地市的地區(qū)用電序列,本文提出一種把貝葉斯聚類方法和自回歸移動平均模型相結(jié)合的方法,在行業(yè)預(yù)測基礎(chǔ)上實現(xiàn)地區(qū)預(yù)測。該方法可以應(yīng)用到具有層次結(jié)構(gòu)的單維及多維度時間序列分析,為現(xiàn)實問題提供一種新的解決途徑。
2 基于貝葉斯聚類的行業(yè)用電量分析
2.1 數(shù)據(jù)來源
本研究的數(shù)據(jù)來源是某地市從2008年1月到2015年10月的用電分類報表,用電分類報表中的行業(yè)劃分包括多個層次,研究過程中可能存在重復(fù)選擇的問題。基于行業(yè)全覆蓋與避免重復(fù)的考慮,最終選擇了表1所示的30個分類作為最終的研究對象。按照上述30個分類,對月度用電報表進行合并和整理,并只保留報表中的“本年本月”數(shù)據(jù)列,形成研究所使用的行業(yè)分類月度用電序列數(shù)據(jù)。
2.2 聚類結(jié)果及分析
對30個用電行業(yè)從2008年1月到2015年10月(其中個別月份數(shù)據(jù)缺失,不影響聚類有效性)的月份用電序列進行K-Means聚類,結(jié)果如表2所示:
聚類結(jié)果的BSS/TTS達到94.45%,說明類別的區(qū)分度較好,聚類的有效性較高。從聚類的結(jié)果可以看出,屬于同一類別的行業(yè),用電量級較為相近。類別1、類別2和類別3中的行業(yè)涵蓋了用電占比最高的10個主要用電行業(yè),這三個類別的行業(yè)總用電量占全社會用電量
約80%。
3 行業(yè)用電量預(yù)測模型
3.1 預(yù)測模型介紹
預(yù)測模型研究,首先,需要對數(shù)據(jù)進行整理,包括有效性檢查、錯誤數(shù)據(jù)剔除與修改等。針對月度數(shù)據(jù)間隔較短特點,運用經(jīng)濟計量方法對數(shù)據(jù)進行初步統(tǒng)計,對趨勢規(guī)律、不規(guī)則變動等因素進行分析,對序列做初步的自相關(guān)分析;其次,結(jié)合模型適用性條件庫信息,通過參數(shù)檢驗(或仿真)初次篩選模型;最后,通過綜合評價體系檢驗,形成最終兼具經(jīng)濟含義與統(tǒng)計含義的用電量月度需求的預(yù)測模型、預(yù)測結(jié)果、預(yù)測區(qū)間。采用的預(yù)測模型包括ARIMA、BP神經(jīng)網(wǎng)絡(luò)、灰色預(yù)測
模型。
3.2 行業(yè)用電量預(yù)測結(jié)果
本研究綜合考慮數(shù)據(jù)的合理性及無效值出現(xiàn)的比例,對于月度數(shù)據(jù)擬采用的擬合區(qū)間(訓(xùn)練模型的數(shù)據(jù))為2010年1月到2015年9月共69期數(shù)據(jù),檢驗預(yù)測區(qū)間為2015年10月到2015年12月共3期數(shù)據(jù)。
針對月度數(shù)據(jù)時間間隔短,季節(jié)波動最為明顯的特點,研究中分別嘗試用灰色系統(tǒng)模型、BP神經(jīng)網(wǎng)絡(luò)、ARIMA模型訓(xùn)練用電數(shù)據(jù)并給出擬合誤差和預(yù)測,結(jié)果如表3所示。圖1至圖5分別為五個行業(yè)類別的預(yù)測結(jié)果圖(ARIMA結(jié)果)。
從表3可以看出,ARIMA模型相比于灰色系統(tǒng)和神經(jīng)網(wǎng)絡(luò)精度更高。五個行業(yè)的神經(jīng)網(wǎng)絡(luò)與灰色預(yù)測結(jié)果。灰色系統(tǒng)模型對于季節(jié)波動較明顯的數(shù)據(jù)無法進行擬合,對于神經(jīng)網(wǎng)絡(luò),由于訓(xùn)練樣本不足或存在某些質(zhì)量較差的數(shù)據(jù)節(jié)點等原因,無法收斂到較準確的精度,故月度用電數(shù)據(jù)預(yù)測擬采用ARIMA模型。
基于ARIMA模型,進一步給出各分類行業(yè)未來3個月(2016年1月到2016年3月)的預(yù)測結(jié)果,如表4所示。
4 結(jié)語
首先,基于貝葉斯聚類方法對各行業(yè)用電量進行分析,最終選取了5類具有行業(yè)代表性的行業(yè)類別,分析表明5類行業(yè)的用電特征具有較好的區(qū)分度;其次,根據(jù)不同用電數(shù)據(jù)的特征,分別利用月度預(yù)測模型庫中幾個有代表性的模型對關(guān)鍵用電行業(yè)數(shù)據(jù)進行預(yù)測并比較各模型精度,研究結(jié)果表明,對于月度分類行業(yè)用電序列,用ARIMA模型預(yù)測的精度較高;最后,按照與行業(yè)用電模型選擇的過程,對某地市月度用電量預(yù)測模型進行構(gòu)建。研究結(jié)果表明,針對月度地區(qū)用電序列,某地市月度用電量預(yù)測用ARIMA模型預(yù)測的精度較高,最后構(gòu)建基于分類行業(yè)的預(yù)測模型,結(jié)果表明對于該地市用電序列而言,行業(yè)分類的預(yù)測模型要比直接運用ARIMA模型預(yù)測精度高。
參考文獻
[1] 何永秀,王冰,熊威,等.基于模糊綜合評價的居
民智能用電行為分析與互動機制設(shè)計[J].電網(wǎng)技術(shù),
2011,36(10).
[2] 郝洪星,朱玉全,陳耿,等.基于劃分和層次的混合
動態(tài)聚類算法[J].計算機應(yīng)用研究,2011,28(1).
[3] 應(yīng)劭霖.數(shù)據(jù)挖掘中的聚類算法的綜述[J].江西化
工,2014,(2).
[4] 樓巍.面向大數(shù)據(jù)的高維數(shù)據(jù)挖掘技術(shù)研究[D].上海
大學(xué),2013.
[5] 陶雪嬌,胡曉峰,劉洋.大數(shù)據(jù)研究綜述[J].系統(tǒng)仿
真學(xué)報,2013,(S1).
[6] 王駿,王士同,鄧趙紅.聚類分析研究中的若干問題
[J].控制與決策,2012,27(3).
[7] 婁銀霞,程銘,文高進,等.基于FCM和遺傳算法
的圖像模糊聚類分析[J].計算機工程與應(yīng)用,2010,
46(35).
[8] 勞蘭珺,邵玉敏.中國股票市場行業(yè)收益率序列動態(tài)
聚類分析[J].財經(jīng)研究,2004,30(11).
[9] 劉興杰,岑添云,鄭文書,等.基于模糊粗糙集與
改進聚類的神經(jīng)網(wǎng)絡(luò)風速預(yù)測[J].中國電機工程學(xué)
報,2014,(19).
[10] 代倩,段善旭,蔡濤,等.基于天氣類型聚類識別
的光伏系統(tǒng)短期無輻照度發(fā)電預(yù)測模型研究[J].中國
電機工程學(xué)報,2011,31(34).
[11] 楊建萍.基于ARIMA模型的用電量時間序列建模和
預(yù)報[J].工程數(shù)學(xué)學(xué)報,2008,25(4).
[12] 毛玉鳳.基于時間序列分析的電力需求預(yù)測及季節(jié)
調(diào)整模型的研究[D].北京工業(yè)大學(xué),2013.
[13] 宋強,趙彪,劉文華,等.智能直流配電網(wǎng)研究綜
述[J].中國電機工程學(xué)報,2013,22(25).
[14] 袁旭峰,程時杰,文勁宇.基于CSC和VSC的混合多
端直流輸電系統(tǒng)及其仿真[J].電力系統(tǒng)自動化,
2006,30(20).
基金項目:本文系中國南方電網(wǎng)公司科技項目(K-KY2014-035)。
作者簡介:宋藝航(1982-),男,南方電網(wǎng)科學(xué)研究院副研究員,博士,研究方向:電網(wǎng)系統(tǒng)預(yù)測。
(責任編輯:周 瓊)