楊方圓 ,包 丹,張明理,鄧鑫陽,張 娜
(1.國網(wǎng)遼寧省電力有限公司經(jīng)濟技術(shù)研究院,遼寧 沈陽 110010;2.國家電網(wǎng)公司東北分部,遼寧 沈陽 110180)
日負荷曲線是電力公司調(diào)度部門制訂調(diào)度計劃,安排發(fā)電機組開停機組合、經(jīng)濟分配發(fā)電機組的有功出力及決定系統(tǒng)調(diào)峰容量的基礎(chǔ)。因此,研究如何實現(xiàn)日負荷曲線的精準(zhǔn)預(yù)測對提高電力系統(tǒng)經(jīng)濟效益有著重要的意義。
目前,傳統(tǒng)的短期負荷預(yù)測分析方法已不能滿足電力供需[1-10]精準(zhǔn)預(yù)測的要求,急需提高電力需求方法的預(yù)測精度。文獻[11]提出基于負荷混沌特性和最小二乘向量機的短期負荷預(yù)測模型,通過相空間重構(gòu)與訓(xùn)練決策函數(shù),避免了傳統(tǒng)人工網(wǎng)絡(luò)法容易陷入局部極值的問題。文獻[12]提出了基于聯(lián)合灰色模型和最小支持向量機回歸的電力短期負荷智能組合方法,通過機器學(xué)習(xí)確定所選單一模型的權(quán)重因子,克服了傳統(tǒng)組合模型中設(shè)定權(quán)重因子的困難。文獻[13]通過對模型關(guān)鍵參數(shù)的自適應(yīng)動態(tài)尋優(yōu),避免了最小支持向量機對設(shè)計者經(jīng)驗的過度依賴以及選擇模型參數(shù)時缺少科學(xué)依據(jù)的局限性。
本文建立基于K-means聚類算法與支持向量機的短期負荷預(yù)測模型。支持向量機的計算結(jié)果通常取決于少數(shù)的幾個關(guān)鍵樣本,采用聚類算法篩選出與待測日最相似的樣本訓(xùn)練集,在不影響支持向量機泛化能力的先決條件下有效地降低算法的復(fù)雜程度,預(yù)測結(jié)果具有較高的精度。采用以上方法對遼寧電網(wǎng)迎峰度夏期間的日負荷曲線進行預(yù)測,算例結(jié)果證明了該方法的有效性。
Κ-means聚類算法的基本原理:首先選取聚類數(shù)目k以及任意確定k個初始類簇中心點,計算每一個樣本點與k個初始類簇中心點之間的歐式距離,按最小歐氏距離的原則對所有樣本類型進行分類。反復(fù)計算類簇中心點,不斷調(diào)整樣本的分類,直至各樣本到所屬類簇中心點之間的距離平方和達到最小。
Κ-means聚類算法具有化繁為簡、快速高效的優(yōu)點,適合于巨量數(shù)據(jù)的聚類分析。該算法的缺陷是聚類數(shù)目k具有不確定性,如果聚類的數(shù)目設(shè)定不合理,將難以獲得優(yōu)良的聚類效果。
聚類的目標(biāo)是通過選取最優(yōu)的聚類數(shù)目k,使得所有樣本的聚類生成簇實現(xiàn)最優(yōu)良的效果。通常情況下,希望獲得類內(nèi)成員緊密、類間成員遠離的最佳聚類結(jié)構(gòu)。為了獲得最優(yōu)的聚類數(shù)目k,通常采用聚類有效性指標(biāo)來度量聚類算法生成簇的結(jié)果。目前,已有文獻中的聚類有效性指標(biāo)難以獲得準(zhǔn)確的最優(yōu)聚類數(shù),本文針對該問題設(shè)計了一種基于調(diào)整余弦相似度的新的Κ-means聚類算法有效性指標(biāo),該指標(biāo)可以對聚類算法劃分結(jié)果的質(zhì)量進行評價,從而獲得最優(yōu)聚類的數(shù)目k。
定義1:令待聚類的樣本數(shù)據(jù)空間為X={x1,x2,…,xn},假設(shè)n個樣本對象聚類為m類,定義第j類的第i個樣本與類間樣本的最小調(diào)整余弦相似度平均值為ic(j,i),即:
(1)

定義2:令待聚類的樣本數(shù)據(jù)空間為X={x1,x2,…,xn},假設(shè)n個樣本對象聚類為m類,定義第j類的第i個樣本與類內(nèi)樣本的調(diào)整余弦相似度平均值為為ac(j,i),即:
(2)

定義3:令待聚類的樣本數(shù)據(jù)空間為X={x1,x2,…,xn},假設(shè)n個樣本對象聚類為m類,定義第j類的第i個樣本的聚類有效性指標(biāo)為最小類間調(diào)整余弦相似度平均值與類內(nèi)夾角調(diào)整余弦相似度平均值之和、最小類間調(diào)整余弦相似度平均值與類內(nèi)調(diào)整余弦相似度平均值之差的比值IACR(j,i),見式(3)。

(3)
IACR指標(biāo)可以反映出數(shù)據(jù)集內(nèi)某個樣本的聚類效果。本文通過計算聚類空間內(nèi)所有樣本的IACR(j,i)指標(biāo)的平均值來研究數(shù)據(jù)集的聚類質(zhì)量,計算方法如式(4)所示。希望聚類生成簇后獲得類內(nèi)成員盡可能緊密、類間成員盡可能分散的最優(yōu)聚類結(jié)構(gòu),如式(5)所示,當(dāng)IACR取最大值時對應(yīng)的聚類數(shù)目為最優(yōu)聚類數(shù)目。
(4)
(5)
該算法是基于結(jié)構(gòu)風(fēng)險最小化原理的通用學(xué)習(xí)方法[14],適合于解決非線性空間的小樣本問題。支持向量機通常通過目標(biāo)極小值優(yōu)化模型來確定回歸函數(shù):
(6)
(7)

通過求解式(7)可以得到回歸函數(shù):
(8)

選取日負荷曲線相似日的流程如圖1所示。
短期負荷預(yù)測存在一定規(guī)律,即相同日類型的負荷具有相似性??紤]到工作日與節(jié)假日的負荷特性存在差異,將日類型分為工作日與節(jié)假日兩類。為準(zhǔn)確反映出氣象因素對負荷的影響,選取每天的整點氣溫、濕度、風(fēng)速作為日特征向量。本文對日類型進行初步篩選后,將日特征向量作為聚類分析的樣本。
結(jié)合遼寧電網(wǎng)的日負荷曲線歷史數(shù)據(jù)及氣象局提供的氣象特征參數(shù)歷史數(shù)據(jù),采用聚類分析與支持向量機結(jié)合的算法對日負荷曲線進行預(yù)測。通過聚類算法選取相似日,充分考慮溫度、濕度、風(fēng)速和日類型等參數(shù)的影響,利用支持向量機對遼寧電網(wǎng)的日負荷曲線進行預(yù)測。
以遼寧省的氣象數(shù)據(jù)為自變量,遼寧電網(wǎng)24 h負荷值為因變量,對2017年6月1日—8月17日的氣象歷史數(shù)據(jù)及預(yù)測日的氣象特征參數(shù)值進行聚類分析,確定最佳聚類數(shù)目,相似聚類效果如圖2所示。利用本文所介紹的方法對遼寧電網(wǎng)2017年8月18日負荷曲線進行預(yù)測,預(yù)測值與真實值的比較結(jié)果如圖3所示。

圖2 相似日聚類結(jié)果

圖3 預(yù)測日負荷的真實值與預(yù)測值比較
為了驗證本文方法的適用性與有效性,將傳統(tǒng)支持向量機與本文方法的預(yù)測效果進行比較,計算得到遼寧電網(wǎng)迎峰度夏期間的負荷預(yù)測結(jié)果如表1所示。采用本文方法計算得到2017年8月18—27日的負荷預(yù)測值,預(yù)測結(jié)果的平均相對誤差均低于3%,均方根誤差均低于3.5%。根據(jù)表2可知,采用本文的算法訓(xùn)練樣本的數(shù)目明顯減少,當(dāng)聚類數(shù)目為6,篩選后的支持向量機訓(xùn)練樣本為384個,所需的訓(xùn)練時間為傳統(tǒng)支持向量機算法的1/5。與傳統(tǒng)的支持向量機算法相比,本文提出的方法復(fù)雜程度明顯減弱,在迎峰度夏期間日負荷曲線的預(yù)測精度平均提高1.6%,實現(xiàn)良好的預(yù)測效果。

表1 負荷預(yù)測誤差比較

表2 本文算法與傳統(tǒng)支持向量機算法訓(xùn)練速度的對比
本文提出一種相似日聚類算法與支持向量機算法結(jié)合的迎峰度夏期間負荷預(yù)測方法。此方法融合聚類算法與支持向量機兩者的優(yōu)勢,實現(xiàn)優(yōu)勢互補。利用遼寧電網(wǎng)迎峰度夏期間的日負荷曲線進行建模驗證,采用本文方法得到的日負荷曲線預(yù)測值,平均相對誤差在3%以內(nèi),樣本訓(xùn)練的時間也大幅減少。該算例證明了本文預(yù)測方法的適用性與有效性。