梁錦來,胡福金
(廣東電網有限責任公司 佛山供電局,廣東 佛山 528000)
電力系統呈現市場化趨勢,電力負荷的精準預測是其重點工作內容之一[1]。目前國內外大量研究學者針對電力負荷進行大量研究,支持向量機方法、回歸預測法等方法均屬于典型的傳統時間序列法;模糊方法以及神經網絡方法等均屬于不確定預測方向[2-4]。大量研究學者研究結果表明,對其的預測結果受很多因素影響,如天氣、溫度、工作日與否等,不同影響因素之間具有較高的非線性關系。電力負荷預測研究領域中,需重點考慮由于非線性原因對結果預測的影響[5-6]。挖掘歷史數據,利用挖掘結果中所蘊含的隱藏規律預測電力系統負荷,已成為目前電力領域主要的研究方向之一。
國外部分研究學者利用專家系統實現電力負荷預測,專家系統雖運算過程簡單,但缺少智能學習能力,不適用于復雜環境中的電力負荷預測;李國慶等人將BP神經網絡應用于電力負荷預測中[7],該方法處理非線性映射的能力較好,但容易出現極小值,缺少泛化能力;謝偉等人將模糊聚類算法應用于電力負荷預測中[8],該算法處理不確定性信息水平較差,對于具有較高非線性變化情況的電力負荷預測結果誤差過高。
研究基于電力負荷歷史數據挖掘的負荷預測算法,有效提升電力負荷預測精度。該算法利用數據挖掘方法充分分析電力系統歷史數據中所蘊含規律以及數據異常情況,處理歷史數據中存在的異常情況,避免預測結果受歷史數據中異常數據影響,選取支持向量機方法作為預測模型,預測電力負荷數據。實驗結果驗證,采用該算法預測電力負荷具有極高的有效性,可應用于電力公司的管理部門實際應用中。
選取K-means聚類算法聚類分析挖掘電力系統電力負荷歷史數據中的屬性特征量、聚類歷史數據的負荷模式。不同歷史數據樣本內數據點具有相近的歐式距離時,海量電力負荷歷史數據樣本中數據點具有更高的相似程度[9]。該聚類算法利用歐式距離將樣本數據中的數據樣本劃分為不同類別,同類別的數據相似度較高[10-12];利用該聚類算法挖掘電力負荷歷史數據的最終目標為獲取獨立的簇,且所獲取的簇需具有較高的緊湊性。
用{C1,C2,…Ci}表示全部數據樣本分類所獲取的簇,選取平方誤差E最小作為聚類目標,可得聚類公式如下:
(1)

電力負荷歷史數據具有平滑性以及相似性特征[13-14],依據所挖掘電力負荷歷史數據可檢測其中所包含的異常數據點。
Xd為單位時間內數據樣本負荷特征曲線。分析固定時間段電力負荷數據樣本負荷曲線特征Xd中待檢測參數i,利用Xd(i)表示其特征值,用Xnorm與Xnorm(i)分別表示聚類中心以及聚類中心相應參數。計算Xnorm(i)與Xnorm(i)間變化率δ(i)公式:
(2)
利用所獲取變化率確定負荷特征曲線是否存在異常數據[15],并在判定存在異常數據時及時修正。
選取灰色系統理論中的GM(1,1)模型修正電力負荷中異常數據。該模型修正電力負荷歷史數據流程如圖1所示。

圖1 異常數據修正流程
將電力負荷歷史數據中不具有異常特征的數據設置為灰色序列,選取能量函數擬合公式實施累加序列預測[16]。利用灰色系統理論所具有的累減生成功能遞推校正電力負荷歷史數據中所包含的異常數據,完成數據預處理。
采用支持向量機預測電力負荷,利用高維空間內數據實施線性回歸運算。

支持向量機函數估計表達式如下:
y=f(x)=ωφ(x)+b
(3)
式中,φ(x)與ω、b分別為非線性映射以及法向量、位移量。通過最小化處理公式估計支持向量機系數ω與b:
(4)
利用ε不敏感損失函數的特性,即稀疏數據點,對公式(3)的決策函數進一步表達如下:
(5)
式(4)屬于正則化風險泛函,其由經驗風險以及正則化2部分組成[17],利用常數c平衡正則化以及經驗風險。

(6)

(7)
通過拉格朗日乘子的引入,利用搜尋二次優化向量ω問題表示凸優化問題,可得向量ω計算公式如下:
(8)

(9)
將參數利用二次優化方法調整,控制支持向量機的泛化能力。
式(9)中,K(xi,xj)為核函數,其獲取公式如下:
K(xi,xj)=φ(xi)×φ(xj)
(10)
式中,φ(xi) 與φ(xj)表示特征空間內向量xi與向量xj映射的像。
當函數滿足Mercer條件時,即可認作核函數[18],利用核函數構造機器學習決策算法。流程圖如圖2所示。由圖2可知,基于電力負荷歷史數據挖掘的負荷預測算法預測流程如下。

圖2 負荷預測流程
(1)預處理電力負荷歷史數據。采用K-means聚類法對海量電力負荷歷史數據實施聚類,通過聚類檢測樣本中的異常數據[19],利用灰色模型修正歷史數據中的異常數據,利用完成修正的數據建立具有高度相似性特征的訓練樣本集以及測試樣本集合。
(2)對支持向量機的參數進行初始化處理。
(3)利用所獲取的訓練樣本建立負荷預測的目標函數[20],求解目標函數,獲取閾值結果。
(4)將所獲取閾值結果代入式(7)中,輸入測試樣本,獲取所需預測的固定時間負荷結果。
(5)計算預測結果的誤差函數,所計算誤差絕對值結果低于已設置正數或迭代次數滿足運算要求時,終止支持向量機學習過程,輸出預測結果;否則轉回至步驟(3)繼續迭代。
為驗證所研究基于電力負荷歷史數據挖掘的負荷預測算法預測電力負荷有效性,選取某電力公司2017—2019年電力負荷歷史數據作為實驗數據。
采用本文算法挖掘該電力公司2018年8月15日15:00—16:00的電力負荷曲線,如圖3所示。

圖3 電力負荷曲線
從圖3實驗結果可以看出,所挖掘電力公司電力負荷歷史數據建立的電力負荷曲線中存在明顯的數據異常情況,需對其校正后,提升電力負荷預測結果精度。
本文算法采用K-means聚類算法挖掘歷史數據,并采用灰色系統理論中的GM(1,1)模型校正異常數據,完成校正后的負荷曲線如圖4所示。

圖4 校正后負荷曲線
采用校正后的電力負荷歷史數據預測電力系統電力負荷,選取文獻[7]算法以及文獻[8]算法進行對比,不同訓練次數情況下的平方誤差結果見表1。

表1 平方誤差對比
從表1實驗結果可以看出,采用本文算法預測電力負荷的平方誤差明顯低于另2種方法,伴隨訓練次數的提升,不同算法預測電力負荷誤差函數均有所降低。本文算法在不同訓練次數情況下,誤差函數均明顯低于另兩種算法,說明本文算法具有較高的電力負荷預測性能,本文算法采用支持向量機模型作為電力負荷預測的分類器,有效提升電力負荷預測精度。
采用3種算法預測2020年1月10日—14日的電力負荷預測結果如圖5所示。采用3種算法預測2020年1月21日11:00—15:00的電力負荷預測結果,如圖6所示。采用3種算法預測2020年1月21日10:00—11:00的電力負荷預測結果如圖7所示。

圖5 長期電力負荷預測結果

圖6 短期電力負荷預測結果

圖7 電力負荷預測結果
從圖5—圖7實驗結果可以看出,采用本文算法可有效預測電力系統的長期、短期、超短期電力負荷,采用本文方法預測不同階段電力負荷的預測結果均與實際電力負荷相差較小。本文算法具有較高的擬合精度,驗證本文算法具有較高的電力負荷預測有效性。本文算法具有預測精度高的優勢,不僅可預測超短期電力負荷,對于電力系統短期、長期電力負荷同樣具有較高預測效果。
統計采用不同算法預測長期、短期、超短期電力負荷預測結果的平均相對誤差以及預測時間,進一步驗證本文算法預測電力負荷可靠性以及實時性,統計結果見表2。

表2 電力負荷預測性能
從表2實驗結果可以看出,采用本文算法可在較短時間內快速預測長期、短期、超短期電力負荷,預測結果的平均相對誤差明顯低于另2種算法,驗證本文算法具有極高的預測可靠性以及預測實時性。本文算法采用數據挖掘方法充分挖掘電力負荷歷史數據中異常數據,并采用灰色系統理論對異常數據實施校正,利用完成校正后的數據獲取電力負荷精準預測結果,有效提升電力負荷預測性能,提升電力系統管理性能。
利用數據挖掘方法挖掘電力負荷歷史數據,對電力負荷歷史數據實施聚類處理,通過聚類處理判斷數據中存在的異常,針對異常及時修正,利用修正后數據集建立訓練樣本以及預測樣本,獲取精準的電力負荷預測結果。實驗結果驗證了采用該算法預測的不同時間段電力負荷預測誤差均較低,具有較高的應用性能。所研究算法利用數據挖掘方法處理電力負荷歷史數據,將完成處理的數據輸入支持向量機中,可以實現電力負荷的精準預測。所研究算法具有易于實現、實用性高的優勢,可應用于電力系統管理工作中。