王 運,孫小湘,祁 鑫,張天睿,陳 婧
(1.寧夏電力調度控制中心,寧夏銀川 750001;2.北京清能互聯科技有限公司,北京 100084)
化石能源的過度消耗所帶來的能源枯竭、環境污染問題,催生出了新能源技術。其技術種類多樣、發展迅速,并具有較高的滲透率,這對電網的短期負荷預測提出了較大挑戰。
目前,常用的負荷預測技術包括時間序列預測、神經網絡和卡爾曼濾波估計器,具體實現方法包括基于長短期記憶(LSTM)的電器行為學習、人工神經網絡、基于遺傳的多層感知以及模糊專家系統等。
該文使用聚類技術,基于卡爾曼濾波技術與小波神經網絡設計了短期電網負荷預測算法。
電網短期負荷的消耗特征定義方式種類繁多,因此該文使用聚類技術[1]在數據分析軟件R-studio和Matlab的輔助下,采用統計分析方法定義短期消耗的特征[2],建立具有共同特征的數據共同區域[3]。創建聚類區域后,將數據提供給后續估計算法進行預測,進而減少預測數據的誤差[4]。降低誤差的關鍵因素為數據群的大小及數量。故嘗試使用不同的集群數量與大小組合,并驗證預測數據及實際數據的誤差[5],經統計分析后得出結論。電網負荷數據聚類的最佳選擇,是將其聚類到6 個不同的簇數[6]。通過多次實驗可知,若簇數大于8 或小于2,則后續識別算法無法正常工作,因此數據分類簇數的最佳選擇為6。
基于樸素的K-means 技術對負載段進行聚類時,定義Z為具有t個實例的數據,可將Z分類為K個不相交的聚類S1,S2…,SK[7]。則誤差E可由下式定義:
其中,μ(Si)是簇Si的質心。D(y,μ(Si))是數據點y與μ(Si)之間的距離,即任何數據點的歐幾里德距離。而對于數據yi=(yi1,yi2,…,yin)與yj=(yj1,yj2,…,yjn)的歐式距離可通過下式定義:
該文使用多種預測模型,將聚類數據聚合到預測混合模型中,如圖1 所示。

圖1 輸入輸出聚類預測聚合模型
如圖1 所示,將數據首先送入聚類算法,再把聚類后的數據送入不同的預測模型以選擇最佳預測模型組合,然后將數據聚合為一個模型。
卡爾曼濾波預測器是使用線性動力系統進行狀態估計的最常用方法之一,該模型定義如下:
小波神經網絡(WNN)具有與人工神經網絡(ANN)相同的能力,其在隱藏層中具有不同的激活函數[8]。由于激活函數為局部小波函數,WNN 具有更緊湊的技術與學習速度,輸出類似于ANN 方式的加權小波總和[9]。定義wjk為隱藏單元j和輸入單元k之間的權重[10],則加權輸入總和定義為fj(n):
式中,xk(n)為第k個輸入。每個隱藏神經元的輸出定義為:
其中,ψ為小波函數,aj(n)定義為尺度,bj(n)為隱藏神經元中小波函數的平移系數。輸出神經元的輸入f(n)與輸出y(n),wij是輸出i與隱藏單元j之間的權重,由以下等式定義[11]:
式中,σ表示輸出與輸入間的映射關系。
由于特征構建和選擇在基于神經網絡的預測模型中起著重要作用,因此該文深入分析了基于神經網絡中的權重選擇特征及其重要性[12]。表1 顯示了數據集的R2 得分,其用于表征數據擬合的優度,是預測任務的重要特征。

表1 數據集的單輸出模型結果
為了解決特征重要性的表征問題,將不同輸入特征的神經網絡權重歸一化后進行評估。這提供了特征重要性的定性描述,但沒有準確的結果分析[13]。MT1-OP20 實驗中存在代表電力生產周期時間滯后特征的權重較高(R2 得分為0.6 以上),而MT1-OP10基線數據和MT2-OP10 測試集數據中存在的其他時間滯后和移動平均特征的歸一化權重均低于0.151。由此表明,電力生產與非電力生產時間之間的區別較為重要。因此,預測模型中需要引入電力生產計劃這一重要特征[14]。
圖2 展示了獨立的超參數值對預測性能的影響。文中涉及的超參數包括特征個數、不同算子以及隱藏單元數量[15]。

圖2 各類因素對預測性能的影響
圖2(a)表明,特征個數為200 時,訓練集誤差顯著變大,因此較大的特征集有明顯的缺點。因此需要針對每個新數據集調整超參數,從而在給定搜索空間內找到最佳組合[16]。
經過實驗可以發現,訓練過少會導致訓練集和測試集欠擬合。而訓練過多則會導致模型過擬合,從而使得測試集性能不佳。因此,該文使用以下策略防止過擬合的發生:一旦驗證數據集的性能開始下降,則停止模型訓練;圖2 的三個超參數對系統影響表明,無法確定具有一般意義的超參數設置規則,這說明需要針對每個新數據集進行超參數調整。
為了評估此次的混合模型,采用真實數據集進行訓練。數據運行環境采用了運行在Intel i3-2370MCPU 和2 GB RAM 上的Matlab 計算軟件,并使用2020 年1-12 月的電力負載值來訓練WNN。同時,采用了2021 年1-12 月的數據來測試WNN。每小時的預測結果如圖3 所示,Y表示模型輸出的百分比誤差。基于雙層預測模型的百分比誤差分別為3.8%和3.81%,ANN 預測模型的百分比誤差分別為2.2%和2.23%,基于混合預測模型的誤差百分比均為1.24%。

圖3 每小時預測誤差實驗
每日的預測結果如表2 所示。從表中能夠清楚地看到,基于ANN 的預測模型預測未來負荷時偏差最大。與其他兩個現有模型相比,所提出的混合預測模型預測未來負荷時偏差最小。基于混合預測模型的短期負載預測算法相比其他兩種模型更為準確。

表2 每日預測誤差實驗
預測策略的準確性與其收斂速度之間存在取舍,雙層預測模型提高了預測模型的準確性,但導致收斂速度相對較慢。混合預測模型由于采用并行的結構,在提高預測精度的同時,在執行時間方面并未付出較多的成本。圖4 為訓練數據樣本的數量對預測模型誤差性能與執行時間的影響。

圖4 訓練數據樣本數量對模型性能的影響實驗
通過圖4(a)可知,當輸入樣本的數量從30 增加到120 時,能夠改善所有模型的誤差性能。當訓練樣本數量從60 增加到120 時,對于預測模型的改進效果并不顯著。圖4(b)顯示了樣本數量對于執行時間的影響,由于訓練樣本的數量增加,人工神經網絡的訓練也需要更多時間。從圖4 中可以看出,與其他兩個模型相比,所提出的混合預測模型更具可擴展性,即擁有相對更高的穩定性。
表3 顯示了在兩組數據集上的平均絕對百分比誤差(MAPE)與3 個預測模型的迭代次數之間的關系。收斂特性(即迭代次數)表明,基于混合模型和雙層模型在幾乎相同的迭代次數中收斂至最優值。而基于ANN 的預測模型只需20-23 次迭代即可收斂至最佳目標值,但這種最小的計算負擔是通過付出高昂的預測準確性成本來實現的。因此,基于混合模型的預測算法實現了比ANN 模型和雙層預測模型略高的運算性能。

表3 MAPE與模型迭代次數關系統計
可再生能源供需側均存在波動性和不確定性,因此負荷預測是智能電網的關鍵一環。該文針對基于聚類技術的短期負荷預測提出了混合模型,為了提高短期預測的效果,使用基于卡爾曼濾波與小波神經網絡的混合模型對電網負荷進行了短期預測。
智能電網區別于傳統的電網技術,具有較高的動態性,這為管理帶來了挑戰。此時,智能電網的信息傳輸更加高效,能為管控提供更多的參考信息。而如何在時變系統下研究電網負荷的短期預測問題,將是該研究下一步的重點。