鐘光耀, 邰能靈, 黃文燾, 李 然, 傅曉飛, 紀坤華
(1. 上海交通大學 電子信息與電氣工程學院,上海 200240;2. 國網上海電力公司,上海 200122)
隨著“雙碳”目標的提出,電力作為清潔、高效的二次能源,將在支撐社會經濟發展、服務民生用能需求、構建清潔低碳、安全高效能源體系中發揮更加重要的作用[1].電力供需平衡對于保障能源安全意義重大.配電網負荷預測是調度的基礎,其預測精度對配電網運行的可靠性、安全性與經濟性均有重要影響[2].根據時間尺度劃分,配網負荷預測可分為超短期、短期、中期和長期.在空間尺度上,系統負荷預測側重于一個城市、一個省甚至全國的負荷系統,因此負荷水平通常較高,負荷曲線相對平滑[3].微電網負荷預測側重于用戶,因此負荷水平通常較低,負荷曲線有明顯的波峰波谷和周期特性.同時微電網負荷對城市交通等因素較為敏感.隨著配網管理的精細化發展,單個配變的短期負荷預測特點與系統級短期預測不同.配電變壓器因用戶數少,負載功率呈現波動性強、非線性程度高等特點,且單個配變的短時功率受天氣和用戶偶然用電行為等因素影響.因此配變短期預測準確度較低.此外,隨著配網規模的不斷增長,負荷預測處理大量數據的效率尤為重要.
負荷短期預測方法主要有統計學方法以及機器學習方法[4].統計學方法包括卡爾曼濾波[5]、線性外推[6]、小波分解法[7]等.統計方法對時序序列的穩定性要求較高,而短期預測數據的波動與突變較為頻繁,因此難以有效反映氣象、事件等因素的非線性影響.近年來,模糊推理系統[8]、支持向量機[9]以及人工神經網絡[10]等機器學習算法逐漸應用于短期負荷預測,有效提升了模型的非線性擬合能力,其預測準確度普遍優于統計方法.隨著深度學習方法的發展,循環神經網絡以及深度置信網絡等均已應用于短期負荷預測.深度學習方法非線性擬合性強,因此有更好的預測精度[11-12].由于循環神經網絡易遇到梯度消失等問題,文獻[13]采用長短期記憶(Long Short-Term Memory, LSTM)模型進行超短期負荷預測,解決了循環神經網絡長期記憶消失的問題,并驗證了LSTM的準確性高于梯度提升以及支持向量機算法.文獻[14]在LSTM 正向傳遞基礎上增加了反向傳遞,提出了一種針對新能源系統負荷的雙向長短期記憶網絡短期預測模型.文獻[15]將 LSTM 和XGBoost 結合,利用混合模型進行負荷預測,有效提升了準確度.文獻[16]利用卷積神經網絡(Convolutional Neural Networks,CNN)提取負荷特征,再利用LSTM進行負荷預測,減小了特征提取的誤差,從而提高了預測準確度.然而,若輸入的時間序列過長,LSTM仍易出現長期信息丟失的問題,影響負荷預測準確率[17].深度學習中的Attention機制能夠自主增強局部信息的權重,增強模型的全局信息處理能力.在LSTM中引入Attention機制能夠有效突出序列中關鍵部分,提高LSTM長期信息記憶力,從而提升負荷預測時間長度以及準確性.
配電網負荷數量大且用電行為特性存在巨大差異.采用統一泛化模型訓練預測所有配變時,算法收斂性差、預測準確率低,甚至可能導致無法預測.如果逐個對單臺配變進行預測建模,雖不會產生收斂性問題,但計算資源需求大且穩健性差.通過聚類將負荷分為多個群體,針對群體進行針對性建模,能有效提升負荷預測準確度以及效率[18].文獻[19-20]、[21-22]分別對負荷序列和日負荷峰谷值進行聚類,有效提升了負荷預測的準確率.文獻[23]、[24]分別使用主成分分析法和自編碼器對負荷序列進行降維處理,提升了聚類效果.以上方法對負荷進行聚類時,僅利用負荷序列點對點的歐式距離或者部分負荷信息,喪失了負荷序列的時序特性.然而在負荷預測中,負荷的時序特性尤為重要.短期電力負荷主要受到天氣因素以及節假日等因素的影響[25].文獻[26]通過選取待預測日的影響因素相似日,構建負荷預測模型,取得了較高的預測精度.文獻[27]通過聚類挑選合適的樣本,提升了節假日的預測準確度.但相似日算法在每次預測時,都需尋找待預測日的相似日進行建模,計算較為繁瑣,且預測長度有限.
本文針對大規模配電預測中負荷用電行為以及影響因素多樣的問題,提出一種基于多維聚類的配變負荷Attention-LSTM短期預測方法.利用動態歸整算法計算了負荷序列的時序相似性,并利用改進的k-means雙層聚類方法對負荷進行聚類分析,將所有負荷分為歐式距離接近、時序相似性較高以及影響因素接近的類.再依據影響因素序列相似性對負荷數據集進行分類.針對每一類負荷的每一種影響因素序列類搭建Attention-LSTM網絡模型,并進行針對性訓練以及預測.經某配網負荷多源數據驗證,并與其他預測方法對比,證明本文所提方法準確率提升了2.75%且效率提升了616.8%.
為了避免大規模配電負荷預測過程中資源消耗過大,對所有配變進行如圖1所示的模型構建.

圖1 負荷聚類預測模型構建過程Fig.1 Process of load forecasting model construction
具體步驟如下:
步驟1由于電網數據在采集過程中,數據存在重復、缺失以及異常等問題.對配變負荷以及影響因素數據進行數據預處理,去除異常值和重復值以及插入缺失值.
步驟2對每個配變提取日負荷特征值,通過非參數核擬合得到代表配變日負荷特征的典型日負荷序列.以典型日負荷序列作為配變的日負荷特征,能夠減少配變聚類的數據量和提升聚類的準確度.
步驟3依據典型日負荷序列對所有配變進行聚類分析,輸出共k′類的配變負荷分類結果.通過聚類降低了模型數量,提高了預測效率.
步驟4依據步驟3的配變負荷分類結果,對每一類配變負荷進行影響因素序列分類,輸出共k″類的影響因素分類結果.通過影響因素序列分類使每一個分類結果對應的負荷序列變化趨勢接近.
步驟5通過步驟3和4,得到k′k″類配變負荷和影響因素序列分類結果.對每一個分類結果構建相應負荷預測模型.
步驟6在配變負荷預測階段,每個配變選擇相應的模型,得到最終負荷預測結果.
若將配變每日負荷序列加入聚類集合中,不僅造成聚類算法復雜度增大、效率降低,還會產生同一配變不同日負荷序列屬于不同類的情況,導致配變負荷分類不準確.因此通過加權疊加每日負荷序列得到配變的典型日負荷序列,代表配變日負荷特征,以便對配變進行聚類分析.由于配變容量較小,當用戶啟動或者關閉大功率電器時,負荷波動較大.因此判定異常數據較為困難,易造成典型日負荷序列計算不準確.故采用非參數核擬合配變負荷日特征指標,以擬合聯合概率作為權重,降低異常數據影響.
從全天、峰期、平期、谷期4個角度選取5個特征來反映負荷的日負荷特點.選取指標如表1所示.表中:Pmax、Pmin、Pav分別為每日負荷最大值、最小值、平均值;Pav, peak、Pav, sh、Pav, val分別為峰期、平期、谷期負荷平均值.

表1 日負荷特征指標Tab.1 Daily load pattern indexes
針對每個配變負荷,首先選取其過去一年的日負荷數據Xi,Xi=[xi,1xi,2…xi,96],i=1, 2, …, 365 (每15 min一個負荷點).再通過日負荷數據計算日負荷特征指標Yi,Yi=[yi,1yi,2yi,3yi,4yi,5].
對表1中的5個特征指標yi分別進行非參數核概率密度擬合,得到每個配變負荷5個特征指標的概率密度分布,擬合公式為
(1)
式中:h為平滑系數;y為日特征指標值;T為樣本選取時間長度;K(·)為核函數;σ為數據標準差;N為樣本數量.
核函數的選擇具有多樣性,當平滑系數確定時,核函數選擇對于擬合效果有重大影響.本文選取的核函數以及相應曲線如圖2所示.在擬合過程中,選取擬合效果最優的核函數.

圖2 核函數形式與曲線圖Fig.2 Kernel function form and graphs
以特征指標Yi的非參數核擬合聯合概率作為日負荷序列的權重值,對一年內日負荷序列加權相加得到負荷的日典型負荷序列:
(2)
式中:fj(Yi)為負荷第j個特征值第i天的擬合概率;Li為第i天配變負荷日負荷序列.
為了實現負荷的準確聚類,首先對典型日負荷序列進行歸一化處理,隨后按典型日負荷序列相似性以及影響因素相似性進行分類,得到具有最大相似負荷特性配變類.
2.2.1典型日負荷序列相似性 如圖3所示,序列a、b、c為3個配變負荷歸一化后的日典型負荷序列.由于序列a、c的歐式距離小于與序列b的歐氏距離,傳統k-means聚類方法常將序列a、c歸為一類.但是序列a、b的形狀接近,即負荷變化趨勢更加接近,在利用時序信息的預測算法中,更應歸屬于同一類.因此引入動態時間歸整(Dynamic Time Warping,DTW)算法來判斷序列的動態相似性.DTW算法將時間序列進行縮短和延伸調整不同時間點之間的對應關系,以對應點之間的距離衡量序列間的動態相似性.經計算,序列a、b的動態歸整距離遠小于與序列c的動態歸整距離.因此DTW算法可以有效評估序列間的動態特性.

圖3 負荷曲線圖Fig.3 Graph of load curves
兩個典型日負荷序列Lc,1、Lc,2,Lc,1=(l1,1,l1,2, …,l1,96),Lc,2=(y1,y2, …,ym′).歸整路徑為W=(w1,1,w1,2, …,wm,m′),i為序列Lc,1中的坐標,j為序列Lc,2中的坐標,i≤m,j≤m′.歸采用動態規劃方法求解歸整路徑距離,動態規劃計算公式為
(3)
所求得的wm, m′即是時間序列X、Y的動態歸整路徑距離.
本文充分考慮同時刻負荷特性以及序列時序特性,將歐式距離與動態歸整距離相結合,形成歐式歸整距離:
(4)
在k-means聚類中,以歐式歸整距離作為相似性計算方法.
2.2.2影響因素相似性 當負荷日典型序列相似而影響因素不同時,無法選取合適的影響因素相似時間序列.故在利用歐式歸整距離進行k-means聚類基礎上,對同一類負荷根據影響因素進一步分類.本文將每日負荷轉換為日平均負荷并分析與各種因素相關性,選取因素包括日平均溫度、日平均濕度、日平均風速、日類型和天氣類型.其中日平均溫度、日平均濕度、日平均風速均經過歸一化得到相應序列.日類型主要包括工作日、周末以及節假日.天氣類型主要包括晴、多云、陰、小雨、中雨、大雨.陰雨天不方便出行以及除濕需求會增加用電量,導致陰雨天比晴天用電量大.天氣以及日類型的標記值如表2所示.當一天存在多種天氣時,標記值取為當天所有天氣標記值最大值以及最小值的平均值.

表2 天氣以及日類型對應標記值Tab.2 Weather and day type corresponding tag values
通過格蘭杰因果檢驗方法獲取負荷和不同因素的影響關系.以日平均負荷與日平均溫度為例,首先獲取同長度的日平均負荷序列P以及日平均溫度序列T.其格蘭杰因果檢驗模型為
(5)
(6)
式中:Pt為t時間的功率值;αu,0為無約束回歸模型的常數項;p為變量P的最大滯后期數;αu,i為無約束回歸模型滯后的變量P的系數估計值;Pt-i為P的第t-i個滯后項;q為滯后的變量T的最大滯后期數;βu, i為無約束回歸模型滯后的變量T的系數估計值;Tt-i為T的第t-i個滯后項;εu,t為無約束回歸模型的隨機誤差項;αr,0為有約束回歸模型的常數項;αr,i為有約束回歸模型滯后的變量P的系數估計值;εr,t為有約束回歸模型的隨機誤差項.式(5)為無約束回歸模型,式(6)為有約束規劃模型.
利用無約束和有約束回歸模型構造F統計量:
F(q,n-p-q-1)
(7)
式中:RSSr和RSSu分別為有約束和無約束回歸模型的殘差平方和;n為樣本容量.
若F≥Fα(q,n-p-q-1) (α分位點),則認為系數估計值βu,i顯著為0,即日平均溫度不是引起日平均負荷變化的格蘭杰原因,其間不存在聯動關系;反之,若F 采用相同的方法求得日平均濕度、日平均風速、日類型和天氣類型是否為日平均負荷的影響因素.若影響則標記為1,若不影響則標記為0.可得配變的影響特征向量Zi=[zi,1zi, 2zi, 3zi, 4zi, 5]. 2.2.3雙層k-means聚類方法k-means算法存在兩個問題,一是需要提前確定初始分類數,二是初始中心分布對最終分類結果存在較大影響.同時將負荷影響因素相差巨大的負荷分在同一類不利于影響因素相似時間序列選取.因此為了得到負荷序列形態以及影響因素相似的配變簇,提出了基于反向修正原理的雙層聚類模型. (1) 以歐式歸整距離作為相似度的判定標準,通過k-means聚類算法對日典型負荷序列進行聚類,得到K類具有相似時序負荷特性的配變負荷. 選用大衛-博爾丁指標(Davies-Bouldin Index,DBI)作為聚類結果的評判指標,DBI指標(IDBI)基于類內距離與類間距離的比值,計算公式為 (8) (2) 針對同一配變群計算其影響因素特征序列熵值,計算公式為 (9) 式中:Z為配變群內影響特征序列的集合;z為集合Z中的特征序列;p(z)為z序列在Z集合中的占比. 若某一類熵值大于等于閾值,則代表該類配變的影響因素區別較大.不應將這些配變分為同一類.因此,選取其中占比最大的兩個特征序列,并將其所對應典型日負荷序列作為兩個新類.剩余特征序列分別計算與上述兩個特征序列的歐式距離,將對應典型日負荷序列加入特征序列歐式距離較近類的子集.若某一類熵值小于閾值,則認為該類負荷的特征序列接近. (3) 重復步驟(1)、(2)的聚類流程,直至聚類中心大于等于最大聚類中心數Kmax或者聚類結果不再變化.最終得到負荷序列形態以及影響因素相似的配變簇. LSTM擅長處理時序性數據.在對電力負荷數據進行預測時,LSTM可以有效挖掘數據之間的時序信息以及非線性關系.但是針對影響因素突變導致的負荷數據突變,LSTM擬合效果不佳.同時LSTM喪失了數據的周期性特征.若將影響因素作為特征輸入,導致網絡參數過多,模型收斂困難,準確率的提升有限.為解決上述兩個問題,減弱氣象因素、日類型因素對短期電力負荷的影響,同時兼顧負荷數據的時序性、周期性、非線性,在第2節的基礎上,對同一個類負荷選擇影響因素相似時間序列構建數據集. 通過第2節聚類后,每個類中負荷具有相似的影響因素特征向量.選取其中占比最大的特征向量作為該類的特征向量Zc. 再對Zc中分量為1的因素通過相關性分析計算影響的程度.分別計算日平均負荷與日平均溫度、日平均濕度、日平均風速、日類型和天氣類型的相關系數,得到每個類的相關系數向量ρ=[ρ1ρ2…ρM],M為影響因素特征數量. 選取連續D1時間內的日平均溫度、日平均濕度、日平均風速、日類型和天氣類型序列.選取時間窗為2D,滑動步長為1,共獲得D1-2D+1個2MD的影響因素矩陣: (10) 得到相似性: (11) AP(Affinity Propagation)聚類算法相對于k-means算法,無需同類取平均值作為聚類中心,無需提前指定聚類中心.同時AP聚類算法的誤差平方和低于其他聚類算法.因此在進行影響因素相似時間序列選取時,具有一定的優勢. 影響因素相似時間序列選取步驟如下: (1) 初始化吸引度矩陣R和歸屬度矩陣A. (2) 計算的相似性矩陣更新吸引度矩陣R: rt+1(i,k)= (12) 式中:rt+1(i,k)為第t+1輪迭代吸引度矩陣R的i行k列值;S(i,k)為相似度矩陣S的i行k列值;at(i,k)和rt(i,k)分別為歸屬度矩陣A和吸引度矩陣R的i行k列值. (3) 更新影響歸屬度矩陣A. at+1(i,k)= (13) (4) 根據衰減系數λ對吸引度矩陣R和歸屬度矩陣A進行衰減 (14) (5) 若矩陣穩定或者大于最大迭代次數,輸出聚類中心,流程結束,得到k″類影響因素相似時間序列分類結果.否則轉至(2). 配變短期負荷預測中,歷史數據從采集到導入數據庫存在滯后性,因此預測長度要求較長.當預測長度過長時,易導致LSTM訓練難以收斂、長期信息丟失等問題. 時序負荷數據中存在大量無關信息,每個時刻負荷往往與歷史負荷中的幾個時刻點相關性較高,例如前幾日同時刻負荷.Attention通過自動對歷史負荷值進行重要度分配,加強相關性較高時刻的負荷影響,減弱相關性較低時刻的負荷影響.提升了模型長期信息記憶能力,從而提高LSTM負荷預測模型的準確率.Attention-LSTM結構如圖4所示. 圖4 Attention-LSTM結構Fig.4 Structure of Attention-LSTM 主要包括4層模型,每層描述如下: (1) 輸入層:輸入經過預處理后的歷史負荷數據l1,l2,…,lT. (2) LSTM層:多層LSTM結構網絡,對輸入的歷史負荷數據進行特征提取,得到不同時刻的特征值ht. (3) Attention層:賦予LSTM隱層中各個特征權重αt, 代表不同時刻的負荷值對于預測時刻負荷的重要度.權重的更新公式為 (15) (16) St=f(St-1,yt-1,ct) (17) 式中:g,hj,atj,ct為神經網絡中的隱藏參數.當短期負荷預測長度過長時,Attention層能夠有效提高歷史信息中重要部分的重要度,忽略非重要部分.因此增加了LSTM 的長期記憶能力,提高了負荷預測準確度. (4) 輸出層:經過Attention-LSTM結構輸出負荷預測結果Y. 配電網計量系統一天共f個采樣點.數據集構建方式采用輸入-輸出對的形式,為考慮負荷的周期性,選取D作為輸入長度和預測長度.故每組數據包含作為輸入的前fD個點與作為輸出的后fD點.總體框架如圖5所示. 圖5 短期負荷預測流程Fig.5 Forecasting process of short-term load (1) 針對每個典型負荷序列類的每個影響因素相似時間序列集合均構建一個LSTM模型. (2) 根據影響因素相似時間序列的日期構建輸入輸出集. (3) 選取80%的輸入輸出集作為訓練集,20%作為測試集. (4) 對每個模型進行訓練,待模型收斂后,利用測試集進行檢驗,若滿足要求則保存超參數,否則重新訓練. (5) 當要預測下一個七天負荷時,首先查找當前配變所屬的類.再通過天氣預報構建未來的天氣因素序列,查找該天氣因素序列與各個影響因素相似時間序列類中相似度最高的類.選擇相應LSTM模型,載入超參數.將歷史fD的負荷值輸入模型,得到未來fD的負荷值. 選取某市配網370臺公變以及340臺專變2019年7月1日至2020年10月1日的負荷數據以及氣象數據,負荷數據的采樣頻率為15 min一次,一天有96個數據,氣象數據為一天一個數據點.以2019年7月1日至2020年6月30日的負荷以及氣象數據作為訓練集,2020年7月1日至2020年10月1日的負荷以及氣象數據作為測試集.首先計算每個配變的典型日負荷序列作為配變特征.再對所有典型日負荷序列進行聚類分析,得到負荷序列形態以及影響因素相似的配變簇.然后對每一個配變簇的數據集進行相似時間序列分類.對相應的相似時間序列類搭建Attention-LSTM模型并進行訓練,以測試集驗證模型的準確率以及效率. 對每個配變的負荷數據進行預處理,去除重復值以及異常值,插入缺失值.提取每日的5個特征值:負荷率、日峰谷差率、峰期負載率、平期負載率、谷期負載率.對5個特征分別利用參數法和非參數法進行概率密度估計,其中參數法為高斯函數,非參數核函數分別為高斯核函數、均勻核函數、葉帕涅奇核函數、指數核函數、三角核函數、余弦核函數.5個特征的分布函數曲線以及實際概率密度分布如圖6所示. 圖6 負荷日特征擬合結果圖Fig.6 Fitting results of load daily feature 從圖6中可以看出,非參數核函數的擬合效果優于參數法,其中三角核函數的擬合效果最優.因此選用作為三角核函數進行非參數擬合.通過2.2節的方法得到每個配變的典型日負荷序列. 以歐式歸整距離作為相似性判定依據,選取聚類中心數量范圍為2~13.對每種聚類中心數分別進行多次k-means聚類,并選取IDBI值最低的聚類結果作為該種聚類中心數的最優聚類結果,結果如表3所示.因此選取最優聚類數k=5. 表3 DBI結果Tab.3 Results of DBI 對于每個類,通過格蘭杰因果檢驗得到每個配變的影響特征序列.計算得到每個類的熵值如表4所示,選取閾值為0.4. 表4 每類熵值結果Tab.4 Entropy results for each type 第二類的信息熵值明顯大于其他類的信息熵值,且大于閾值.選取影響因素特征向量占比最大的兩類,Z1=[1 1 0 1 1],Z2=[1 1 0 0 1]作為新類.將剩余的配變分入影響特征向量歐式距離較近的一類.以6類負荷分類結果作為k-means初始狀態重新聚類,得到新的聚類中心結果如圖7所示,圖中t′為時刻.每類負荷影響因素特征向量的熵值均小于0.4,故停止聚類.聚類結果為6類,其中類2、3序列的歐式距離及時序特性較為接近,通過影響因素的不同區分成兩類. 圖7 負荷聚類中心圖Fig.7 Center graphs of load cluster 依照第3節的方法對過去一年的多維影響因素序列進行影響因素相似時間序列選取,共得到9種類型.根據相關性分析結果,負荷普遍為溫度強驅動型.故僅展示每種聚類結果的溫度信息.9條聚類中心曲線主要存在平均值以及動態特征的差異.季節不同,負荷曲線的特性會存在明顯的區別.計算每條聚類中心曲線的平均值可以主要分為如圖8所示的3類,分別對應冬季、春秋季、夏季的影響因素相似時間序列典型曲線. 圖8 影響因素相似時間序列劃分結果的溫度曲線Fig.8 Temperature curves of division results of similar time series of influencing factors 由于一般負荷具有周期性,因此輸入、輸出長度均設置為96×7.將七天96×7個歷史負荷數據作為LSTM網絡的輸入層,輸出層為下個七天的96×7個負荷值.LSTM網絡參數設置為:神經元數為8,學習率為0.002,網絡深度為2,優化方式為自適應矩估計優化器.對每類配變的每類影響因素相似時間序列均訓練一組超參數.為驗證本文方法有效性,設置3個對比組,使用模型均為LSTM.對比組1:LSTM模型僅利用歷史負荷數據且每個配變配置一套超參數.對比組2:每個配變配置一套超參數,LSTM在輸入歷史負荷序列的基礎上增加影響因素序列,包括每個時刻的溫度、濕度、風速以及每天的天氣與日類型.對比組3:利用改進k-means進行負荷分類,但不進行影響因素相似時間序列分類.每種負荷類配置一套超參數. 為了評價模型的預測精度,選用平均絕對百分比誤差以及均方根誤差作為評判指標,其計算式分別為 (18) (19) 實驗環境為i5-9400F處理器、16 GB內存、NVIDIA GeForce GTX 1660顯卡,編程語言環境為python3.7,軟件架構基于Tensorflow框架.應用本文方法及對比組方法,均訓練50輪 epoch.6個負荷類在不同方法下的MAPE、RMSE以及模型50輪epoch所需的訓練時間和泛化時間如表5所示,預測結果曲線如圖9所示. 表5 預測結果Tab.5 Forecasting results 可見,對比組1、2、3的MAPE分別為5.42%、4.07%、4.88%,RMSE分別為0.166 kW、0.125 kW、0.148 kW.相對不同對比組,本文方法MAPE值分別降低了3.38%、2.03%、2.84%,RMSE分別降低了0.103 kW、0.063 kW以及 0.085 kW.710組配變的平均訓練效率相對于對比組1、2分別提升了600%和616%.從圖9中可以發現,對比組1、3由于在預測過程中未加入影響因素相關信息,預測負荷曲線與前七日負荷曲線接近,無法準確預測出趨勢變化.實驗組與對比組2增加了影響因素信息,預測曲線與實際曲線趨勢接近,準確預測了負荷趨勢變化.兩種方法的準確率均高于對比組1和3.對比組2由于模型參數過多,導致預測曲線存在一定的波動.對比組1結果表明配變負荷受到各個因素的影響較大.若僅基于歷史負荷數據進行預測,無法預測由于影響因素變化導致的負荷變化,導致預測精度不足.對比組2結果表明將影響因素加入LSTM神經網絡能一定程度提升負荷預測準確度.但是由于不同配變影響因素不同而且輸入維度的增加容易使網絡陷入局部最優,導致準確度的提升有限.對比組3結果表明對負荷根據典型日負荷序列進行聚類,能夠提升模型的準確率.但是不進行影響因素相似時間序列劃分,即不考慮影響因素,準確性仍然較低. 圖9 負荷預測結果圖Fig.9 Graphs of load forecasting results 綜上所述,本文提出的基于多維聚類的配變負荷Attention-LSTM短期預測方法在效率以及準確度的提升上具有良好的效果. 本文將負荷序列時序特性以及影響因素特性加入配網負荷聚類分析中,得到相似時序特性以及影響因素關聯性的配變簇.并依據影響因素特性進行相似時間序列分類.有效解決了配網負荷數量大、特征復雜、預測難的問題,提高了配變負荷預測的準確度以及效率.主要結論如下: (1) 利用非參數核方法有效提升了日負荷特征概率密度估計的準確度,得到更加準確的日典型負荷序列. (2) 對所有日負荷特征序列以歐式歸整距離以及影響因素作為相似性判定原則進行雙層聚類得到負荷的分類結果.結果表明此方法在負荷序列聚類問題上具有良好的效果. (3) 利用AP聚類算法對多影響因素進行相似時間序列分類,相較于傳統的k-means分類、余弦相似度分類,提升了效率與分類準確性. (4) 利用負荷雙層聚類以及影響因素AP聚類的結果劃分數據集,構建不同的Attention-LSTM網絡.選取某市級配網實測負荷數據以及氣象等影響因素數據進行對比實驗表明,所提方法的負荷預測的準確率提升了2.75%且效率提升了616.8%.能夠適用于大規模配變的負荷預測場景,具有較高的應用價值.

3 影響因素相似時間序列聚類


4 Attention-LSTM負荷預測模型
4.1 Attention機制

4.2 負荷預測模型

5 算例分析
5.1 典型日負荷序列計算

5.2 典型日負荷序列雙層聚類



5.3 影響因素相似時間序列劃分

5.4 基于LSTM的短期負荷預測



6 結論