胡 欣,馮 杰,徐先峰,王世鑫
(長安大學電子與控制工程學院,陜西 西安 710064)
隨著我國電力市場化改革的深入發(fā)展以及新能源的逐漸應(yīng)用,不僅電力行業(yè)對負荷預(yù)測的精度要求越來越高,而且在負荷數(shù)據(jù)不斷豐富的情況下,剔除冗余因素以提取出關(guān)鍵因素也給負荷預(yù)測帶來了一定的挑戰(zhàn)[1]。因此,在選擇科學、合理的負荷預(yù)測方法的同時,全面分析研究各因素之間的聯(lián)系,對于提高負荷預(yù)測精度至關(guān)重要。
歷史負荷數(shù)據(jù)通常蘊含著自身特性及其相關(guān)變化規(guī)律。深入挖掘剖析歷史信息,并將其延伸至預(yù)測未來趨勢,是電力負荷預(yù)測領(lǐng)域的常用數(shù)據(jù)基礎(chǔ)之一。文獻[2]利用聚類算法和門控循環(huán)單元網(wǎng)絡(luò),提高預(yù)測性能。文獻[3]提出基于K近鄰的深度學習方法。文獻[4]提出了一種基于長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)和極速梯度提升方法的組合預(yù)測模型,均改善了預(yù)測準確性。文獻[5]結(jié)合了評價指標和優(yōu)化算法,實現(xiàn)了負荷預(yù)測。文獻[6]提出了由單一乘性神經(jīng)元模型、粒子群優(yōu)化算法和非線性濾波器組成的混合方法。上述基于歷史負荷數(shù)據(jù)預(yù)測只是考慮到歷史負荷的變化規(guī)律對未來用電量的影響,沒有涉及其他外在因素的作用。但是隨著電力行業(yè)的不斷發(fā)展,越來越多的學者也考慮到其他外在因素對負荷預(yù)測產(chǎn)生的影響。文獻[7]和文獻[8]同時考慮了歷史負荷數(shù)據(jù)和氣象因素,利用LSTM實現(xiàn)負荷預(yù)測。文獻[9]結(jié)合了電價,提出了基于卷積神經(jīng)網(wǎng)絡(luò)和LSTM相結(jié)合的預(yù)測模型。文獻[10]在歷史負荷數(shù)據(jù)基礎(chǔ)上,考慮了氣象和季節(jié)因素兩方面,提出基于電力負荷因子的深度聚類神經(jīng)網(wǎng)絡(luò)。文獻[11]針對溫度、日期以及歷史數(shù)據(jù),提出了注意力機制的多層門控循環(huán)單元網(wǎng)絡(luò)進行多步預(yù)測。
從上述文獻可以看出,大多數(shù)研究只是針對歷史負荷數(shù)據(jù)或者人為主觀指定外在因素來實現(xiàn)負荷預(yù)測。但是在日新月異的電力行業(yè)中,采集的負荷數(shù)據(jù)越來越豐富,使得對電力負荷預(yù)測產(chǎn)生影響的因素不僅局限于歷史數(shù)據(jù)或者氣象因素等,還包括其他一些外在因素,比如電價、溫度等;各因素對負荷變化的作用或大或小,如果僅憑主觀指定某一因素作為輔助輸入數(shù)據(jù),則無法充分挖掘出外在因素對真實負荷的潛在信息。因此,本文在考慮涉及電價、氣象等諸多因素的基礎(chǔ)上,基于特征選擇能尋找最優(yōu)子集的優(yōu)勢,遴選出與真實負荷相關(guān)性較高的關(guān)鍵因素,并且利用注意力機制根據(jù)不同影響因素的不同信息,以減少不相關(guān)信息干擾的功能,給予重要因素更高的權(quán)重,從而搭建基于注意力機制的長短期記憶網(wǎng)絡(luò)預(yù)測模型。
負荷預(yù)測領(lǐng)域中的特征選擇本質(zhì)上就是從原始的n個負荷測試樣本數(shù)據(jù)選擇m(m 本文結(jié)合RFE、注意力機制(Attention)和LSTM的特點,利用RFE自動計算得出的待測歷史負荷數(shù)據(jù)與其他負荷影響因素之間的重要性關(guān)系,構(gòu)造新的輸入負荷數(shù)據(jù)集;將其在不斷循環(huán)調(diào)整輸入因素個數(shù)的試驗過程中,依次引入LSTM中得到輸出值,并通過Attention分配權(quán)重實現(xiàn)最終的預(yù)測結(jié)果,從而完成預(yù)測性能指標評價。 基于特征選擇的LSTM-Attention預(yù)測流程如圖1所示。 圖1 基于特征選擇的LSTM-Attention預(yù)測流程圖Fig.1 Flowchart of LSTM-Attention prediction based on feature selection RFE主要用于評價特征變量的重要性。首先,針對初始負荷特征數(shù)據(jù)集,通過循環(huán)迭代的方式,根據(jù)系數(shù)選出與真實負荷相關(guān)性高的特征(即影響因素)。然后,在剩余的特征上重復(fù)這個過程,以此逐漸消除相關(guān)性不強的特征,直至達到所需的特征數(shù)量。在迭代過程中,特征被刪除的順序就是特征的最后排序。這樣能夠有效去除冗余的特征變量。RFE具體執(zhí)行步驟如下。 ①初始的負荷特征集為所有可以使用的特征,需對其進行標準化處理。 (1) 式中:Y*為標準化處理后的負荷數(shù)據(jù);Y為負荷數(shù)據(jù)序列;Ymax為序列Y中的最大值;Ymin為序列Y中的最小值。 ②使用當前特征集進行建模,計算每個負荷特征的重要性,通過循環(huán)迭代的方式,根據(jù)系數(shù)選出與真實負荷相關(guān)性高的特征(影響因素);然后,在剩余的特征上重復(fù)這個過程,以此逐漸消除相關(guān)性不強的特征,直到最終得到所需的特征數(shù)量。 ③刪除最不重要的一個(或多個)特征,更新特征集。 ④跳轉(zhuǎn)到步驟②,直到完成所有特征的重要性評級。 在電力負荷預(yù)測模型學習訓練過程中,當外在影響因素輸入越多,模型預(yù)測性能會更好,也能夠保存更多的有用負荷信息。但是這樣容易復(fù)雜化網(wǎng)絡(luò)拓撲結(jié)構(gòu),引起模型學習速度緩慢的問題。因此,為了讓相關(guān)性小的因素減少對真實負荷的影響度,本文利用注意力機制對輸入的13種外在影響因素數(shù)據(jù)Xi(i=1,2,...,13)進行動態(tài)加權(quán)的處理方式,以降低與真實負荷相關(guān)性較低的影響因素的權(quán)重,著重關(guān)注相關(guān)性高的因素。 以此為基礎(chǔ),本文搭建了基于LSTM-Attention的預(yù)測模型,得到最終預(yù)測結(jié)果Y,以實現(xiàn)高精度的電力負荷預(yù)測。 LSTM-Attention模型結(jié)構(gòu)如圖2所示。 圖2 LSTM-Attention模型結(jié)構(gòu)圖Fig.2 LSTM-Attention model structure diagram 如今,注意力機制已成為深度學習神經(jīng)網(wǎng)絡(luò)的重要組成部分,并且在自然語言處理、統(tǒng)計學習、語音翻譯和計算機視覺等領(lǐng)域具有大量的應(yīng)用。注意力機制源自人類的視覺直覺。人類視覺快速掃描圖像全局選擇性地關(guān)注一部分目標區(qū)域,即所謂的關(guān)注焦點,在抑制其他無用信息的同時,更多地關(guān)注目標的重要信息。注意力機制[11]可以根據(jù)輸入數(shù)據(jù)的不同特征動態(tài)調(diào)整重視程度的一種學習機制:對于輸出結(jié)果的重要信息,給予更高的權(quán)重;同時,減少不相關(guān)信息的干擾。因此,該模型可以更好地學習有效信息。在引入注意力機制的LSTM模型的實現(xiàn)過程中,將參與負荷預(yù)測試驗的一系列歷史數(shù)據(jù)X看作是由尋址操作中的存儲內(nèi)容數(shù)據(jù)的地址Key和該數(shù)據(jù)對應(yīng)的注意力值Value組成的,則通過計算給定元素和各個Key的相似性或者相關(guān)性,可得到每個Key對應(yīng)Value的權(quán)重系數(shù),再對Value進行加權(quán)求和,即可得到最終的注意力數(shù)值。注意力qi的計算式如式(2)所示。 (2) 式中:vi為注意力機制中第i個數(shù)據(jù)的注意力值;ai為vi的權(quán)值系數(shù)。 ai的具體計算方法如式(3)所示。 (3) 式中:Si為第i個數(shù)據(jù)的余弦相似性。 (4) 式中:Ki為輸入負荷信息第i個數(shù)據(jù)對應(yīng)的地址。 LSTM改善了循環(huán)神經(jīng)網(wǎng)絡(luò)可能會引起梯度消失或爆炸的問題,能夠存儲較長時間的信息,并且可以使模型獲得更好的預(yù)測效果[13]。 LSTM模型結(jié)構(gòu)如圖3所示。 圖3 LSTM模型結(jié)構(gòu)圖Fig.3 LSTM model structure diagram ①遺忘門。根據(jù)當前的輸入負荷信息xt和(t-1)時刻負荷信息的輸出ht-1,共同確定LSTM需要剔除(t-1)時刻負荷狀態(tài)信息冗余的部分。 ft=σ{Wf·[ht-1,xt]+bf} (5) 式中:ft為遺忘門;σ為Sigmod函數(shù);Wf為遺忘門的連接權(quán)重矩陣;bf為遺忘門的偏置項;·為矩陣相乘。 it=σ{Wi·[ht-1,xt]+bi} (6) (7) (8) ③輸出門。決定將被用作當前狀態(tài)的輸出狀態(tài)ht。ht-1和xt先通過Sigmod激活函數(shù)得到ot,以控制負荷預(yù)測輸出;接著利用tanh函數(shù)將Ct值變換至[-1,1]之間;最后將變化結(jié)果與ot相乘,得到新的負荷預(yù)測狀態(tài)ht。 ot=σ{Wo·[ht-1,xt]+bo} (9) ht=ot·tanh(Ct) (10) 式中:ot為輸出門;Wo為輸出門的連接權(quán)重矩陣;bo為輸出門的偏置項。 為驗證本文算法的有效性,利用新英格蘭地區(qū)電力負荷數(shù)據(jù)集進行試驗分析。數(shù)據(jù)集包括2014年共365天的負荷數(shù)據(jù)。同時,考慮了日前競標負荷、真實負荷、電價溫度、濕度等13個負荷影響因素,并每隔一小時采集一次數(shù)據(jù),共得到8 760個數(shù)據(jù)樣本。本文選取真實負荷為待測負荷因素,其余因素為輔助影響因素。在試驗時,選擇2014年9月1日到11月30日共2 184條數(shù)據(jù)作為訓練集、12月1日和12月2日兩天共48條數(shù)據(jù)作為測試集。 新英格蘭地區(qū)數(shù)據(jù)集說明如表1所示。 表1 新英格蘭地區(qū)數(shù)據(jù)集說明Tab.1 New England regional data set description 表1中采集時所涉及的因素首先考慮到了新英格蘭所處的地理位置情況。由于該地區(qū)靠近大西洋,容易受近海的寒流影響,導致其每年降水量和降雪量較大,尤其第四季度的寒冷天氣,加劇了人們的供熱需求,故溫度和濕度的數(shù)據(jù)采集必不可少。其次,新英格蘭的電力市場管制比較放松,市場參與成員可以通過競拍購買或者發(fā)售一定的輸電權(quán),也可以在二手市場中進行自由交易[14]。這期間,一旦競爭激烈,電價隨時可能因各種原因產(chǎn)生波動。而且電力市場會因用戶的需求高峰期而帶來價格的劇烈上漲,對該地區(qū)的用電量也會產(chǎn)生不小的影響。由此可見,在對該地區(qū)進行負荷預(yù)測的過程中不能忽視電價對負荷的影響。為了更全面地考慮上述因素對歷史負荷數(shù)據(jù)的影響,本文采用RFE對各負荷影響因素數(shù)據(jù)進行重要性排序,結(jié)合LSTM的長時記憶功能,以及注意力機制的權(quán)重分配優(yōu)勢,實現(xiàn)多因素電力負荷預(yù)測,為預(yù)測電力需求變化趨勢提供理論依據(jù)。 RFE評價得出了13個影響因素對真實負荷的重要性排序。部分RFE排序結(jié)果的對應(yīng)因素如表2所示。排序中的K值表示每次試驗包含關(guān)鍵性因素的個數(shù)。 表2 部分RFE排序結(jié)果的對應(yīng)因素Tab.2 Corresponding factors of partial RFE ranking results 根據(jù)試驗最終選擇的關(guān)鍵因素,分析原因除了文中2.1節(jié)提到的采集電價因素原因之外,還與競標負荷及電力行業(yè)各部門的利益密切相關(guān)。如果真實負荷最終小于競標負荷,被市場統(tǒng)籌調(diào)度的可能性會很小,造成電能資源浪費;反之則會影響電網(wǎng)穩(wěn)定,不利于電力市場的運行調(diào)度。而且,競標負荷往往是根據(jù)歷史負荷數(shù)據(jù)的變化規(guī)律確定的。另外,阻塞電價通常會對電力負荷造成影響。當阻塞區(qū)內(nèi)出現(xiàn)電量相對稀缺時,由于電力市場一般不是競爭市場,發(fā)電公司為獲得高額利潤,使用保留部分可調(diào)度發(fā)電容量或采用報高價等策略,以實現(xiàn)其市場勢力。同時,溫度、濕度也會造成一定的影響,主要體現(xiàn)在特定時間段內(nèi)對電器的過渡使用造成負荷的波動。因此,試驗結(jié)果所選擇的關(guān)鍵因素較符合實際情況。 為了評價文章提到的模型預(yù)測效果,本文選擇了均方根誤差(root mean square error,RMSE)和平均絕對誤差(mean absolute error,MAE)這2個性能指標作為負荷預(yù)測的評價指標。這2個指標的計算如式(11)和式(12)所示。 (11) (12) 本次試驗中,LSTM模型采用自適應(yīng)矩估計(adaptive moment estimation,Adam)優(yōu)化算法,根據(jù)前一小時歷史負荷數(shù)據(jù),結(jié)合特征選擇算法遴選的其他負荷影響因素,預(yù)測下一小時通過計算梯度的一階矩估計和二階矩估計,為不同的參數(shù)設(shè)計獨立的自適應(yīng)學習率。經(jīng)過多次超參數(shù)試驗,最終確定的部分超參設(shè)置如下:隱藏層神經(jīng)元數(shù)量為50個;步長為100;批大小為72個;學習率為0.01。 經(jīng)過試驗仿真,RFE-LSTM-Attention預(yù)測曲線如圖4所示。 圖4 RFE-LSTM-Attention預(yù)測曲線圖Fig.4 RFE-LSTM-Attention prediction curves 圖4中:實線表示真實值;虛線表示預(yù)測值。此時,遞歸特征選擇算法選出的關(guān)鍵因素個數(shù)為3,即真實負荷、日前阻塞電價以及日前競標負荷時,預(yù)測效果最佳。從圖4中也可以看出,預(yù)測值與真實值具有較高的擬合程度。 為了驗證使用的方法有效性,本試驗計算了模型的RMSE和MAE,選取了僅使用歷史負荷數(shù)據(jù)時的K-近鄰(K-nearest neighbor,KNN)、LSTM、支持向量機(support vector machine,SVM)、LSTM結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、LSTM-Attention以及RFE-LSTM作為對照試驗。對比算法試驗結(jié)果如表3所示。從表3中可以看出,RFE-LSTM-Attention的RMSE和MAE更小。與SVM相比,RFE-LSTM-Attention的RMSE和MAE分別降低了14.283和6.507。而且與適合處理長序列數(shù)據(jù)的LSTM相比,RFE-LSTM-Attention預(yù)測性能相對更優(yōu)。 表3 對比算法試驗結(jié)果Tab.3 Experimental result of comparison algorithm 為了進一步提高電力負荷預(yù)測精度,本文提出了RFE-LSTM-Attention的電力負荷預(yù)測模型。在新英格蘭地區(qū)的原始數(shù)據(jù)集的基礎(chǔ)上,以遴選關(guān)鍵因素為切入點,利用RFE按照重要性自動排序關(guān)鍵因素,從而生成新的數(shù)據(jù)集。基于Attention分配權(quán)重的優(yōu)勢,搭建了LSTM-Attention電力負荷預(yù)測模型,并進行了仿真試驗。從預(yù)測結(jié)果可以看出,RFE-LSTM-Attention提高了整體預(yù)測精度。與其他單一算法、組合算法對比,RFE-LSTM-Attention的誤差最小,具有良好的預(yù)測性能。
1.1 基于RFE的關(guān)鍵因素遴選模塊
1.2 LSTM-Attention電力負荷預(yù)測模型





2 LSTM-Attention預(yù)測模型分析
2.1 數(shù)據(jù)集分析

2.2 關(guān)鍵因素分析

2.3 評價指標

2.4 超參數(shù)設(shè)置
3 試驗結(jié)果分析
3.1 試驗結(jié)果

3.2 對比試驗

4 結(jié)論