錢育樹,孔鈺婷,黃 聰
(1.中國能源建設集團新疆電力設計院有限公司, 新疆 烏魯木齊 830002;2.新疆工程學院信息工程學院,新疆 烏魯木齊 830023;3.新疆大學軟件學院,新疆 烏魯木齊 830091)
電力工業是國民經濟發展中的重要基礎性能源產業,是保證國民經濟和社會持續、穩定、健康的發展的關鍵[1]。電力工業的發展建設對國家各行業起到至關重要的作用[2]。隨著改革開放后中國經濟的高速發展,各領域的用電需求在不斷激增,推動著電力系統向數字化、智能化轉型發展[3]。
電力負荷預測是電力工業規劃中的一個重要過程,其通過電力歷史負荷數據和其他各類相關影響因素(如天氣條件、人類活動、工業過程類型、時間和季節特征等)對未來時段的電力負荷、用電形勢、用電需求、用電量等進行綜合預測及推算[4]。電力負荷的準確預測并快速響應對電力系統運行的安全性、穩定性、經濟性具有重要意義。
為明確電力負荷預測的研究發展方向,需要掌握和了解電力負荷預測研究現狀,下面介紹了電力負荷預測的特性及分類、電力負荷預測的影響因素以及電力負荷預測的基本步驟;梳理并分析了電力系統負荷預測的現有研究成果并對電力負荷預測的未來發展方向進行了展望。
在對電力負荷進行預測時,需依據歷史負荷數據及其影響因素,考慮電力負荷預測時段的外在條件和用戶需求,建立相關的預測模型并進行模型擇優,實現對電力系統負荷的可靠預測[5]。電力負荷預測具有以下特性:
1)不確定性:電力負荷數據受各種不可預見的情況影響是不斷變化的;隨著電力負荷預測技術的更新迭代,電力負荷預測的精度要求也在不斷變化[6]。
2)條件性:無論使用何種預測方法或模型進行電力負荷預測,都需要滿足相應的預測條件[7]。
3)時間性:電力負荷預測需明確需要使用到的歷史負荷數據的時間范圍以及需要預測的未來負荷數據的時間范圍[8]。
4)多方案性:由于電力負荷的不確定性和條件性,需要依據多個預測方案的預測結果來挑選最優的預測模型[8]。
5)相關性:電力負荷的自身發展過程存在相關性;電力負荷與外在影響因素之間也存在相關性[6]。
6)相似性:電力負荷在相近的年、季度、月、周、日、節假日呈現出相似的變化趨勢[9]。
7)地域多樣性:不同地區的經濟發展能力、氣候變化、行為習慣存在差異,電力負荷在地域上存在多樣性,在進行電力預測時需考慮地區的具體情況[10]。
電力負荷預測的內容包括最大負荷功率、負荷電量及負荷曲線的預測[11]。電力負荷預測可按如下依據進行分類:
1)行業:商業負荷、工業負荷、農用負荷、民用負荷以及其他負荷預測等[12]。
2)特性:最低負荷、最高負荷、平均負荷、負荷峰谷差、高峰負荷平均、低谷負荷平均、平峰負荷平均預測[12]。
3)時空特性:基于時間序列的負荷預測和基于空間范圍的負荷預測[12]。
4)預測時間周期:長期負荷預測(年)、中期負荷預測(月)、短期負荷預測(日)、超短期負荷預測(時)、節假日預測(時)[13]。
5)用戶等級:一類負荷、二類負荷和三類負荷[14]。
6)電能:用電負荷、供電負荷、發電負荷[14]。
電力負荷是指用戶在電力系統中某一時刻所需的用電功率,經常受外在因素影響。開展電力系統負荷預測不僅要考慮預測模型,同時需要考慮外在因素對電力負荷變化的影響,以達到提升預測結果準確性的目標。對電力負荷預測的客觀影響因素主要有:
1)自然因素:室內外氣溫、空氣濕度、太陽照射角、風速、降水量、氣壓、天氣等自然環境的變化會影響用戶用電行為及用電設備發生變化,造成電力負荷變化[15]。
2)經濟因素:經濟因素在區域經濟水準、居民收入水準兩方面影響著電力負荷的變化。區域經濟水準受地區的宏觀政策、產業總量增長、產業結構、人口發展、電價等影響;居民收入水準對居民用戶用電行為及設備所有權起決定性作用[16]。
3)時間因素:在較長的時間尺度中,電力負荷的變化趨勢隨著時間的推移呈現出周期性的變化,如周末與工作日以周為單位的變化、法定節假日等長假期與短假期帶來的變化、春夏秋冬等隨著季節變化電力負荷存在一定的變化規律[17]。
4)人文特點:某地區的居民密集度、住戶位置、生活習俗、居民職業特點、家庭人口年齡構成等對用戶用電習慣與負荷高低會產生影響[15]。
5)突發事件:受自然災害、人為因素不可預知的未來事件影響所導致的配電設施的臨時性維修、輸電線路的突然故障、變電系統故障等會造成電力負荷突變,影響電力系統的安全穩定運行,同時對電力負荷預測增加難度[16]。
6)其他因素:例如大型賽事或演藝活動等短暫且無舉辦固定時間的活動會導致短期電力負荷增加;節能減排、新能源等政策實施會降低用戶用電量。這些短暫性的電力負荷變化因素在開展電力負荷預測工作時需要人工經驗干預[18]。
電力負荷預測需要確定預測對象,選取相應的電力負荷歷史數據集,處理分析并挖掘出電力負荷數據的特征,建立合適的負荷預測模型,最后完成電力負荷預測任務[10]。
電力負荷預測任務的性能評價指標通常有平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean square error, RMSE)、平均絕對百分比誤差(mean absolute percentage error, MAPE)、均方誤差(mean square error, MSE)、相對誤差(relative error,RE)、預測精度(forecast accuracy,FA)、預測區間覆蓋率(prediction intervals coverage probability,PICP)、平均區間寬度 (mean prediction intervals width,NMPIW)、考慮覆蓋率及寬度的綜合評價指標(coverage width-based criterion,CWC)、平均誤差(mean error,ME)、準確率 (accuracy,ACC)[19-25]。
電力負荷預測的基本步驟如下:
1)確定預測的目標。針對電力負荷任務,分析確定預測的對象、要求和目的等。
2)獲取電力負荷歷史數據。在明確預測目標的基礎上搜集完整準確的電力負荷歷史數據。
3)數據分析及處理。結合影響電力負荷的外在因素的歷史數據,分析出電力負荷預測任務的數據特征,并進行數據集的整合;對數據集進行缺失值和異常值的處理,再開展數據的歸一化、標準化、特征編碼、數據集劃分等工作。
4)建立合適的電力負荷預測模型。數據處理完之后,結合數據的輸入特征和變化規律,建立合適的電力負荷預測模型。訓練集用于訓練預測模型,驗證集用于驗證和調優模型。
5)模型測試及評估。在模型優化完成后,輸入測試集開始模型的預測,對比預測負荷與真實負荷,通過性能評價指標對模型預測結果和表現進行定性分析,幫助研究人員從多個模型中選擇出當前電力負荷任務的最優模型[22]。
下面按照傳統預測方法、機器學習預測方法及深度學習預測方法等對電力系統負荷預測方法進行劃分,并指出這些方法優劣及適用的環境。
傳統預測方法包括時間序列分析法、趨勢分析法、回歸分析法、指數平滑法、灰色預測模型等多種方法[26]。
1)時間序列分析法,分析的是隨時間變化的連續的電力負荷歷史數據序列,建立數學模型來描述負荷值與時間的相互關系, 確定時間序列的表達式來進行時間序列的負荷預測[27]。該方法的優點在于所需的數據量少,且預測結果具有連續性;其劣勢在于只適用于短期電力負荷預測,對周期性因素考慮較多,對不確定因素如節假日、天氣等考慮較少。文獻[28]提升基于小波變換的時間序列分析方法來進行電力負荷預測,采用提升小波變換對用戶電力負荷數據的主要特征進行提取,避免用電量數據隨機和波動帶來的干擾。文獻[29]融合利用卡爾曼濾波算法的自適應優勢,較簡單地得到比較準確的狀態方程和觀測方程,短期電力負荷預測精度得到提升。
2)趨勢分析法又稱為趨勢曲線分析方法,是使用最廣、研究最多的定量預測方法[30]。趨勢分析法是根據已知的歷史數據來擬合一個函數,使得函數能表達未來某個時間點電力系統負荷的預測值,常用的函數類型有多項式、對數、冪函數、指數等。趨勢分析法通常要求完全擬合歷史數據,不考慮隨機誤差,預測精確度易受突發事件的影響。基于負荷曲線進行的預測方法還有負荷極值分析、電力負荷密度等,均屬超短期負荷預測方法[31]。
3)回歸分析法又稱統計分析法,是確定預測值和影響因子之間關系的方法。在電力系統負荷預測中表現為分析天氣、區域經濟水平和產業結構等眾多因素與預測值之間的關系。但單純的回歸分析不能滿足日益復雜的數據和精度要求,通常會結合一些其他的數據處理方法,如文獻[32]通過對海上油田各生產環節的電力負荷需求和發展趨勢進行分析,采用逐步回歸分析法進行電力負荷預測特征量的強篩選,并建立電力負荷預測盲數化回歸模型提升電力負荷預測的精度。回歸分析法的優勢在于方法簡單、參數較少、預測的速度較快,但對于歷史數據要求較高,且無法將大量的影響因素考慮進來。回歸分析法適用于中期、長期電力負荷預測的應用場景。
4)指數平滑法與回歸分析法類似,都是基于時間序列和負荷值建立預測模型,與回歸分析法不同的是指數平滑法更靈活,擬合性能也更好。指數平滑法采用過去數周的同類型日的相同時刻的負荷組成時間序列數據,對時間序列數據進行加權平均,得出待預測的負荷值。文獻[33]提出具有“厚近薄遠”特性的指數平滑法,解決了中長期電力負荷預測中存在時間跨度大和廣域分布廣等難題。指數平滑法的優勢在于對季節波動不敏感及對季節趨勢變化不明顯的時間序列數據預測效果較好;劣勢在于該方法的預測結果為變化趨勢,難以實現準確的定量預測。該方法適用于短期、中期、長期電力負荷預測。
5)灰色預測模型是對含有不確定因素的系統進行電力負荷預測的方法。使用灰色預測模型時先鑒別系統的不確定因素以及不確定因素之間變化的相異程度;然后處理原始數據,尋找系統變化的規律;最后生成有較強規律的時間序列數據,以便開展電力系統中電力負荷趨勢的預測。灰色預測模型的優勢在于預測的計算量小、所需的負荷數據少,對指數趨勢負荷預測效果較好;劣勢在于該方法未考慮到其他影響因素導致負荷變化規律不具有指數性時,電力負荷預測精度隨之降低。該方法適用于短期、中期、長期電力負荷預測。文獻[34-36]等對灰色預測模型進行改進應用,電力負荷預測的精度和穩定性得到提升。
早期電力系統的經濟結構相對簡單,影響電力負荷的因素較少,傳統的電力負荷預測模型能快速、準確地預測電力負荷。隨著經濟結構的快速發展與變化,電力負荷中非線性和不確定性使得電力負荷預測愈發困難,傳統預測方法不能很好地預測結果,需要依據實際情況進行預測方法的優化改進,考慮到氣候、天氣等外界因素影響,實現對電力負荷的精準穩定預測。
電力負荷預測受多種因素影響,具備一定的非線性。機器學習具有較強的非線性映射能力,能有效地處理電力負荷預測中的非線性問題。傳統的機器學習方法有支持向量機、決策樹、隨機森林等,這些方法能使用較少的數據處理非線性問題。
1)支持向量機(support vector machine,SVM)是尋找一個超平面來處理非線性問題,能處理分類問題和回歸問題。支持向量機用于處理回歸問題時被稱為支持向量回歸,該模型是尋找一個超平面擬合現有數據,使得所有數據到超平面的損失值最小。支持向量機具備處理小樣本、非線性問題的優勢;其劣勢在于支持向量機的參數量選擇困難。該方法適用于超短期、短期、中期、長期電力負荷預測。文獻[37]通過混沌類電磁學算法優化支持向量機的參數選擇過程,算法收斂效率和尋優能力得到了提升,適用于短期電力負荷預測。支持向量機還可以通過K-means[38]、最小二乘支持向量機[39]、麻雀搜索算法[40]、海鷗優化算法[41]等進行模型優化。
決策樹(decision tree,DT)在機器學習中表示的是對象屬性與對象值之間的一種映射關系,是一種可以處理分類與回歸問題的方法。決策樹學習時,根據訓練數據與損失函數最小化的原則構建決策模型。決策樹具有分類速度快、生成模式簡單的優點,其劣勢在于易受訓練數據中對決策不相關屬性的影響。該方法的適用場景為短期、長期電力負荷預測。文獻[42]通過減少異質數據的干擾,降低訓練數據的規模,提出基于局部相似度取小綜合的相似度計算方法和加權相似度損失函數,提升訓練數據的相似度,改進梯度提升決策樹學習算法,進而提升電力負荷預測的性能。
3)隨機森林(random forest)是一種由決策樹構成的集成算法,屬于Bagging類型。隨機森林處理回歸問題時稱為隨機森林回歸。隨機森林回歸模型通過隨機抽取樣本和特征,建立多顆互不關聯的決策樹,綜合所有決策樹的結果得出最終預測結果。通過集成多顆決策樹,使得模型具有較高的精確度和泛化性能。隨機森林的優勢在于對異常值有較高的容忍度,且不容易出現過擬合;劣勢在于當數據不平衡時會導致分類準確率降低。該方法適用于短期、中期、長期電力負荷預測。文獻[43]在電力預測中采用隨機森林對不同產業進行針對性建模,提升了中短期電力負荷預測的精度。將隨機森林與其他機器學習的方法相結合同樣能提升模型的精度,文獻[44]通過將模糊聚類與隨機森林回歸相結合,預測北愛爾蘭短期電力負荷,預測結果表明了模糊聚類與隨機森林相結合的有效性。
傳統的基于機器學習預測方法相比于傳統的預測方法可以提升預測精度,得到較好的預測結果,但傳統的機器學習方法對數據特征的挖掘還是略顯不足,面對復雜的電力系統時不能很好地預測電力負荷。
深度學習預測方法是用神經網絡作為參數結構進行優化的機器學習方法。神經網絡也稱人工神經網絡,是一種模仿生物神經網絡信息傳遞和處理的數學模型。該模型通過大量節點并行或串行處理輸入的信息,得到一個或多個輸出目標。該模式具有復雜度高、適應性強、能自適應的學習數據特征,因此被廣泛使用。神經網絡的基本單元是感知機,能夠接收多個輸入特征(x1,x2,…,xn),經過可學習的權重(w1,w2,…,wn)和偏置b加權融合所有信息。加權融合并不能增加模型的非線性映射能力,因此通過一個非線性的激活函數θ(·)增加模型的非線性能力。電力行業經過多年的發展已經累積了大量珍貴的數據,深度學習的自適應學習特性非常有利于擬合這些數據特征,進行電力負荷預測。目前廣泛應用于電力負荷預測的神經網絡有誤差逆傳播(back propagation,BP)神經網絡、卷積神經網絡、循環神經網絡以及新興的Transformer模型[15]。
1)BP神經網絡是通過反向傳播算法進行訓練的多層神經網絡。BP神經網絡分為兩個過程,即信息的前向傳播和誤差的反向傳播。前向傳播中,信息從輸入層開始,經過隱含層提取信息和特征,最后由輸出層輸出結果。反向傳播中,誤差通過鏈式求導更新每個權重和偏置。文獻[45]將BP神經網絡應用于短期電力預測,取得較好的預測結果。BP神經網絡具有較好的非線性擬合性能,與其他算法結合能取得更好的預測結果,文獻[46]提出將主成分分析和BP神經網絡相結合,提升影響因子的細粒度,降低冗余信息的干擾,提升預測精度。文獻[47]發現將負荷數據與氣象信息作為輸入,結合貓群優化算法與BP神經網絡能獲得更好的預測結果。BP神經網絡雖然具有較強的非線性映射能力、高度的自適應和自學習能力、較強的泛化能力以及具有一定的容錯能力,但BP神經網絡的參數冗余、收斂速度慢、局部極小化問題不容忽視。BP神經網絡適用于短期、中期、長期電力負荷預測。
2)卷積神經網絡(convolutional neural networks, CNN)是帶有卷積結構的深度神經網絡,可以高效地處理圖像數據或圖像序列數據,同樣可以處理電力數據。與BP神經網絡不同的是,卷積神經網絡的上下層神經元并不直接連接,而是通過共享卷積核連接,極大地減少神經網絡中的參數量,避免參數冗余。卷積運算是指將輸入的特征圖通過多個不同的卷積核做加權融合運算,得到新的特征圖或特征序列。其中卷積核提取需要的各種特征,每個輸入的特征都有權重與之相乘。權值共享方式能大幅度降低神經網絡中的參數量。不同的任務使用不同大小的卷積核,小尺寸卷積核能有效降低模型的參數量,但也限制了模型的感受野,在相同參數量時堆疊多個小尺寸的卷積核性能更優。卷積神經網絡適用于短期電力負荷預測。文獻[48]通過全卷積網絡和因果邏輯約束增強時間序列特征表達,通過多尺度卷積核提取不同時間長度的特征,進而提高模型預測電力負荷的精度和穩定性。卷積神經網絡與BP神經網絡類似,可以結合一些傳統的機器學習方法提升模型的預測精度,例如文獻[49]通過結合K-means與卷積神經網絡預測短期電力負荷:首先,通過K-means將用戶分為日相關強的類和日相關弱的類;然后,對相關性強的類采用相鄰時刻的數據和日數據作為輸入,對相關性弱的類,僅使用相鄰時刻的數據作為輸入;最后,通過CNN提取特征,用實驗結果表明了算法的可行性。
3)循環神經網絡(recurrent neural network,RNN)是一種將輸出作為下次輸入一部分的神經網絡模型[50]。該模型能捕獲前后輸出之間的相關性,其特性也能用于電力負荷預測,但RNN不善于學習長期依賴,僅適用于短期依賴,即應用于短期電力負荷預測場景。文獻[51]提出長短時記憶網絡(long short-term memory,LSTM)有效地解決RNN中長期依賴問題。LSTM增加了輸入門、遺忘門和輸出門。輸入門決定隱藏層信息是否更新,遺忘門決定更新的隱藏層是否包含上一時刻的信息,輸出門決定輸出那部分信息。電力系統負荷預測任務具有時間屬性,這與循環神經網絡的特性相符合。文獻[52]中當訓練數據較少、數據中時間間隔較短時,RNN能較好地學習數據特征并較為準確地預測電力系統負荷;但隨著數據中時間間隔增長,RNN難以達到理想的預測結果。電力負荷數據中,不同尺度的信息側重點不同,結合不同尺度的信息能有效地提升預測的精度,如基于多尺度跳躍[53]、利用自適應柯西變異粒子群算法[54]等進行模型優化。卷積神經網絡按步長滑動卷積核計算的方式雖然降低了參數量,但造成互不相干的特征提取無法采用矩陣運算,進而限制了模型的推理速度。循環神經網絡能很好地適應電力數據的時間特性,LSTM能自發記憶長期依賴,但訓練速度慢、訓練難度高和模型的可解釋性差,使得基于LSTM的電力預測模型還需進一步研究。
4)Transformer模型最初提出用于解決自然語言處理中循環神經網絡難以并行加速的問題[52]。標準Transformer模型由編碼器(encode)和解碼器(decode)組成,decode相比于encode多了一個多頭注意力模塊和規范化網絡層(layer normalization)用于接收encode輸出。除了encode的輸出,decode的輸入還包括上一個decode的輸出,依次類推完成解碼。電力負荷預測的非線性、時間性和不確定性提高了負荷預測的難度,但Transformer模型能充分捕獲電力負荷序列的位置、周期性、趨勢和時間信息,能有效地降低預測難度,提高預測精度。該方法適用于短期、中期、長期電力負荷預測場景。文獻[55]提出基于特征嵌入和Transformer的負荷預測模型,首先通過融合負荷位置、趨勢、周期性、時間和天氣信息得到負荷特征向量,再通過Transformer模型挖掘特征向量中的非線性時序依賴關系,最后通過全連接預測電力負荷。Transformer模型能有效挖掘電力負荷數據中長期的依賴關系,進而提高電力負荷預測的精度。利用Transformer捕獲電力負荷數據中長距離依賴關系的模型還有基于XGBoost、GRU的改進模型[56-57〗,可進一步提高電力負荷預測的精度和效率。
上面總結了電力負荷預測的特性、影響因素、預測基本步驟及性能評價,并從傳統預測方法、機器學習預測方法、深度學習預測方法等三方面梳理并分析了電力系統負荷預測的研究成果。隨著新能源汽車、儲能系統等技術的快速發展,電力系統即產即用的特征將發生重大轉變,風能、太陽能等不穩定能源發電的潛力將得到極大釋放,因此電力系統負荷預測技術也應在以下幾個方面進一步發展:
1)隨著儲能技術的發展,不穩定能源將得到極大開發,電力負荷預測應細化天氣、地理環境、風能和太陽能儲備等因素的影響,以獲得更準確、更合理的長期預測結果,為電力規劃部門提供更有力的依據;
2)傳統方法雖然存在一定的局限性,但在特定領域仍發揮著重要的作用,如何更有效地結合傳統方法與最新的深度學習方法仍值得研究;
3)電力負荷受地區政策、經濟影響較大,應多考慮研究融合時間和空間的電力負荷預測技術。