



摘要:準確預測對能源的高效利用和可持續發展至關重要。現有研究多聚焦于能源價格預測,而關于中期(月度)電力生產預測的研究較少。提出一種基于零樣本遷移學習的新方法以解決此問題。首先使用包含多種時間序列數據的大規模數據集訓練NBEATS神經網絡模型,然后將此模型應用于無需額外訓練的零樣本學習場景中進行電力生產預測。實驗結果表明,該方法相較于傳統的深度學習和統計預測方法具有更低的預測誤差,并且由于省去了針對具體任務的訓練步驟,在計算效率上也展示出明顯優勢。
關鍵詞:電量預測;遷移學習;深度學習
一、前言
有限的自然資源和日益增長的全球能源需求共同導致了能源供應緊張的局面。隨著世界人口增長,以及電動汽車和環保替代方案的普及,燃料和電力需求急劇上升。由于發電能力有限,必須通過高效規劃來滿足這一需求[1]。
電力分配效率依賴于對未來供需的準確預測,電力生產預測成為現代工業社會中的關鍵任務。然而,隨著可再生能源比例的增加,電力生產的波動性加劇。盡管電價預測的研究較多,但電力生產預測的研究較少[2]。本研究提出基于遷移學習的電力生產預測方法,填補這一研究空白。
現有能源預測方法主要分為統計方法、深度學習方法和混合方法。統計方法預測準確,但計算慢。深度學習方法效果顯著,但受數據限制,難以廣泛應用。混合方法結合多種方法設計模型,盡管在特定情況下有效,但推廣性差。近年來,遷移學習在加速訓練和提高準確性方面顯示出巨大潛力。
遷移學習作為一種用于深度學習模型訓練的強大技術,在計算機視覺、語音識別和大規模語言模型等領域取得了成功[3]。然而,它在電力預測中的應用仍然有限。本文提出了一種基于遷移學習的電力生產預測模型,尤其采用了零樣本學習的新方法,以實現最低的執行時間。與傳統遷移學習方法不同,零樣本學習無需對預訓練模型進行額外微調,從而使模型更加高效靈活。在包含多種時間序列數據的大型數據集上使用神經基底擴展分析NBEATS模型進行訓練,并將其應用于電力生產的零樣本學習預測。通過采用遷移學習的方法,利用從不同領域提取的知識和模式來提高電力生產預測的準確性和效率。本研究探索了遷移學習在應對現代電力系統波動性方面的潛力。此外,通過使用零樣本學習,無需上下文特定訓練即可實現快速預測。
二、實驗方法
本節詳細介紹所提出的電力預測方法。首先,闡述遷移學習、元學習和NBEATS模型的基礎概念。接著,描述如何結合遷移學習與NBEATS模型構建零樣本預測模型。
(一)遷移學習
遷移學習是一種將從解決一個問題中獲取的知識應用到另一個相關問題的機器學習技術。它的核心思想是使用預訓練模型作為起點,借助其已學習的特征來提高新任務的性能。形式上,遷移學習可通過領域和任務來描述。一個域包括特征空間和邊緣分布,對于給定域,任務由標簽空間和預測函數組成。該預測函數用于對新實例進行標記,并從訓練集中學習得到。給定源域及源任務、目標域及目標任務,遷移學習旨在利用源域和源任務的知識來改進目標預測函數的學習。
(二)元學習
元學習,又稱“學習如何學習”,是遷移學習的子領域,旨在跨任務積累知識并快速應用于新任務。其過程包括元訓練和元測試兩個階段。元訓練階段,模型接觸多樣任務,學習提取特征、調整參數或開發可泛化策略,以適應新任務。在最佳情況下,元學習實現零樣本學習,即模型無需在目標數據集上訓練即可進行預測。在時間序列預測中,面對數據不足時,零樣本學習是可行的深度學習應用方式。
(三)NBEATS模型
(四)NBEATS與遷移學習結合的零樣本學習
本研究提出的基于零樣本學習的電力預測方法是電力預測領域的首次嘗試。本方法使用兩個不同的基礎訓練集構建了兩個NBEATS模型。第一個模型基于M3數據集,該數據集包含1399個月度時間序列,涉及金融、經濟和工業等多個領域。第二個模型基于M4數據集,該數據集包含47,992個月度時間序列,廣泛應用于預測研究和競賽。訓練后的模型直接用于電力生產預測,無需額外訓練,實現了零樣本預測。訓練設置見表1。
模型在訓練時采用30個月的回溯和4個月的預測,輸入長度30大約為輸出長度的7倍,模型使用Darts庫實現。本方法框架如圖2所示。通過在M4數據集月度時間序列上預訓練的NBEATS模型,能夠在未見數據上直接進行預測,而無需傳統遷移學習中的微調,從而實現更高效的預測。
三、實驗結果與分析
(一)評價指標
本文使用平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)和均方根誤差(Root Mean Square Error,RMSE)作為評價指標。MAPE計算的是預測值與實際值之間的絕對百分比誤差的平均值,RMSE計算的是預測值與實際值之間差的平方的平均值的平方根。
(二)結果分析
將本模型與RNN[5]、GRU[6]、LSTM[7]和ARIMA[8]模型的性能進行對比與評估,其實驗結果見表2。
ARIMA模型在所有測試模型中實現了最低誤差,緊隨其后的是NBEATS模型。由于深度學習模型通常包含大量參數,且需要大量數據進行訓練,而本研究中的電力數據集較小,導致深度學習模型容易過擬合,表現較差。相比之下,ARIMA作為參數模型,不依賴大數據集來估計模型系數,因此在本研究中的表現符合預期。盡管NBEATS模型未專門在電力數據上訓練,但其仍優于深度學習基準模型,證明了所提出方法的有效性。在執行時間比較中,NBEATS模型比其他模型快得多,超過20倍于ARIMA,接近70倍于LSTM。這些結果展示了零樣本學習方法在減少計算時間的同時,依然能夠提供準確的預測。
敏感性分析評估輸入參數變化對模型結果的影響,有助于理解模型的健壯性和可靠性,尤其是在確定脆弱或需要增強的區域時至關重要。在訓練基礎模型時,考慮了不同的回溯窗口長度。回溯窗口長度對模型性能至關重要。表3顯示了NBEATS模型在不同回溯長度下的精度和執行時間。分析表明,NBEATS模型的性能顯著依賴于回溯窗口長度,最佳窗口長度為20時,模型達到最高精度和合理的執行時間。過長或過短的窗口都會降低模型精度,表明存在最優窗口長度。因此,為確保模型的可靠性,需要通過敏感性分析確定最佳回溯窗口長度。
四、結語
本研究提出了一種基于零樣本遷移學習的電力生產預測方法,為電力預測領域提供了新視角。實驗結果表明,該方法無需額外訓練即可顯著提高預測準確性和效率。與傳統深度學習和統計方法相比,NBEATS模型在預測精度和執行時間上表現優異。敏感性分析揭示了回溯窗口長度對模型性能的重要影響,為參數優化提供了依據。本研究不僅填補了中期電力生產預測的空白,也為遷移學習在電力系統中的應用提供了實證支持。
參考文獻
[1]孫傳旺,占妍泓,徐夢潔.電力需求響應信號與新能源制造企業績效[J].管理世界,2024,40(12):185-203.
[2]王蕾,李斌,吳飛,等.基于改進極限學習機的電力市場實時電價預測方法[J].電子設計工程,2024,32(20):21-25+30.
[3]王若男,董琦.基于學習機制的多智能體強化學習綜述[J].工程科學學報,2024,46(07):1251-1268.
[4]OLIVARES K G, CHALLU C, MARCJASZ G, et al. Neural basis expansion analysis with exogenous variables: Forecasting electricity prices with NBEATSx[J]. International Journal of Forecasting, 2023, 39(02): 884-900.
[5]ABUMOHSEN M, OWDA A Y, OWDA M. Electrical load forecasting using LSTM, GRU, and RNN algorithms[J]. Energies, 2023, 16(05): 2283.
[6]MIM T R, AMATULLAH M, AFREEN S, et al. GRU-INC: An inception-attention based approach using GRU for human activity recognition[J]. Expert Systems with Applications, 2023, 216: 119419.
[7]XIN J, ZHOU C, JIANG Y, et al. A signal recovery method for bridge monitoring system using TVFEMD and encoder-decoder aided LSTM[J]. Measurement, 2023, 214: 112797.
[8]RAY S, LAMA A, MISHRA P, et al. An ARIMA-LSTM model for predicting volatile agricultural price series with random forest technique[J]. Applied Soft Computing, 2023, 149: 110939.
作者單位:陳峰,南京南瑞繼保電氣有限公司;朱旻昊,南瑞集團有限公司;車洵,南京理工大學紫金學院;石鵬飛,北京航天長峰科技工業集團有限公司
責任編輯:張津平 尚丹