









摘" 要: 針對(duì)負(fù)荷數(shù)據(jù)波動(dòng)性強(qiáng)、特征存在冗余而導(dǎo)致使用單一模型預(yù)測(cè)短期負(fù)荷時(shí)精度較低的問(wèn)題,提出一種融合梯度提升樹(shù)(GBDT)、自適應(yīng)噪聲完備集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMDAN)、長(zhǎng)短期記憶(LSTM)和極端梯度提升(XGBoost)的短期負(fù)荷預(yù)測(cè)組合方法。首先利用GBDT對(duì)負(fù)荷數(shù)據(jù)集進(jìn)行特征選擇,篩選出重要特征;然后使用CEEMDAN將負(fù)荷序列分解后合并為低頻分量和高頻分量;再將低頻分量輸入到LSTM中進(jìn)行預(yù)測(cè),將高頻分量輸入到XGBoost中進(jìn)行預(yù)測(cè);最后,短期負(fù)荷的最終預(yù)測(cè)結(jié)果由兩個(gè)模型的預(yù)測(cè)結(jié)果進(jìn)行疊加而成。與單一預(yù)測(cè)模型相比,所提方法在短期負(fù)荷方面具有更高的準(zhǔn)確性。
關(guān)鍵詞: 長(zhǎng)短期記憶; 極端梯度提升; 短期負(fù)荷預(yù)測(cè); 自適應(yīng)噪聲完備集合經(jīng)驗(yàn)?zāi)B(tài)分解; 梯度提升樹(shù)
中圖分類(lèi)號(hào):TM715" " " " " 文獻(xiàn)標(biāo)識(shí)碼:A" " "文章編號(hào):1006-8228(2023)12-49-06
Short-term load predicting based on LSTM-XGBoost and multi-model algorithm
Shao Bilin, Zhuang Xueli, Zeng Huibin
(School of Management, Xi'an University of Architecture and Technology, Xi'an, Shaanxi 710055, China)
Abstract: To address the problem of low accuracy in predicting short-term load using a single model due to the high volatility of load data and redundancy of features, a combined method for short-term load prediction is proposed that combines GBDT, CEEMDAN, LSTM, and XGBoost. Firstly, GBDT is used to feature select the load dataset to filter out important features. Next, the load sequence is decomposed and merged into low-frequency and high-frequency components using CEEMDAN. Then, the low-frequency components are input into LSTM and the high-frequency components are input into XGBoost for prediction. Finally, the final prediction results of short-term load are made by superposing the prediction results of the two models. Compared with the single prediction model, the proposed prediction method has higher accuracy in the short-term load.
Key words: long short-term memory (LSTM); extreme gradient boost (XGBoost); short-term load prediction; complete ensemble empirical mode decomposition with adaptive noise (CEEMDAN); gradient boosting decision tree (GBDT)
0 引言
我國(guó)“雙碳”政策的提出,促進(jìn)了電能系統(tǒng)進(jìn)一步發(fā)展。準(zhǔn)確地預(yù)測(cè)短期電力負(fù)荷既有助于維持電網(wǎng)系統(tǒng)的長(zhǎng)久穩(wěn)定運(yùn)行,還利于制訂電力調(diào)度策略以提高經(jīng)濟(jì)效益[1]。現(xiàn)如今,國(guó)內(nèi)外提出的短期負(fù)荷預(yù)測(cè)方法主要分為基于統(tǒng)計(jì)的傳統(tǒng)方法和基于機(jī)器學(xué)習(xí)的智能方法兩大類(lèi)。傳統(tǒng)的數(shù)理統(tǒng)計(jì)法主要包括線(xiàn)性回歸法、自回歸(AR)模型等,這類(lèi)方法的模型結(jié)構(gòu)簡(jiǎn)單,計(jì)算速度較快,但對(duì)于非線(xiàn)性負(fù)荷數(shù)據(jù)還難以獲得較高精度的預(yù)測(cè)結(jié)果。隨著科技的發(fā)展,將人工智能技術(shù)運(yùn)用到短期負(fù)荷預(yù)測(cè)中成為了眾多學(xué)者的首選。其中最具代表性的方法包括循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)以及極端梯度提升(XGBoost)等。這類(lèi)方法能很好地處理特征眾多、樣本大的非線(xiàn)性數(shù)據(jù),提高短期負(fù)荷預(yù)測(cè)精度[2]。LSTM解決了RNN梯度消失和爆炸的問(wèn)題,可以在很大程度上改善時(shí)間序列數(shù)據(jù)的預(yù)測(cè)精度,但對(duì)模型的輸入數(shù)據(jù)要求較高[3]。以XGBoost為首的深度學(xué)習(xí)方法,具有較高的學(xué)習(xí)能力,在負(fù)荷預(yù)測(cè)領(lǐng)域表現(xiàn)非常好。
然而單獨(dú)使用這些方法時(shí)都有各自不足之處,負(fù)荷預(yù)測(cè)方法由單一模型轉(zhuǎn)變?yōu)榻M合模型能夠?qū)⒛P透髯缘膬?yōu)點(diǎn)結(jié)合起來(lái)以取得更好的預(yù)測(cè)效果。由于負(fù)荷數(shù)據(jù)受氣候、節(jié)假日和歷史負(fù)荷等多方面的影響,導(dǎo)致特征存在冗雜,為進(jìn)一步提高負(fù)荷預(yù)測(cè)精度,將特征選擇方法融入負(fù)荷預(yù)測(cè)中成為主流[4]。文獻(xiàn)[5]使用互信息(MI)選擇模型的輸入變量,能夠降低特征維度,提高預(yù)測(cè)模型效率。然而,目前大多數(shù)采用的這些特征選擇方法都是線(xiàn)性的,側(cè)重點(diǎn)在于計(jì)算速度,不具有較高的預(yù)測(cè)精度。梯度提升樹(shù)(GBDT)是一種集成算法,能夠作為非線(xiàn)性特征選擇方法對(duì)特征進(jìn)行篩選,從而有效提高模型的預(yù)測(cè)精度與效率[6]。
此外,由于負(fù)荷序列數(shù)據(jù)具有較強(qiáng)的波動(dòng)性和隨機(jī)性,有學(xué)者將分解的思想引入到負(fù)荷預(yù)測(cè)領(lǐng)域中,以進(jìn)一步提高模型的預(yù)測(cè)速度和精度。文獻(xiàn)[7]將電力負(fù)荷由經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)分解后再進(jìn)行預(yù)測(cè),實(shí)驗(yàn)發(fā)現(xiàn)EMD出現(xiàn)了模態(tài)混疊現(xiàn)象導(dǎo)致預(yù)測(cè)精度低。文獻(xiàn)[8]為了提高負(fù)荷數(shù)據(jù)的平穩(wěn)性,利用互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMD)將風(fēng)電功率的負(fù)荷數(shù)據(jù)分解為多個(gè)子序列。結(jié)果表明,使用分解方法使得風(fēng)電功率預(yù)測(cè)結(jié)果的準(zhǔn)確性顯著提高。然而,CEEMD雖僅用少量的平均次數(shù)就能快速達(dá)到消除殘余噪聲的效果,但存在產(chǎn)生不正確組件的傾向?qū)е骂A(yù)測(cè)模型精度下降的問(wèn)題。自適應(yīng)噪聲完備集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMDAN)通過(guò)更少的試驗(yàn)次數(shù)引入額外的噪聲系數(shù)向量,這樣不僅解決了EMD模態(tài)混疊和CEEMD具有產(chǎn)生不正確組件傾向的問(wèn)題,還減少負(fù)荷分解工作的內(nèi)容[9]。
基于上述研究,本文提出了基于LSTM-XGBoost和多模型算法的短期負(fù)荷組合預(yù)測(cè)方法,融合了CEE-MDAN、GBDT、LSTM和XGBoost四種算法。首先使用GBDT算法根據(jù)特征的重要性評(píng)分篩選出重要特征以作為預(yù)測(cè)模型的輸入特征;然后,通過(guò)CEEMDAN對(duì)負(fù)荷數(shù)據(jù)進(jìn)行分解重構(gòu)為低頻和高頻分量?jī)煞N分量,不僅能夠有效降低負(fù)荷序列的波動(dòng)性,還能減少計(jì)算成本;接著,將較平穩(wěn)的低頻分量輸入到LSTM中進(jìn)行預(yù)測(cè),將波動(dòng)性強(qiáng)的高頻分量輸入到XGBoost模型中進(jìn)行預(yù)測(cè);最后,短期負(fù)荷的最終預(yù)測(cè)結(jié)果由兩個(gè)模型的預(yù)測(cè)結(jié)果進(jìn)行疊加而成。
1 相關(guān)理論原理
1.1 自適應(yīng)噪聲完備集合經(jīng)驗(yàn)?zāi)B(tài)分解
CEEMDAN是在EMD、EEMD、CEEMD方法的基礎(chǔ)上進(jìn)行改進(jìn)的一種信號(hào)分解算法,它在分解過(guò)程中添加的是具有標(biāo)準(zhǔn)正態(tài)分布的自適應(yīng)白噪聲,這種白噪聲會(huì)隨著分解過(guò)程而分解,對(duì)于復(fù)雜分量幾乎沒(méi)有影響。因此,CEEMDAN無(wú)需過(guò)多試驗(yàn)次數(shù)即可達(dá)到較高的分解精度,不僅解決了EMD、EEMD的模態(tài)混疊問(wèn)題,還兼顧了分解精度和計(jì)算成本。
1.2 梯度提升決策樹(shù)
梯度提升樹(shù)(gradient boosting decision tree,GBDT)是一種常用的集成算法,廣泛應(yīng)用于分類(lèi)、回歸和排序等任務(wù)中。使用GBDT進(jìn)行特征選擇的核心就是計(jì)算并排序各個(gè)特征對(duì)于建立的K棵決策樹(shù)的分類(lèi)性能所作出貢獻(xiàn)的程度,以此來(lái)評(píng)估每個(gè)特征的重要性。GBDT算法具體公式如下。
⑴ 初始化弱學(xué)習(xí)器[f0x]:
[f0x=argmini=1nL(yi,c)] ⑴
其中,[f0x]是一顆只有一個(gè)根節(jié)點(diǎn)的樹(shù);[L(yi,c)]是損失函數(shù);[yi∈Y?R],[Y]為負(fù)荷值;[c]是使損失函數(shù)最小化的常數(shù);[i]是樣本數(shù),[i(i=1,2,…N)]。
⑵ 計(jì)算第[m(m=1,2,…M)]次迭代樣本[i]的損失函數(shù)的負(fù)梯度,并將其作為殘差估計(jì)值[12]:
[rmi=-?L(yi,f(xi))?f(xi)fx=fm-1(x)]" ⑵
其中,[rmi]是殘差估計(jì)值;[xi∈X?Rn],[X]是輸入樣本空間,[xi]是特征值。
⑶ 計(jì)算回歸樹(shù)葉節(jié)點(diǎn)區(qū)域相對(duì)應(yīng)的損失函數(shù)最小化時(shí)的最佳擬合值[10]:
[cmj=argminxi∈Rmjyi-fm-1(xi)] ⑶
其中,[cmj]是最佳擬合值;[Rmj,j=1,2,…,J]是[m]棵樹(shù)的節(jié)點(diǎn)區(qū)域。
⑷ 對(duì)學(xué)習(xí)器進(jìn)行[m]次更新:
[fmx=fm-1x+m=1McmjIx∈Rmj]" ⑷
其中,[fmx]是更新[m]次的學(xué)習(xí)機(jī);[I]為學(xué)習(xí)率。
⑸ 最終強(qiáng)學(xué)習(xí)器:
[fx=fMx=m=1Mj=1JcmjI(x∈Rmj]" ⑸
1.3 長(zhǎng)短期記憶網(wǎng)絡(luò)
LSTM在RNN基礎(chǔ)上引入遺忘門(mén)、輸入門(mén)和輸出門(mén)結(jié)構(gòu),以解決梯度消失與爆炸,確保預(yù)測(cè)時(shí)間序列數(shù)據(jù)時(shí)所需的長(zhǎng)期依賴(lài)性[11]。結(jié)構(gòu)公式如下:
[ft=σWf?ht-1,xt+bf]" ⑹
[it=σWi?ht-1,xt+bi]" ⑺
[Ct=tanh (Wc?ht-1,xt)+bc]" ⑻
[Ot=σWo?ht-1,xt+bo]" ⑼
[ht=Ottanh (Ct)]" ⑽
[Ct=ftCt-1+itCt]" ⑾
其中,[ft]為遺忘門(mén);[σ]為sigmoid激活函數(shù);[Wf]和[bf]為遺忘門(mén)的權(quán)值和偏置;[ht-1]為[t-1]時(shí)刻的輸出;[xt]為[t]時(shí)刻的輸入;[it]為輸入門(mén);[Wi]和[bi]為輸入門(mén)的權(quán)值和偏置;[Ct]為[t]時(shí)刻的暫停狀態(tài);[tanh]為激活函數(shù);[Wc]和[bc]為[Ct]的權(quán)值和偏置;[Ot]為輸出門(mén);[Wo]和[bo]為輸出門(mén)的權(quán)值和偏置;[ht]為隱藏層輸出的信息。
1.4 極限梯度提升
XGBoost屬于基于樹(shù)的Boosting串行集成學(xué)習(xí)方法,是基于GBDT的一種改進(jìn)算法,與其只使用一階導(dǎo)數(shù)信息不同,XGBoost采用了二階泰勒展開(kāi)的損失函數(shù),并將一個(gè)正則項(xiàng)添加到目標(biāo)函數(shù)中,不僅能降低模型復(fù)雜度,還可以?xún)?yōu)化模型的計(jì)算精度[12]。XGBoost的目標(biāo)函數(shù)如式⑿、式⒀所示。
[objθ=iRlyi,yi+k=1KΩ(fk)]" ⑿
其中,第一項(xiàng)為損失函數(shù),是樣本訓(xùn)練的總體誤差;[yi]和[yi]表示第[i]個(gè)點(diǎn)的負(fù)荷預(yù)測(cè)值和實(shí)際值;第二項(xiàng)為[k]棵樹(shù)的正則化項(xiàng)的總和。
[Ωfk=γT+λ12j=1Tωj2]" ⒀
其中,[λ]為控制葉子結(jié)點(diǎn)權(quán)重的分?jǐn)?shù);[ω]為葉子節(jié)點(diǎn)的分?jǐn)?shù);[γ]是懲罰函數(shù)系數(shù),控制葉子結(jié)點(diǎn)的數(shù)量。
2 CEEMDAN-GBDT-LSTM-XGBoost的組合預(yù)測(cè)模型
針對(duì)負(fù)荷序列波動(dòng)性強(qiáng)、復(fù)雜性高,負(fù)荷特征存在冗余,單一預(yù)測(cè)模型無(wú)法克服固有困難導(dǎo)致精度不高的問(wèn)題,本文提出一種基于LSTM-XGBoost和多模型算法的短期負(fù)荷組合預(yù)測(cè)方法,該算法融合了CEEMDAN、GBDT、LSTM和XGBoost四種算法,預(yù)測(cè)流程如圖1所示。
⑴ 數(shù)據(jù)預(yù)處理。由于某些不可控因素會(huì)使手機(jī)的負(fù)荷數(shù)據(jù)存在異常,因此先要對(duì)原始數(shù)據(jù)集進(jìn)行數(shù)據(jù)清洗、異常和缺失值處理數(shù)據(jù)標(biāo)準(zhǔn)化與歸一化等。
⑵ 特征選擇。利用GBDT對(duì)氣候、日期和歷史負(fù)荷等九種輸入特征進(jìn)行降維處理,篩選出重要特征。
⑶ 負(fù)荷分解。使用CEEMDAN將經(jīng)過(guò)預(yù)處理后的負(fù)荷數(shù)據(jù)分解為多個(gè)IMF分量,并根據(jù)過(guò)零率將這些IMF分量合并為低頻和高頻兩種分量。
⑷ 構(gòu)建LSTM-XGBoost預(yù)測(cè)模型。將低頻分量和經(jīng)特征選擇后的重要特征一同作為L(zhǎng)STM的輸入進(jìn)行短期負(fù)荷預(yù)測(cè);將高頻分量和經(jīng)特征選擇后的重要特征一同作為XGBoost的輸入進(jìn)行短期負(fù)荷預(yù)測(cè)。
⑸ 最后,短期負(fù)荷的最終預(yù)測(cè)結(jié)果由兩個(gè)模型的預(yù)測(cè)結(jié)果疊加而成。
3 實(shí)例分析
為了驗(yàn)證CEEMDAN-GBDT-LSTM-XGBoost組合預(yù)測(cè)模型的可行性和有效性,選取國(guó)內(nèi)某電力市場(chǎng)2012年至2015年數(shù)據(jù)作為數(shù)據(jù)集。該數(shù)據(jù)集包括采樣頻率為每小時(shí)一次的歷史負(fù)荷數(shù)據(jù)、氣象類(lèi)五個(gè)因素和日期類(lèi)三個(gè)因素。本文將數(shù)據(jù)集的前95%作為訓(xùn)練集來(lái)構(gòu)建本文的預(yù)測(cè)模型,剩余的數(shù)據(jù)作為測(cè)試集進(jìn)行仿真實(shí)驗(yàn)。
3.1 數(shù)據(jù)預(yù)處理
由于原始負(fù)荷數(shù)據(jù)規(guī)模較大,為了避免負(fù)荷與因素之間量綱不同而影響降維效果的問(wèn)題,首先要將負(fù)荷數(shù)據(jù)做歸一化處理,公式如下:
[Z=x-xminxmax-xmin]" ⒁
其中,[Z]是歸一化后的數(shù)據(jù)值;[x]是原始負(fù)荷數(shù)據(jù)值;[xmin]是原數(shù)據(jù)中的最小值;[xmax]是原數(shù)據(jù)中的最大值。
3.2 評(píng)價(jià)指標(biāo)
為客觀評(píng)估模型的預(yù)測(cè)性能,本文選擇將平均絕對(duì)百分比誤差(MAPE)和均方根誤差(RMSE)作為各個(gè)模型的評(píng)價(jià)指標(biāo),二者表達(dá)式如下:
[MAPE=1ni=1nyi-y*yi×100%]" ⒂
[RNSE=1ni=1nyi-y*2]" ⒃
其中,[n]為負(fù)荷預(yù)測(cè)樣本的總數(shù)量;[yi]為負(fù)荷的實(shí)際值;[y*]為負(fù)荷的預(yù)測(cè)值。
3.3 用CEEMDAN進(jìn)行時(shí)間負(fù)荷序列分解
將原始負(fù)荷序列通過(guò)CEEMDAN算法進(jìn)行分解得到九個(gè)IMF分量與一個(gè)視為誤差的殘余分量,對(duì)負(fù)荷數(shù)據(jù)的內(nèi)部特征信息進(jìn)行了深入挖掘。在表1中給出的CEEMDAN算法相關(guān)參數(shù)下,本文通過(guò)CEEMDAN對(duì)原始負(fù)荷進(jìn)行了分解,并得到如圖2所示的結(jié)果。
為了避免對(duì)每個(gè)IMF都分別進(jìn)行預(yù)測(cè)會(huì)導(dǎo)致預(yù)測(cè)精度不高且計(jì)算效率低的問(wèn)題,采用過(guò)零率來(lái)劃分低頻與高頻分量,再對(duì)這兩種分量分別進(jìn)行預(yù)測(cè),過(guò)零率公式如下:
[L0=l0M]" ⒄
其中,[l0]為某分量過(guò)零的次數(shù);[M]為樣本總量。
參考現(xiàn)有研究,大多數(shù)學(xué)者采用0.01來(lái)劃分低頻和高,由表2可知,IMF1、IMF2、IMF3、IMF4和IMF5的過(guò)零率小于0.01,因此將它們合并作為低頻分量,剩余的分量IMF6、IMF7、IMF8以及IMF9合并作為高頻分量,剔除RES[13]。
3.4 使用GBDT進(jìn)行特征選擇
為了降低LSTM-XGBoost預(yù)測(cè)方法的特征冗余和模型的復(fù)雜程度,深層次挖掘特征的內(nèi)部信息,使用GBDT算法挖掘出高相關(guān)地冗余的重要特征。通過(guò)直接將溫度、濕度、降雨量、歷史七天負(fù)荷數(shù)據(jù)、節(jié)假日、星期、月份等九個(gè)影響因素對(duì)負(fù)荷影響程度的大小進(jìn)行排序,以篩選出影響程度最大的三個(gè)因素最為重要特征,并與歷史負(fù)荷同時(shí)作為L(zhǎng)STM-XGBoost預(yù)測(cè)模型的輸入。結(jié)果如表3所示。
表2為計(jì)算的特征重要性結(jié)果排序,反映了這些特征對(duì)負(fù)荷的影響程度。其中,預(yù)測(cè)前七天的歷史負(fù)荷數(shù)據(jù)的特征重要性值最高,這說(shuō)明該特征最能反映外部特征對(duì)負(fù)荷變化的主要影響。氣象相關(guān)因素特征重要程度相對(duì)較高,其中溫度對(duì)負(fù)荷的貢獻(xiàn)程度最大,最高溫度比平均溫度和最低溫度具有更重要的影響,其次是降雨量。經(jīng)過(guò)特征選擇后的特征重要性評(píng)分之和為55.99%,說(shuō)明此方法在剔除了冗余特征的同時(shí),還篩選出了極具代表性的重要特征。
3.5 預(yù)測(cè)結(jié)果分析及對(duì)比實(shí)驗(yàn)研究
3.5.1 單一模型與組合模型對(duì)比
接下來(lái)用預(yù)處理后的負(fù)荷數(shù)據(jù)來(lái)驗(yàn)證本文提出的CEEMDAN-GBDT-LSTM-XGBoost負(fù)荷預(yù)測(cè)組合模型的有效性,分別用LSTM、XGBoost和LSTM-XGBoost對(duì)同一組數(shù)據(jù)進(jìn)行預(yù)測(cè),結(jié)果如圖5和表3所示。
圖3和表3結(jié)果顯示XGBoost作為集成模型整體表現(xiàn)優(yōu)于LSTM模型,預(yù)測(cè)結(jié)果更接近真實(shí)值,表明深度學(xué)習(xí)模型具有更好的預(yù)測(cè)性能;LSTM-XGBoost的MAPE和RMSE較于LSTM模型降低了56.91%和66.51%;較XGBoost模型降低了36.19%和50.07%。組合模型的預(yù)測(cè)結(jié)果精度較前二者都有所提高,表明LSTM-XGB-oost組合模型能夠針對(duì)負(fù)荷波動(dòng)的周期性、非線(xiàn)性等特點(diǎn)結(jié)合LSTM與XGBoost各自的優(yōu)勢(shì),獲得到更優(yōu)異的預(yù)測(cè)能力。綜上,LSTM-XGBoost組合模型的預(yù)測(cè)效果比單一的LSTM和單一的XGBoost都表現(xiàn)得更好。
3.5.2 特征處理前后
為了進(jìn)一步驗(yàn)證將特征選擇應(yīng)用于短期負(fù)荷預(yù)測(cè)領(lǐng)域的有效性以及GBDT算法進(jìn)行特征處理的優(yōu)越性,本文把使用GBDT進(jìn)行特征選擇后得到的重要特征和未經(jīng)處理的特征分別作為L(zhǎng)STM-XGBoost模型的輸變量進(jìn)行預(yù)測(cè),結(jié)果如圖4和如表4所示。
從圖4可以看出使用了GBDT方法后的LSTM-XG-Boost模型預(yù)測(cè)曲線(xiàn)較未經(jīng)特征處理的預(yù)測(cè)曲線(xiàn)更貼合真實(shí)值曲線(xiàn)。根據(jù)表4,通過(guò)GBDT進(jìn)行特征選擇后的預(yù)測(cè)結(jié)果MAPE降低了37.966%,RMSE降低了51.90%,驗(yàn)證了采用GBDT算法在負(fù)荷預(yù)測(cè)領(lǐng)域中進(jìn)行特征選擇能夠提升模型學(xué)習(xí)效率,說(shuō)明分解與特征選擇結(jié)合的方法能夠提高負(fù)荷預(yù)測(cè)精度。
3.5.3 不同分解方法對(duì)比
為了驗(yàn)證CEEMDAN分解較其他分解方法更有優(yōu)勢(shì),本文還選取了EMD分解對(duì)負(fù)荷數(shù)據(jù)進(jìn)行處理,利用EMD-GBDT-LSTM-XGBoost對(duì)同一天的負(fù)荷數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如圖5和表5所示。相比未經(jīng)分解的預(yù)測(cè)結(jié)果,使用負(fù)荷分解并對(duì)分量進(jìn)行分類(lèi)預(yù)測(cè)的結(jié)果精度都有所提高;對(duì)比基于EMD分解和基于CEEMDAN分解的預(yù)測(cè)結(jié)果,采用基于CEEMDAN分解方法進(jìn)行預(yù)測(cè)的MAPE降低了47.85%,RMSE降低了41.58%,結(jié)果表明基于EMD分解的預(yù)測(cè)效果差于基于CEEMDAN分解,EMD分解存在的模態(tài)混疊問(wèn)題會(huì)對(duì)負(fù)荷預(yù)測(cè)結(jié)果產(chǎn)生負(fù)面影響。綜合表明,分解預(yù)測(cè)的思想能夠有效地提高后續(xù)的預(yù)測(cè)精度,為最終獲得高精度預(yù)測(cè)結(jié)果奠定了基礎(chǔ)。CEEMDAN通過(guò)添加自適應(yīng)白噪聲的方式進(jìn)行處理,從而進(jìn)一步提升了模型預(yù)測(cè)精度。
4 結(jié)論
本文針對(duì)短期負(fù)荷預(yù)測(cè)中存在特征冗余、負(fù)荷數(shù)據(jù)波動(dòng)性強(qiáng)的問(wèn)題,提出了基于LSTM-XGBoost和多模型算法的短期負(fù)荷組合預(yù)測(cè)方法,融合CEEMDAN、GBDT、LSTM和XGBoost四種算法,該預(yù)測(cè)方法具有以下優(yōu)勢(shì):
⑴ 通過(guò)CEEMDAN算法將原始負(fù)荷數(shù)據(jù)進(jìn)行分解能降低其波動(dòng)性,獲取到更多的負(fù)荷內(nèi)部信息以提高負(fù)荷預(yù)測(cè)模型的精度。
⑵ 基于GBDT算法的特征選擇方法能夠有效分析特征對(duì)于負(fù)荷的影響程度大小,篩選出影響程度較高的特征來(lái)作為模型的輸入,不但可以減少模型中的特征冗余,還保證了模型的預(yù)測(cè)精度。
⑶ 結(jié)合LSTM和XGBoost對(duì)高低頻分量進(jìn)行分別預(yù)測(cè),不僅能夠有效提高預(yù)測(cè)效率,還可以發(fā)揮各自的優(yōu)勢(shì)克服單一模型誤差大的缺陷。
參考文獻(xiàn)(References):
[1] 郭韶昕,陳祥,周楓.基于CEEMD-IDA-SVM的風(fēng)電功率
短期預(yù)測(cè)[J].上海電機(jī)學(xué)院學(xué)報(bào),2022,25(6):339-345.
[2] 高超,孫誼媊,趙洪峰,等.基于ICEEMDAN-ISSA-LSTM的
短期電力負(fù)荷預(yù)測(cè)[J/OL].中國(guó)測(cè)試:1-9[2023-06-24]
[3] 王子樂(lè),王子謀,蔡瑩,等.基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)組合算法
的短期電力負(fù)荷預(yù)測(cè)[J].現(xiàn)代電力,2023,40(2):201-209.
[4] 常樂(lè),汪慶年.基于優(yōu)化聚類(lèi)分解與XGBOOST的超短期
電力負(fù)荷預(yù)測(cè)[J].國(guó)外電子測(cè)量技術(shù),2022,41(5):46-51.
[5] 徐巖,向益鋒,馬天祥.基于EMD-CNN-LSTM混合模型的
短期電力負(fù)荷預(yù)測(cè)[J].華北電力大學(xué)學(xué)報(bào)(自然科學(xué)版),2022,49(2):81-89.
[6] 鄭豪豐,楊國(guó)華,康文軍,等.基于多負(fù)荷特征和TCN-GRU
神經(jīng)網(wǎng)絡(luò)的負(fù)荷預(yù)測(cè)[J].中國(guó)電力,2022,55(11):142-148.
[7] OmajiSamuel,F(xiàn)ahad A. Alzahrani,Raja Jalees Ul Hussen
Khan,etal.Towards Modified Entropy Mutual Information Feature Selection to Forecast Medium-Term Load Using a Deep Learning Model in Smart Homes[J]. Entropy,2020,22(1).
[8] 陳振宇,劉金波,李晨,等.基于LSTM與XGBoost組合模型的
超短期電力負(fù)荷預(yù)測(cè)[J].電網(wǎng)技術(shù),2020,44(2):614-620.
[9] Hui Liu,Chao Chen. Data processing strategies in wind
energy forecasting models and applications: A comprehensive review[J].Applied Energy,2019,249.
[10] 張永真,呂學(xué)強(qiáng),申閆春,等.基于SAO結(jié)構(gòu)的中文專(zhuān)利實(shí)體
關(guān)系抽取[J].計(jì)算機(jī)工程與設(shè)計(jì),2019,40(3):706-712.
[11] 賈銳軍,冉祥來(lái),吳俊霖,等.基于XGBoost算法的機(jī)場(chǎng)旅客
流量預(yù)測(cè)[J].民航學(xué)報(bào),2018,2(6):34-37,33.
[12] 張亞寧.基于LSTM模型的短期負(fù)荷預(yù)測(cè)[J].科技與創(chuàng)新,
2018(12):18-21.
[13] 武國(guó)良,祖光鑫,楊志軍,等.基于MLR和LSTM神經(jīng)網(wǎng)絡(luò)的短期
負(fù)荷預(yù)測(cè)方法[J].黑龍江電力,2021,43(4):297-301.