謝國民,王潤良
(遼寧工程技術大學電氣與控制工程學院,葫蘆島 125105)
負荷預測是電力系統中十分重要的環節,其準確性不僅關系到用電可靠性,還可以有效減少電力系統運行中的資源損耗,同時還能保證居民和工業生產的用電需求得到滿足。為了降低能源損耗和提升經濟效益,對短期負荷精準預測是目前該研究領域的重點[1-2]。
傳統預測方法主要有時間序列法[3]、指數平滑法[4]和灰色預測法[5]。時間序列法對數據需求較少,但對溫度、降雨量等不確定性因素考慮不足,對原始數據的平穩性要求很高,當該地區負荷波動較大時,其預測誤差較大。指數平滑法通過加權系數體現負荷數據的時變性,其平滑作用可處理序列中的隨機波動信號,但只能對單一指標進行預測。灰色預測法基于灰色系統理論,對樣本數據需求量少,對非線性變化的負荷數據適應性較好,但只適合指數增長型數據。現代預測方法包括支持向量機[6]、反向傳播BP(back propagation)神經網絡[7]和專家系統[8],有效提高了預測精度和計算速度。但是,上述方法都沒有考慮時序關聯的問題,其中支持向量機面對龐大數據時,處理速度較慢;專家系統需要制定大量的知識規則,學習能力較差;BP神經網絡存在過擬合現象,泛化能力較差。
目前,深度學習已成為受到學者們廣泛關注的預測方法。其中,雙向長短期記憶BiLSTM(bidirectional long short-term memory)網絡考慮了數據間的時序關聯性,在長時間復雜序列預測方面也得到深入發展[9]。但是單一預測模型具有較大的局限性,BiLSTM 模型會受負荷數據波動性的影響,同時也存在超參數難以選擇的問題,而組合預測模型則能結合負荷分解和超參數尋優的優點,進一步提升預測精度,滿足負荷預測的需求。文獻[10]針對長短期記憶LSTM(long short-term memory)網絡參數難以確定的問題,利用麻雀搜索算法SSA(sparrow search algorithm)對LSTM 進行參數尋優,取得了較為理想的預測結果,但SSA在尋優過程中易陷入早熟。文獻[11]采用經驗模態分解EMD(empirical mode decomposition)將非平穩時間序列分解為多個平穩的子序列,利用BiLSTM對子序列進行預測,但EMD 存在模態混疊的缺點。相較于EMD,變分模態分解VMD(variational mode decomposition)可以有效提取復雜信號的特征信息,避免EMD 中模態混疊缺點,對信號分解效果較為理想。排列熵PE(permutation entropy)理論通過檢測時間序列復雜性,避免了子序列過多引起的計算量過大的缺點。
為此,針對電力負荷波動性和隨機性問題,本文提出一種基于VMD、PE 與改進金豺IGJO(improved golden jackal optimization)算法優化BiLSTM的組合預測模型。首先利用VMD將原始負荷序列分解為多個平穩的子序列,再采用PE 算法對子序列進行熵值重組;然后利用BiLSTM 模型對各子序列進行預測,并通過IGJO 優化模型參數;最后,采用中國泉州和歐洲某地區的負荷數據驗證本文方法的有效性。
VMD 是一種新的非遞歸信號自適應處理的方法[12],具有降低數據復雜度和改善負荷序列非平穩性的優點,可以克服EMD 存在模態混疊的缺點。因此,本文利用VMD方法處理初始負荷序列,將負荷數據曲線分解為多個不同頻率且相對平穩的子序列,有效降低電力負荷序列的隨機性和非線性。變分問題構造步驟如下。
步驟1利用高斯平滑度估計各分量的帶寬,在確保各模態分量的帶寬和最小的情況下,將負荷序列分解成K個分量,此時目標函數可表示為
式中:K為要分解的子信號個數;(ft)為原始負荷;δ(t)為狄拉克函數;*表示卷積運算;{uk(t)}、{ωk} 分別為分解后模態分量與中心頻率的集合;?t()為對t求偏導。
步驟2引入拉格朗日乘子λ(t)和二次懲罰項α,將上述約束問題轉換為無約束變分問題,改進后的表達式為
步驟3通過交替方向乘子法迭代求解模態分量和中心頻率,從而找到改進后拉格朗日的鞍點。中心頻率的表達式為
式中:Uk(ω)為uk(t)的傅里葉變換;上標(n+1)表示迭代次數。
PE[13]可以準確表示時間序列的復雜性和突變性程度,其計算速度快、抗噪聲能力強,對于電力負荷這種動態非線性數據有很好的適用性和較強的敏感性。本文采用PE 計算各負荷分量的復雜度,將具有相似復雜度的分量合并成新的子序列。PE計算流程如下。
步驟1對時間序列{x(i),i=1,2,…,n}進行重構,得到重構矩陣X,即
式中:m為嵌入維度;τ為延遲時間;N為重構分量個數;X(i)為重構矩陣的第i行向量。
步驟2矩陣X中每行為重構分量,對每行的x(i)按升序排列,得到一組新的時間序列。
步驟3任一重構分量可得到新的序列,即
式中:j1,j2,…,jm表示重組后的新序列,若重構分量x(i)中存在大小相等的值,則根據j1、j2的值對齊;k=1,2,…,g,g≤m!。m種不同的向量會產生m!種s(k)序列,計算此時s(k)序列的概率分布,Pk為s(k)序列出現的概率,可得
步驟4時間序列x(i) 的排列熵Hp(m) 可定義為
式中,ln(m!)為時間序列x(i)的PE達到的最大值。
LSTM 為一種循環神經網絡RNN(recurrent neural network)[14-15],相比于傳統神經網絡,RNN 可以通過反向傳播算法讓各網絡層的神經元相互交流,并充分考慮了時序關聯問題,但RNN 存在長期依賴問題,即當時序信息與預測點距離較遠時,RNN 無法學習該時序信息。為解決這一問題,LSTM在輸入、輸出和更新門的基礎上,加入自適應遺忘門,自適應遺忘門使其在學習過程中不斷更新并丟棄內部信息,從而增強了對長序列數據學習的能力。LSTM 網絡結構如圖1 所示。其中,t時刻的輸入由上一時刻的狀態信息St-1、輸出值ht-1及當前時刻的網絡輸入值xt組成;t時刻的輸出由當前時刻狀態信息St和輸出值ht組成;ft為遺忘門輸出;it、ot分別為輸入門和輸出門的輸出;gt為輸入節點的輸出;σ為sigmoid函數。

圖1 LSTM 網絡結構Fig.1 Structure of LSTM network
LSTM 在學習過程中,往往忽視反向時間序列數據的有用信息,并且由于時序數據過多、訓練時間過長而導致LSTM丟失訓練過程前期的資源。因此,綜合考慮時序數據的正反向可以提高預測精度,BiLSTM便是基于以上思想構建網絡,其結構如圖2所示。

圖2 BiLSTM 網絡結構Fig.2 Structure BiLSTM network
BiLSTM網絡結構被劃分為前向與后向兩個部分。首先,將負荷數據正向輸入到前向LSTM 中計算,得到并保存前向LSTM 的輸出;然后,將負荷數據反向輸入到后向LSTM 中計算,得到并保存后向LSTM層的輸出;最后,將每個時刻的前向層與后向層的輸出加權疊加,便能得到了最終的預測結果。相比于常規LSTM訓練過程,通過BiLSTM進行正反向學習更加適合于電力負荷數據。
金豺GJO(golden jackal optimization)算法是由Nitish Chopra 和Muhammad Mohsin Ansari[16]于2022年提出的一種新的元啟發式算法,該算法是一種模仿金豺合作狩獵行為的新型智能優化算法。GJO算法包括搜索獵物、包圍獵物和攻擊獵物3 個基本步驟。
2.1.1 搜索獵物
搜索工作由雄性豺狼領導,雌性豺狼跟隨雄性豺狼,其位置更新可表示為
式中:Y1(t)、Y2(t)分別為雄豺和雌豺更新后的位置;YM(t)、YFM(t)分別為第t次迭代雄豺和雌豺的位置;Prey(t)為獵物位置的行向量;l為獵物逃脫軌跡;E為獵物逃脫時的能量變化,可表示為
式中,E0為獵物初始能量值。
獵物逃脫軌跡l可表示為
式中:LF(y)為萊維飛行函數;y為向量維度。
獵物脫逃能量下降的過程μ可表示為
式中:t為當前迭代次數;Tmax為最大迭代次數;c1為常數,本文取1.5。
獵物位置由雄豺和雌豺的位置Y1(t)、Y2(t)共同決定,即
式中,Y(t+1)為獵物第t+1次迭代后的位置向量。
2.1.2 包圍和攻擊獵物
獵物被金豺襲擾后,其逃脫能量E將減弱,在金豺將獵物包圍后,雄豺和雌豺將一同對其發起捕獵,其位置更新可表示為
2.2.1 混沌初始化
種群初始化會影響算法的求解精度和收斂速度,然而GJO算法在求解優化問題時往往采用隨機方式生成初始種群,使得尋優算法初始種群多樣性較差,影響求解精度和速度。混沌算法具有不確定性、不可預測性及遍歷性的特性,將其映射到尋優算法上時,這些特性能夠保持種群的多樣性,使算法更易逃離局部最優解。同時,Logistic具有映射結構簡單、強發散性的優點,但其分布不夠均勻;Tent映射迭代速度快且有均勻的概率密度,但混沌區間有限。Logistic-Tent復合混沌映射融合了以上兩者的優點,具有結構簡單、發散性強、迭代速度快和生成的混沌序列更為均勻的優點,因此改進金豺IGJO(improved golden jackal optimization)算法采用Logistic-Tent混沌初始化策略及其算法可表示為
式中:r∈[0,4];mod()表示取余運算;i為種群規模,i=1,2,…,n;d為混沌變量序號,d=1,2,…,m;xi,d為當前混沌映射結果。通過式(14)選取初值后,將混沌序列映射到函數空間中,金豺個體的表達式為
式中,Yd_max和Yd_min分別為搜索上限和下限。
2.2.2 高斯變異
GJO 算法在進化迭代后期會出現種群多樣性快速下降的現象,不可避免地陷入局部收斂。為改進這一缺點,本文對當前最優位置以一定概率執行高斯變異策略,以維持種群的多樣性和算法收斂性之間的平衡,并借鑒貪婪選擇策略,比較變異前后適應度大小,確定最優適應度個體位置。高斯變異算子的表達式為
式中:Ybest(t+1)為變異后位置;Gaussion(σ)為高斯隨機分布變量;σ為高斯變異的標準差。
全局最優位置更新可表示為
2.2.3 引入粒子群優化算法
GJO算法在更新下一代位置信息時,只考慮金豺個體位置信息與種群中的雄豺和母豺位置信息,而忽略自身經驗對金豺個體的影響。因此,本文引入粒子群優化PSO(particle swarm optimization)算法來改進金豺位置更新過程,使算法既能加快收斂,又能保證全局最優。在PSO算法中,每個粒子更新位置時需要考慮個體最優位置和全局最優位置,故本文將金豺個體經歷過的最佳位置信息引入式(12)所示的位置更新公式中。新的位置更新公式為
式中:c1、c2為學習權重,本文取均2;r1、r2為[0,1]的隨機數;Pbest為金豺個體歷史最優位置;w1、w2為慣性系數。
為保證BiLSTM 有效追蹤實際負荷曲線,提高負荷預測的精準度,IGJO首先采用復合混沌映射初始化種群增加種群多樣性;其次,以一定概率執行高斯變異,拓展算法搜索空間;然后,引入PSO 思想,加強個體與自身經驗間的信息交流,進一步提升算法收斂精度。
BiLSTM模型的學習率L、隱含層節點H和正則化系數L2能夠直接影響負荷預測結果,且BiLSTM具有較多的隱含層節點數,隨機選取超參數會使輸出結果出現較大的不確定性。本文采用IGJO 算法對BiLSTM 網絡進行優化,即通過IGJO 算法對學習率、隱含層節點和正則化系數這3個超參數進行尋優,找到對應最佳適應度值的3個超參數并將其賦給BiLSTM 網絡模型,解決模型難以選擇超參數的問題,使其負荷預測的準確性得到進一步提高。IGJO算法優化BiLSTM模型流程如圖3所示。

圖3 IGJO 算法優化BiLSTM 模型流程Fig.3 Flow chart of BiLSTM model optimized byIGJOalgorithm
本文基于IGJO-BiLSTM 模型預測方法的主要步驟如下。
步驟1利用混沌映射產生種群個體,將BiLSTM網絡的學習率、隱含層節點數和正則化系數作為參數變量,確定參數的尋優范圍。
步驟2定義適應度。將BiLSTM 模型輸出值的均方差作為適應度函數fit,即
步驟3計算所有金豺個體的適應度值并排序,確定雄豺和母豺的位置;利用式(18)更新下一代金豺個體位置,并重新計算個體對應的適應度。
步驟4對當前種群中最優金豺個體位置按一定概率執行高斯變異策略,利用貪婪選擇策略確定是否接受新的金豺個體位置。
步驟5通過適應度選取最優種群位置,并判斷是否滿足迭代條件。
步驟6將迭代結束產生的最優值作為BiLSTM模型的參數進行模型預測。
本文選取氣溫、濕度和降雨量作為特征變量,將負荷序列作為主體變量,將原始數據分為負荷數據和氣象數據。通過VMD將原始負荷序列分解為多個子序列,有效解決了負荷波動和非線性的問題,提高了負荷預測的準確性,減小了預測難度。在對原始數據分解后,容易造成因子序列較多進而導致計算時間過長的問題。為解決這一問題,本文利用PE 對VMD 后的子序列進行熵值計算,并疊加熵值相似的子序列,通過PE 處理有效減小了計算復雜度并保證了預測精度。
基于VMD-PE-IGJO-BiLSTM 的組合方法流程如圖4所示,具體步驟如下。

圖4 組合方法流程Fig.4 Flow chart of combination method
步驟1對經過VMD 后的負荷子序列,利用PE 對各子序列進行熵值計算,重構成新的負荷子序列集。
步驟2對數據進行歸一化處理,即
式中:x′為歸一化后的值;xi為原始值;xmin為最小值;xmax為最大值。
步驟3初始化IGJO 算法的參數、BiLSTM 參數和相關變量。對于K個子序列,分別采用IGJO算法對BiLSTM 進行尋優,將所得最優超參數賦予一個新的BiLSTM進行預測。
步驟4對步驟3中的結果進行疊加輸出最終預測值,并對最終預測值和真實值進行誤差分析。
本文選取福建省泉州市某地區2020 年8 月1日—2020年9月30日電力負荷數據為樣本,采樣周期為15 min,共5 856 組數據,其中包括天氣因素、日期類型和負荷功率,將最后一天96 組數據作為測試集,其余為訓練集。本文模型采用滑動窗口建模,即利用前n組數據的氣溫因素、降雨量和負荷功率作為輸入,以第n+1組數據的負荷功率作為輸出,其中n取12,即每隔3 h截取一組時間序列。
將VMD-PE-IGJO-BiLSTM 模型與其他預測模型進行對比實驗,所有預測模型均輸入相同負荷序列數據,保證對比實驗的有效性。本文選取平均百分比誤差MAPE(mean absolute percent-age error)、均方根誤差RMSE(root mean squared error)和平均絕對誤差MAE(mean absolute error)作為評價指標,其表達式分別為
式中:n為數據集個數;yi和分別為第i個數據的真實值和預測值。若MAPE、RMSE 和MAE 的值越小,則說明模型預測結果誤差越小,泛化能力越強。
負荷數據在進行VMD 前,需指定分解的固有模態函數IMF(intrinsic mode functions)數量,即在分解前確定模態分解的K值。本文通過中心頻率觀察法[17]確定K值,即從K=2開始對負荷數據進行分解,VMD 處理后的各分量中心頻率如表1 所示。分析各分量的中心頻率,若出現中心頻率相近的情況,則認為分解序列數過多。當K=7 時,IMF3和IMF7的中心頻率相近,因此K取6。

表1 VMD 分解Tab.1 VMD decomposition
如果利用BiLSTM預測模型直接對每個模態分量進行時序預測,會增大計算規模。為減小計算復雜度,采取PE 算法分析所有模態分量時序復雜程度,根據分析得到的PE值對相似分量合并疊加,各分量的PE如圖5所示。

圖5 各模態分量PEFig.5 PE of each mode component
由圖5 可知,IMF1和IMF2的PE 值相差不大,兩者差值僅為0.027,這說明IMF1和IMF2的復雜度相似,兩者可混疊成一個新的時間序列作為BiLSTM新的輸入,這樣可得到重構分量如圖6所示。

圖6 重構分量結果Fig.6 Resultof reconstructed component
為進一步分析VMD 和PE 算法的優異性,并對其進行量化評價,分別采用VMD 和EMD 兩種分解算法對負荷進行處理,對9 月30 日的負荷進行預測,其預測結果如表2所示。可以看出,經過VMDPE 處理后的預測精度要明顯優于其他模型,而PE算法除了減小了計算量,對于預測準確性也有一定程度提升。

表2 數據處理后預測結果Tab.2 Prediction results after data processing
對第4.2節中處理后的不同模態分量分別建立IGJO-BiLSTM 模型。將IGJO-BiLSTM 模型與其他預測模型進行對比,設置種群數量為30,迭代次數為30。為防止搜索空間過大,降低尋優效率,設置學習率搜索范圍為[0.000 1,0.500 0]、隱藏層節點數范圍為[1,50]、正則化系數范圍為[0.0001,0.500 0),各參數經IGJO 算法優化后得到各分量的BiLSTM參數如表3所示。各負荷分量預測結果如圖7所示。

表3 各分量優化結果Tab.3 Optimization result of each component

圖7 各分量預測結果Fig.7 Prediction result of each component
分別采用BP 網絡、LSTM 網絡、BiLSTM 網絡和本文方法分別進行負荷預測,預測曲線如圖8 所示。可以看出,經過IGJO算法參數優化后的VMDPE-BiLSTM 模型預測精度最高,與真實值擬合度最好。

圖8 預測結果對比Fig.8 Comparison of prediction results
為驗證預測模型有效性,本文方法與其他8 種模型分別進行時間序列負荷預測,結果如表4所示。

表4 負荷預測結果Tab.4 Load prediction results
由表4 可知,IGJO-BiLSTM、GJO-BiLSTM、和SSA-BiLSTM 均提高了預測精度,有效避免了模型超參數隨機化的問題。對比3 種模型的誤差指標可以發現,IGJO-BiLSTM 模型的預測精度更高,泛化能力更強。對比3種分解組合模型的評價指標,本文預測模型的RMSE為5.02 kW、MAE為4.10 kW、MAPE 為0.50%,其誤差小于SSA-BiLSTM 模型。VMD-PE-IGJO-BiLSTM 模型與本文所用方法相比,3 種誤差評價指標相差不大,甚至本文方法的部分指標要優于未加入PE 算法的預測模型,但是本文方法的20 次訓練時間的平均值為737.98 s,小于VMD-IGJO-BiLSTM 組合模型的917.40 s,節省了大量時間。
為驗證本文模型在不同季節下負荷預測精度與泛化性能,選擇2020年6月和12月的電力負荷數據分別代表夏季和冬季,每個月的數據均為2 976組,分別對每個季節提前3 天預測,預測結果如圖9 所示,預測誤差評價如表5所示。

表5 夏冬季節誤差評價Tab.5 Error evaluation in summer and winter

圖9 夏冬季節負荷預測Fig.9 Load prediction in summer and winter
由圖9和表5可知,無論夏季還是冬季,本文模型都能有效追蹤實測負荷曲線,預測曲線擬合度很高。由于泉州冬季電力負荷波動較小,本文模型預測對冬季負荷的精度較高,而夏季負荷波動大,其預測精度要低于冬季負荷預測。在夏季負荷預測中,本文模型的RMSE 和MAE 比VMD-PE-BiLSTM降低了26.80%、31.40%;在冬季負荷預測中本文方法 的RMSE 和MAE 比VMD-PE-BiLSTM 降低了33.27%、35.62%。這說明本文預測模型要優于傳統模型且具有較強的泛化性。
為進一步驗證本文模型在不同地區下負荷預測精度與普適性,本文選擇歐洲某地區2020年7月1 日—2020 年8 月31 日的電力負荷數據為樣本,采樣周期為1 h,共1 488 組數據。測試集為2020 年8月最后1 d、最后2 d 和最后3 d 的數據。預測結果如圖10所示,預測誤差評價如表6所示。

表6 歐洲地區誤差評價Tab.6 Error evaluation in European region

圖10 歐洲地區負荷預測Fig.10 Load prediction in European region
由圖10 和表6 可知,歐洲地區負荷波動小,在預測樣本數較少的情況下,本文模型的預測效果較好,在預測天數為3 d時,RMSE為6.42 kW、MAE為4.19 kW、MAPE 為0.54%,這說明對于不同地區的負荷預測,本文模型具有普適性。
針對負荷序列波動性強、預測精度低的問題,本文提出了一種基于VMD-PE-IGJO-BiLSTM 的短期電力負荷預測模型,主要結論如下。
(1)采用BiLSTM模型進行時間序列預測,能有效利用反向時間序列數據的有用信息及前期的資源,通過實際負荷數據進行驗證。BiLSTM 與BP、LSTM網絡模型相比,其各類誤差指標更低,更適合短期負荷預測。
(2)針對電力負荷序列的隨機性和非線性,本文選擇VMD 電力負荷序列,并通過PE 對處理后的模態分量進行復雜度分析,根據PE 值的大小進行分向量重組,能大大減小預測模型的計算量,縮短計算時間。
(3)針對BiLSTM的超參數難以確定的問題,提出了采用IGJO 算法來優化BiLSTM 的超參數。利用IGJO 算法收斂精度高的優點,分別對重構后的模態分量構建IGJO-BiLSTM的預測模型,顯著提高了負荷預測精度。