楊淑凡, 王永威, 謝聞捷
(三峽大學 電氣與新能源學院,湖北宜昌 443002)
電能很難實現大規模儲存,為保證發電量和用電量的動態平衡,需根據用戶的用能特點和負荷變化的不確定性,要做好短期電力負荷的精確預測[1]。短期負荷預測是電力系統經濟可靠運行的有效工具,基于短期負荷的預測結果,能夠幫助發電生產進行規劃安排,減少資源浪費,對電網運行的可靠性和安全性進行分析并制定維護計劃[2]。
地域不同、社會經濟活動、氣候變化及電價的波動都會對用戶用電行為產生影響。傳統預測法包括回歸分析法[3]、時間序列法[4]、指數平滑法[5]、灰色理論法[6]等,這類方法預測精度不高,且非線性擬合性能差,無法滿足日益增長的負荷預測要求。智能預測法主要基于各類人工智能方法進行預測,例如BP神經網絡[7-8]、支持向量機(SVM)[9]、極限學習機(ELM)[10],這類算法相比于傳統方法能更有效地處理非線性問題。深度學習算法在傳統人工智能算法的基礎上得到了進一步的拓展提升[11-12]。組合模型可以結合多種預測模型的優點,有效處理數據樣本中的線性和非線性特征,從而提高負荷預測精度。為降低數據樣本的波動性和復雜程度,可以采用基于信號分解的組合模型。文獻[13]利用經驗模態分解算法(EMD)分解短期負荷序列,用最小二乘支持向量機作為預測算法,但EMD算法會出現模態混疊問題,LSSVM不能有效處理時序數據間的關聯性問題。文獻[14]并沒有考慮氣象、日類型等外界因素對負荷波動帶來的影響,該組合模型的預測誤差主要集中在每天負荷峰谷時段。文獻[15]采用的LSTM網絡無法對預測結果糾錯,導致預測的精度降低。
基于以上研究,為避免因外界因素諸如一天中時刻、溫濕度、日類型以及預測模型預測過程中的固有誤差對居民用戶短期負荷預測性能造成的影響,本文構建了一個計及誤差補償的兩階段短期電力負荷預測組合模型:第一階段,利用變分模態分解[16](Variational mode decomposition,VMD)對具有復雜波動不確定性的電力負荷數據進行分解,降低每個模態的復雜程度,作為負荷預測模型的輸入數據集,以在時間序列預測中表現優異的BiLSTM模型為基礎,利用螢火蟲擾動改進的麻雀搜索算法優化BiLSTM模型中的參數設置,使BiLSTM模型能夠根據電力負荷數據的特性,快速、精準地確定最優超參數,構建基于VMD-FASSA-BiLSTM的負荷預測模型;第二階段,將第一階段得到的預測值與真實值作差得到模型固有的誤差序列、與本文選定的外界影響因素一起作為BiLSTM網絡的輸入,建立二者之間的非線性關系,利用該模型實現對誤差的預測,最后將兩階段的預測結果相加即為最終的預測結果。將上述研究方法應用于某地區某小區的真實電力數據進行仿真實驗,驗證所提方法在居民用戶負荷預測效果中的有效性。
SSA是Xue[17]基于對麻雀的覓食和反捕行為的觀察而提出的一種新的智能群體優化算法,與傳統算法相比擁有更快的收斂速度和更強的尋優能力。
由于SSA算法在尋優過程中容易陷入局部最優解、在尋優階段后期種群的多樣性減少,導致算法全局搜索能力降低,收斂精度不高,需對其進行改進,克服以上弊端。
(1)混沌初始化:種群個體初始位置的分布情況對算法的尋優能力有很大影響。采用隨機性和遍歷性更強的混沌序列初始化種群,使初始種群的分布更加均勻。本文采用Cubic混沌映射策略,由此生成的初始種群分布更加均勻,個體之間的差異更小。Cubic混沌映射函數如下:
式中,a、b為混沌影響因子。Cubic映射范圍取決于a、b的值。b∈(2.3,3)時,其映射狀態為混沌序列。
(2)螢火蟲擾動策略:麻雀種群的搜索方式主要是在具有最優位置的個體附近進行,搜索的步長較小,容易陷入局部最優解。因此需要對種群中具有最優位置的個體進行變異擾動,比較擾動前后的適應度值,擇優選取,幫助種群跳出局部最優解。本文采用螢火蟲擾動策略,對于任意數量的螢火蟲,總是會趨向更亮的一只;但是距離越遠,亮度也會降低;如果附近沒有更亮的螢火蟲,則會做隨機無規則運動。
螢火蟲之間的相對亮度表示為:
式中:rij為第i只和第j只螢火蟲之間的歐氏距離;I0是由目標函數的優秀程度決定的螢火蟲最大亮度;γ為亮度吸收系數,取值范圍為[0,∞)。
螢火蟲之間的吸引力表示為:
式中:j*為螢火蟲i所能感知到的具有最強亮度的螢火蟲,j*=argmax(Iij);η0為最大吸引力。
第i只螢火蟲根據式(9)和第j*只螢火蟲的位置進行位置更新:
式中:α為步長因子,α和rand均為[0,1]內的隨機常數。
采用螢火蟲擾動策略改進麻雀搜索算法,利用FASSA對BiLSTM負荷預測模型進行快速精準的超參數尋優,避免因模型參數的選取不當影響預測模型的訓練結果,導致訓練得到的預測模型不能達到最優精度且會加大模型的訓練難度。FASSABiLSTM算法流程如圖1所示。建立FASSA-BiLSTM模型的主要步驟如下。

圖1 改進SSA-BiLSTM流程
(1)初始化參數:初始化FASSA 的參數;初始化BiLSTM結構,將BiLSTM的相關超參數初始化,以BiLSTM模型的隱藏層神經元個數和學習率作為優化目標。
(2)建立目標函數:將未經訓練的BiLSTM負荷預測模型的預測值與實際值相比的平均百分比誤差(MAPE)作為FASSA的適應度函數,并計算每只麻雀的適應度值,選取適應值大的前smum個作為搜索者,剩余的為追隨者,偵察者的數量為dmum,并得到最優適應度值與最差適應度值及其對應的位置。
(3)尋優過程:在搜索者、追隨者和偵察者更新位置的同時,利用螢火蟲擾動策略更新變異麻雀的位置,重新計算各個體的適應度值并再次更新最優位置,得到每個個體的最佳位置。當達到設定的最大迭代次數后,得到最優的超參數數值。
(4)BiLSTM訓練:將FASSA求得的最優超參數代入到BiLSTM負荷預測模型中,重新進行訓練測試,得到負荷預測模型。
為評價預測模型的性能,采用平均絕對百分比誤差(mean absolute percentage error,MAPE)和均方根誤差(Root Mean Square Error,RMSE)作為模型的評價指標,其公式分別為:
式中:yi和xi分別表示i時刻的真實值和與預測值;n為樣本數量。
基于優化模型的短期負荷預測過程分為兩個階段,具體的預測流程構架如圖2所示。

圖2 計及誤差補償的短期負荷預測模型
第一階段,即初始負荷預測階段:首先用VMD對原始數據序列進行分解,提高輸入數據的質量;然后用FASSA搜索算法對BiLSTM的隱藏層神經元個數和學習率這2個超參數進行自適應尋優,得到最優參數組;最后通過訓練好的FASSA-BiLSTM負荷預測模型進行負荷預測,并疊加得到的各分量的預測值,得到初始負荷預測結果。
第二階段,即誤差補償階段:由于預測值和真實功率之間存在一定偏差,為進一步提高預測精度,需要對第一階段的初始負荷預測值進行誤差補償。利用VMD-FASSA-BiLSTM模型得到的負荷預測結果,提取每個時間點的預測誤差序列,然后與造成負荷波動和非線性的影響因素(溫度、濕度、日類型)共同構成誤差訓練集,作為誤差補償模型的輸入,并建立BiLSTM網絡得到預測誤差序列。最后將兩個階段得到的預測結果相加,即最終的負荷預測結果。
居民用戶負荷預測與很多因素有關, 本文主要從日類型因素、歷史負荷和溫濕度三方面,尋找密切影響社區居民用戶用電負荷變化的因素,與負荷數據一起作為預測模型的輸入變量,進而提升預測結果的精度。輸入變量x的特征集設置如表1所示。

表1 輸入變量設置
為驗證所提負荷預測模型的準確性,采用的實驗樣本為江蘇省某市某社區2019年6月1日至6月22日的電力負荷數據、日類型因素和溫濕度數據,采樣間隔為15 min,每天能采集96條原始電力負荷數據,共2112個采樣點。將6月1日到6月21日的所有數據劃分為訓練集,得到已訓練的負荷預測模型后,對6月22日全天96個時間點的各個負荷數據進行預測,與實際的數據對比,即可作為驗證模型預測精度的判斷依據。6月22日該天的特征數據如表2所示。

表2 6月22日相關特征數據
引入最大信息系數[18]來定量分析評價4種外界氣象影響因素與負荷數據的相關性。選取4月1日至4月22日的氣象數據,氣象數據是以1 h為時段提供的24點曲線,因此需要對氣象因素的數據進行插值處理,成為和負荷曲線相匹配的96點曲線。計算結果如表3所示。

表3 各影響因素與負荷序列的相關性分析
分析表3中的相關性數據,負荷與一天中的溫度具有強相關性,與濕度具有中度相關性,與風速和氣壓的相關性較弱。結合生活實際,溫濕度主要通過影響用戶體感舒適度來影響用電負荷的變化,人的體感是溫度濕度綜合作用的結果。為了選取與負荷相關性更強的氣象因素,將閾值設置0.5,因此預測模型氣象影響因素的輸入選擇為溫度、濕度。
負荷數據序列具有時間依賴性和非平穩波動特性,所以先用VMD將其分解,減少序列的噪聲影響,降低其復雜程度。采用遺傳算法確定VMD分解的兩個關鍵參數:分解模態數K以及懲罰因子α。遺傳算法的種群規模和最大迭代次數均設為50,采用單點交叉,交叉概率為0.8,變異概率設為0.1。通過遺傳算法得到的參數最優解分別為K=5,α=1816。原始負荷數據和經VMD分解后的數據如圖3和圖4所示。

圖3 原始負荷數據

圖4 負荷序列VMD分解
根據FASSA算法對BiLSTM網絡的重要參數(隱藏層神經元個數和學習率)進行尋優,將預測結果和真實數據之間的平均百分比誤差作為尋優過程中的適應度函數。設置迭代次數和麻雀種群數量均為100,預警值為0.8。搜索者比例為20%,追隨者比例為70%,剩下10%作為偵察者。BiLSTM相關參數的尋優范圍如表4所示。最終經FASSA尋優得到的BiLSTM最優參數為{[23,28],0.0024}。

表4 BiLSTM參數尋優范圍
為驗證FASSA在優化BiLSTM參數時的可行性和優異性能,與其他三種優化算法的結果進行對比分析,以平均百分比誤差為適應度的迭代曲線如圖5所示。由圖5可知,四種優化算法中FASSA收斂速度最快且收斂的精度最高,在20次迭代后達到收斂,FASSA-BiLSTM的適應度值為0.021,且相較于標準的SSA算法,收斂速度和收斂精度都有很大的提升。由此可見,利用FASSA優化BiLSTM的相關參數建立的負荷預測模型具有可行性和優越性。

圖5 適應度曲線
VMD-FASSA-BiLSTM模型的各部分參量確定后,將VMD分解得到的各IMF分量代入負荷預測模型中進行訓練驗證,迭代預測出6月22日全天96個時間點對應的數據,然后疊加各分量的預測結果,得到完整的負荷預測數據。
為保證對比試驗的合理性和有效性,以上所有預測模型的參數選擇均在多次實驗下選取的最佳值,均各自執行10次將其結果取均值,預測結果如圖6與表5所示。

表5 不同組合方法的精度比較

圖6 不同負荷預測模型的預測結果
由圖6、表5可知,組合算法具有更好的預測效果,因為組合模型能使整個預測過程更加精細,且本文所提算法的預測結果更接近真實電力負荷數據曲線的變化趨勢,預測精度優于其他算法。VMD-FASSA-BiLSTM與VMD-FASSA-ELM、VMD-FASSA-SVM模型相比,其誤差指標RMSE分別降低了52.93 kW、38.67 kW;MAPE指標分別降低了0.73%、0.49%。說明結合BiLSTM方法所建立的預測模型精度更高,這是因為BiLSTM能很好地學習提取雙向時序數據間的特征。
分別建立初始負荷預測模型、僅補償模型自身固有誤差的預測模型以及以模型自身固有誤差和外界影響因素進行補償的預測模型,3種模型的預測結果與真實值的絕對誤差對比如圖7所示。

圖7 誤差糾正前后絕對誤差對比圖
在VMD-FASSA-BiLSTM預測模型的基礎上,加入誤差補償模型,通過引入模型訓練過程中的訓練誤差序列以及影響負荷波動的外界因素,使最終的負荷預測模型得到的預測結果在各采樣時間點的單點誤差變小,預測更加精確,其誤差指標RMSE和MAPE相比于未引入誤差糾正的模型分別降低了14.71 kW、0.94%。此外,實驗還證明了本文所引入的誤差糾正因素均對模型的預測性能有明顯的改善。綜上所述,誤差補償模型可以降低模型自身訓練過程中產生的誤差對預測結果的影響,并且可以深入挖掘外界影響因素中的隱含信息,從而有效地提高綜合模型的預測精度。
為進一步提高短期負荷預測的精度并降低模型自身的固有誤差和外界因素對預測結果的影響,構建了計及誤差糾正的兩階段短期電力負荷預測模型,通過對實際電力數據的仿真試驗得到以下結論。
(1)基于螢火蟲擾動策略改進后的FASSA算法擁有更優的適應度值,其求解迭代速度和求解精度均優于PSO、GWO和SSA算法,在對BiLSTM網絡超參數尋優過程中有更好的性能。
(2)綜合考慮了預測模型固有的誤差序列以及外界因素對負荷預測的影響,在引入誤差糾正模型后,模型的精度得到了提升。與其他5種負荷預測模型相比,本文提出的負荷預測模型具備更高的預測精度,MAPE達到1.26%。
(3)VMD分解過程中仍存在噪聲影響,未來可研究信號去噪,優化信噪比的相關策略,以期獲得更高質量的分解數據,得到更好的預測結果。