姜山,周秋鵬,董弘川,馬旭,趙振宇
(1.國網湖北省電力有限公司經濟技術研究院,武漢 430077;2.華北電力大學工程建設管理研究所,北京 102206)
長期電力負荷的準確預測對電網規劃及電力基礎設施建設具有重要戰略意義。近年來,長期電力負荷預測多以年度負荷值的總體趨勢預測為主[1],較少考慮預測中數據慣性增長、周期性變化以及數值的累積效應,進而影響了負荷預測的準確性。因此,模型建模需要考慮年度負荷增長應基于月度負荷累積的情況,以提高模型區間預測的分段精度,確保預測的準確性,將基于此項工作開展數據趨勢性和周期性預測的組合方法研究。
電力負荷預測方法包括參數化預測方法及非參數化預測方法。基于數據參數化特性的分析算法主要有機械學習算法及時間序列算法,機械學習如神經網絡學習[2]、SVM支持向量機[3]、決策樹等. 該類方法采用迭代思維進行數據尋優從而求得數據最優解;時間序列ARIMA等方法通過人工參數設置實現數據自身發展趨勢規律的分析預測。為提高時間序列數據的預測精度,可將多種機械學習算法與ARIMA方法復合,實現數據的耦合修正[4]。非參數方法是一類直接或間接地從實際系統的實驗分析中得到的響應分析方法. 如通過實驗記錄得到的系統脈沖響應或階躍響應[5],該類算法可充分挖掘數據自身規律的周期特性,基于數據的周期性通過數據的降維處理以預測區間單元內數據走勢。為進一步提高長期電力負荷趨勢預測的準確度,將電力負荷數據進行年度及月度分解,把用以研究數據自身發展規律的ARIMA[6]方法融入BP神經網絡算法內,提出改進的BP-ARIMA負荷趨勢預測模型,實現在多因素綜合影響下的年度電力負荷預測功能;引入函數型非參數方法對歷年月度數據進行數據分析,通過函數型時間序列預測模型對未來數據進行周期性預測,將趨勢性預測及周期性預測進行分量融合以得到新型組合預測模型,從而提升長期電力負荷預測的精確性。
為研究負荷數據發展特性,提出的新型組合預測模型是基于BP-ARIMA趨勢性預測及函數型非參數化周期性預測的綜合預測模型。BP-ARIMA模型是基于BP神經網絡及ARIMA模型進行影響因素耦合獲取趨勢線而形成的改良方法,函數型非參數化方法通過引入適宜核函數對月度負荷開展周期性預測工作。
BP人工神經網絡可實現輸入端與輸出端非線性函數的函數映射問題[7],具體算法可通過如下步驟實現。確定輸入向量X=[x1,x2,…,xn]T,輸出向量Y=[y1.y2. ….yn]T。設置初始化輸入層至隱含層連接權值ωij,隱含層至輸出層連接權值ωjk;具體過程函數為:
(1)
式中f1()、f2()分別為輸入層至隱含層、隱含層至輸出層神經網絡激活函數,以上為輸入模式的順向傳導過程,利用順向傳導過程所得輸出值求得輸出層校正誤差,再將輸出層誤差經由隱含層逆向傳導至輸入層,循環往復直至訓練穩定。
ARIMA(p,d,q)模型[8],是一種根據數據自身規律揭示系統動態結構及發展規律的時間序列模型。文中該模型應用于影響因素趨勢預測及趨勢線提取校核,ARIMA模型須將序列數據進行一次或多次差分以得到平穩時間序列,基于數據的復雜程度對數據進行分析建模,模型表達式為:
(2)
式中?d=(1-A)d為數據的d階差分項;Φ(A)=1-φ1A-φ2A2-…-φpAp為模型的自回歸相關系數多項式;Θ(A)=1-θ1A-θ2A2-…-θqAq為滑動平均系數多項式。
函數型非參數回歸模型[9]可對周期性數據進行函數性質的數據統計及預測,將觀測區間內一次觀測到的數據視為整體,利用函數型數據分析方法對無限維中具有函數性質的數據進行結構分析,降低數據整體維度,提高數據推斷的準確度。函數模型表達式為:
(3)
式中Xi為函數型變量;響應變量Yi為實值變量;εi為誤差項,構成(Xi,Yi)數據對。通過Nadaraya-Watson(N-W)核估計方法對函數型非參數模型進行回歸函數估計. 具體估計模型表達式為:
(4)
式中K為對稱核函數;窗寬h=hn為正實數序列;φ(h)為小球概率。
相關系數大小決定自變量與因變量間的相關性強弱. 檢查自變量與因變量間的共線性程度。通過分析數據之間的相互依存關系,為數據的遠期預測提供趨勢框架. 防止預測效果失真。采用皮爾森相關性系數對影響因素與年度負荷數據進行相關性檢驗,相關性系數表達式為:
(5)
式中Cov(X,Y)為X、Y序列數據協方差;σx,σy為X、Y序列數據標準差。
所研究的基于函數型非參數方法的BP-ARIMA預測模型將時間序列數據進行分解,在采用相關性檢驗對影響因素進行初步篩選的情況下,利用BP-ARIMA模型對時序性數據的年度負荷數據進行趨勢預測,利用函數型非參數方法對周期性月度負荷數據進行回歸估計。通過兩類數據的分量組合,提高模型長期預測的穩定性及準確性,流程見圖1。

圖1 負荷預測流程圖
模型將區域電力負荷與區域生產總值、工業增加值、可支配收入等經濟性、社會性指標相關聯[10]。提取各項因素數據的預測值,基于各影響因素耦合特點,對數據采取擬合分析,明確影響因素數據的精確走勢,并依據各個影響因素走勢及年度負荷數據進行BP神經網絡的數據訓練,獲得年度電力負荷趨勢預測值。
采用MATLAB數據分析軟件[11],編制BP-ARIMA年度負荷預測模型,建模步驟如下:
(1)通過相關性檢驗方法初步檢驗影響因素與年度負荷值的相關性程度;
(2)電力負荷通過BP神經網絡對各影響因素數據進行神經網絡訓練。基于校核后的因素預測數據. 提取影響因素趨勢數據,趨勢線可精確判斷數據走勢及數值范圍;
(3)ARIMA模型進行各個影響因素的趨勢預測,采用已校核的趨勢線置換影響因素原始趨勢線。該過程可通過趨勢線預測進行進一步相關性檢驗,剔除呈弱相關性影響因素,利用多項式擬合方法輸出因素預測值;
(4)將各校核之后的影響因素數據與年度負荷數據耦合,開展年度負荷趨勢預測。
從已有研究看,學者普遍采用經濟與社會指標分析對電力負荷的影響。由于區域GDP、區域財政投資、區域人口增長等對區域電力負荷增長起到正向促進作用,因此區域電力負荷增長及電力基礎設施建設與區域經濟、社會指標增長存在必然聯系[12]。綜合現有研究,從經濟發展、社會發展和工業生產角度進行相關數據的收集、整理與分析,相關影響因素如表1所示。

表1 1995年~2018年度用電量及相關因素統計數據
區域月度負荷數據存在周期性遞增特性,針對該類時間序列數據,以整年(周期T=12)為單位生成函數型數據,設生成隨機變量F,F在t=a到時間t=a+nT上的觀測值構成一個連續的時間序列F(t)。月度負荷數據可看成是按周期T重復統計得到的。函數型數據[13]表達式為:
(6)
式中fi為第i年負荷函數型數據,依據式(6)第三項可將觀測區間的[a,a+nT]上的連續時間序列F(t)轉化為{f1,f2,…fn},依據{f1,f2,…fn}即可預測fn+1等遠期月度負荷數據。本預測模型通過{f1,f2,…fn}構建函數型數據對。選取的核函數及半度量參數公式如下:
(7)
半度量參數的選取基于周期曲線導數,d(xi,yi)中q值影響曲線的擬合程度。函數型非參數法還通過核函數中的窗寬(h)影響曲線擬合程度,通過交叉驗證的形式自動獲取窗寬。即:
(8)
從觀測到的(Xi,Yi)數據對中剔除最后第n項,基于前n-1項對數據進行函數型回歸分析。通過CV(h)取最小值時確定h的取值。將預測的第n項數據與負荷真實值進行比較,確定周期性函數預測的準確性。
綜合預測模型將年度趨勢性負荷預測與月度周期性負荷預測進行分量組合,可通過平均絕對百分誤差(MAPE)權重法[14]對月度負荷及年度負荷分配權重. 提高模型預測可靠性、準確性。負荷預測權重分配函數為:
(9)
式中Pload為負荷分量組合預測值;pm,py分別為月度負荷值、年度負荷值;ωm,ωy為月度、年度負荷值權重。
引入我國中部某省區域生產總值、固定資產投資額、年度區域用電量等指標,數據見表1,為提高負荷預測準確率,引入2006年~2018年間月度負荷指標,如表2所示。

表2 2006年~2018年間月度用電量統計數據
注:月度負荷單位為:億千瓦時
研究采用BP-ARIMA模型的相關通用參數及改進的ARIMA算法差異性參數見表3。其中n值為采用多項式擬合方法中多項式的最高次冪[15]。

表3 BP-ARIMA模型通用及差異性參數
將各影響因素分別與年度負荷值進行相關性檢驗,區域常住人口數量相關性系數較低,呈弱相關性. 各影響因素相關系數如表4所示。

表4 相關性檢驗
采用年度電力負荷值對各影響因素值進行神經網絡訓練,校核各影響因素趨勢線。以城鎮居民人均可支配收入因素為例,如圖2所示,“菱形”標趨勢線從“圓形”標校核值序列中被提取出,并且將該校核的趨勢線植入原始數據中,形成“星形”標改良值,該法可對影響因素趨勢線進行一定程度的修正。依據ADF及AIC準則對各影響因素進行p、q、d判斷,采取最優數組組合模擬,數據如表3所示。

圖2 城鎮居民人均可支配收入趨勢線分解及優化圖
通過模型校核過程中的影響因素趨勢預測發現,區域常住人口數量的模型走勢吻合程度較差,再次驗證了該因素與年度負荷值的弱相關性,數據模擬失真,效果如圖3所示。

圖3 常住人口數模擬結果
經校核的ARIMA模型可基于數據結構特性對其余強相關性的影響因素開展目標年預測,研究將1995年~2015年數據作為模擬樣本數據,對2016年~2018年三年進行預測,部分影響因素預測效果對比見圖4和圖5。

圖4 固定資產投資額模擬結果

圖5 工業增加值額模擬結果
將經過篩選及校核的影響因素與年度電力負荷通過BP-ARIMA預測模型進行多因素耦合預測,該模型為基于影響因素及負荷序列數據趨勢性發展的一類預測,年度區域用電量預測數據如圖6,圖中2019年~2021年為電力負荷模型預測值,未來三年電力負荷仍為增長趨勢,但增長速度有所放緩。

圖6 BP-ARIMA預測模型年度電力負荷預測值
研究基于函數型非參數化方法對月度電力負荷數據開展周期性預測,算法模型采用2006年~2015年間月度負荷數據進行非參數化算法學習,預測2016年~2021年間月度負荷數據,比對2016年~2018年間月度真實數據,真實值與預測值吻合程度較好,預測及對比結果如圖7所示。

圖7 函數型非參數方法月度電力負荷預測值
將BP-ARIMA模型與函數型非參數方法進行組合預測,2016年~2018年趨勢性預測值與周期性預測值進行MAPE權重方法組合。函數型非參數預測方法MAPE值1.17%小于BP-ARIMA的1.93%,經兩種方法的分量融合,新型組合模型的MAPE值為1.59%,誤差結果相對理想,負荷預測數據如表5所示。

表5 研究模型預測結果
為體現該新型組合模型的預測優勢,研究分別采用灰色預測模型GM(1,1)、GM(1,N)、BP神經網絡模型、ARIMA模型等與該組合模型進行比較,誤差結果見表6,新型組合預測模型預測精度最高,MAPE值僅為1.59%,具有明顯的預測優勢。

表6 模型誤差對比分析
同時,為驗證文中函數型非參數方法對周期性月度負荷的預測優勢,研究采用隨機森林預測方法進行周期性預測比對,2016年~2018年間兩種方法的月度負荷預測對比結果見圖8,隨機森林預測方法MAPE誤差值為1.78%,誤差累計比非參數方法增加11.95%。從結果看,所采用的函數型非參數方法預測精度較高,適合于周期性數據預測。

圖8 非參數法與隨機森林方法的預測值比較
提出了一種新型的組合預測模型,該模型將年度負荷的趨勢性與月度負荷的周期性進行分量融合,模型既考慮了數據自身結構的趨勢性、周期性特點,又通過影響因素耦合的特點增加了數據趨勢預測的合理性,數據的預測精度得到大幅提升。BP-ARIMA負荷預測模型將BP的非線性處理能力與ARIMA的線性預測能力相結合,通過趨勢線校核提高影響因素的預測精度及數據穩定性,模型還可篩除相關性較差影響因素,利用因素之間的耦合特性提高年度電力負荷趨勢性預測的穩定性。函數型非參數方法通過降維的處理手段實現數據的周期性預測,該法可通過選用合適的核函數達到良好的月度負荷預測精度。該組合預測模型可為長期電力負荷預測提供更為符合客觀事實依據的負荷預測方法。