蘭 輝 于佳卉 曹經福 劉玉坤 孫玫玲 郭 玲 熊明明
1 天津市氣象服務中心,天津 300074 2 天津市氣象科學研究所,天津 300074 3 國網天津市電力公司,天津 300010 4 天津市氣候中心,天津 300074
提 要: 氣象條件是影響電力消耗的主要因素之一,是用電量預測模型的基礎要素。利用天津市2014—2018 年日用電量數據和氣象觀測數據,分析二者之間關系。發現天津地區日用電量與氣溫和相對濕度呈“U”型的非線性關系,舒適區與冷卻區之間的氣溫閾值隨相對濕度增加向低溫一側明顯偏移?;诖耍陉P系模型中引入相對濕度,利用用電量與溫濕度之間的非線性擬合曲線斜率確定舒適區的氣溫閾值,提出基于溫濕效應的日用電量分段新方法。對比發現,該方法對用電量的預測效果有明顯提升,線性模型中,較“V”型方法,均方根誤差(RMSE)和平均絕對百分誤差(MAPE)分別減小1.562 GW·h和0.546%;針對舒適區與冷卻區的過渡區域(21.1~26.2℃),較傳統“U”型方法,RMSE和MAPE分別減小0.759 GW·h和0.215%,非線性模型中則分別減小0.647 GW·h和0.209%,不同模型中預測提升效果穩定??梢?,綜合溫濕度的“U”型分段方法能夠有效提升日用電需求預測精準度。
電能作為重要能源之一,是工業生產、交通運輸及日常生活的基本保障,電力需求的變化可能對城市安全、未來溫室氣體的減排要求、區域及全球的能源政策產生一定影響。對電力需求的準確預測,不僅能夠有效地指導電力調控,幫助電力企業節約發電成本,還對未來能源供應的規劃和經濟評估具有重要意義(Scapin et al,2016;Wang and Bielicki,2018)。很多學者利用氣象因子與用電量之間的關系展開預測分析(胡江林等,2002;Mirasgedis et al,2006;Apadula et al,2012;尹炤寅等,2017;劉俊等,2019;李海英等,2020;喬黎偉等,2020),由于用電量與氣象因子之間呈非線性變化,研究中往往通過建立分段模型來分析氣象因子對用電量的影響,并基于此實現對電力需求的預測。因此,深入理解用電量和氣象因子之間的非線性關系對于提升電力需求的預測效果具有重要意義。在以往研究中,不同學者利用多種方法分析了氣溫和用電量之間的非線性特征(Moral-Carcedo and Vicéns-Otero,2005;Bessec and Fouquau, 2008;Lee and Chiu,2011)。其中度日值作為能源預測中的常用方法,被用于探究其與用電量之間的關系(Al-Zayer and Al-Ibrahim,1996),并以此建立了氣溫和用電量之間的“V”型分段模型,即設置一個氣溫閾值,當室外氣溫低于氣溫閾值時,電能主要用于加熱,而氣溫高于氣溫閾值時,則轉換為冷卻。通過氣溫閾值將用電量與氣溫之間的關系區分為加熱區和冷卻區,從而直接通過氣溫變化判斷電力需求,并得到了廣泛應用(Al-Zayer and Al-Ibrahim,1996;石玉恒等,2019)。在“V”型分段方法中,氣溫閾值選用18.3℃。Moral-Carcedo and Vicéns-Otero (2005)在研究中發現,分段后的氣溫閾值實際上是一個溫度區間,并由此引入平滑過渡方法,假設在該溫度區間內,用電量隨氣溫的改變沒有明顯變化,則定義為舒適區,從而形成了氣溫和用電量的“U”型分段模型。Wang and Bielicki(2018)在逐時用電量研究中也發現,氣溫與用電量中大約有7℃范圍的舒適區。利用度日值的分段能夠將用電量與氣溫的非線性關系轉為線性進行分析,在“V”型或“U”型分段方法的實際應用中發現,根據用電量與氣溫在不同區域的關系,還可進一步分為線性對稱、線性不對稱及非線性模型(Hekkenberg et al,2009;Bessec and Fouquau,2008;Gupta,2012;羅慧等,2016)。
以往的研究中,利用分段回歸、門限回歸、平滑轉換模型等多種方法來確定氣溫閾值 (Moral-Carcedo and Vicéns-Otero,2005;Deschênes and Greenstone,2011;Wang and Bielicki,2018),但大部分研究僅根據氣溫和用電量的關系展開分析,而未考慮其他氣象要素對氣溫閾值的影響。Hekkenberg et al(2009)指出用電量與氣溫之間的分段閾值會隨體感溫度等要素發生偏移;Wang and Bielicki(2018)也在研究中提出,相對濕度和輻射會對氣溫閾值的范圍產生一定影響。然而,目前針對用電量分段方法的研究中,還未考慮相對濕度,這可能是導致舒適區產生一定偏差的主要因素,特別是在濕度高低差異較大時,氣溫閾值的范圍會與平均狀態相差較多,從而影響最終的用電量預測結果。
本文綜合考慮了氣溫和相對濕度兩個氣象因子,研究其對用電量分段的影響,通過分析不同相對濕度范圍下,用電量與氣溫的擬合曲線,利用曲線斜率判斷氣溫隨相對濕度變化的閾值,建立綜合考慮溫濕度的電力分段方法,以期提升用電量分段的科學性與準確性,為精準預測電力需求提供科學依據。
本文數據包括電力數據和氣象數據。電力數據為國網天津市電力公司提供的2014—2018年逐日用電量。氣象數據為2014—2018年天津市城市氣候監測站的逐時氣溫和相對濕度,均處理為日平均值。為減小特殊日期用電量波動對研究結果的影響,本文剔除了節假日期間的數據,主要包括元旦、農歷小年至元宵節、清明節、勞動節、端午節、中秋節和國慶節,每年約40余天。
對用電量與氣象因子之間響應特征的初步分析(圖1)表明:日用電量與氣溫和相對濕度之間呈現明顯的非線性關系,隨著氣溫的降低,用電量先減少后增加,且減少與增加區域呈現非對稱的特點,這與以往研究中“U”型、“V”型的非對稱性相一致。同時發現,在不同相對濕度條件下,用電量和氣溫的變化特征存在差異。用電量對氣溫的低敏感區(舒適區)會隨相對濕度的變化發生明顯偏移;當相對濕度較小時,舒適區的氣溫區間較大,且氣溫閾值偏高,當相對濕度較大時,舒適區的氣溫區間減小,且隨著相對濕度的增加,氣溫閾值向低溫一側有明顯偏移??梢?,舒適區受溫度和相對濕度的共同影響,因此分段方法需要同時引入氣溫和相對濕度這兩個氣象要素。

圖1 2014—2018年天津日用電量與氣溫 和相對濕度之間的三維關系分布Fig.1 Distribution of three-dimensional relationship between daily electricity load and temperature and relative humidity in Tianjin during 2014-2018
Scapin et al (2016)的研究結果表明,用電量預測模型主要受周期性變化和氣象條件變化兩部分影響,而用電量隨氣象條件的變化表現為線性和非線性特征,Brown et al(2016)認為線性不對稱模型在評估多種氣象條件對用電量的影響及人為控制變量方面存在明顯優勢,故文中以此模型來確定分段閾值。具體公式如下所示:
(1)
式中:D表示日用電量;等式右端前兩項均代表周期性變化的影響,第一項是用電量隨時間的變化,主要代表經濟形勢和消費習慣的長期變化對電力需求的影響,采用二階函數表示(更高階擬合效果提升極小),即m=2,α為系數,t為時間;第二項代表周周期的用電量變化,相關研究表明(Pardo et al,2002;Moral-Carcedo and Vicéns-Otero,2005),周二至周五用電量比較接近,周一次之,周末最少,因此本文通過控制虛擬變量I的取值(I1、I2、I3、I4分別代表周一、周六、周日及周二至周五四個時段,對應時段取1,其他時段為0),僅選取周二至周五的數據進行分析,以排除其他時段系數β選取不當造成的偏差;等式右端第三項表示氣象條件影響下的用電量變化,選取氣溫和相對濕度作為預測因子,即n=2,V1代表平均氣溫,V2代表平均相對濕度,γ為系數;右端第四項ε為殘差項。
由式(1)可知,在日用電量D中減去第一項長期趨勢變化,排除第二項周周期影響,第三項和第四項的和即可代表用電量受氣象條件的影響程度,如式(2)所示。本文通過分析DF(去除時間趨勢項的用電量)與氣象條件之間的關系,得到對應的用電量分段方法。
(2)
Hansen(1999)在求取分段閾值的研究中以殘差平方和的最小化為條件來確定閾值,本文采用類似的均方根誤差(RMSE)的最小化來選取最優氣溫閾值,該模型也被廣泛用于評估各類模型預測效果(吳瓊等,2020;任永建等,2020;張天航等,2020),具體計算公式為:
(3)
除RMSE外,由于平均絕對百分誤差(MAPE)可以捕捉預測絕對誤差與實際載荷之間的比例關系,因此在負荷和用電量預測中被更廣泛采用(Barman et al,2018)。具體計算公式為:
(4)

文中分段建立不同相對濕度下氣溫和用電量的非線性擬合曲線,利用曲線斜率確定氣溫閾值,由此得到相對濕度和氣溫閾值的對應矩陣,并擬合得到基于溫濕度的用電量分段曲線。具體計算方法如下:
首先,選取相對濕度范圍為P(分別為20%~25%,25%~30%,…,70%~75%,75%~80%,相對濕度低于20%或高于80%的樣本少,所以不予考慮)的所有樣本,該樣本中的用電量和氣溫數據經歸一化處理為數組(Tj,Dj),兩者之間的非線性擬合方程如式(5)所示(由于二次擬合公式的R2超過0.98,故不再取更高階):
Dj=aTj2+bTj+c
(5)
式中:T代表氣溫;D代表日總用電量;j代表樣本編號;a,b為系數;c為常數。
計算擬合曲線上每點j的斜率為k,代表用電量隨氣溫的變化幅度,用下式表示:
(6)
假設冷卻區與舒適區的臨界點為m,加熱區與舒適區的臨界點為n。斜率分別為km和kn。舒適區作為用電量與氣象因子的低敏感區域,其上下限點(m,n)應具備兩個特點,日總用電量較小(計算中取1/3),且日總用電量隨氣溫變化幅度較小,基于以上兩點,推得上下限臨界值的公式如下所示:
(7)
由此得到,在相對濕度范圍為P,斜率取km和kn時,冷卻區與舒適區對應的臨界氣溫為Tm,加熱區與舒適區對應的臨界氣溫為Tn。當km=kn=0時,電量分段呈現“V”型分布。當km≠0或kn≠0時,Tm至Tn溫度區間則對應舒適區,用電量分段則呈現“U”型分布。
圖2給出相對濕度P取55%~60%時,用電量和氣溫的擬合曲線及對應舒適區范圍的示意圖。根據擬合曲線斜率的變化情況,選取最佳斜率km和kn。對應的m,n即為歸一化后冷卻區與舒適區、加熱區與舒適區的分段節點,計算得到對應的Tm和Tn即分別為上、下限氣溫閾值,兩點之間的范圍為舒適區。
按照式(5)~(7),可確定每個相對濕度范圍內的鄰近點氣溫T(m,P,km)和T(n,P,kn),即得到一個包括氣溫T、相對濕度RH(P)、斜率k值、冷卻或加熱臨界點m或n的四維數組(為計算方便,相對濕度取P的中值,如當P為20%~25%,RH取為22.5%),從而建立冷卻區與舒適區、加熱區與舒適區鄰近點的溫濕度數組為(Tm,km,RHm,km,Tn,kn,RHn,kn),并分別建立對應的線性擬合方程(8)和(9)。
Tm,km=ωm,kmRHm,km+θm,km
(8)
Tn,kn=ωn,knRHn,kn+θn,kn
(9)
擬合曲線對應的均方差誤差分別為Qm和Qn,公式如下所示:
(10)
(11)

圖2 相對濕度為55%~60%時氣溫和用電量 歸一化數據的非線性擬合及分段示意圖Fig.2 Nonlinear fitting and segmental diagram of normalized temperature and electricity load in the range of 55%-60% relative humidity
通過取Qm,km值的極小值,解得系數ωm,km,ωn,kn值,同理求得常數θm,km,θn,kn值,得到氣溫閾值和相對濕度的擬合曲線。表1以km=1.0,kn=0.8為例,給出不同相對濕度下,Tm和Tn的變化情況。

表1 km=1.0,kn=0.8時,不同相對 濕度范圍內的用電量分段的氣溫閾值Table 1 Temperature thresholds for electricity load segments during different relative humidity when km=1.0, kn=0.8
根據表1得到相對濕度范圍和上下限氣溫閾值的擬合曲線及舒適區變化如圖3所示,可以看出,隨著相對濕度的增大,Tm逐漸下降,Tn則變化不大,舒適區范圍逐漸縮小,其范圍變窄主要因為Tm的波動明顯大于Tn,說明二者對相對濕度的敏感度存在差異。這是由于當相對濕度增加時,人體對高溫的承受度下降,因此體感氣溫會隨之上升,特別是在高濕的天氣條件下,Tm會明顯下降,進而影響用電量,這與實際經驗相一致;而對于Tn,其受相對濕度的影響較小,這表明加熱區和舒適區之間的氣溫邊界隨相對濕度的變化并不明顯。說明該方法應當更有利于對Tm閾值的改進。

圖3 km=1.0,kn=0.8時, 用電量分段的溫濕度擬合曲線Fig.3 Fitting curve of temperature and RH by different electricity load segments when km=1.0, kn=0.8
由上文可知,不同相對濕度下,用電量和氣溫擬合曲線斜率k的取值將直接決定臨界點m,n的位置,并通過改變Tm和Tn,最終影響分段曲線的變化,為了能夠更加精準地捕捉到RH在用電量分段中的影響,利用上文中所述方法,以Δk=0.1為步長,計算不同k值下的擬合結果,并通過選取RMSE最小值,確定最優取值為:km=1.0,kn=0.8,表2給出氣溫閾值與RH的分段關系模型。

表2 基于溫濕度的日用電量分段模型——以天津為例Table 2 Segmental model of daily electricity load based on temperature and humidity in Tianjin
為了檢驗該模型引入相對濕度后的計算效果,本文選擇常用的18.3℃為氣溫閾值的“V”型分段模型和采用門限回歸模型(TR)計算的“U”型分段模型與文中分段方法進行對比。
門限回歸模型在經濟學分析中有很好的應用(Hansen,1999),Moral-Carcedo and Vicéns-Otero (2005)研究表明,該方法也同樣適用于研究用電量隨氣溫變化的閾值,其中雙閾值一元線性回歸模型的計算公式為:
(12)
式中:DF代表去除時間趨勢的日用電量,與式(2)中DF意義一致;T為平均氣溫;μ和ω為回歸系數;ε是殘差;m和n即為門限值,也即“U”型分段模型中的氣溫閾值。利用TR模型計算得到的舒適區氣溫閾值為23.2℃和12.3℃,如圖4所示。

圖4 基于TR模型的天津地區氣溫和 用電量的擬合分布曲線Fig.4 Fitting curve of temperature and electricity load in Tianjin based on threshold regression model
在以往研究對用電量與氣溫關系曲線的分析中,模型的不同會造成一定差異,為了提升評估的科學性和準確性,文中采用線性和非線性兩種預測方法進行評估。
3.2.1 線性模型下的預測效果檢驗
表3給出基于式(1)的線性預測方法下的評估結果,可以看出,“U”型分段方法的預測效果整體優于“V”型。與不考慮相對濕度的傳統“V”型相比,考慮相對濕度的“V”型分段方法(km=kn=0)能夠將RMSE減小0.36 GW·h,MAPE減小0.141%。同樣,在“U”型分段方法中,考慮相對濕度的日用電量預測效果均優于傳統分段方法。其中基于溫濕度日用電量分段模型(km=1.0,kn=0.8)的預測效果最好,與18.3℃的“V”型分段方法相比,日用電量預測的RMSE和MAPE分別減小1.562 GW·h和0.546%,較TR模型計算的“U”型分段方法相比,RMSE和MAPE分別減小0.253 GW·h和0.112%。

表3 基于公式(1)的各類分段方法下日用電量預測效果對比Table 3 Comparison of daily electricity load forecasting result by different segmentation methods based on Eq.(1)

3.2.2 非線性模型下的預測效果檢驗
文中確定分段方法時采用的線性不對稱模型,一般來說,該模型比非線性模型的預測效果差,因此對應表3中MAPE明顯偏大。為了檢驗文中分段方法在非線性模型下適用能力,修改式(1)為:
(13)
式中:右側前兩項與式(1)意義一致;右側第三項n取為3;V1代表度日值TP;V2代表度日值的平方值(TP)2;V3代表相對濕度;度日值的計算方法見式(14);由于用電量受到用電慣性及建筑熱慣性的影響(Scapin et al,2016),用第四項代表該效應,其中Dt-1代表預測日前一日用電量,對于周間的用電量差異,同樣利用虛擬變量,L1和L2在預測周一和周二至周五時分別為1,其他時段為0,系數分別取為ω1和ω2。
(14)

非線性模型對比預測結果(表4)表明,考慮相對濕度的用電量分段方法同樣提升了非線性模型中的預測效果,與傳統的“U”型分段模型相比,RMSE和MAPE值分別減小了0.316 GW·h和0.101%,針對舒適區和冷卻區過渡區域的預測效果也有明顯提升,RMSE和MAPE值分別減小了0.647 GW·h和0.209%。

表4 基于式(12)各類分段方法下日用電量預測效果對比Table 4 Comparison of daily electricity load forecasting result by different segmentation methods based on Eq.(12)
綜上看出,基于溫濕度的日用電量分段方法的預測效果在線性和非線性模型中均有明顯提升,這主要由于對數據實現了更為科學的分類,正確的分區提升了樣本準確性,同時去除以往錯誤歸入舒適區或冷卻區的樣本值對預測曲線的影響,從而提升了整體預測的準確性。
本文通過分析用電量和氣象因子之間的非線性關系,提出了基于溫濕度的日用電量分段新方法。并到如下結論:
(1)日用電量對氣溫和相對濕度均表現出高敏感性,隨著相對濕度的變化,用電量和氣溫之間的低敏感區范圍(即舒適區)會發生明顯偏移,并在冷卻區與舒適區之間表現更為顯著。
(2)分析舒適區的氣溫閾值發現,隨著相對濕度增大,Tm向低溫一側偏移,Tn則變化不大,因此舒適區范圍會隨相對濕度增大而變窄。
(3)對預測效果評估結果顯示,線性模型中,預測效果較傳統“V”型和“U”型均有所提升,針對舒適區和冷卻區過渡區,RMSE和MAPE值分別減小了0.759 GW·h和0.215%;非線性模型中同樣表現出了較好的提升效果,RMSE和MAPE值分別減小了0.647 GW·h和0.209%,不同模型的預測效果均有提升且效果穩定,表明新方法在提升對氣象敏感的電力需求預測的準確性上具有顯著意義。
文中對臨界斜率最優解的選取及對比均以天津地區為例,因此實際應用中會隨著地區氣候特點、居住環境的不同而有所差異。同時,Tn對相對濕度敏感較低,因此在實際業務中,Tn的計算可以僅考慮氣溫。