周春雷, 董新微, 季 良, 張璧君, 李守超, 陳潤東, 張 辰
(1.國家電網有限公司大數據中心, 北京 100032; 2.北京國網信通埃森哲信息技術有限公司, 北京 100032;3.華北電力大學電氣與電子工程學院, 北京 102206)
隨著電力物聯網的大力開展,智能電表等大量先進量測體系設備在用戶側廣泛接入[1],使電網企業全面走向信息化,數據化,用戶用電數據迎來了爆發式增長,并且隨著新能源消納、電動汽車、智能用電等新興業務開展[2],電網與用戶的關系已經從用戶單向用電模式轉化為電網-用戶之間雙向互動的深層次模式,同時需求響應(demand response,DR)的試點應用也需要調動大量用戶參與實施[3],
但是由于用戶的主觀心理以及客觀環境的差異導致不同用戶具有不同程度的不確定性行為(uncertain behavior,UB),使需求響應的執行往往難以達到理想效果,影響電網調控目標的實現和電網新業務的開展,因此如何分析用戶的不確定性行為,挖掘用戶的不確定性行為,量化評價用戶用電行為的不確定性程度,從而選取合適用戶參與電網業務,是電網需要考慮的難點。此外也存在用戶不確定性程度難以量化評價的問題,因此挖掘用戶的不確定性行為,分析用戶的不確定性程度,有助于電網公司合理選取用戶參與調控,降低用戶違約風險,保障電網安全運行和調控目標實現。
目前針對用戶用電不確定性問題已逐漸成為研究熱點,但是相關研究仍較少。彭文昊等[4]建立用戶與電網激勵之間關系的不確定性模型,與電網側激勵間的關系用不確定性模型來表征;徐青山等[5]根據用戶心理,建立了不確定性模型;孫毅等[6]通過定義舒適度違反率的概念量化表示了用戶為的不確定性;姜勇等[7]考慮了不確定性對電價設定的影響;Tabandeh等[8]考慮設備故障導致用戶的不確定性行為;徐蕾等[9]提出一種識別人群異常行為的方法,通過人群分布和運動信息加以檢測異常行為而更好的預警;龔安等[10]對單維狀態數據通過時間序列自回歸模型對主泵的異常狀態進行檢測;Wu等[11]利用隨機模糊變量來表示用戶不確定性,但存在主觀性較強的問題;李忱等[12]提出了一種基于支持數據描述和不確定性推理的單類通用隱寫分析算法,但檢測精度和可靠性離實用還有較大的差距。
以上文獻雖然從電價、激勵,用戶舒適度、主觀心理等方面研究了用戶的不確定性,但是上述方法較少從用戶用電數據角度考慮,隨著用戶用電需求爆發式增長,智能電表采集的用戶用電數據日益增長,而現有方法存在的用戶不確定性程度判斷效果欠佳,檢測精度和可靠性較低,仍未具備可泛化實用的特征,難以適應大量用戶參與電網新興業務開展的現狀,電網需要選取優質用戶參與新興業務,保證電網與用戶實現良好的雙向互動,達到需求響應等新興業務開展的理想效果。因此亟需一種具有高精度、高可靠性,具有泛化特征的用戶用電不確定性行為檢測方法。
基于此,根據用戶用電數據的時序特性,提出基于時域特征提取的用戶用電不確定性行為檢測方法,首先對用戶用電數據進行特征分量提取,從中檢測用戶的不確定性行為,其次提出局部不確定性指標和整體不確定性指標分析用戶不確定性程度,進而對用戶進行優先級排序;最后將本文檢測方法與傳統方法進行對比,為電網公司選取優質用戶參與需求響應等新興業務提供依據。
在電力物聯網支撐下,電力系統的發、輸、配、用電等各個環節都將演繹出新業務,比如電動汽車服務、源網荷儲協同互動[13]、新能源云建設、綜合能源服務、多站融合發展、虛擬電廠運營、能源互聯網生態圈構建等新興業務的建設,新業務的發展離不開電力用戶的廣泛支撐。此外隨著電力物聯網廣泛建設,智能電表也廣泛應用于新能源接入業務場景、雙向計量業務場景和智能家居控制與需求響應調控場景。
以智能用電和DR調控場景為例,隨著人們消費水平的提高和住宅智能化發展,智能家居涉及范圍日漸增多,系統配置也更加多元化。智能電表在其中起到重要作用,既可實時監測智能家居負荷狀態,同時可與電網保持雙向通信,在必要時控制柔性負荷。此外,可以對智能電表采集的用戶用電數據開展用戶行為分析,選取合適用戶可對其智能家居進行控制,可以避免出現用電高峰時電能不足和用電低谷時電能富余等狀況。
因此在開展上述新興業務場景建設時,電網公司需要通過智能電表與用戶建立雙向互動,只有充分了解用戶的用電行為特征,分析用戶行為的不確定性對電網業務造成的影響,電網才能更準確地選取用戶進行雙向互動,進而發展新興業務。
用戶產生不確定性主要有三方面原因[14-15]:一是用戶主體,每位用戶都具有獨立的思維意識,其心情和心理活動都各有差異;二是用電行為環境,影響電力用戶行為的外界環境包括環境溫濕度、天氣因素、電價因素等;三是用電方式,電力用戶為達到某一用電目標需要對電器采取不同的用電方式,包括對空調、熱水器、電熱泵等家用電器的溫度和開關調節,還有對電動汽車、分布式儲能、分布式可再生能源的使用或控制,以上各個方面的因素均導致用戶出現不確定性行為。
雖然對電力系統中各物理元件已建立相應的物理模型,但是對用戶的不確定行為難以建立有效的先驗物理模型,往往是基于大量歷史用電數據進行預測分析[16-17]。
用戶用電行為具有可預測性和不確定性。而用戶的用電數據是一個典型的時序數據[18],其具有周期性和趨勢性等時序特性,時間維度上體現為時變特性,因此可以從用戶的用電數據中檢測用戶的不確定性行為[19],對用戶的不確定性行開展研究,分析其不確定性程度。
面向電力新業務的用戶不確定性行為檢測技術架構如圖1所示,由下至上可分為業務場景層,智能電表采集層,不確定性行為檢測層,以及電網調控層。

圖1 用戶不確定性行為檢測技術架構
在業務場景層中,由電力物聯網衍生出的諸如新能源消納、電動汽車服務、源網荷儲協同互動、用戶智能用電等新興業務中,均有大量用戶參與,且用戶的不確定性程度對業務的開展具有不同程度的影響,因此文中將各業務場景的用戶用電數據作為不確定性行為檢測對象。
智能電表主要是對來自業務場景層的用戶用電數據進行采集分析,以便進一步對數據進行特征分量提取,檢測用戶用電不確定性行為。針對智能電表上傳的數據,在檢測層利用特征分量提取算法,對時序用電數據進行分解,提取周期分量、趨勢分量和隨機分量,并進一步挖掘隨機分量,判斷其中的用戶不確定行為點,具體算法步驟在第2節詳述。在提取用戶不確定性行為點后,智能電表將數據上傳給電網公司,由電網公司對各類用戶的不確定性程度進行分析,評價用戶的整體不確定性和局部不確定性,并對用戶不確定性進行排序,從而選取不同的用戶參與電網調控業務,實現用戶與業務的雙向互動。
為了從各業務場景的海量用電數據中檢測用戶的不確定性行為,根據時序數據具有周期性、趨勢性和隨機性的特點,提出一種基于時序數據的特征分量提取算法來檢測用戶的不確定性行為,具體算法流程如圖2所示。
用戶用電數據具有典型非平穩時間序列的特征,可以用時序分解算法對其進行分解,并表示為一種加性模型:
Yt=Tt+St+Rt
(1)
式(1)中:Yt為用戶用電時序數據;由趨勢分量Tt、周期分量St和隨機分量Rt組成;t為用電數據對應時刻。其中趨勢分量和周期分量是平穩部分,剩余的隨機分量就是時序數據的非平穩部分,基于這部分對用戶的不確定性異常用電行為檢測進行研究。首先提取周期分量和趨勢特征分量,在確定隨機誤差后提取隨機分量Rt,再判斷奇異點是否為用戶不確定性行為,具體步驟如下。
步驟1提取周期特征分量。為了確定用戶用電時序數據的周期性,便于后續研究,需要提取周期特征分量。目前已有方法是利用傅里葉變換(Fourier transform,FT)、小波變換(wavelet transform,WT)等方法確定周期。現根據時序數列周期特點,提出一種全新方法確定周期L。首先根據式(2)對時間序列X{x1,x2,…,xM}進行差分計算,M為數據編號(m>30,n>50),得到矩陣A。
(2)
分別對式(2)的每一行元素做線性擬合,并分別代入Y=aN+b中得到A′,a和b分別為線性擬合后的系數矩陣和常數項矩陣,如式(3)所示。
(3)
采用最小二乘法即式(4)計算A與A′每行最小誤差,最小誤差的所在行數即為周期L。誤差d如式(4)所示,i和j分別為行數和列數。
(4)
步驟2提取趨勢特征分量。在確定周期L后,用L將用戶數據的時序數列X劃分成矩陣B。
(5)
式(5)中:各行表示相同周期內所有時間點的集合;各列表示不同周期但相同位置的點的集合。xM之后數據均為空值NA。分別提取B中每列,依次記做L1~LL。對序列Li分別進行如下操作:①數據清洗,若用戶用電數據序列中存在空值,則去除空值;②對清洗后的用戶用電數據時序序列Li進行聚類,將聚類后單獨的離群點判斷為奇異點E;如果用電時序數列Li的趨勢分量為定值,則在該定值直線上的點為趨勢分量點,其余點則判定為奇異點;若趨勢分量按規律分布,則按規律分布的點為趨勢分量點,否則為奇異點;若為隨機分布,則需確定隨機分布范圍的上下限,在該范圍之外的點均為奇異點。
步驟3確定隨機誤差NeN~FeN(r)。為了確定用電數據時序數列的隨機誤差,需要求取隨機誤差分量的分布函數,分別提取矩陣B的每一行元素,得到共計N個時間序列,分別記做N1~NN,其中每個Ni序列均有L個數據,然后對序列X進行統計分析,得到序列X的分布模型X~F(x)。按照F(x)的分布模型可以得到一組全新的序列N′1,N′2,…,N′N,對新序列從小到大依次排序,對于原序列N1,N2,…,NN內元素從小到大排序,并減去序列N′1,N′2,…,N′N內對應位置元素,得到N個隨機誤差序列,記為Rt(i)。基于Rt(i)可求得每個序列Ni的隨機誤差分布模型,記做Ne1~Fe1(r),Ne2~Fe2(r),…,Xe~Fe(r)。
(6)
由式(6)即可求得用戶用電數據時序數列X的隨機誤差分布范圍。

(7)
(8)
選取北方某地用電數據進行仿真,經智能電表采集三類用戶某一周工作日的用電數據集,采樣間隔為15 min,共480個采樣點。首先對用戶用電數據進行數據清洗,之后采用上述特征分量提取算法對時序數據進行分解,提取用戶用電數據的趨勢分量、周期分量,這部分作為用電時序數據的平穩部分,可以反映用戶一周內的用電趨勢性和相對固定的用電周期性等確定性行為特性。在剔除時序數據平穩部分后,隨機分量作為非平穩部分集中了用戶用電行為的不確定性和隨機性,對用戶不確定性行為檢測也主要集中在這一部分。下面分別對三類用戶進行用電數據特征分解,并檢測不確定性異常行為點。
圖3是第一類用戶特征分量提取結果。圖3(a)是經數據清洗后第一類用戶一周用電數據,在此基礎上,利用時序特征分量提取算法,提取出用戶用電時序數據的周期、趨勢和隨機分量,如圖3(b)~圖(d)所示。其中圖3(b)是提取用電數據的周期分量,從中可以看出用戶具有明顯的周期特性,周期L=72。圖3(c)提取出用電數據趨勢分量,反映了用戶一周的大致用電趨勢,為了完整體現提取的特征分量,在特征分量中會有負值域部分,但是這部分并不影響對用戶整體用電數據的分析,因為周期、趨勢和隨機三個分量之和仍為用電數據采樣值。對剩余隨機分量的480個采樣點進行檢測,紅點代表檢測出的用戶不確定性行為點,其中共有31個點為用戶不確定性異常行為點,分布情況如圖3(d)所示。

圖3 第一類用戶用電數據特征分量提取結果
圖4是對第二類用戶的特征分量提取結果,周期分量、趨勢分量和隨機分量如圖4(b)~圖(d)所示,其中周期長度L=60,該類用戶用電趨勢較為平穩,在隨機分量中共有16點被判為用戶不確定性異常行為點,分布情況如圖4(d)所示。

圖4 第二類用戶用電數據特征分量提取結果
圖5是對第三類用戶的特征分量提取結果,各分量如圖5(b)~圖5(d)所示,其中周期長度L=63,該類用戶的用電趨勢具有一定的波動,在隨機分量中共有20點為用戶不確定性異常行為點,分布情況如圖5(d)所示。

圖5 第三類用戶用電數據特征分量提取結果
為了準確評價用戶的不確定性程度,便于電網在不同時段選擇合適的確定性用戶參與需求響應策略,從時域角度分別定義用戶局部不確定性指標fUBP(iL)和整體不確定性指標FUBP(nL):
(9)
(10)
式中:kiL是在第i個周期內檢測出的用戶UB點數;NiL是在第i個周期內的采樣點數;i=0,1,2,…,n。局部不確定性指標fUBP(iL)反映了當前第i個周期內用戶的不確定性程度,而整體不確定性指標FUBP(nL)是對前n個周期檢測結果的分析,是對用戶不確定性程度的整體評價。基于這兩個指標對三類用戶的不確定性程度進行評價,如表1所示。

表1 各類用戶的fUBP和FUBP指標結果
根據特征分量提取結果可知,用戶用電數據的周期分量共可分為7個長度Ln=3的周期,在每個周期內各類用戶具有不同程度的不確定性。對于局部不確定性指標fUBP,當檢測L2周期內的采樣值時,三類用戶的指標排序為fUBP1>fUBP2>fUBP3,說明此時第一類用戶的不確定性程度最大,而第二類用戶的不確定性大于第三類用戶;而在L4周期內,fUBP指標排序為fUBP2>fUBP3>fUBP1,此時第二類用戶的不確定性程度最大,然后為第三類用戶和第一類用戶;而在L6周期內,fUBP指標排序為fUBP2>fUBP3=fUBP1,即此時第二類用戶的不確定性最大,但第一和第三類用戶的不確定性程度相同。
對于整體不確定性指標FUBP2>FUBP1>FUBP3,當Ln=7時,三類用戶的整體不確定性程度排序為FUBP1>FUBP2>FUBP3,說明第一類用戶的整體不確定性程度最大,其次為第二類用戶和第三類用戶;當Ln=5時,FUBP2>FUBP1>FUBP3,說明在前5個周期內,第二類用戶的不確定性最大,其次為第一類和第三類用戶;當Ln=3時,FUBP1>FUBP3>FUBP2,說明在前3個周期內第一類用戶的不確定性程度最大,其次為第三類用戶和第二類用戶。在不同周期內,各類用戶的不確定性程度都有差異。
因此當電網需要用戶響應調控時,根據要下發指令的起止時間和持續時長,將不確定性從低到高依次排序,優先選擇在當前時段不確定性程度最低的用戶,并根據持續時間長短,動態選擇用戶參與調控,從而減少用戶違約風險,最大程度滿足電網業務要求,減少不確定性所帶來的影響。
最后將文中檢測方法與傳統常用方法進行對比,結果如表2所示。

表2 本文方法與其他方法對比
從表2中可以看出,本文方法與傳統方法相比,總體上有明顯優勢,雖然在短期檢測速率上稍慢,但是在短期精度和效率上均有明顯提高,并且從長期來看精度、效率和速率均有明顯提升,因此在面對大量用戶長期用電數據時,本文方法的優勢能進一步凸顯。
針對電網用戶不確定性行為檢測和用戶不確定性程度難以量化評估的問題,文中提出一種基于用戶用電數據的特征分量提取算法來檢測用戶的不確定性行為,并從局部不確定性和整體不確定性指標兩個維度量化和評價用戶的不確定性程度,對用戶的不確定性進行排序。
通過算例仿真可知,不同類型的用戶具有不同的趨勢分量、周期分量和隨機分量特征,檢測出的不確定性行為點在隨機分量中的分布呈集中或分散的特性,因此用戶的不確定性是動態變化的,其整體不確定性并不等于局部不確定性,電網公司在選取用戶參與調控時應根據所處時段不同用戶的不確定性程度進行排序,優先選擇確定性程度高的用戶參與調控。通過對比其他檢測方法,文中方法在檢測精度、效率和速率方面具有明顯優勢。