張浩海,王昊,丁耀杰
(北京中電普華信息技術有限公司,北京 100000)
電力物聯網應用于電力系統發電、輸電等全部環節中,電能數據具有極強的周期性[1],利用歷史數據作為電能數據缺失修復方法的依據,對于電能數據修復具有重要意義。DA(Data Augmentation)多重插補法通過缺失電能數據的可能分布值修復缺失數據。DA 多重插補法結合觀測數據與數據的先驗數據實現數據修復。該文提出基于DA 多重插補法和電力物聯網的電能數據缺失修復方法,提升電力物聯網中海量電能數據的應用性能。
電力物聯網的總體結構圖如圖1 所示。

圖1 電力物聯網總體結構圖
通過圖1 電力物聯網的總體結構圖可以看出,電力物聯網的各個環節共同作用,實現電力物聯網在電力系統中的良好應用。電力物聯網利用感知層的設備終端采集電能信息,處理電能信息相關數據[2-4]。電力物聯網的通信層,利用移動通信技術等網絡設施,對感知層采集的信息進行數據接入與傳輸。平臺層將所采集的電能信息整合處理,平臺層具有存儲數據、缺失電能數據修復、檢索數據以及保護電力系統的數據資源安全性的功能。應用層接收用戶提交請求后,從平臺層調取數據,利用平臺層分析處理后的數據,為用戶提供服務。電力物聯網利用感知層的電能數據采集終端采集電能數據。電力物聯網運行過程,是采集電能數據、傳輸電能數據與處理電能數據的過程[5-7]。電能數據的完整性與可靠性是電力物聯網可靠運行的重要前提。電力系統在數據感知與處理過程中,容易出現數據缺失情況,數據缺失對于電力系統電能數據的實際應用具有重要影響。數據缺失將導致很多業務無法順利開展。如電能數據中的電壓波形數據丟失時,無法精準識別電能質量干擾情況,無法精準定位電力系統故障信息[8-9]。及時修復電力物聯網中的電能缺失數據,對于保障電力系統中業務正常運行、利用完整數據建設電力物聯網具有重要意義。
利用EM 插補算法對電能物聯網中的電能數據的缺失值進行初始插補處理。EM(Expectation-Maximum)算法即期望最大化算法,該算法利用極大似然估計方法,估計給定的電能觀測數據。假設X為電力物聯網中電能數據的觀測數據集,Y為電力物聯網中的缺失電能數據集,電力物聯網中包含缺失電能數據的全部電能數據集Z=(X,Y),該電能數據集Z的概率密度函數表達式為:
式中,p為缺失電能數據的概率,θ為電能數據概率密度函數的缺失電能數據參數,x、y、z分別為電力物聯網中電能數據集X、Y、Z中的數據。缺失電能數據y的假設、缺失電能數據參數θ的初始估計值、缺失電能數據y與觀測電能數據變量及電能數據邊緣密度函數p(x|θ)間的關聯,是決定電能數據概率密度函數p(z|θ)的重要因素。依據式(1),獲取電力物聯網中全部電能數據集的似然函數表達式為:
式中,L為電能物聯網中全部電能數據集似然函數的似然性。考慮到電力物聯網中,缺失的電能數據存在未知性[10],因此似然函數L(θ|Z)是依據缺失電能數據Y產生的隨機數。為提升似然函數估計的準確性,假設缺失電能數據變量為不完全隨機缺失[11-12],即該類電能數據的缺失依賴于其他完全電能數據的變量。
給定觀測數據集X與缺失電能數據參數θ的初始估計值后,利用EM 算法的E 步驟與M 步驟對電力物聯網中的缺失電能數據進行挖掘。E 步驟是計算與完全電能數據對數似然函數lnp(X,Y|θ)關聯的缺失數據集Y的期望。完全電能數據對數似然函數期望的表達式為:
式中,θi表示現有已知參數的估計值。其中,Y中的數據服從y→f(y|X,θi)分布。
似然函數h(θ,Y)的最優化表達式如下:
式(4)可以轉化如下:
式中,f(y|X,θi)表示電力物聯網中電能缺失數據y的邊緣密度函數,參數θi和觀測數據對邊緣密度函數影響較大。
存在式(6)的函數:
參數θ與因子f(X|θi)無直接關聯,電力物聯網中電能數據缺失修復過程中,將f(y|X,θi) 利用f(y,X|θi) 代替,對式(4)的似然函數最優化不存在影響。
利用EM 算法對電力物聯網中的電能數據進行插補處理的第二步M 步驟,通過搜尋θi+1,將期望值g(θ|θi,X)進行最大化處理,令θi+1值滿足以下公式:
式中,Θ 表示參數空間。
EM 算法依據算法參數與電力物聯網中缺失電能數據間的關系,插補缺失數據。電能缺失數據已知,算法參數未知時,算法參數可以利用電能缺失數據估計;算法參數已知時,利用算法參數可以精準估計電能缺失數據。假設可以利用算法參數估計電能缺失數據,利用電能缺失數據修復算法參數[13-14]。重復迭代以上過程,直至算法參數為收斂狀態,利用收斂的算法參數獲取電力物聯網中的缺失電能數據。EM 算法利用重復迭代過程,獲取極大似然估計結果。數據重復迭代過程,可以增加似然函數值,同時將似然函數值快速收斂至局部極大值,該算法具有較高的穩定性,計算簡便。
將利用EM算法獲取的電力物聯網缺失電能數據初始插補結果[15-16],作為DA 多重插補法的插補初始值,獲取最終電能數據缺失修復結果。DA多重插補法充分考慮電力物聯網中電能數據的時間序列,利用局部加權回歸模型修復電力物聯網的缺失電能數據。用φ0表示包含利用EM 算法獲取缺失電能數據初始插補結果的初始觀測數據,DA 多重插補法修復電力物聯網缺失電能數據的觀測方程表達式如下:
缺失電能數據修復的狀態方程表達式如下:
式中,Yt與φt分別觀測向量以及期望向量,vt與wt分別表示觀測誤差與狀態誤差。DA 多重插補法采用動態正態模型,更好的修復缺失電能數據。相對于φt-1,φt存在一個狀態誤差,狀態誤差序列wt與觀測誤差序列vt為互相獨立狀態。
DA 多重插補法利用局部加權回歸模型,更新電能數據狀態,修復電力物聯網內海量電能數據的缺失數據。局部加權回歸模型可以靈活地探索不同變量間的關系。利用局部加權回歸模型修復電力物聯網的缺失電能數據時,對電能數據φt進行局部多項式估計處理,構建一元非參數回歸模型表達式如下:
式中,yt與m(φt) 分別表示實際電能數據以及模型預測值,ut表示隨機誤差項。電能數據缺失修復時,隨機誤差項的期望值為0。
設m(φt) 表示電力物聯網電能數據φ0附近的p+1 階導數。數據φ0的鄰域表達式如下:
一元非參數回歸模型的加權誤差平均和需要滿足以下公式:
式中,wt表示模型的權重,t=1,2,…,T,表示局部加權時間參數。
式(13)中的穩健權數表達式如下:
式中,c表示固定時間段內,電力物聯網電能數據的中值函數。
利用穩健權數ξ對模型參數估計,獲取最新預測誤差值et。依據誤差最小化原則,獲取電力物聯網電能數據缺失值修復的插補值,完成電力物聯網的電能數據缺失修復。
為了驗證所研究方法修復電力物聯網的缺失電能數據有效性,選取某電力企業作為研究對象。該電力企業利用電力物聯網為用戶提供服務,電力物聯網缺失電能數據修復性能決定電力企業對用戶的服務性能。選取該電力企業供電區域的某用戶的電流數據作為研究對象。采集該用戶2019年12月1日-12 月31 日的用電電流數據,該用戶A 相、B 相以及C相三相電流的額定電流為4 A,電能數據缺失值的取值區間為[0,4]。用戶的電流數據具有極強的周期性,缺失電能數據修復有助于分析用戶用電情況。
電力物聯網的感知層利用電能數據采集終端,采集該用戶的三相電流原始數據,如表1 所示。

表1 用戶原始三相電流數據
通過表1 電能數據采集結果可以看出,電力物聯網利用感知層采集的用戶電能數據中的三相電流數據中,存在明顯的缺失數據,影響電能數據在電力物聯網中的應用。利用文中電力物聯網電能數據缺失修復方法,精準修復用戶缺失的三相電流數據,提升電力物聯網的應用性能。
利用EM 插補算法,依據所采集的電力物聯網電能數據,插補計算缺失的電能數據。EM 算法獲取缺失數據的初始插補結果如表2 所示。

表2 缺失電能數據初始插補結果
通過表2 實驗結果可以看出,采用文中方法可以有效利用EM 插補算法,獲取電力物聯網中,該用戶三相電流數據中的電流插補數據。將利用EM 插補算法獲取的缺失電能數據插補結果,作為DA 多重插補法的初始值。DA 多重插補法依據初始插補數據對缺失電能數據進行多次插補。DA 多重插補法的插補結果如圖2 所示。

圖2 DA多重插補法的插補結果
通過圖2 實驗結果可以看出,該文方法利用DA多重插補法,可以有效獲取電力物聯網中三相電流數據的缺失插補值。
計算利用DA 多重插補法,對電力物聯網電能缺失數據插補結果的狀態誤差方差,八次插補的狀態誤差方差統計結果如圖3 所示。

圖3 插補狀態誤差方差統計結果
通過圖3 實驗結果可以看出,利用DA 多重插補法插補電力物聯網的缺失電能數據,三相電流數據的插補結果中,第六次插補的三相電流數據的狀態誤差方差為8 次插補結果中的最低值,實驗結果表明,八次插補中,第六次的插補結果為最優值。選取第六次的插補結果作為電力物聯網缺失電能數據的最終修復結果。
電能數據缺失率對電力物聯網缺失電能數據修復結果存在明顯影響。統計不同缺失率時,采用該文方法修復電力物聯網缺失電能數據的觀測誤差方差,統計結果如圖4 所示。通過圖4 實驗結果可以看出,采用該文方法修復電力物聯網中的缺失電能數據,不同缺失率情況下,采用該文方法修復電力物聯網中用戶的三相電流數據,電能數據缺失修復的觀測誤差方差均低于0.2。實驗結果驗證,該文方法具有較高的缺失電能數據修復水平,不受電能數據缺失率影響。不同電能數據缺失率時,缺失電能數據修復性能良好,可應用于電力物聯網的實際應用中。
為了進一步衡量該文方法對電力物聯網中的缺失電能數據的修復性能,統計采用該文方法對用戶于2019 年12 月5 日-12 月12 日的缺失電能數據修復結果,如圖5 所示。

圖5 電能數據缺失修復結果
通過圖5 實驗結果可以看出,采用該文方法不僅可以修復電力物聯網在短期內缺失的電能數據,對于缺失的長期電能數據同樣具有良好的修復性能。該文方法可以有效修復電力物聯網中缺失的電能數據。采用該文方法修復電力物聯網缺失電能數據,修復性能穩定,電力物聯網缺失電能數據修復的應用性較高。
對電力物聯網感知層的電能數據采集終端,采集電能數據過程中的缺失數據進行修復,對于提升電力物聯網的數據完整度,以及服務質量具有重要意義。選取某電力企業的電力物聯網作為研究對象,驗證不同缺失率情況下,該方法均可以有效修復電力物聯網的缺失電能數據,修復效果良好。該方法充分考慮了電力物聯網電能數據的波動特性,不僅可以有效描述電力物聯網內電能數據的短期變化,同時可以描述電力物聯網電能數據的長期變化規律,對于短期與長期的缺失電能數據,均可以精準修復,提升電力物聯網的電能數據質量。