馬占海,張俊超,田光欣
(國網青海省電力公司信息通信公司,青海西寧 810008)
電力系統影響著人們的生活,關系著國家的發展。目前,工業企業及生活用電需求不斷攀升。在利益的驅使下,存在通過不合法的手段來獲取電量的情況[1]。近年來,竊電手段變得越來越多樣化,高科技的竊電手段會干擾計量裝置,破壞電子式電能表的計量裝置,導致裝置出現誤差[2]。目前,大量學者針對用電竊電行為進行了研究,劉海等人[3]提出了基于C-lightGBM 的用戶竊電檢測方法,建立竊電檢測模型,設置輕量級提升決策樹分類器,利用分類器進行檢測,同時使用CNN 深度特征進行電力檢測,從而達到快速分類的目的,該方法能夠有效提高檢測精度,但不具備自動檢測能力。趙云等人[4]提出了一種相關性與聚類自適應融合技術的竊電檢測方法,將最大互信息系數技術和密度峰值快速聚類實現融合檢測,分析用戶之間的相關性,提高檢測的適用性,但是這種方法的自動化能力相對較差。
大數據分析技術具有數據量大、速度快、種類多和價值豐富的優點。因此,文中提出基于大數據分析的電網竊電行為特征自動提取模型,并通過實驗驗證了模型的實際應用效果。
以時間序列對電力數據進行存儲,通過合理的變換方式實現電力大數據矩陣隨機分析,利用預處理方法確定矩陣的隨機條件。在大維隨機矩陣理論中,電力數據會有更加靈活多樣的表現方式,變量處于隨機分布狀態,能夠有效提高竊電識別效果。[5-6]。
在電力系統中確定觀測點,設定共有N個,建立時間序列維度并統計顯示,電力系統共有m個維度。設定電力系統工作時間為t,則在t時刻中,共有m個參量[7],則觀測點i(i=1,2,…N)在時間序列的電力數據樣本可以表示為:
在得到每個觀測點的矩陣后,使用疊加方式確定原始大維度隨機矩陣,行列比計算公式如下:
其中,c為得到的行列比。由于在正常狀況下,Nm的數值小于t,因此必須通過變換處理使原始矩陣更具多樣性。
選取觀測點i(i=1,2,…N),拆分矩陣,設定拆分段為k段,則有:
對得到的N個矩陣進行疊加,疊加處理后,能夠得到大維隨機矩陣,在N個觀測點內部的大維隨機矩陣可以表示如表1 所示。
利用大維隨機矩陣能夠很好地監測電力系統用戶狀態,對用戶信息進行存儲,通過共享的方式反映用電的電流和電壓數據,在得到合適的參量后,利用預處理實現分析[8-9]。
矩陣需要去量綱化和數值歸一化處理,在統一處理后,不同的矩陣具備可比性,根據極限譜分布理論對數據進行預處理[10]。通過標準化處理使數據矩陣從二維矩陣轉換成三維矩陣。由于元素內部數據都為實數,因此需要對樣本協方差矩陣進行奇異化處理,在復平面上完成處理。
在完成信息預處理后,對電網竊電行為特征進行識別。在對電網竊電行為特征進行識別后,首先確定線路是否存在線損異常,然后逐個臺區進行檢測,分析臺區是否存在異常[11]。在確定異常后,對不同用戶的竊電嫌疑程度進行判斷,通過全方位的分析確定竊電時間區段,最后根據竊電分析確定重點嫌疑用戶,從而更好地實現識別和監測。在對電網竊電行為特征進行識別時,要采用針對性的方式,不斷尋找竊電用戶,從而實現識別,識別采用遞進的方式[12-13]。首先尋找所有線路中線損較高的線路;然后對線路上的臺區進行鎖定,確定電量異常高的臺區[14];最后在臺區內部縮小到用戶單位,尋找臺區內部竊電嫌疑最大的用戶,依次排序,尋找竊電時間數據,從而能夠實現快速識別竊電行為特征。
若用電用戶都屬于正常用戶,則線路處于正常狀態,即使存在線損,波動值也在恒定值附近。一旦有用電用戶存在竊電行為,線路的線損就會瞬間陡增,本來呈現曲線變化的線損值會出現峰值[15]。
除了竊電行為之外,如果用戶在用電過程中存在負載三相不平衡或者電力設備異常,則會出現線損增加。因此線損異常只是判斷用戶存在竊電行為的一個指標,而并不是唯一指標,用戶可以通過分析線損異常狀況進行篩選,尋找竊電嫌疑大的用戶,通過逐步分析,使分析結果更加準確,提取的電網竊電行為特征更具有代表性。
分析圖1 滑動窗口構造可知,利用正向有功電量分析用電參數,確定不同采樣時刻的不同時間區段內電表示數差值,從而得到累積量,反映不同時刻用戶的用電情況。
利用大數據挖掘技術在電力系統中提取不同的線路,計算線損時間,并將計算結果輸入到樣本內部,建立隨機矩陣,通過預處理得到有效的矩陣數據,再進行標準化處理,計算線路特征,得到復平面上的分布圓環,從而得到不同臺區線損的異常率,判斷異常程度,篩選出異常狀態較高的線路。
對異常狀態較高的線路進行臺區劃分,設定線路上共有M個臺區,一旦用戶存在竊電行為,該用戶的竊電量必然會減少,則證明用電總量有可能存在異常情況。基于大數據分析的電網竊電行為特征主要有視在功率、三相電壓不平衡率、三相電流不平衡率和功率因數,分析用戶的用電量和用電負荷,由于二者蘊含的信息相同,因此可以相互轉化兩個指標,利用這兩個指標來反映用戶的用電行為狀態,在大維隨機矩陣中尋找功率參量,從而更好地構建大維隨機矩陣。設定視在功率為隨機矩陣內部的參數,將視在功率分為有功功率和無功功率,從而更好地完成大數據挖掘[16-18]。
分別計算三相電壓不平衡率和三相電流不平衡率,根據計算結果判斷用戶是否存在欠流或者欠壓的情況,欠壓判別計算公式如下:
其中,ua、ub、uc表示A相、B相、C相對應的電壓;max{ua,ub,uc} 表示三相電壓最大值;min{ua,ub,uc} 表示三相電壓最小值;ξUt表示欠壓判別結果。
欠流判別計算公式如下:
其中,ia、ib、ic表示A相、B相、C相對應的電流;max{ia,ib,ic} 表示三相電流最大值;min{ia,ib,ic} 表示三相電流最小值;ξIt表示欠流判別結果。
在分析上述特征排序后,處理分離函數,分析不同時間區段內圓環點,從而比較竊電時間區段。識別內部特征,從而判定用戶的用電量是否存在異常,如果存在異常,則需要對現場狀況進行勘察,及時解決問題。
為了驗證文中提出的基于大數據分析的電網竊電行為特征自動提取模型的有效性,進行實驗研究,選取某省級電網作為研究對象,分別部署基礎數據平臺,比較線損,實現竊電預警。將提出的自動提取模型接入到省級電網中,電網的存儲容量為12 TB,每條記錄400 個字節,每日數據量的增長為8 GB。
建立的物理節點配置環境如圖2 所示。

圖2 物理節點配置環境
根據圖2 可知,當節點發展到一定模式后,出現竊電現象,分析各種不同節點的運行參數,得到時間序列矩陣。實驗運行參數如表2 所示。
使用文中自動提取模型對電網正常運行狀態和竊電狀態,得到的協方差特征值譜分布方式如圖3所示。
根據圖3 可知,在不存在竊電行為時,電網的特征值全部集中在圓環內部,內環和外環中間值與特征值譜半徑相吻合,一旦發生竊電行為,線損方差矩陣特征值以集中地方式分布在圓環中心。

表2 實驗運行參數

圖3 竊電發生前后特征譜分布實驗結果
發生竊電前后方差特征值密度函數如圖4所示。

圖4 竊電發生前后方差特征值密度函數
根據圖4 可知,電網的運行狀態為正常狀態時,特征值譜密度函數的規律為M-P 規律。而一旦出現竊電行為,電網內部數據存在異常,分布方式不再是獨立分布,特征譜函數偏離M-P 定律。因此文中研究的特征自動提取模型,通過分析特征值譜密度函數與M-P 規律的重合度,判斷是否發生竊電行為。
電網竊電時間實驗結果如圖5 所示。

圖5 電網竊電時間實驗結果
觀察圖5 可知,當電力系統不存在竊電現象時,特征值平均譜半徑以平穩的方式進行波動。而在出現竊電現象后,特征值平均譜半徑會產生兩個非常顯著的突變點,這兩個突變點正好對應竊電的起始時間和終止時間。因此,文中研究的特征提取模型能夠更好地反映出電網的運行狀態,確定分析平均譜半徑的變化狀況后,可以確定系統運行的異常點。
文中利用大數據分析技術研究了電網竊電行為特征自動提取模型,對數據進行預處理,實現信息分析,從而完成特征自動提取。設計的特征自動提取模型同時分析了多個參數,實現數據采集、數據存儲和數據處理,分析線損狀況和臺區狀況,完成電力數據的實際應用。文中研究的特征自動提取模型能夠充分利用大數據技術優勢,更好地實現竊電。但是文中對電網實時運行分析的研究較少,難以更好地完成負荷預測,因此未來需要進一步深入研究這一問題。