蔡嘉榮,王順意,吳廣財
(廣東電網有限責任公司,廣東廣州,510080)
2014年,南方某縣級供電公司統計該地區非正常技術損耗電量5163萬度。其中,居民和農村地區理論上被盜竊電量達4290萬度,占理論總被盜竊電量的83%,按居民用電0.61元/度計算,損失電費超2600萬元。由此可見,每年因竊電對國家資產造成了巨大損失。
目前供電企業反竊電工作主要存在查證難、取證難、定量難的問題,用檢人員在查證上往往無從入手。一方面電力營銷中總供電量和總售電量之差稱為線損,往往與用戶竊電很容易混雜,另一方面竊電用戶越加狡猾,竊電手法更加隱蔽,不再局限于傳統的改接線路等方法,同時普通用檢人員由于理論與實踐上的約束,增加了反竊電管理難度。
本文主要通過選取歷史用戶用電行為數據(包括竊電數據實例),運用機器學習算法對用戶竊電行為進行有監督學習,形成用戶竊電分類模型,同時使用當年用電檢查實際數據對模型進行檢驗,分析模型識別準確率,為實際用檢工作提供參考。
為了維護正常供用電秩序和公共安全,保護供用電雙方的合法權益,供電企業按照《電力供應與使用條例》等法規履行用電檢查職責,其中周期檢查和專項檢查是供電企業用電檢查的兩大手段,供電企業應在每年第四季度編制出下一年度周期檢查計劃,在每月末要及時編制下月周期檢查計劃。對于0.4千伏及以下的居民客戶每年按不低于1%的比例進行抽查,其他客戶每年按不低于5%的比例進行抽查。對于客戶安全風險等級較高客戶應縮短檢查周期。
供電企業用電檢查業務指導說明書中明確指出:對于客戶線損異常、抄表異常、計量異常、業擴變更異常、舉報、投訴、無檔案戶(黑戶)違竊電等情況,應開展專項檢查。歸納起來,營銷線損、電費、計量、業擴、客服、稽查等專業數據可作為用戶竊電預測信息來源。
將上述業務數據從時間維度上劃分,可分為靜態數據和動態數據兩大類,靜態數據主要包括用戶編號、用戶名稱、用戶類別、電壓等級、信用等級、地區類型、行業類別、用電類型、用電性質、用電容量、用電地址、計量點與用戶關聯關系、平均月電能量、平均月電費、欠費記錄、違約記錄、客戶投訴舉報記錄、現場檢查記錄等;動態數據包括電表表碼數據、電壓數據、電流數據、相位角、臺區線損、線路線損、電能量差動異常、電能表開蓋、電能表停走、三相不平衡、電流過流、電壓斷相、電能表失壓、電能表失流、用電負荷、各行業類別平均用電情況等。
用戶竊電預測本質上為分類問題,即通過適當的模型可以將實際的、未知的用戶用電行為數據進行自動分類(如正常、竊電兩類),同時分類過程要求可解釋性強,便于用檢人員調查取證。
基于上述考慮,本文采用決策樹方法,其構建思路如下:(1)給一個帶有類標簽(正常/竊電)的樣本數據集;(2)選擇信息量大的屬性作為根結點;(3)根據根結點屬性的取值對數據集進行劃分,形成一個二叉(或多叉)樹;(4)根據分叉將數據又分成幾個數據集;(5)再遞歸用其余屬性對幾個數據集進行劃分,直到分類屬性為止。
決策樹方法難點在于如何選擇屬性進行分枝。決策樹中越靠近根節點的屬性,該屬性對分類的決定越重要,信息增益是屬性選擇的一個重要指標(信息增益=信息熵-條件熵),屬性越重要,信息增益越大。
信息熵的計算公式如下:

其中的n代表有n個分類類別(本文n取2,即只有正常、竊電兩種情況)。分別計算這2類樣本在總樣本中出現的概率p1和p2,這樣就可以計算出未選中屬性分枝前的信息熵。
現在選中一個屬性xj(假定是電壓等級) 用來進行分枝,此時分枝規則是:如果xj=vx(假定vx=0.4kV)的話,將樣本分到樹的一個分支;如果不相等則進入另一個分支。很顯然,分支中的樣本很有可能包括2個類別(即0.4kV用戶中同時有正常和竊電兩種分類),分別計算這2個分支的熵H1和H2,計算出知道屬性xj之后的條件熵H’=p1*H1+p2*H2(此時p1表示0.4kV用戶在樣本中出現的概率,p2表示其他用戶出現的概率)。則此時的信息增益ΔH=H-H’。以信息增益為原則,把所有的屬性都計算一遍,選擇信息增益最大的屬性根節點,以此類推直至分類屬性為止。
首先,通過帶有類別標記的樣本集進行機器學習,由于樣本的標記是人給定的,也稱有指導的學習。這個樣本集稱訓練樣本集。訓練樣本集的樣本典型(有代表性)量越多,學到的模型就會好。
為了測試模型的準確性,可用一個測試樣本集測試分類器的準確性,實際過程中可由用檢部門設定模型準確度閥值,當沒有達到閥值時,可增加訓練樣本集重新訓練模型直至滿足要求為止。
對于實際用電檢查過程中,任意給定一個沒有標記的實際數據,用學到的模型對其進行分類,即可給出其分類標記。
用電檢查計劃制定過程中首要風險點在于遺漏檢查客戶,對于大客戶和重要客戶,目前只能采取定期檢查的手段(每半年至每兩年檢查一次);而對于數量龐大的0.4千伏及以下的居民客戶,只能按照1%的比例去抽取檢查對象,檢查的盲目性太大。

圖1 機器學習示意圖
運用本文方法對用電客戶的竊電潛在行為進行預測,有針對性地根據概率安排用戶用檢順序,優化班組工作計劃性,幫助供電用檢人員有針對性地開展用戶檢查工作,提升用檢查處效率,同時也解決過去用檢工作查證難的問題。
本文通過分析用戶用電相關特征及數據,運用機器學習決策樹方法,對竊電行為進行科學的數學判斷,幫助工作人員及時發現用戶是否存在竊電行為,有效減少竊電行為給供電企業所帶來的經濟損失,同時也能很好地避免因竊電、破壞電力設備行為造成的人身傷亡和電氣火災事故,保障人民生命財產安全,減少用電糾紛。
[1]周瑾.國網江蘇電力應用大數據分析精準反竊電[J].國家電網報,2017,5(第003版).
[2]鳳凰資訊.一年被竊電3000萬元,2016年01月07日,http://news.ifeng.com/a/20160107/46971190_0.shtm l.
[3]吳毅良,基于Hadoop的竊電預測平臺研究[J].電氣工程與自動化,2017(6).