杜章華,蘇 盛,劉正誼,薛 陽,楊藝寧,劉 廈
(1. 長沙理工大學電氣與信息工程學院,湖南省長沙市410114;2. 國網常德供電公司,湖南省常德市415000;3. 中國電力科學研究院有限公司,北京市100192)
竊電直接造成供電企業凈利潤流失[1],是長期存在的問題。由于用戶竊電往往會表現為電量異常,研究人員多以電量為依歸,根據用電量曲線的滑落、波動或報裝容量利用率低等設計特征指標項建立檢測模型[2-3],并設計分類[4-8]和聚類算法[9-12]來識別低電量異常用戶[1]。需要指出的是,圍繞用電量異常設計特征指標項,隱含用戶用電基本平穩的前提。實際系統中,相當一部分用戶需根據訂單安排生產,用電并不具有平穩性,日際電量波動30%~40%較為常見,而單相分流竊電時損失電量在30%以下,正常電量波動和竊電容易混淆。此外,環保限產、消防整改、設備大修等因素也可能造成持續低電量異常。以電量為核心指標檢測用電異常存在可用信息不足的缺陷,難以識別是竊電還是生產經營狀態轉換導致的低電量異常,造成誤報,影響工程應用。
盡管工業和商業用戶的生產經營活動具有不確定性,部分用戶的用電量還存在明顯的日際波動,但它們的生產經營狀態數量基本上固定(如工業用戶有春節放假、周末輪休、滿負荷排班或正常生產排班等狀態,商業門店有春秋季和冬季、夏季工作日/節假日以及節假日打烊等狀態),而每種狀態下的用電設備投用組合和用電行為模式是基本明確和固定的。因此,利用用戶用電數據,有可能識別出其所處的狀態,進而識別用戶轉入正常的低電量生產經營狀態導致的低電量異常。
本文首先提出了基于負荷特征的用戶生產經營狀態識別方法,然后將竊電檢測識別出的低電量異常用戶每天三相功率數據作為負荷特征,根據負荷特征聚類識別低電量異常時段所處的生產經營狀態,從而判斷造成低電量異常的原因,避免正常低電量生產經營狀態造成的誤報。最后,結合實際竊電數據的測試計算驗證了所提方法的可行性。
用電設備在特定運行模式下所體現出來的負荷特性稱為負荷特征[13],是實現用戶用電行為特性分析的關鍵。用電設備的負荷特征可分為高頻特征和低頻特征。其中,前者主要包含設備操作過程的電流、功率暫態波形、跳變沿寬度和高度等[14];后者主要包含有功/無功功率和諧波構成等[15]。因采集的高頻特征超出了智能電表等計量設備的性能水平,當前的研究主要側重采用低頻特征提取用戶用電信息[16]。本文通過對用戶不同生產經營狀態下的設備投用組合進行整體綜合分析,將一天每15 min 間隔的三相功率作為負荷特征,識別用戶當天投用電氣設備組合決定的用電模式及對應的生產經營狀態。
工業與商業用戶用電設備構成基本固定,且一般以天為最小單位安排生產經營。一天之中各類用電設備的投用組合由生產經營狀態對應的排班安排決定,不同狀態對應的用電設備投用組合將會形成相對固定的用電模式。根據一天的計量數據,有可能識別用戶當天所處的生產經營狀態。因用戶所處的生產經營狀態的數量總是有限的,它的狀態總會在幾種有限的狀態間轉換。
一般而言,一年時間可以遍歷特定用戶的所有生產經營狀態。用戶從用電量多的狀態轉換到用電量少的狀態,只是狀態之間的轉換而不會產生新的狀態。盡管正常用戶的日電量不一定平穩,會不定期進入低電量狀態,但是如果此時的用電模式為已有模式,即可認為是誤報。
需要指出的是,計量數據蘊含的信息量在很大程度上決定了其映射用戶生產經營狀態的潛力。與單相計量數據相比,三相計量數據包含更高維度的信息,能更有效地表征用戶的生產經營狀態。
用電設備中,一般小功率設備為單相負荷,而大功率設備多為三相負荷。夜間休息時段,主要負荷為照明等單相負荷,一般負荷較小、三相對稱度也最低;晝間時段,投用設備多、功率大,三相對稱度明顯高于夜間,往往負荷越重三相對稱度越高。
用戶用電設備的投用組合根據所處生產經營狀態的不同而有所差異。一天每15 min 間隔的三相功率包含了負荷水平和三相對稱性等信息,可作為負荷特征標識當天用戶的用電設備投用情況及對應的生產經營狀態。為直觀呈現,以用戶三相負荷最大值為基準值,計算各時刻三相瞬時功率的標幺值后,將某用戶在工作日和周末節假日每15 min 間隔的三相功率以散點云圖的形式繪制見圖1。其中,圖1(a)為工作日的三相功率散點云圖,圖1(b)為節假日的三相功率散點云圖,由圖1 可得如下結論。
1)工作日投用的三相對稱大功率用電設備多,用電負荷的數值和三相對稱度都比較高,三相瞬時功率緊密地沿對角線集中分布;夜間低負荷時的功率散點集中于零功率的右下角。
2)節假日狀態下,大量三相對稱大功率設備停用,投用的主要為單相小功率設備,負荷水平和三相對稱度明顯較低,此時三相功率松散地分布于對角線周邊,散布于右下角零功率附近的功率散點也明顯多于工作日狀態。
無論采用何種手法,竊電總會改變負荷特征(負荷大小或三相對稱性),使其偏離用戶固有生產經營狀態對應的用電模式。因此,采用一天的三相功率作為負荷特征,并將低電量異常用戶的負荷特征和出現異常之前的歷史數據進行對比,可以識別和篩除正常的低電量生產經營狀態造成的低電量異常,降低竊電檢測誤報率。

圖1 用戶正常用電的三相功率散點圖Fig.1 Scatter diagrams of normal three-phase power consumption for users
用電異常檢測中常用聚類分析識別用電異常。電力用戶生產經營狀態數量難以預判,需采用無須預設類簇數的方法進行聚類分析。近鄰傳播(affinity propagation,AP)聚類算法[17]不但無須指定聚類數目,還具有以類簇中心為實際樣本、便于理解等突出優點,以下選擇AP 聚類算法進行用戶生產經營狀態聚類分析。
AP 聚類是一種基于近鄰信息傳播的聚類算法,其目的是找到最優類代表的集合,使得所有樣本到最近的類代表的相似度之和最大[18-19]。AP 聚類算法的具體原理及實現流程說明如附錄A 所示。
工業和商業用戶的用電設備構成相對固定,設備投用組合由生產經營狀態對應的排班安排決定,可以根據負荷特征標識用戶的用電模式和對應的生產經營狀態[20-21]。因為特定用戶的生產經營狀態數量總是有限的,其用電模式會在有限的幾種狀態間轉換,對應的負荷特征可根據生產經營狀態的不同聚類為多個類簇[22-23]。盡管不同狀態對應的負荷大小各有不同,但表現出來的都是正常狀態下的負荷特征。用戶竊電時無論采取何種手法,都將改變負荷數值大小或三相對稱水平(單相或兩相竊電時,影響對稱性;三相等比例竊電時,降低負荷絕對值),從而改變負荷特征的結構,形成新的負荷特征類簇。
因為難以區分導致低電量異常的原因,以電量異常為導向的竊電檢測方法識別出的異常用戶中往往有一部分為誤報。盡管通過異常度累積的方式,可在恰當閾值設置下避免短期負荷驟降引起的誤報[24],但對用電量不具有平穩性的用戶及干擾影響下持續低電量的用戶仍難以避免被誤報。對于竊電檢測識別出的低電量異常用戶,可根據負荷特征標識生產經營狀態,將低電量異常時段的負荷特征與出現異常以前歷史時段的負荷特征進行聚類分析,判斷是用戶轉入正常的低電量生產經營狀態還是竊電導致的低電量異常。具體流程如附錄B 圖B1 所示,詳述如下。
1)竊電檢測識別出低電量的疑似竊電用戶。
2)選擇疑似竊電用戶低電量時段及出現低電量異常前較長時段的用電數據,以最大的單相瞬時功率為基準值,計算每天的三相功率標幺值作為負荷特征。
3)采用AP 聚類算法對低電量異常時段及異常之前負荷數據的負荷特征進行聚類分析。
4)確定各聚類簇在時間上的分布,判斷低電量異常時段的負荷特征是否出現在之前未有的聚類簇中。如果低電量時段和之前時段聚為一類而未新增類簇,則可認為用戶是正常的生產經營狀態轉換導致用電量下降,可排除嫌疑;如果聚類為新的類簇,則可判別為需要現場稽查確認的疑似竊電。
AP 聚類算法的參數主要有衰減系數、最大迭代次數、聚類中心最大迭代不發生改變的次數和偏向參數p。為清楚描述參數設置的影響,結合附錄B圖B2 所示正常無竊電的制鞋業用戶2019 年1 月至7 月用電數據進行測試分析。
聚類參數中,衰減系數0 <λ<1,主要影響聚類收斂時間,取值對聚類結果無影響,以下將其設置為0.5。為控制聚類結束的迭代次數,設置最大迭代次數T為500,聚類中心最大迭代不發生改變的次數t為50。偏向參數p影響聚類類簇數。將p從小到大逐個測試仿真分析其影響,分析結果見附錄B圖B3。其中,橫軸標識p的取值范圍,縱軸標識對應p值下形成的類簇數。由圖B3 可見,p取相似矩陣中元素的最小值及其附近值時,形成的類簇數只有3 個,明顯不足以描述用戶所具有的生產經營狀態;p值增大后,形成的類簇數逐漸增加;p取最大值及其附近值時,類簇數急劇增加,也有悖于對制鞋用戶生產經營狀態數量的認知。結合文獻[19]的做法,將p取中位數時形成的類簇數及各類簇中心對應的生產經營狀態與用戶實際情況比較貼合。由于很難在大量用戶用電異常檢測時逐個調參,可將p統一設置為相似度矩陣中所有值的中位數。
因需要根據歷史數據判斷新增低電量時段是否正常,歷史數據時間窗的長度決定了它可能覆蓋生產經營狀態的廣度。時間窗太短時,可能因涵蓋的狀態不足導致誤判。有必要通過測試確定恰當的時間窗長度。由附錄B 圖B2 可見,制鞋用戶受訂單影響,日用電量具有不平穩特性,2019 年7 月日電量波動可達30%~40%。以下將2019 年7 月負荷為測試對象,按3 個月時間窗(2019 年4 月至6 月)和6 個月時間窗(2019 年1 月至6 月)進行比對分析,測試結果如附錄B 表B1 所示,所得結論如下。
1)采用3 個月時間窗識別2019 年7 月數據時,類簇數將從3 類增加為4 類。對于電量波動較大的用戶,時間窗覆蓋的生產經營狀態不足,電量波動可能形成新的類簇,造成誤判。
2)采用6 個月時間窗時,類簇數始終為5 類。類簇4 除了出現在2019 年7 月電量波動期間外,在2019 年1 月至3 月均有較集中的分布。可認為電量波動是用戶正常狀態切換造成的,不影響聚類結果。
3)選取時間窗長度時應盡可能遍歷用戶正常生產經營活動安排。因不同行業生產經營周期有差異性,建議將時間窗長度設置為一年,以充分遍歷用戶正常的各種生產經營狀態。
采用針織制品制造、金屬制品制造、水泥制品制造和塑料制品制造業經稽查確認的40 個竊電用戶用電數據,各樣本為包含竊電時段在內一年每15 min 間隔的電流、電壓、瞬時功率和用電量計量數據,對所提方法進行測試分析。以某單相分流竊電的紡織用戶為例,說明篩選用電異常的流程和效果。圖2 為該用戶2019 年日用電量曲線。由圖2 可知:①用電負荷具有明確的周期性和平穩性,周末負荷明顯低于工作日;②2019 年2 月上旬為春節長假,用戶處于完全停產狀態,春節長假前后用電負荷隨人員返鄉和返程而逐漸跌落和恢復;③2019 年8 月中下旬,用電量明顯下降,經稽查確認為電流互感器B 相 分 流 竊 電,2019 年8 月9 日 至9 月2 日 的B 相 計量負荷約為實際負荷的20%;④五一長假的第1 日和十一長假的前4 日,用戶接近停產,清明期間用電負荷也有明顯下降。

圖2 電量異常用戶負荷曲線Fig.2 Load curve of abnormal electricity user
采用何種聚類算法對聚類識別用戶的生產經營狀態有重要影響,需要比較不同算法的識別效果。作為最常用的密度聚類算法,采用基于密度的帶噪聲數據應用的空間聚類(DBSCAN)算法來首先計算各樣本間的相互距離,然后設置鄰域半徑和鄰域樣本數閾值Nmin[25]。某個樣本鄰域中樣本數少于Nmin時,認定為離群點;達到和超過Nmin時,認定為一個類簇,且該樣本為核心點;當核心點鄰域半徑內的其他樣本點也是核心點時,該2 個類簇可合并為一個類簇。通過核心點的融合,DBSCAN 算法可進行凸樣本集和非凸樣本集的聚類分析。以下采用同樣無須預設類簇數的DBSCAN 算法和AP 聚類算法,進行疑似竊電用戶的負荷特征聚類對比分析。
為確認圖2 中紅色虛線區域低電量異常是否為竊電,采用前8 個月每天15 min 間隔的有功功率計算負荷特征,243 d 的負荷數據集可表示為X={xn},n=1,2,…,243,其中xn=[xa,xb,xc],為用戶用電數據的向量表征形式,xa,xb,xc分別為A相、B 相、C 相每15 min 間隔的有功功率計量數據,xa=[xa1,xa2,…,xa96],xb=[xb1,xb2,…,xb96],xc=[xc1,xc2,…,xc96]。
采用DBSCAN 算法進行聚類分析時,考慮到工程應用中一般將用電量下降持續時間超過3 d 的視為用電異常,本文將Nmin設置為4。鄰域半徑以0.001 為步長,從0.001 逐漸增大到0.1,進行了100 種參數設置下的測試計算。鄰域半徑為0.001時,因半徑太小,未形成任何類簇,所有樣本均為離群點;鄰域半徑增大到0.006 時,形成的類簇數量達到最大值14,但此時仍有一定數量離群點。此后,類簇數量逐漸減小,當鄰域半徑大于0.09 時,類簇數量減少到1 并不再變化。綜上,DBSCAN 算法的參數設置對聚類結果有突出影響,需逐個對用戶調參分析選優,不利于工程應用。
采用AP 聚類算法的算法參數設置如2.3 節所述。AP 聚類將竊電時段及之前8 個月的數據聚為6 簇,各類簇日期構成、對應生產經營狀態及類簇中心如附錄B 表B2 所示。為方便比對說明,AP 聚類識別出的各類簇中心的日負荷曲線及三相功率散點云圖如圖3 和圖4 所示。結合圖3、圖4、表B2,分析說明如下。
1)類簇1 標識春節、五一等長假生產經營狀態,此時工人休假、機器停工,僅有照明等基礎用電,三相功率散點集中分布于右下角零功率和底部功率較低位置。
2)類簇2 標識正常工作日生產經營狀態。紡織廠為倒班生產模式,設備不停機運行,負荷全天分布較均勻,晝間略大于夜間;因全天負荷均較大,所有功率散點遠離零功率的右下角和功率較低的底部,在散點圖中上部沿對角線分散分布。
3)類簇3 標識春節前后工人陸續返鄉/返工時段,因開工不足僅部分設備在白天投產、夜間休息,負荷略小于正常工作日;三相功率散點分為2 個部分,白天的計量數據與類簇2 類似,在散點圖中上部沿對角線分散分布,而夜間則集中在零功率的右下角。
4)類簇4 標識正常周休日和清明節,該紡織廠周休日設置在星期五,晝夜負荷水平均明顯小于類簇2 標識的正常工作日,三相功率散點靠下部分布。
5)類簇5 和類簇6 分別標識竊電時段的正常工作日和周休日,由于B 相分流近80%,類簇中心日的日負荷明顯低于其他兩相,兩者在散點云圖上都明顯偏離對角線,在圖右側靠近B 相低功率區域分布。類簇6 白天輕載,在散點圖零功率的右下角緊密聚集。因此,用電量下降時段分別形成2 個與之前有差異的新類簇。
由于低電量異常時段與之前的負荷特征聚類形成不同類簇,可將其識別為竊電。在之后的國慶長假,用戶用電量再次持續跌落(如圖2 中綠色虛線區域所示),以下將該時段與之前的負荷特征進行聚類分析。

圖3 聚類中心日用電量曲線Fig.3 Curves of daily power consumption for clustering center

圖4 聚類中心三相功率散點圖Fig.4 Scatter diagrams of three-phase power of clustering center
2019 年國慶7 d 的負荷曲線如圖5 所示,長假前4 日處于停產狀態,第5 日開始恢復正常。前4 日和后3 日的負荷曲線分別與類簇中心1 和2 高度相似。為方便比較,將長假前4 日和后3 日的負荷特征以不同顏色繪制,如圖6 所示。由圖6 可見,前4 日的負荷特征與類簇1 相似地集中于零功率的右下角和低功率的底部;后3 日恢復生產,負荷特征與類簇2 的分布形態相似。將國慶期間與歷史數據的負荷特征按相同設置進行AP 聚類,未產生新類簇,可確認為正常的狀態切換,排除竊電嫌疑。

圖5 國慶長假用電量曲線Fig.5 Electricity consumption curves during National Day holiday of China

圖6 國慶長假分段三相功率散點圖Fig.6 Scatter diagrams of segmented three-phase power during National Day holiday of China
按照前述相同參數設置和測試流程,對所有40 個竊電用戶進行測試分析,各用戶具體竊電手法描述、包含和不包含竊電時段負荷特征的聚類類簇數列如附錄B 表B3 所示。由表B3 可得如下結論。
1)同一行業用戶的用電行為模式仍存在較大差異,正常用電時段聚類形成的類簇數量差異明顯。
2)聚類數據包含竊電時段負荷數據時,形成的類簇數在絕大多數場景下多于正常數據聚類的類簇數,所提方法可準確識別所述行業用戶竊電造成的用電模式差異,從而降低竊電檢測誤報率。
3)18 和35 號竊電用戶三相等比例竊電和繞表用電,等比例竊電時僅改變負荷特征的幅值而不影響三相平衡,更容易和其他的正常生產經營狀態的負荷特征混淆;在偷逃全部電量時也會與節假日停產的零用電狀態重疊,因而判斷出錯。
4)22,36 和38 號用戶長時間持續竊電,出現低電量異常前已經記錄了竊電時的負荷特征,低電量異常時段負荷特征會和之前竊電產生的負荷特征聚為一類,也會造成判斷出錯。
綜上,本文所提方法可有效確認絕大多數竊電造成的低電量異常,但可能在三相等比例竊電、繞表用電和長時間持續竊電時,將竊電用戶誤認為正常,造成漏報。需要指出的是,供電企業在竊電檢測的誤報和漏報上存在差異性偏好。因為用戶基數龐大,總有相當數量的竊電用戶,因此可以容忍一定程度的竊電檢測漏報。與之相反,為避免打草驚蛇、提高檢測命中率,供電企業在有限人力資源約束下,對竊電檢測誤報率要求更高,一般都會采用不同方法多方確認為高危用戶后才登門稽查。本文所提方法可有效降低根據低電量異常檢測竊電的誤報率,有助于提高稽查命中率。
針對以電量異常為導向的竊電檢測方法容易受電量波動影響造成誤報的問題,提出了基于負荷特征的低誤報率竊電檢測二次篩查方法,對選出的低電量異常用戶進行生產經營狀態識別,以篩除用戶狀態正常轉換造成的誤報,開展了以下工作。
1)分析指出了以電量異常為導向的竊電檢測方法在機理上存在難以確定是竊電還是低電量生產經營狀態造成的異常、容易誤報的缺陷。
2)構建了基于用戶一天三相功率數據的負荷特征,可利用負荷特征標識用戶當天的用電模式和生產經營狀態。
3)提出了基于負荷特征聚類的用電異常二次篩除方法。可在識別出的低電量異常用戶的基礎上,對低電量異常時段和之前的負荷特征進行AP 聚類。如低電量時段負荷特征與之前正常的低電量生產經營狀態的負荷特征聚為同類,則可排除竊電嫌疑,從而降低竊電檢測誤報率。
4)應用4 個行業40 個竊電用戶的計量數據進行了測試驗證,測試結果表明所提方法在絕大部分案例中能準確識別竊電用戶,驗證了所提方法的有效性。
本文所提方法的缺陷是可能將部分三相等比例竊電、繞表用電和長期竊電用戶誤判為正常,導致漏報。實際上,每種竊電檢測方法都有一定的前提假設和對應的適用范圍,很難用一種檢測方法應對所有的竊電。下一步還要分析各種竊電手法在不同方面的表征,針對性地研究不同機理的竊電檢測方法,并充分認識每種檢測方法的局限性,才能多管齊下地實現準確可靠地檢出竊電用戶。
附錄見本刊網絡版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網絡全文。