




摘要:電網線損能耗監測是電力系統能效管理的重要環節,其直接影響電網的運行效率和能源消耗。在此背景下,應用Python、PySpark、HBase等組件進行數據處理,基于機器學習框架研發突變點檢測算法,并結合用戶檔案、行業用電規律、歷史竊電信息等,建立基于電力大數據的反竊電智能化監測模型。為了提升該模型的精準率,緊密結合業務實際,準確挖掘和定位疑似竊電行為數據,從而為竊電偵查和欠費追繳工作提供有力的依據和支撐。
關鍵詞:電力大數據;反竊電;電網線損;智能化監測
中圖分類號:TP391.4;TP183;TM73 文獻標識碼:A
0 引言
隨著全球氣候變化的日益嚴峻,我國提出了“碳達峰”“碳中和”目標(“雙碳”目標)。這一目標對電力行業,特別是對電網線損能耗監測提出了更高的要求。傳統的監測方法主要依賴于人工巡檢以及傳感器,存在效率低、成本高以及實時性差等問題,亟須更高效、準確的監測方法來滿足電力行業的需求。在此背景下,基于電力大數據進行智能化監測成為一種新的趨勢。
電力大數據是指在電力生產、傳輸、分配和消費過程中產生的海量數據,具有數據量大、類型多樣、可快速處理等特點[1]。通過研究基于電力大數據的反竊電智能化監測技術,實現了從大范圍摸索到精準定位核查用戶不規范用電行為的轉變,以及從滯后異常響應到提前分析預測的監督管理機制的升級。同時,這項技術還強化了用電市場管理,有效防范了竊電行為,優化了線損指標。
1 基于電力大數據的反竊電智能化監測系統架構設計
隨著電力系統復雜化的增加和竊電行為的隱蔽化,傳統的反竊電手段已難以滿足需求。在此背景下,基于電力大數據設計反竊電智能化監測系統顯得尤為重要。首先,應用Python、PySpark、HBase等組件將從電力系統各個終端和設備中獲取的海量數據進行歸一化和標準化處理,以確保數據的準確性和可比性。其次,基于機器學習框架研發突變點檢測算法,并充分利用電力大數據中的豐富信息(包括用戶檔案、行業用電規律、歷史竊電信息等),構建基于電力大數據的反竊電智能化監測模型,以精準識別異常的用電模式,從而鎖定潛在的竊電行為。最后,結合實際業務場景,對構建的模型進行測試,并根據業務反饋對模型進行優化和調整,持續提升模型的精準率,以期更準確地挖掘和定位疑似竊電行為數據,為電力營銷部門的竊電偵查工作以及欠費追繳行動提供依據和支撐,確保電力系統的安全、穩定和公平運行。
2 電力大數據處理
2.1 數據層架構
反竊電智能化監測技術使用的電力大數據主要來自反竊電監控平臺、營銷業務應用系統、采集運維閉環管理模塊、一體化線損平臺和設備資產精益管理系統(power production management system,PMS)。
反竊電智能化監測數據層架構如圖1所示。其中,檔案數據、線損數據、運行數據等被用于智能診斷模型以生成異常用戶工單;而舉報數據、追補電費數據、用電數據等被用于生成違竊工單。
2.2 數據接入
從用電信息采集系統中接入部分歷史數據,并將這些數據與營銷業務應用系統的數據進行集成,以此構建模型所需的大數據基礎。應用統計工具對這些數據進行特征提取,所提取的特征需要體現原數據某一方面的特征,以達到拓展數據維度的目的。反竊電智能化監測技術使用的電力大數據主要包括低壓數據和專變數據兩大類,其具體指標如表1所示。
2.3 數據預處理
數據預處理包括5個方面[2-6]:一是數據審核,主要從完整性和準確性兩個方面對原始數據進行審核;二是數據篩選,對審核過程中發現的不符合要求或有明顯錯誤的數據予以剔除,同時將符合某種特定條件的數據篩選出來;三是數據集成與清洗,包括格式標準化、異常數據清除、錯誤糾正以及重復數據清除等環節;四是數據歸約與轉換,利用數據歸約技術得到數據集的歸約表示,同時通過平滑聚集、數據概化、規范化等方式將原始數據轉換成適用于數據挖掘的形式;五是特征處理,包括采集樣本、樣本過濾、歸一化、離散化、缺省值處理、特征降維、特征選擇等過程,該步驟是特征工程的核心。
3 基于電力大數據的反竊電智能化監測模型
3.1 模型特征
結合具體業務流程,提取電力大數據中的有用信息,構建反竊電智能化監測模型,其特征主要分為低壓特征和高壓特征,具體指標如表2所示。
高壓特征 時間序列用電數據范圍閾值、季節性用電規律特征、尖峰平谷用電規律特征、地市對應行業用電特征標記、地市對應行業用電規律閾值、歷史同期用電規律閾值、行業同期用電規律閾值、行業增長規律閾值、增/減容季節性規律特征、用電突變時間點特征、異常事件發生次數特征、用戶換表頻率、用戶電量趨勢、用戶三相平衡度、用戶用電趨勢規律、用戶每月最大需量、用戶用電檢查工單、用戶功率因數相關性、用戶平均負載率波動率、用戶最大負載率波動率、地區所在同行業用電規律
3.2 模型訓練
根據營銷業務應用系統登記的歷史竊電數據,建立歷史竊電用戶黑名單和正常用戶白名單,然后按照一定比例抽取竊電用戶和正常用戶,組成混合樣本名單,將用戶用電量、臺區線損率、異常事件的特征序列以及該用戶竊電與否的標簽作為數據輸入,整合為原始訓練數據集。將原始訓練數據集劃分為訓練集、驗證集和測試集3個部分,采用不同算法對模型進行訓練,并使用測試集對模型進行性能檢驗,以達到不斷學習優化的目的。
3.3 模型評估
為了評估反竊電智能化監測模型的準確率,采用混淆矩陣進行驗證,如表3所示。
基于上述數據進行測試驗證,計算出該模型的準確率(accuracy,ACC)、精確率(positive predictive value,PPV)、靈敏度(true positive rate,TPR)、特異度(true negative rate,TNR),以評估模型有效性,并根據評估結果持續優化模型。具體計算公式如下:
4 模型核心算法及應用描述
4.1 模型核心算法
在模型構建上,采用了多種算法進行交叉驗證,包括時間序列階躍突變點檢測算法、電量突變檢測算法、隨機森林算法、線性時間精確剪枝算法、支持向量機(support vector machine,SVM)、線型回歸算法、邏輯回歸算法、聚類分析算法等[7]。本文僅對時間序列階躍突變點檢測算法和電量突變檢測算法這兩種核心算法的構建進行簡要描述。
4.1.1 時間序列階躍突變點檢測算法
時間序列階躍突變檢測算法是評估電表是否存在故障或被竊電的一個重要方法。因此,時間序列階躍突變點檢測模型的性能直接決定了自動檢測裝置的靈敏度和可靠性。針對時間序列階躍突變點檢測,現有的技術方法如下:①基于突變點檢測組合算法的電力系統故障數據匹配方法,主要結合貝葉斯分類模型和人工經驗規則,對量測負荷數據進行突變點檢測;②滑動規則過濾算法,對監控告警時間序列數據進行處理,以識別并定位其中的毛刺異常點。時間序列階躍突變點檢測技術架構如圖2所示。
首先對原始時間序列進行預處理,包括歸一化以及填充時間序列缺失值等。假設預處理后的時間序列為S,長度為N,以長度為2w+1的滑動窗口從左到右對S進行滑動切片,由此得到N-2w+2個長度為2w+1的時間序列切片;如果數字0表示第一個時間序列點,數字1表示第二個時間序列點,依次類推,N-1則代表第N個時間序列點。那么可以得到時間序列切片S1=[0,1,…,2w],S2=[1,2,…,2w+1],依次類推,SN-2w+2=[N-2w+1,N-2w,…,N+1]。其中,S1整體作為時間序列點w的時間序列上下文特征,S2整體作為時間序列點w+1的時間序列上下文特征,那么SN-2w+2則作為時間序列點N-w+1的時間序列上下文特征,將S1,S2,…,SN-2w+2依次通過訓練好的深度學習判別模型,分別得到時間序列點w,w+1,…,N-w+1對應的突變標簽序列[Lw,Lw+1,…,LN-w-1]。突變標簽定義為L∈{-1,0,1},其中,-1表示突增突變,0表示未發生突變,1表示突降突變。
4.1.2 電量突變檢測算法
電量突變檢測算法通過結合滑動點突變檢測算法和遞歸區間突變檢測算法兩種獨立突變檢測算法的結果,并取其交集,來確定最終的電量突變點,具體算法如下。
(1)滑動點突變檢測算法。計算候選突變點,對一個給定日期設置一個固定的滑動日期窗口N,假設給定日期前N天的電量均值為left_mean、電量方差為left_std,給定日期后N天的電量均值為right_mean、電量方差為right_std,則可以通過如下公式計算得到平均值與標準差的比率(mean_std_ratio)和平均值之差與其中一個條件下平均值的比率(mean_diff_ratio):
mean_std_ratio= , (5)
mean_diff_ratio= 。" (6)
如果同時滿足mean_std_ratio>1.5且mean_diff_ratio>0.3,則該給定日期被視為候選突變點。按照此方式,遍歷所有日期,可以得到候選突變點列表。選擇具有最大mean_std_ratio值的候選突變點,將其作為最終的突變點。
(2)遞歸區間突變檢測算法。如果在一個指定日期區間存在突變點,那么以該突變點作為劃分點,將日期區間劃分為兩個子區間,則突變日期前子區間的電量方差和突變日期后子區間的電量方差之和會顯著小于整個區間的總方差。以相同的方式分別查找兩個子區間的突變點,不斷遞歸操作,得到最終的突變點列表。
4.2 應用描述
基于上文構建的多種模型以及自研智能算法,可以針對營銷、運維、稽查等不同業務場景(部門)電流和電壓異常的情況,通過動態閾值調整、模式匹配及多維特征關聯分析,定制化輸出差異化的異常檢測方案,挖掘和定位疑似竊電行為的數據,從而為竊電偵查和欠費追繳工作提供有力的依據和支撐。本文對以下幾種典型的應用模型及場景識別結果進行總結。
4.2.1 負荷波動檢測模型/專變用電負載失衡檢測模型/失流欠流模型
采用滑動點突變檢測算法和電量突變檢測算法,取二者檢測結果的交集來確定最終的電量突變點。同時,針對高壓用戶,特別是三相三線和三相四線系統中部分三相平衡的用戶,若發現其電流曲線存在三相不平衡且不平衡度超過閾值(30%)的情況,則判斷其存在竊電嫌疑。主要有以下3類情況。
(1)三相三線單相失流/欠流。①該相電流與正常負荷相電流大小存在等比例關系,且該用戶非政府、企事業單位,其合同容量在200 kVA及以上,未進行無功補償(無負電流現象)。當處于這種狀態時,現場往往會出現以下情形:二次側短接連接片、U型環短接或互感器端短接,說明可能存在分流竊電嫌疑,但也可能是由于電流導線接觸不良、互感器變比故障導致的計量故障。②某相負荷表現正常,個別相在小負荷時存在負電流,則表明該用戶配備了電容補償裝置,屬于正常現象。③用戶的合同容量在200 kVA及以下或該用戶屬于政府、企事業單位,其用電類別為非工業類用電,則此用戶的用電負荷處于正常水平。
(2)三相三線兩相失流/欠流。①在用戶所在行業、區域負荷皆正常的情況下,且用戶未辦理減容、停運等業務,若觀察到其所在線路線損向上波動,且這種波動的時間節點與用戶用電情況存在相關性,則可以判斷此部分用戶存在兩相短接或分流竊電嫌疑。②用戶辦理減容、停運等業務后,負荷急劇減小則為正常現象。
(3)三相四線(單相/多相)失流/欠流。①該相電流數據與歷史數據曲線不一致,若出現單相或兩相電流負荷驟降,而其余相電流負荷增大的情況,則說明存在負荷切換現象,這在某些情況下是正常的。②該相電流數據與歷史數據曲線不一致,若出現單相或兩相電流負荷驟降,而其余相電流負荷與日常一致,則說明存在負荷異常現象,可以判斷存在分流竊電或電表計量(簡稱“表計”)故障現象。③某相負荷正常,個別相在小負荷時存在負電流,表明該用戶配備了電容補償裝置,此現象屬于正常現象。
4.2.2 二次壓降異常模型/專變二次壓降突變檢測模型/失壓欠壓模型
以滑動點突變檢測算法和聚類分析算法為基礎,同時結合行業特性和失壓/欠壓竊電的常見手法,對數據特征提取和識別模型進行相應的設計。針對高壓用戶,分別檢查其三相電壓并與額定電壓做對比,如果三相電壓≤70%額定電壓,且存在持續失壓或欠壓的特征,可以判定該用戶存在失壓/欠壓竊電嫌疑。主要有以下5類情況。
(1)三相三線單相/兩相欠壓可能出現以下現象:一次側跌落保護裝置故障、互感器接觸不良、二次側回路連接片或進表接線接觸不良。數據顯示,存在單相或兩相電壓低于額定電壓(可設置閾值)的情況。部分異常情況可能是采集誤判所致,可根據近期電壓曲線進行二次篩選,以識別并處理表計故障。
(2)三相三線單相/兩相失壓可能出現以下現象:一次側跌落保護裝置開路、互感器端接線開路、二次側回路連接片開路、進表接線虛接或夾皮。數據顯示,存在單相或兩相電壓等于0 V的情況。部分異常情況由采集誤判所致,可根據近期電壓曲線進行二次篩選。由于失壓責任劃分問題較為復雜,難以判斷為竊電,若存在接線異常抽出或鉛封破壞現象,則可能存在表計故障。
(3)三相四線單相/多相欠壓可能出現以下現象:一次側跌落保護裝置故障、互感器接觸不良、二次側回路連接片或進表接線接觸不良。數據顯示,存在單相或多相電壓低于額定電壓(可設置閾值)的情況,部分異常情況由采集誤判所致,可根據近期電壓曲線進行二次篩選,以識別并處理可能存在的表計故障。
(4)三相四線單相/多相失壓可能出現以下現象:一次側跌落保護裝置開路、互感器端接線開路、二次側回路連接片開路、進表接線虛接或夾皮。數據顯示,存在單相或多相電壓等于0 V的情況。部分異常情況由采集誤判所致,可根據近期電壓曲線進行二次篩選。因失壓責任劃分問題較為復雜,難以判斷為竊電,若存在接線異常抽出或鉛封破壞現象,則可能為表計故障。
(5)三相三線/三相四線失壓/欠壓:當對應相存在負荷時,可能存在電費少計量的情況。這種現象通常表現為一次側跌落保護裝置故障、互感器接觸不良、二次側回路連接片或進表接線接觸不良。數據上表現為單相/多相存在失壓/欠壓情況,并且對應的失壓/欠壓相存在電流,且電流大小與正常用電時期的負荷相同。對于這部分用戶,可通過分析其近期用電負荷來判斷其是否仍處于異常狀態,從而確定是否存在表計故障。
5 結語
在經濟效益層面,應用反竊電智能化監測技術能夠有效避免因違約用電、竊電行為給電力企業帶來的直接經濟損失,進而提高供電企業的盈利能力,同時還能降低供電企業運維成本,提高管理效率,大幅縮減定位嫌疑用戶所需的數據分析工作量,并實現遠程監控和自動報警功能,從而全面保障企業的合法權益。通過建立反竊電智能化監測模型,國家電網公司逐步加強了反竊電工作,并為這一領域提供了新的拓展方向,有效保障了供用電雙方的經濟利益。
在社會效益層面,通過反竊電智能化監測技術,可以降低線損率,提高能源利用率,有助于我國實現節能減排的目標,同時還能推動大數據、人工智能技術在電力行業的應用,進而培育一批懂業務、懂技術的大數據分析應用人才,有效提升竊電查處的準確性與及時性,從而建立安全有序的用電環境,營造誠信用電氛圍[8]。
綜上,基于電力大數據的反竊電智能化監測技術研究具有重要的經濟和社會效益,大力發展此項技術有助于推動我國電力行業持續健康發展。
參考文獻
[1] 王紅,孫志翔. 基于電力大數據分析的接電成本預測模型[J]. 電力需求側管理,2023,25(5):104-109.
[2] 林卓,張福山,陳樂. 融合大語言模型的國防科技情報智能感知系統構建及應用研究[J]. 情報理論與實踐,2024,47(4):35-41.
[3] 紀鑫,武同心,楊智偉,等. 基于時序知識圖譜的電力設備缺陷預測[J]. 北京航空航天大學學報,2024,50(10):3131-3138.
[4] 李小聰. 基于機器學習的數據預處理框架研究[J]. 中國信息化,2023(7):67-68.
[5] 唐成龍,諶頏,唐海春,等. 大數據背景下數據預處理方法研究運用[J]. 信息記錄材料,2021,22(9):199-200.
[6] 劉欣宇. 基于自適應相似性的無監督多視圖特征選擇[D]. 太原:太原理工大學,2021.
[7] 王浩,馬迅,劉安磊,等. 機器學習算法在反竊電分析中的應用[J]. 河北電力技術,2020,39(1):38-41.
[8] 馮桂玲,丁忠安,楊悅,等. 大數據分析助力反竊電工作有效提升[J]. 電力系統裝備,2021(17):114-115.