




摘 要:為了優化用電異常核算效果,提高用電異常檢出率,借助物聯網與數據挖掘技術,提出了一種用電異常精細化核算算法。首先,利用物聯網技術,采集用戶用電數據,并對采集到的用電數據進行標準化轉換處理;然后,提取用戶用電數據特征,計算特征向量的重要性指數并排序;最后,利用數據挖掘算法中的孤立森林算法,劃分多尺度特征節點數據空間,使用iTree深度計算用電數據異常分值,實現用電異常核算。實驗結果表明,在應用該算法后,用電異常的檢出率顯著提升,最高可達98%。
關鍵詞:物聯網;數據挖掘;電量數據;異常檢測;精細化核算;孤立森林
中圖分類號:TP39;TN082 文獻標識碼:A 文章編號:2095-1302(2025)01-00-03
0 引 言
用電異常核算指對電力用戶的用電數據進行實時監控和分析,旨在及時發現異常用電情況,進而有針對性地對其作出處理[1],從而有效減少能源浪費、提高電力使用效率、保障電力系統的安全穩定運行[2-3]。如何對用電異常進行精細化核算,成為了當前電力行業亟待解決的問題。傳統的用電異常核算方法主要依賴于人工巡檢和統計分析,不僅效率低下,而且難以發現潛在的用電異常。
物聯網和數據挖掘技術的發展,為用電異常精細化核算提供了新的解決方案。通過這兩種技術的結合,可以實現對用戶用電數據的全面分析和利用,從而為用電異常精細化核算提供有用的信息和支持?;诖?,本文提出了基于物聯網和數據挖掘技術的用電異常精細化核算算法。
1 基于物聯網的用戶用電數據采集
物聯網技術在用戶用電數據采集領域的應用,可以使得數據采集更加智能、高效和準確。通過物聯網傳感器可以實時采集用戶用電設備的數據,并將其傳輸至數據中心,使電力公司可以及時了解用戶的用電情況,進行實時監測和分析。物聯網技術支持大規模的傳感器部署,能夠覆蓋更多的用戶和設備,從而采集并分析更多的用電數據,為電力公司提供更全面的信息基礎。物聯網技術使得用電數據可以通過云平臺進行遠程訪問和控制,電力公司可以隨時隨地監控用戶用電情況,并根據需求進行優化調整,提供個性化的能源服務。
為了提高用電數據采集的效率與準確性,本文借助物聯網技術,對用戶用電數據進行采集。具體步驟如下:在電力用戶的用電設備上安裝物聯網傳感器[4-6];遠程采集中心發布采集任務,輪詢物聯網數據庫,獲取滿足條件的采集任務[7-8];分解采集任務,得出若干個子任務,通過消息總線,將子任務轉發給協議棧;協議棧對子任務進行解析后發送給集中器,組成相應的報文;物聯網傳感器根據報文采集相應的用電數據,并將采集結果發送給執行模塊。數據采集過程中,需要綜合考慮電壓波動的幅度、頻率等因素對設備運行可能造成的影響。最后,通過物聯網通信技術,將傳感器采集到的用電數據傳輸至數據采集中心。
2 用戶用電數據預處理
用戶用電數據采集完畢后,需要對數據進行標準化預處理,將用電數據轉換成統一尺度,便于不同特征之間的比較和分析。同時,提升用電數據的準確性與可靠性,為后續的用電異常精細化核算奠定良好的基礎。標準化預處理的具體計算公式見式(1):
" "(1)
式中:xi、xi' 分別表示標準化轉換前后的用電數據;max(xi)、min(xi)分別表示樣本中用電數據的最大值與最小值。通過式(1),能夠實現對不同量綱用電數據的運算與特征分析。將標準化處理后的用電數據存儲到數據庫中,以便后續進行數據挖掘與用電異常核算。
3 提取多尺度用電特征
用戶用電數據預處理完成后,接下來需要進行多尺度用電特征的提取。由于后續用電異常精細化核算是以用戶用電數據特征為基礎的,因此,所提取的用電特征越具有代表性,后續的核算結果便越精確?;诖?,本文開展了用戶多尺度用電特征提取的研究。
首先,依據上述預處理后的數據,提取出所有的用戶用電數據特征,見表1。
其次,對各指標作矢量量化,并求出其重要性指數,具體計算公式見式(2):
(2)
式中:Pi表示第i個用電特征向量的重要性指數;wi表示指標權重;Si表示第i個特征向量;m表示用電特征向量的數量。通過式(2)計算特征向量的重要性指數,并從大到小對特征向量進行排序。選取排名前5的特征向量,組合在一起形成新的特征集合[9-10]。分析提取用電數據特征,借助數據挖掘技術,研究用電數據的趨勢和周期性變化,以便發現異常值。
4 基于數據挖掘的用電異常精細化核算算法設計
多尺度用電特征提取完畢后,接下來需要利用數據挖掘技術,設計用電異常精細化核算算法。本文所提出的基于數據挖掘的用電異常精細化核算算法設計主要分為2個階段。
(1)利用數據挖掘中的孤立森林方法,構建用電樣本的分析架構。首先,設計t個iTree,將其進行組合以形成孤立森林。其次,從用電數據中隨機選取ψ個用電數據樣本點,組成待核算的子樣本集,共同置于孤立森林的樹根節點中。在當前樹根節點數據中,隨機設定一個用電異常核算維度,并圍繞該核算維度生成切割點p。以p點為中心,構造一個超平面。在該平面內,劃分節點數據空間,生成2個形狀、規格均相同的子空間。統計核算維度中大于和小于p的用電數據,放入2個子空間內。隨后,遞歸處理子節點,不斷分解出新的用電數據子節點,直至用電數據無法再進一步分解為止,完成孤立森林構建。
(2)計算被核算用電樣本的異常分值。在獲取t個iTree后,將先前提取到的多尺度用電特征分別輸入到iTree的各個節點中,對整個孤立森林進行迭代訓練。然后,用生成的迭代訓練結果,對用電測試數據進行全方位、多維度的評估。在此基礎上,將用電數據x均勻地分布在孤立森林中的每一棵iTree中,并根據用電數據的多尺度特征,確定數據在iTree中所處的深度,即數據最終落在iTree的第幾層。以iTree的深度作為判定用電數據異常程度的依據,深度越小,則用電數據異常分值越高。異常分值的具體計算公式為:
(3)
式中:h(x)表示被核算樣本在孤立森林中檢索到的節點深度;E[·]表示對t個iTree取均值;c(ψ)表示孤立森林平均路徑長度。通過式(3)計算用電數據異常分值s(x),根據經驗設定0.5為界限值。若s(x)≥0.5,則說明用電存在異常隱患;若s(x)lt;0.5,說明用電數據正常。s(x)越接近1,說明用電異常的可能性越高;s(x)越接近0,說明用電異常的可能性越低。
由此,構建基于數據挖掘的用電異常精細化核算算法,實現對用電異常行為的識別、分類和核算,為電力行業的運營、管理和決策提供科學依據和支持。
5 實驗分析
5.1 實驗準備
本實驗旨在驗證基于物聯網和數據挖掘技術的用電異常精細化核算算法的有效性和準確性。首先,進行實驗環境配置,使算法能夠穩定運行。實驗環境配置如下:服務器采用Intel Xeon 處理器,有著16 GB內存和1 TB SSD硬盤;操作系統選用Ubuntu 18.04 LTS;物聯網采集軟件使用MQTT Broker(如Eclipse Mosquitto);數據挖掘工具選擇Weka 3.8.5。其次,分別連接寬帶網絡與無線網絡,以保證數據傳輸速度和穩定性,方便移動設備訪問。本文所使用的資料是一家供電公司所提供的實際用電資料。數據集的時間范圍為一個月,采樣頻率為1次/min。該實驗數據集包含約1億條用電數據記錄,總大小約為12 GB,其中用電異常數據大小約為1 GB,均標有標簽。數據集內所有數據的格式均為CSV格式。根據時序對數據進行分類,并將其分為訓練樣本和測試樣本。
將本文提出的算法設置為實驗組,將文獻[1]中的方法設置為對照組1,將文獻[4]中的方法設置為對照組2。
5.2 核算結果分析
設定用電數據量分別為2 GB、4 GB、6 GB、8 GB、10 GB、12 GB,在用電數據量增加的情況下,測定應用3種算法后的用電異常檢出率,并作出對比,結果如圖1所示。
通過圖1的對比結果可知,本文算法表現出了良好的性能優勢;在用電數據量持續增加的情況下,本文算法用電異常檢出率始終高于另外2個對照組,最高達到了98%。這說明該算法能夠在數據集中有效地提取出異常用電行為的特征,并對其進行分類和識別,對用電異常行為的識別能力更強,能夠準確地核算出潛在的用電異常情況,從而有效預防和減少電力資源的浪費和損失。
6 結 語
本文提出了用電異常精細化核算算法,一方面通過物聯網技術,實時采集與監控電力用戶的用電情況,實現用電數據的全面監測和數據共享;另一方面通過數據挖掘技術,對采集到的用電數據進行進一步地分析和挖掘,為電力行業的運營和管理提供科學決策和支持。實驗結果表明,該算法可以有效地提高用電異常核算的準確性,降低電力行業的運營成本,推動電力行業的智能化發展,促進可持續發展。
參考文獻
[1] 武亞光,張才俊,程飛飛. 基于FP-growth算法的多尺度用電異常行為檢測方法[J]. 電子設計工程,2023,31(23):118-121.
[2] 鄭世英,牛清林,劉偉,等. 電力用戶異常用電的深度神經網絡檢測方法[J]. 電力需求側管理,2023,25(6):82-87.
[3] 錢旭盛,朱萌,翟千惠,等. 基于改進孤立森林算法的異常用電行為識別方法[J]. 沈陽工業大學學報,2023,45(6):601-606.
[4] 潘駿,夏祥武,李梁,等. 基于關聯潮流感知與高斯混合模型的異常用電檢測[J]. 電力建設,2023,44(11):138-148.
[5] 陳慧,陳適,郭銀婷,等. 基于正則自編碼器及Optuna尋優的異常用電數據清洗研究[J]. 電力需求側管理,2023,25(5):53-58.
[6] 閆相偉,宋國壯,劉怡豪. 基于改進Stacking集成分類算法的用戶用電信息異常識別[J]. 電子技術應用,2023,49 (8):13-18.
[7] 孟宋萍,彭偉,田晨璐. 基于門控循環單元的非均衡數據驅動異常用電檢測方法[J]. 計算機測量與控制,2023,31 (10):54-60.
[8] 吳澤黎,李清清,梁皓. 基于BiLSTM-CatBoost模型的電力用戶異常用電檢測[J]. 自動化與儀表,2023,38(5):22-27.
[9] 田健,杜暄,韓碩辰,等. 基于物聯網技術的低壓居民日均電量異常自動判斷系統設計[J]. 微型電腦應用,2023,39(5):123-128.
[10] 顧臻,莊葛巍,賀青,等. 基于LOF+SVM的異常用電用戶分階段識別方法[J]. 電氣傳動,2023,53(3):90-96.