邱衍江,張 超,張新燕,張錫泉,常喜強
(1.廣東電網有限責任公司江門供電局,廣東 江門 529030;2.廣東電網有限責任公司廣州供電局,廣州 510620;3.新疆大學電氣工程學院,烏魯木齊 830047;4.新疆電力公司電力調度控制中心,烏魯木齊 830002)
近年來,隨著我國電網企業的數字化、智能化建設不斷推進,輸電、變電、配電及營銷等領域開發并使用了多套業務系統,如數據采集與監控系統、營銷管理系統、用電信息采集系統、生產管理系統及電網地理信息系統等。在這些系統的使用過程中會產生并存儲海量的電網運行數據。
為了順應電網轉型和數字化建設融合發展趨勢,盤活電網的數據資產并挖掘電網大數據的價值將成為電網企業未來重點關注方向,電網大數據的分析已成為研究熱點。文獻[1-2]建立大數據運算平臺,通過分析線損大數據得到竊電預警信號;文獻[3-5]從優化線損分析方法的角度出發,提出線損計算的最優算法。文獻[6-8]利用大數據分析技術對線損特征進行研究,并根據線損特征建立線損管理平臺。同時,線損定位技術與線損管理方法的優化也是研究熱點[9-10]。當前,關于線損大數據的研究僅停留在線損運算及其數據的使用,而針對其本質的價值挖掘與線損治理的有機統一等方面仍缺乏關注。本文以配電網運行中產生的海量數據為基礎,在Tableau環境下建立線損大數據價值挖掘模型,對配電網線損大數據蘊藏的信息進行深度剖析,查找影響線損率的主要因素,提出具有針對性的線損管理措施,以提升配電網線損管理水平。
用電信息采集系統是線損大數據的數據源,主要由計量終端、通信網絡、工作主站等組成(如圖1所示),具有用電檢測、負荷管理、線損分析、電能質量分析及自動抄表等功能。

圖1 用電信息采集系統結構示意圖
用電信息采集系統中,配電計量終端、負控裝置、終端用戶電能表等計量表計對供電量、售電量、線路負載、三相電壓與電流等配電臺區常規數據進行采集,通過接口數據傳輸通道(TCP/IP規程)將其傳送至計量主站或其他工作主站,以供數據調用、計算分析與監控等。而配電網線損大數據主要取自計量系統的線損管理、電能質量分析2個數據庫,通過進一步整合,將其存儲于數據倉庫中備用。
根據線損大數據價值挖掘需求,本文建立含數據處理、Tableau可視化與價值挖掘3個環節的線損大數據價值挖掘模型,具體流程如圖2所示。

圖2 線損大數據價值挖掘流程
線損率ΔP是供電企業的重要經濟技術指標,不僅可以反映某個時間段內供電單位的經濟性,還可以間接反映供電單位的線損管理技術條件和管理水平,其數學表達式為:

式中:Psupply—供電量;
Psale—售電量;
P′—損耗電量。
在供電量一定時,ΔP越高,P′越大,說明該線路或臺區線損管理水平越差。因此選用ΔP作為線損大數據價值挖掘的影響因子。0<ΔP≤8%為正常范圍,8%<ΔP≤20%為不合格范圍。
計量終端在采集數據時可能會存在一定問題,如數據采集重復、錯漏等。為了避免數據冗雜,在保證不減少數據所包含信息的前提下,將數據中每月售電量大于供電量、有供電量但無售電量、數據格式亂碼等明顯異常的數據進行篩查。其次,將ΔP<0或ΔP>20%的極端數據剔除,以提高入庫數據的質量。
大數據可視化是將每一數據項作為圖元元素,將海量集中的數據集以圖形形式表示,數據各屬性值以多維數據形式表示。大數據價值挖掘是指利用數據分析和開發工具對大數據可視化圖形進行分析,挖掘大數據蘊藏的未知信息及潛在價值的處理過程。根據挖掘任務可將大數據挖掘技術分為聚類分析、預測模型挖掘、趨勢發現、離群點檢測及曲線擬合等。
本文基于Tableau軟件建立線損大數據可視化模型,將線損大數據篩選出庫進行計算與可視化。利用K均值聚類算法將線損離散數據進行特征挖掘分析,提取數據蘊藏的規律,再利用曲線擬合算法將其擬合為連續函數或離散方程,找出線損率與其他因素的相關性。
線損率數據集由n個數據點組成,且每個數據點均具有m個維度的屬性。在價值挖掘前,選取k個代表點P1、P2、P3、…、Pk,建立k個聚類中心C1、C2、C3、…、Ck(1<k≤n)。按照最小距離法則對空間聚類表樣本值到聚類中心的距離逐個進行計算,表達式為:

式中:Xi—第i個聚類樣本值;
Cj—第j個聚類中心;
Xit—第i個聚類樣本值的第t種屬性;Cjt—第j個聚類中心的第t種屬性。
將樣本值劃分至離相應聚類中心最近的類簇中,再進行新聚類中心的計算,直到計算收斂[11]。計算公式為:

式中:Cl—第l個聚類中心,1≤l≤k;
Sl—第l個類簇的樣本值個數;
Xi—第l個類簇中第i個樣本值,1≤Xi≤Sl。
在計量系統中提取2019年11月至2020年3月某供電局7個縣區局(A、B、C、D、E、F、G)的10 kV配電網線損大數據,包括供電單位名稱、配電線路信息、臺區信息、供電量與售電量、損失電量、線損率、負載率、三相參數等。為了對比各局在5個月內損耗電量與線損率的變化情況,在Tableau中建立損耗電量與線損率對比圖(如圖3所示)。由圖3可知,5個月內各局損耗電量總體變化不大,其中C局在各個月中損耗電量均最大;線損率平均值由大到小依次為C、F、A、G、E、D、B局。結合損耗電量與線損率分析,F與E局線損管理水平最差。A局從2020年開始線損率大幅下降,說明其線損管理成效較好。

圖3 損耗電量與線損率對比
為了詳細分析各局的線損管理情況,利用K均值聚類算法將線損數據進行特征分析后在Tableau建立各局供電量與線損率散點圖,進一步根據散點分布規律擬合線損率趨勢線(如圖4所示)。圖4中,線損率趨勢線代表供電量與線損率的發展趨勢,對應線損的管理水平,趨勢線衰減越快反映線損管理越差,反之則線損管理越好。E、F、G、D局的趨勢線為減函數,說明其線損管理水平較低;C、A、B局趨勢線為增函數,說明其線損管理水平較高。

圖4 各局供電量與線損率散點及趨勢線
取線損管理水平較差的E、F、G、D局大數據進行深入分析,確定線損率過大或線損率不合格(ΔP≥8%)的臺區分布,結果如圖5所示。圖5中,F局不合格臺區分布在12個供電所轄區內,涉及范圍最廣。其次是E、G局,而D局線損率不合格臺區涉及供電所數量最少。D3、E8、F3及G9供電所線損問題最突出。

圖5 線損率不合格臺區分布
對線損問題較嚴重的區域進行原因分析、重點治理。對E、F、G、D局線損率不合格臺區(ΔP≥8%)的三相電流電壓數據、變壓器負載、配電網線路參數及供電長度等數據進行K均值線損聚類分群計算,查找線損率不合格的主要影響因素,結果如圖6所示。

圖6 線損率不合格影響因素占比
由于地理位置分布差異,線損率不合格的因素也不盡相同。配電網參數三相不平衡是E與F局線損率不合格的主要原因,分別占38.89%、43.24%;供電范圍、供電結構不合理是G局線損率過高的主要原因,同時也是E局線損率過高的重要原因之一。而D局線損率過高主要由配電臺區負載率問題引起,占比超過了50%。
根據配電網線損大數據價值挖掘與分析結果,提出以下管理方案。
(1)配電網供電范圍及結構不合理性的情況主要有臺區配電網絡中供電半徑過大、線路交叉分布、供電裝置超負荷運行等。E、F、G局此類問題較突出,可以對供電范圍內用戶的用電信息進行全面統計后更換變壓器裝置。其次,對交叉架設的線路進行絕緣改造,避免線路感應引起損耗。在臺區新建時,合理進行臺區布點,縮減配電、供電范圍,實現智能臺區線損治理。
(2)臺區設備落后、變壓器不合理運行等問題都可能引起配電網三相參數不平衡,導致計量表用電數據采集不準確。對于三相參數不平衡問題較突出的E、F局,可通過SCADA系統監測配電線路三相電壓、電流等數據,分析引起三相參數不平衡的原因,不定期進行負荷檢測,根據負荷電氣量調整配電線路的用電負荷。
(3)正常情況下,變壓器負載率在50%左右時變壓器損耗率最低;輕載時變壓器損耗率增加明顯;重載時損耗率也會增加。由圖6可知,各局由于負載率問題導致線損率不合格的占比較大,在新增臺區配電變壓器時,在設計階段充分考慮供電半徑及用戶負載大小,平衡分配。
(4)配電臺區集中器有失壓、斷流、接線錯誤及計量表故障等都可能使線損率不合格。用戶竊電行為也是導致線損率較高的重要原因之一。對此,應加強配電線路和計量表計的運維,對疑似故障或存在隱患的表計及時校驗和更換。核對營銷系統、用電信息采集系統相關數據,確保用戶用電信息采集無誤,電流互感器變流比與現場一致,避免系統漏抄、錯抄計量表計的情況。另外,還要加強宣傳依法用電相關知識,結合智能營銷平臺推進反竊電工作,扼制違法用電行為。
將線損大數據價值挖掘模型推廣應用,不僅便于供電企業掌握線損管理水平,而且可以實現科學降損,減少損失電量帶來的經濟損失。下一階段,考慮對線損大數據價值挖掘模型進行優化,并嵌入供電企業的生產管理系統,建設基于大數據價值挖掘的線損管理平臺,實現供電企業的線損精細化管理。