馬曉琴,薛峪峰,楊 媛
(1.國網青海省電力公司信息通信公司,青海西寧 810008;2.國網青海省電力公司海東供電公司,青海海東 810600)
線損率是指線損與供電功率之比,其是反映電網規劃設計和運行管理水平的一個重要經濟指標,直接影響著配電系統的日常維護工作。線損率的預測受設備異常采集、負載轉移、雙用戶供電切換等多種因素的影響,使得少數統計結果與實際數據不符。對線損率預測結果與實測結果進行對比,可以有效地檢驗配電網的數據量測與網絡拓撲的聯系是否正確、可靠。以往提出的基于最小二乘支持向量機的預測方法,利用離散粒子群優化算法,從配電網絡的運行數據中查找含有大量運行狀況的樣本,并建立了一個專家樣本庫。利用最小二乘算法,構建線損率預測模型[1]。提出的基于深度學習的線損率預測方法,在綜合考慮主、客觀兩個方面的因素的基礎上,計算配電網線路參數權重,采用加權方法,構建預測模型,將各種配電網線路參數輸入該模型中,并對其分析,獲取預測結果[2]。由于預測過程中出現了時序數據缺失問題,上述兩種預測方法難以用于動態線損預測情況,為此,提出了考慮時序數據缺失的配電網線損率動態預測方法。
文中提出了一種新的基于改進KNN 的缺失時序數據補全方法,對數據丟失的問題進行了處理,圖1 顯示了該過程。

圖1 基于改進KNN的缺失時序數據補全流程設計
由圖1 可知,設計的詳細補全步驟如下所示:
步驟1 弗雷歇距離計算:假設XC集合由x集合和x* 集合組成,其中,x集合是由n維空間的(a1(x),a2(x),…,an(x))特征向量組成的,x*集合是由時序數據缺失樣本組成的[3-4]。計算x*在XC集合中與x的弗雷歇距離,該距離是一種解決空間路徑相似度的方法,能夠精準判別曲線相似度,其原理如圖2所示。

圖2 弗雷歇距離計算示意圖
圖2 中的曲線a代表x集合,曲線b代表x*集合,兩個集合的弗雷歇距離計算公式為:
式中,d表示度量函數;t為時序變量;α、β表示作用于兩個曲線的重參數化函數[5-6]。
在計算結果中只考慮x*集合中沒有坐標的數值,根據該數值確定x*集合中的k個最近鄰,進而插補缺失坐標值[7]。
步驟2 基于改進KNN 的嵌入式特征選擇:對輸入時序特征變量和歷史數據進行相關性分析,通過后向搜索方法獲取最優特征集合。對每個特征變量及預期變量進行分析,在第一個分析過程中,所有的特征參數都被用作函數候選集[8-9]。在每次分析過程中,將最少的相關變量剔除,直到達到臨界點為止[10]。其中,具有最大負載預測準確率的特征集合被確定為最后的優先特征集。
步驟3 基于改進KNN 的數據補全:通過時序集合,使用改進KNN 進行有監督學習,基于此,構建一種新的門控循環模型[11],包括更新門和重置門,其中更新門負責控制前一時序的狀態信息保留程度,重置門負責確定是否結合當前信息[12]。不斷重復學習過程,使原始時序數據通過學習后獲取一種包含缺失數據的序列,能夠更好地學習到x集合和x*集合的時序關系。
利用馬爾可夫模型進行預測,并進行相關誤差的估算。通過對狀態區間的分割,求得狀態轉換概率矩陣,通過修正理論損失率的預測誤差,使得計算結果與實際情況更加吻合[13]。詳細步驟為:
步驟1 數據預處理:首先,通過對采樣數據的預處理,將其轉化為[-1,1]區間內。
步驟2 馬爾可夫預測模型的建立:馬爾可夫結構層在輸入層、隱層和輸出層中加入了承接層,其特征類似于BP 等前向網絡,能夠實現反饋式連接[14]。隱層的結點數目和承接層的節點數目一一對應,由于承接層具有反饋與記憶的作用,使得馬爾可夫模型具有更高的靈敏度和較強的動態信息處理能力,以實現動態模型構建的目標。
馬爾可夫預測模型是一種基于概率隨機預測的模型[15],根據預測值的大小,將其劃分為下列類型m狀態,然后根據相應的區間將數據放置到模型中,得到的考慮時序數據缺失的第n步狀態轉移概率矩陣f(m)為:
根據式(2)可確定狀態轉移概率矩陣,并求出最佳的數據區間。
步驟3 預測結果:采用優化的最優網絡模型,對線損率進行了預測,并將其回歸到實際區間,從而得出了其理論線損率的預報結果。
步驟4 判斷線損率波動趨勢:若想判斷線損率的變化趨勢,必須對影響線損率變動的各種因素進行分析,其中包括售電量結構影響因子、專線管理水平影響因子及公用線管理水平影響因子。
①售電量結構影響因子:售電量是指由供電公司銷售的電量,其中包括直接銷售給客戶的電能和銷售到其他電力公司的電能,以及用于非電力生產的電能。
②專線管理水平影響因子:高壓配電網被供給到特殊的變壓器,而低壓配電網則是通過特殊的變壓器來輸出。隨著電力消耗的增加,專用線路的損失也隨之增加。
③公用線管理水平影響因子:公用線路是接地或母線和零線,在電力系統中,電力損耗的完整性直接關系到電力系統的運行效率[16]。
步驟5 基于動態潮流的線損率計算:按照配電網實際運行情況,計算售電量結構影響因子、專線管理水平影響因子、公用線管理水平影響因子影響下的損耗,公式為:
式中,λz表示售電量所占比重;pz表示專線線損率;pg表示公用線線損率。為了更精準反映各個因子隨時間變化情況,經過累加得到的動態潮流線損率為:
式中,W表示供電量。
線損率是指配電網絡中輸電線損失的百分比,該指標是衡量企業運營、管理和規劃設計水平的重要指標。所以,線損率計算結果既能體現配電網的結構和運行模式,又能體現供電企業的技術管理水平。經過累加計算的動態潮流線損率,使預測結果更加精準。根據營銷普查的業務需要,對營銷稽查、計量設備業主等重點工作開展檔案異常信息查詢、營銷普查計劃管理、營銷普查工作管理。
實驗數據采集的時間跨度為2020 年5 月1 日到9 月1 日,實驗采集配電網正常工作時的電力運行數據,將每天24 h 采集的數值作為當天樣本記錄,進而實現所有參數的采樣頻率一致。對采樣數據進行清洗與預處理,包含缺失的數據,根據先驗知識,避免對預測結果造成影響。采集到的10 條配電線路的參數如表1 所示。

表1 實驗參數統計結果
將統計的參數劃分為三個數據子集,A 組用于訓練,B 組用于誤差分析,C 組用于檢驗。使用Matlab 工具對考慮時序數據缺失的配電網線損率動態預測方法進行驗證分析。
在考慮專線管理水平影響因子、公用線管理水平影響因子不變的情況下,對比最小二乘SVM 預測方法(方法1)、基于深度學習的預測方法(方法2)和考慮時序數據缺失的預測方法(方法3)受到售電量結構因子影響下的預測結果,如圖3 所示。

圖3 售電量結構因子影響下預測結果
由圖3 可知,使用方法1 與實際預測結果相差較大,在樣本序列為11 時,線損率與實際預測結果相差最大,誤差為3.05%;使用方法2 與實際預測結果相差較大,其中在樣本序列為18 時,線損率與實際預測結果相差最大,誤差為0.45%;使用方法3 與實際預測結果基本一致,僅存在0.02%的誤差。
在考慮售電量結構影響因子、公用線管理水平影響因子不變的情況下,對比三種方法受到專線管理水平因子影響下的預測結果,如圖4 所示。

圖4 專線管理水平因子影響下預測結果
由圖4 可知,使用方法1 與實際預測結果最大誤差為1.1%;使用方法2 與實際預測結果最大誤差為2.65%;使用方法3 與實際預測結果基本一致,僅存在0.01%的誤差。
在考慮售電量結構影響因子、專線管理水平影響因子不變的情況下,三種方法受到公用線管理水平因子影響下的預測結果,如圖5 所示。

圖5 公用線管理水平因子影響下預測結果
由圖5 可知,使用方法1 與實際預測曲線相差較大,最大誤差為2.1%;使用方法2 與實際預測結果最大誤差為1.8%;使用方法3 與實際預測結果存在0.2%的誤差。通過上述分析結果可知,使用考慮時序數據缺失的預測方法能夠精準預測配電網線損率。
提出的考慮時序數據缺失的配電網線損率動態預測方法,利用基于改進KNN 的缺失時序數據補全算法補全缺失數據,結合馬爾科夫模型,預測配電網線損率。通過實驗驗證結果發現,該方法線損率預測精準度較高。通過對客戶基礎數據、電價執行、電費抄收、計量管理、市場能效等方面的調查,發現管理上的缺陷和不足,進一步夯實市場基礎,加強營銷基礎檔案的質量。