曹 晶,謝文浩,周志飛,劉旭陽
(1.國網(wǎng)湖南省電力公司,長沙 410004;2.國網(wǎng)湖南供電服務中心(計量中心),長沙 410004)
配電網(wǎng)結構相對復雜,存在拓撲多變、監(jiān)測難度大以及整定難度大的問題。隨著配電網(wǎng)應用范圍和用戶數(shù)量不斷上升,配網(wǎng)線損問題也越來越嚴重。配網(wǎng)線損在線監(jiān)測數(shù)據(jù)缺失不僅會影響配電網(wǎng)的運行、調(diào)度、分析等工作,還對線路運行質(zhì)量造成了一定程度的損害,導致配電網(wǎng)工作效率和質(zhì)量有所下降。
在配網(wǎng)線損在線監(jiān)測數(shù)據(jù)累積量較多的現(xiàn)狀下,文獻[1]提出基于次序依賴的配電網(wǎng)數(shù)據(jù)自動填補修復模型構建方法,但方法逐步查找計算的工作量較大,應用在實際電網(wǎng)線損檢測中不易實現(xiàn);文獻[2]提出基于DBSCAN 二次聚類的配電網(wǎng)缺失數(shù)據(jù)填補方法,由于配電網(wǎng)中不只存在一種屬性數(shù)據(jù),是多種數(shù)據(jù)疊加,特征規(guī)律難以查找和捕捉,運用該方法進行數(shù)據(jù)缺失填補的誤差較大。
結合上述分析,本文以配網(wǎng)線損的數(shù)據(jù)損失函數(shù)為基礎,提出基于加權類平均的配網(wǎng)線損在線監(jiān)測數(shù)據(jù)缺失自適應填補方法,并通過實驗驗證了該方法的有效性。
本文采用聚類算法對配網(wǎng)線損全部數(shù)據(jù)進行聚類處理,具體操作步驟如下:
(1)將配電線路中特征表現(xiàn)最為明顯的線損點作為數(shù)據(jù)樣本X={x1,x2,…,xn}(n 為樣本數(shù)量),將樣本數(shù)據(jù)的線損特征作為無量綱指標[3],選用極值法對全部數(shù)據(jù)進行無量綱化處理。
(2)以步驟(1)預處理后的線損數(shù)據(jù)特征作為初始輸入值,將樣本集X 劃分為c(c>1)個類別,以此實現(xiàn)數(shù)據(jù)聚類。根據(jù)求得的每個樣本的隸屬度[4]uij值,計算其與聚類中心vi的距離,通過距離判定數(shù)據(jù)的所屬類別范圍。聚類目標函數(shù)JFCM為
(3)結合上述分析輸出最終配網(wǎng)線損在線監(jiān)測數(shù)據(jù)聚類結果。按照上述過程,通過初始數(shù)據(jù)輸入求得配電線路中目標點距線損點的距離值,根據(jù)該距離值設定線損影響范圍,可以為后續(xù)的數(shù)據(jù)缺失自適應調(diào)補奠定堅實的基礎。
本文通過分析配網(wǎng)線損數(shù)據(jù)特征,建立損失函數(shù)[7],通過損失函數(shù)盡可能找到缺失數(shù)據(jù)的真實區(qū)域,提高填補精準性。損失函數(shù)f(x)定義為
為了提升數(shù)據(jù)質(zhì)量,需要保證配網(wǎng)線損缺失數(shù)據(jù)損失函數(shù)最小化,結果如下:
對于真實樣本y 而言,要想提高配網(wǎng)線損計算的準確性,需要確保輸出結果D(G(z))與期望結果之間的貼合度足夠大,此時,線損計算結果才能不斷逼近真實值。
將損失函數(shù)f(x)逼近問題轉換為min-max 可得到:
由于配電網(wǎng)數(shù)據(jù)具有實時變化特性[10],需要不斷更新并輸入特征計算,這樣求得的損失結果才更貼近真實值,結合該結果進行缺失數(shù)據(jù)區(qū)域定位。
在定位配網(wǎng)線損數(shù)據(jù)缺失數(shù)據(jù)區(qū)域后,計算不同數(shù)據(jù)之間的相似度[11]。通過相似度判定可大大降低多次查找效率,即可根據(jù)一組缺失數(shù)據(jù)的屬性分析,查找與其存在正向關聯(lián)的數(shù)據(jù),提高配網(wǎng)線損在線監(jiān)測數(shù)據(jù)缺失自適應填補效率[12]。
設An、Bn為同一聚類簇中的2 條缺失數(shù)據(jù)記錄,其中αi、βi為數(shù)據(jù)i 的不同的屬性值,將二者之間的損失量定義為
αi、βi的相似度定義為
式中:lmax表示數(shù)據(jù)i 屬性相似性最大差異。通過式(8)可得到配網(wǎng)線損缺失數(shù)據(jù)的基本取值范圍Si(αi,βi)為0~1 之間,查找損失量最大且與該樣本相似性最高的數(shù)據(jù)點即可判定缺失點位置。
本文以缺失數(shù)據(jù)的屬性特征、采樣點數(shù)量以及缺失連續(xù)性為參照基礎,采取針對性的填補策略。缺失數(shù)據(jù)采樣點和連續(xù)性對配電網(wǎng)的影響如圖1所示。

圖1 缺失數(shù)據(jù)采樣點和連續(xù)性對配電網(wǎng)的影響Fig.1 Impact of missing data sampling points and continuity on distribution networks
由圖1 可知,當缺失數(shù)據(jù)數(shù)量出現(xiàn)大范圍變化時,會造成電網(wǎng)其他區(qū)域的數(shù)據(jù)缺失,其中采樣點連續(xù)性的整體影響面較大。根據(jù)不同狀態(tài)下的配電區(qū)域缺失數(shù)據(jù)變化,結合上述過程的相似性數(shù)據(jù)判定分析,將缺失數(shù)據(jù)集狀態(tài)矩陣表示為
若狀態(tài)矩陣參數(shù)xij(i=1,2,…,n;j=1,2,…,m)為配網(wǎng)線損缺失數(shù)據(jù)項,配網(wǎng)線損在線監(jiān)測數(shù)據(jù)缺失自適應填補的實現(xiàn)過程如下:將第j 個配網(wǎng)線損在線監(jiān)測數(shù)據(jù)與其他相關聯(lián)屬性數(shù)據(jù)組成K 個組,假設缺失數(shù)據(jù)xij在第k(k=1,2,…,K)組中,此時,對缺失數(shù)據(jù)xij的填補數(shù)據(jù)方差為
式中:E 表示期望變量;Y2表示自適應填補參數(shù)。通常情況下,在配網(wǎng)線損在線監(jiān)測數(shù)據(jù)缺失進行自適應填補時,由于缺失屬性判定不一致導致的填補誤差較大,且過于粗糙。針對該問題,采用加權類平均填補法,賦予每組缺失數(shù)據(jù)不同的損失函數(shù)權重,按照權重匹配實現(xiàn)配網(wǎng)線損在線監(jiān)測數(shù)據(jù)缺失精確化填補,表達公式為
式中:ωk表示該組數(shù)據(jù)的填補權重;μk表示修正系數(shù)。通過上述過程,可以實現(xiàn)配網(wǎng)線損在線監(jiān)測數(shù)據(jù)缺失自適應填補,且所需運算較少,通過賦予每組缺失數(shù)據(jù)不同的權重確保了填補的精準性,整體實用價值較高。
為驗證文中提出配網(wǎng)線損在線監(jiān)測缺失數(shù)據(jù)自適應填補方法的有效性,選取2022 年5 月1 日~6 月1 日間某地區(qū)的配網(wǎng)線損在線監(jiān)測數(shù)據(jù)作為實驗數(shù)據(jù)。為提高缺失數(shù)據(jù)填補效果的對比性,在原本不存在缺失數(shù)據(jù)的原始數(shù)據(jù)集中設置有25%的監(jiān)測數(shù)據(jù)缺失,缺失區(qū)域有5 個。實驗數(shù)據(jù)相關參數(shù)如表1 所示。

表1 實驗數(shù)據(jù)相關參數(shù)Tab.1 Experimental data related parameters
以上文數(shù)據(jù)集為基礎,運用本文聚類方法進行缺失區(qū)域定位,缺失區(qū)域定位結果如圖2 所示。

圖2 缺失區(qū)域的定位Fig.2 Location of missing areas
通過圖2 可以看出,本文方法很好地定位出5個數(shù)據(jù)缺失區(qū)域,定位效果較好。
將基于次序依賴的配電網(wǎng)損壞數(shù)據(jù)自動填補算法、基于DBSCAN 二次聚類的配電網(wǎng)缺失數(shù)據(jù)修補法作為實驗對比方法,并將未填補前配網(wǎng)線損在線監(jiān)測數(shù)據(jù)作為參照,實現(xiàn)精準比對,實驗結果如圖3~圖6 所示。

圖3 未填補前配網(wǎng)線損在線監(jiān)測數(shù)據(jù)變化Fig.3 Changes in online monitoring data of distribution line loss before filling

圖4 次序依賴法填補后的數(shù)據(jù)變化Fig.4 Data changes after filling in the order dependency method

圖5 DBSCAN 二次聚類法填補后數(shù)據(jù)變化Fig.5 Data changes after filling in DBSCAN secondary clustering method

圖6 本文方法填補后數(shù)據(jù)變化Fig.6 Data changes after filling in the method in this article
分析未進行自適應填補前配網(wǎng)線損在線監(jiān)測數(shù)據(jù)變化情況可知,整體呈現(xiàn)較為混亂的變動趨勢,線損電量曲線存在較大空缺和留白,不存在規(guī)律變化,說明受缺失數(shù)據(jù)影響,電網(wǎng)運行不穩(wěn)定。經(jīng)過3 種方法的自適應填補后,線損電量曲線得到明顯的改善,但從細節(jié)對比可發(fā)現(xiàn),本文的填補效果表現(xiàn)最佳,填補節(jié)點位置與原始數(shù)據(jù)缺失位置一致,填補后線損電量分布更為規(guī)律,更加穩(wěn)定;而另外2 種方法填補效果明顯不佳,填補位置與實際缺失位置不匹配,存在一定的填補誤差,精準度較低,實用效果不佳,應用價值較低。
3 種方法填補結果的絕對誤差值與相對誤差值對比結果如表2 與表3 所示。

表2 3 種方法的絕對誤差值比較Tab.2 Comparison of absolute error values of three methods

表3 3 種方法的相對誤差值比較Tab.3 Comparison of relative error values of three methods
分析表2 與表3 中的數(shù)據(jù)可知,與次序依賴法、DBSCAN 二次聚類法這2 種方法相比,本文方法的配網(wǎng)線損在線監(jiān)測數(shù)據(jù)缺失自適應填補結果的絕對誤差值與相對誤差值均保持在較低的水平,說明本文方法的填補效果更好。
本文以配網(wǎng)線損在線監(jiān)測數(shù)據(jù)缺失情況為基礎,采用加權類平均算法進行自適應填補研究,得出以下幾點結論:①本文考慮到電網(wǎng)在線監(jiān)測數(shù)據(jù)量較大,基數(shù)較高,缺失數(shù)據(jù)種類較多的問題,在進行填補前,采用聚類算法對數(shù)據(jù)進行聚類處理,形成包含同種屬性的聚類簇,通過查找損失量最大且與該樣本相似性最高的數(shù)據(jù)點確定缺失點位置;②采用加權類平均填補法賦予每組缺失數(shù)據(jù)不同的權重,通過權重匹配實現(xiàn)數(shù)據(jù)缺失自適應填補。實驗數(shù)據(jù)證明,本文方法對自適應填補效果較好,填補后電網(wǎng)運行更穩(wěn)定,且填補結果的絕對誤差值與相對誤差值均保持在較低的水平,實際應用效果好。