潘 煒,史 琳,張 卓
(廣東電網有限責任公司廣州供電局,廣東 廣州 510000)
配電網自動化系統在應用中積累了豐富的數據,如果有效分析這些歷史性數據,能夠為掌握和控制配電網線損提供數據依據。借助大數據的處理技術,基于機器學習的線損異常分析模型,通過機器學習的自適應和自學習的能力不斷優化和處理模型。按照聚類分析和關聯分析方法和個別異常之間存在的關聯關系,實現對模型分析的準確度和精度的優化,可提高線損問題發現的及時性。結合系統判斷的結果和核查確認的情況,系統能夠提取被確認異常線路和臺區內的數據特征,通過機器學習算法聚焦被確認的同類數據特征的異常情況,同時每月不斷排查未確認異常的數據特征,深度剖析問題原因,并跟蹤異常數據的整改情況,驗證異常的消失時間,從而有效控制配電網的線損。
目前有很多線損的計算方法,包括均方根電流法、牛頓法以及線性回歸分析法等。由于實際中數據的缺失和電力網絡的節點較多,電網的運行數據和結構參數的收集和整理比較困難,因此上述方法存在很大弊端。隨著人工神經網絡的發展和引入,依據神經網絡的配電網線損計算法逐漸產生。神經網絡模型有著高度非線性處理性能,能夠擬合配電線路線損和特征參數間復雜性和非線性的關系,所以提出了一種以機器學習為基礎的對配電網線損進行自動計算的模型(ELACM-ML)。此模型主要通過使用無監督的聚類算法自動聚類處理訓練樣本,然后借助每個類別訓練樣本對支持向量的回歸機實施訓練,以獲取相應擬合的函數[1]。此模式具有顯著的優點,能夠自動聚類訓練樣本,借助無監督的聚類算法聚類處理訓練樣本。每個類中的樣本線損值較為接近,能夠提升每個類別內模型擬合的程度,同時線損計算的效率較好、精度較高且誤差較小。
此模型主要包括訓練樣本集合、無監督的分類器、支持向量的回歸機以及線損計算模塊4部分。訓練樣本集合主要包括訓練樣本、計量電網線路內表計的數據、各個節點屬性值以及各相鄰節點間的差值等數據,在特征選擇和樣本標準化后構成訓練樣本集合。無監督的分類器的主要作用是自動分類整理訓練樣本集合內的數據,使每個類中的樣本具有接近的線損值。無監督的分類器的樣本集合的預處理,可提升每個類別內支持向量的回歸精度。支持向量的回歸機的主要作用是學習無監督的分類器,獲取訓練樣本的子類,從而獲取各個子類擬合函數的估計情況。在線損計算的模塊中,用支持向量的回歸機學習每一類樣本,從而獲取一組支持向量的回歸機仿真機。把某樣本按照無監督的分類器實施分類并獲取其分類結果,然后把其輸入到所在類支持向量的回歸機仿真機內,通過計算和輸出能夠得到線損的計算結果[2]。
配電網中與線路線損有很多相關性的特征參數,主要包括線路有功功率和無功功率的供電量、線路長度、變壓器總容量、變壓器臺數、線路總截斷數、流經電流以及線路內自動化的表計所獲取運行的參數等。計算配電網的線損時,支持向量的回歸機模型內輸入節點的數量主要由配電網能夠獲取線路的參數和運行參數的個數決定。通過分析實際的配電網,發現4個和線損最相關的數量特征參數,同樣也可以考慮更多的特征參數。按照4個數量特征的參數對模型內輸入的變量X設置維數組(x1,x2,x3,x4),分別代表線路有功功率的供電量值、線路無功功率的供電量值、變壓器總容量以及線路總長度值。
對輸入值和輸出值實施標準化處理,確保計算不會受到量綱影響。輸入的變量維數是4個,樣本個數是N個,樣本數據集為X={x1,x2,…,xN},則對樣本某xi的自變量xij要實施標準化處理。
聚類的數目假定是C,通過一種簡單無監督的聚類算法對此C類數據實施聚類處理。此方法與傳統K-means算法相比,預先指定的類別數不同,是按照預先給定聚類的半徑聚類處理數據,聚類速度較快[3]。對于待聚類X={x1,x2,…,xN}的數據集,假定其聚類的半徑是R,此算法的描述為:

若Z=0,聚類會停止,否則選擇x∈Z樣本,在經存在的質心找出和xi最近距離的質心Oj;若dist(xi,Oj)≤R,則要把xi添加到類Cj中,也就是Cj=Cj+{xi};若dist(xi,Oj)>R,增設一新類為cluster_num=cluster_num+1,則:
此算法中,最大的時間開銷是O(cluster_num×m),效率較高。
通過學習樣本的構造和對樣本分類處理獲取某子類訓練的樣本為(xi,zi),i=1,2,…,N。通過高維特征的空間線性函數來擬合訓練樣本,此函數表示為:

式中,φ(x)把訓練的數據自輸入的空間向高維特征的空間映射,從而把輸入空間內非線性的擬合問題轉變為高維特征的空間線性擬合的問題。考慮協商性問題的實時性要求,本文的模型通過支持向量的回歸機學習樣本,使得支持向量的回歸機內算法回歸問題能夠表示成約束優化問題,然后通過Lagrange方法將約束優化問題轉變為無約束的優化問題,再結合學習樣本的構造獲取支持向量的回歸機具體輸出,也就是擬合函數:

此擬合函數為配電網的線損計算函數,把待計算的樣本x輸入擬合函數,得到的輸出就是線損實際值。
假定存在訓練的樣本集為X,借助無監督的分類器分類整理樣本集,能夠獲取x1、x2以及x3共3個子樣的本集,然后通過此3個子樣的本集對支持向量的回歸機分別實施訓練,獲取3個支持向量的回歸機。假定各自擬合的函數為f1(x)、f2(x)以及f3(x),在對某被測數據x計算中,要先實施分類,后按照所在的類別計算擬合函數,從而獲取此x數據線損的估計值。若x屬類別X2,則通過f2(x)擬合函數計算其線損。
選取相應實驗室的數據,準確計算68組線路線損,以驗證模型的有效性和實用性。本文訓練與分析此68組線損樣本的數據,其中58組當作訓練樣本,其余10組當作檢驗樣本。
先通過無監督聚類算法將這58組線路的樣本數據分作4類,對4類樣本的數據分別進行支持向量的回歸機訓練,完成訓練后獲取相應4種支持向量的回歸仿真機。分類處理10組測試樣本的相關數據,然后用各自支持向量的回歸機SVR仿真并輸出,得到相應的結果。
為進一步驗證本文模型算法的有效性,此實驗不分類訓練樣本,直接通過支持向量的回歸機實施處理,能夠獲取一種支持向量的回歸仿真機,然后通過此支持向量的回歸仿真機仿真計算和輸出10組測試樣本相關數據得到的相應結果。
實驗一和實驗二的實驗結果如表1所示。
從表1能夠看出,支持向量的回歸仿真機的線損計算結果具有較高的精度,存在的誤差較低,說明此方法對線損的計算效果較好。通過對比表1的實驗結果可知,與通過分類的預處理支持向量的回歸仿真機實驗相比,沒有通過分類的預處理支持向量的回歸仿真機對配電網的線損計算得到結果的精度較低,且其平均相對誤差超過了10%??梢姡瑢τ柧殬颖緦嵤┓诸愵A處理,可以有效提升線損模型計算的效率。

表1 在分類和未分類的預處理后線損計算的結果
本文在配電網線損計算中運用了向量機,構建了相應線損計算模型,然后利用代表性線路線損和特征參數的樣本數據,借助支持向量的回歸擬合線損和特征參數間的復雜性和非線性關系,從而獲取線損與特征參數的變化規律。模型先通過無監督聚類算法分類訓練樣本,然后按照每類內樣本對其實施訓練,不僅降低了所有樣本的計算復雜度,還能夠提高結果的精度。