謝 林 李紅偉 袁 岳 周海林
(1.西南石油大學電氣信息學院 成都 610500;2.國網四川省電力公司資陽市雁江供電分公司 資陽 641300;3.四川大學電氣工程學院 成都 610065)
低壓配電系統的線損管理是電力系統線損管理的重要組成部分,涉及配電系統的規劃、運行、營銷和計量。統計的線損包含管理線損,但由于低壓配電系統網絡結構復雜、用戶數量多、性質復雜、海量數據管理困難等原因,低壓配電系統線損計算存在較大偏差[1]。理論線損的計算是基于電網設備參數、操作數據和功率流以及載荷分布理論,它可以準確地了解電網損耗的構成,并且提供一個可靠的依據充分利用電網企業的潛在損失。
配電網處于發電、輸電、配電的末端,其設備數量多、覆蓋范圍廣、電壓等級低,導致配電網損耗大。到目前為止,低壓配電系統的線損僅根據用戶文件進行簡單計算,未考慮負荷、供電半徑的影響。此外,目前的計算周期一般都是按日計算,當運行方式發生變化時,無法進行實時線損計算[2]。隨著分布式可再生能源的廣泛集成,低壓配電系統中的潮流、線損、電壓分布發生了變化,對低壓配電系統的線損管理產生了很大的影響。
配電網理論線損計算方法主要有前向-后向掃描法、等效電阻法(容量法和電學法)、均方根電流法、平均電流法、最大電流法等[3]。這些算法以前受配電網自動化程度的限制,在使用時存在不同的局限性,如計算工作量大,沒有考慮負荷曲線變化的差異、各負荷節點的實際功率、節點電壓、線路電抗等[4]。近年來,人工智能算法的發展逐漸應用于線損率計算,比如利用神經網絡搭建計算模型,通過大量的樣本訓練,擬合特征參數和線損之間的關系。文獻[5]引入多源數據,并通過隨機森林法搭建線損計算模型,在一定程度上提高了線損計算效率;文獻[6]通過建立線性回歸模型進行數據挖掘來預測線損率,得到較好的準確率;文獻[7]通過聚類算法來確定神經網絡的隱層節點,來構建線損計算模型,具有較快的計算速度。
為此,本文提出了一種基于K-Means 聚類算法和多分類相關向量機(Multi classification correlation vector machine,MRVM)的線損快速計算方法。首先選取與配電網線損有關的電氣指標作為模型的輸入;針對指標接近,但網架結構和負載特性會影響線損率的情況,本文采用K-Means聚類算法對臺區進行聚類分析,簡化數據處理,對每一類臺區進行具體分析;然后搭建果蠅算法優化MRVM 的模型,計算臺區線損。以四川資陽供電公司為例,對配電網理論進行了理論在線損耗計算,并與傳統理論線損計算結果和綜合電力線損管理系統進行了對比,驗證了該方法的有效性。
為了改善多分類相關向量機的性能,需要優化輸入參數,減少維度。通過現場經驗和相關電力系統理論知識得知影響臺區線損率的參數有供電半徑、線路長度、負載率、用電性質、三項不平衡度、電壓等,考慮參數的影響大小及獲取難易程度,選取與低壓臺區線損率密切相關的4 個電氣參數作為輸入。通過反復篩選,選取了供電半徑、線路總長、負載率以及用電種類及用電種類占比情況[8],由于研究的是低壓臺區線損,因此選用居民用電性質來表示用電性質。
(1) 供電半徑X1(m)。供電半徑指的是最遠的用戶到電源點的線路長度,一般用于控制線路電壓降,是判斷供電半徑是否正確的重要參數。
(2) 低壓線路長度X2(m)。低壓線路長度指的是所有低壓臺區線路總長。
(3) 負載率X3(%)。負載率表示該變壓器實際承擔的負荷與額定容量之比,用于反映變壓器的承載能力。
(4) 用電性質比例X4(%)。用電性質比例表示負荷用電性質與供電量的比例,能夠反映所在臺區的用電性質。
選取上述4 種參數作為MRVM 的輸入,由于4中變量的量綱不同,對其進行標準化處理,處理方法如式(1)~(3)所示

式中,Zij表示標準量;表示xij的均值;sij表示xij的方差。
為了減少網架結構帶來的計算誤差,需要對臺區樣本進行聚類分析。在對其進行聚類前,首先要計算樣本之間的相似度,一般用距離來表示相似度。本文采用K-Means 聚類算法來對臺區進行聚類分析,該算法以距離作為相似性的評價指標,以誤差平方和準則函數作為聚類準則函數,是一種迭代求解的聚類分析算法,該算法步驟如下[9]所示。
(1) 初始化:隨機選取K個點,作為聚類中心。
(2) 類劃分:按照式(4)計算每個點到K個聚類中心的距離,然后將該點分到最近的聚類中心,這樣就形成了K個簇。

(3) 中心點計算:再重新計算每個簇的質心(均值),以此作為聚類中心。
(4) 迭代計算:重復以上步驟(2)~(4),直到質心的位置不再發生變化或者達到設定的迭代次數,用式(5)判斷是否收斂。

式中,mi表示Ci的中心簇;Zq表示其樣本。不斷進行迭代計算,直到E值收斂。
K-Means 聚類算法主要有如下缺點。
(1)K值需要預先給定,然而K值是很難估計的,并且對噪音和異常點十分敏感。
(2) K-Means 算法對初始給定的質心十分敏感,選取不同的中心點,會得到不同的聚類結果。
(3) 該算法有可能陷入局部最優。
為了解決以上問題,本文通過聚類結果的輪廓系數St確定K的大小,輪廓系數的計算方法如式(6)所示[10]

式中,q(i)表示點i到所在類別其他點的平均距離;p(i)表示該點到非所在類別中其他點的距離最小值。計算S(i) 的均值作為St,St越大,表示聚類效果越好,即

為了解決局部收斂問題,可以多次隨機選取聚類中心,最后比較各自完成后的畸變函數值,畸變函數越小,則說明聚類效果更優[11]。
本文選取低壓臺區供電半徑,低壓線路總長,負載率以及用電比例最小值作為電氣指標值,臺區評價指標如式(8)所示[12]

可以看出,參數PE可以反映線損,并且變化趨勢相同,因此,可根據PE的值將樣本分為k組,讓每組的中心作為初始聚類中心。
多分類相關向量機(MRVM)是在相關向量機(RVM)的基礎上進行了擴展,該算法相關向量數量少,泛化能力強,可解決小樣本、非線性問題。MRVM使用分層貝葉斯模型,能以概率形式給出結果,便于分析問題的不確定性[13]。

式中,ync表示矩陣Y的n行c列;w表示矩陣Wc的第c列;N x(m,v) 表示變量x服從正態分布。設多項概率聯系函數t n=i,yn>y nj?j≠i,則多項概率似然函數公式為[14]

式中,u服從均值為0,方差為1 的正態分布,為了提高模型的稀疏性,使αnc服從超參數分別為a,b的Gamma 分布[15]。MRVM 采用分層貝葉斯模型結構,由上述可知其模型結構如圖1 所示。

圖1 分層貝葉斯模型
由此模型圖可得出后驗概率為


權重向量的先驗值的后概率為

果蠅算法被廣泛用于機器學習的參數優化,大大提高了機器學習的效率[16]。其中,種群大小取10,復雜的取20~50;搜索半徑為一正整數,搜索方向為0~1 之間的隨機數;迭代次數要根據計算結果,一般迭代次數越多,結果越精準,但太多會導致效率低下。
3.3.1 果蠅算法優化步驟
果蠅算法的7 個步驟如下所示。
(1) 對果蠅個體初始化,即賦予初始位置。
(2) 設置搜索方向和搜索半徑。
(3) 計算每個果蠅到原點長度和味道濃度的判定數值。
(4) 將濃度判定值代入適應函數中,計算果蠅位置和味道濃度值。
(5) 比較味道濃度值,尋求最優味道濃度值。
(6) 把步驟(5)的最優值記錄下來,所有果蠅朝這個方向飛去。
(7) 重復步驟(2)~(5),直到迭代收斂。具體算法流程圖如圖2 所示。

圖2 果蠅算法流程圖
3.3.2 果蠅算法優化MRVM 參數設計
MRVM 核函數參數的選擇對模型具有較大影響,包括懲罰參數、徑向基核函數參數和敏感因子。僅人為經驗選擇參數不能達到理想效果,達不到精度要求,因此,本文選擇果蠅算法進行尋優,流程圖如圖3 所示。

圖3 果蠅算法優化MRVM 流程圖
3.4.1 臺區線損歸一化處理
由于變壓器臺區線損的指標量綱不同,因此需要對其進行歸一化處理,選取臺區線損率作為MRVM 的輸出,其輸出值域為(0,1),因此需要將線損率歸一化在(0,1)區間內。本文采用式(14)進行歸一化處理[17]

式中,di為歸一化前的值;di為歸一化后的值;dmax和dmin分別為樣本最大值及最小值。
3.4.2 結合K-Means 和MRVM 的線損計算步驟分析
結合 K-Means 聚類算法和果蠅算法優化MRVM 模型計算低壓臺區線損率分為4 個步驟,具體如下。
(1) 選取臺區線損的電氣特征參數指標,并對其標準化處理。
(2) 利用K-Means 聚類算法將臺區樣本進行聚類處理。
(3) 利用果蠅算法優化的MRVM 模型計算臺區線損率。
(4) 對計算結果進行誤差分析。
本文采用均方誤差Em來衡量計算結果的整體誤差,假設臺區樣本數為N,計算公式如下[18]

除整體誤差外,還需要考慮單個樣本誤差情況即相對誤差,計算方法如下[19]所示

計算流程圖如圖4 所示。

圖4 臺區線損率計算流程圖
為了驗證該模型計算的實用性,一共選取了600 個樣本,按照第2 節所述,選取臺區4 個指標作為輸入,分別為:x1為居民用電比例,x2為供電半徑,x3為低壓線路長度,以及x4為負載率,輸出為線損率d(%)。
使用上述600 樣本進行聚類分析,然后根據標準化后的數據計算樣本的性能指標PE,然后根據性能指標的大小進行排序[20]。通過聚類分析發現,當聚類數目k等于6 時,聚類結果的輪廓系數達到最大值,因此本文把k值設為6。根據PE值把樣本分為 6 類,則樣本的聚類中心如表 1所示。

表1 樣本聚類中心
低壓臺區樣本聚類結果如表2 所示。由表2 可知,6 個類別所含樣本數分別為150、301、11、40、85 和13,總共600 個樣本。

表2 各類別所含樣本數
使用上述6 類樣本分別訓練果蠅算法優化多分類相關向量機(MRVM)模型,在訓練時,設置目標誤差分別為:0.01、0.005、0.001、0.000 1,得到線損率結果如表3 所示。

表3 不同訓練目標誤差下的線損結果分析
由表3 可知,訓練目標誤差越小,模型計算結果越準確,但迭代次數增多,同時有可能出現不收斂的情況。果蠅算法優化MRVM 模型在訓練目標誤差為0.000 1 時仍然能夠實現全局收斂,線損率EC結果非常小,迭代次數達到480 次,時間消耗為6 s,時間消耗仍在可接受范圍內。
設置訓練目標誤差為0.000 1,得到實際線損率和估計線損率,6 類樣本計算結果如圖5~10 所示。

圖5 第1 類樣本誤差結果

圖6 第2 類樣本誤差結果

圖7 第3 類樣本誤差結果

圖8 第4 類樣本誤差結果

圖9 第5 類樣本誤差結果

圖10 第6 類樣本誤差結果
以上為6 類樣本的誤差結果分析,從圖5 中可看出第1 類樣本中的樣本30 的誤差率達到了25.7%;第2 類樣本的誤差率都在10%以下,誤差率最高的樣本168,誤差率也才7.3%;第3 類樣本誤差率在0.5%以內,誤差非常小;第4 類樣本誤差率最大的為樣本5,達到了11.7%,樣本14 誤差率為8.2%,其他樣本誤差率都小于5%;第5 類樣本的樣本5 誤差率達到了21.4%,樣本15 和樣本64誤差率分別為13.2%和17.6%,其余樣本誤差率均在10%以下;第6 類樣本中,樣本5 誤差率最高為6.8%,樣本7 次之,誤差率為5.3%。下面對誤差率在10%以上的樣本校核。

表4 誤差率10%以上樣本校核
根據電力系統相關理論,特征指標值越大,則線損率越大,然而對比第五類樣本的5 號、15 號和64 號,5 號樣本的X1、X2、X3、X4均小于15 號和64 號對應的指標值,然而其實測線損率最大,因此可判斷5 號實測值不準確,需要重新校核;同理可對比第五類樣本的15 號和64 號,15 號樣本線損率理應小于64 號樣本線損率,然而實測線損值得到相反結果,因此可推測15 號和64 號的實測值存在問題。依此對比一類樣本的30 號和四類樣本的5 號,需要重新校核實際測量的線損值,然后和模型的預測值作對比。通過校核后,得到這5 個臺區樣本的線損率為 11.31%、11.22%、10.14%、12.17%、14.28%,重新計算相對誤差率,得知誤差率都下降到了5%以下。
為了驗證基于果蠅算法優化MRVM 模型的優越性,設置目標誤差為0.01,把計算結果進行比較,結果如表5 所示。

表5 標準MRVM 模型與果蠅算法優化MRVM 模型計算結果比較
通過表5 可看出,果蠅算法優化的MRVM 跌得次數更少,且有更高的線損計算準確率。
本文提出了一種新的低壓臺區線損率計算方法,把該計算方法應用于資陽低壓臺區線損計算,得到如下結果。
(1) 通過K-Means 聚類算法對臺區樣本進行聚類分析,可解決以為臺區樣本分散導致的計算誤差較大的問題。
(2) 在臺區分類后,搭建果蠅算法優化的M-RVM 線損率計算模型,并對其進行訓練,得到線損率計算結果
(3) 對資陽地區的600 個臺區樣本進行實例驗證,通過計算證明了該算法具有較快的收斂速度和準確率。