王棟,蔣亮,江陳楨,李珺涵,胡斌,朱力鵬,鄧松
(1.國網南通供電公司,江蘇南通226001;2.全球能源互聯網研究院,北京102209;3.南京郵電大學,南京210023)
配電網處于電力系統的末端,具有地域分布廣、電網規模大、設備種類多、網絡連接多樣、運行方式多變等鮮明特點[1-2]。
隨著智能電網的不斷發展,用戶的用電量和對電能質量的要求不斷提高,有些地方的低壓配電網電能質量和供電能力無法滿足廣大用戶的要求。低壓配電網具有規模巨大、結構復雜、不確定的信息較多、智能化不夠等特征,正是這些特征對智能配電低壓臺區的綜合評價帶來一定的挑戰。影響智能配電網低壓臺區綜合評價的指標特征很多,各指標之間的發展程度也各不相同。整個智能配電網低壓臺區綜合評價是綜合低壓配電網建設的重要依據,這為配電網進一步科學的規劃、建設和管理提供決策。
針對智能低壓配電網的采集裝置配置少、臺區線路多樣、管理復雜的現狀,如何對眾多配電低壓臺區進行一個綜合評價,為后面的配電網低壓臺區規劃建設提供決策依據是亟待解決的一個難題。文獻[3]提出了一種面向臺區管理的臺區狀態綜合評價方法,設計了低壓配電網臺區的特征指標體系,構建了低壓配電網臺區狀態綜合評價模型,最后實際臺區數據驗證了該模型的正確性和適用性。張夢等提出了基于智能化的農村低壓配電網臺區管理方法和相應的措施,以滿足低壓配電網負荷增長的實際需求,提高低壓配電網的供電可靠性和電能質量[4]。文獻[5]針對城市配電網規劃缺乏有效的量化手段的情況,提出一種有關配電網規劃的綜合評價指標體系與方法。現有的這些配電網綜合評估方法存在主觀性強、評價指標體系復雜多樣等問題,為了更好地解決智能低壓配電臺區的高效準確評估,本文結合粗糙集和基因表達式編程的思想,提出一種基于混合基因表達式編程的智能配電網低壓臺區綜合評價算法(Comprehensive evaluation algorithm of low voltage station area in smart distribution network based on hybrid gene expression programming,CE-LVHGEP)。
文章所做的主要工作如下:(1)為了解決影響智能配電網低壓臺區綜合評價因素過多的問題,本文提出基于粗糙集的智能配電網低壓臺區綜合評價指標約簡算法(Attribution reduction algorithm of comprehensive evaluation index in low voltage smart distribution network based on rough set,AR-CEILV);(2)在AR-CEILV基礎上,結合基因表達式編程的思想,提出基于混合基因表達式編程的智能配電低壓臺區綜合評價算法(CE-LVHGEP)。
為了更好地對智能配電網低壓臺區進行綜合評價,首先要做的就是梳理影響智能配電網低壓臺區綜合評價的各類要素。文獻[6]指出影響智能配電網低壓臺區綜合評價的主要指標包括電網投資、運維管理、客戶服務和外部因素等,其中電網投資又包括線路理論損耗率、線路統計損耗率、配變理論損耗合格率、容載比、平均供電半徑以及戶均容量等;運維管理又包括最小負荷率、峰谷差率、負荷率、功率因數、供電可靠性、配變最大負載率、三相不平衡率和電壓合格率等;客戶服務又包括到達時長和修復時長等;外部因素主要包括氣溫、濕度、臺風和鹽霧。
但由于影響配電網臺區綜合評價的要素復雜多樣,則導致構成的配網臺區綜合評價要素集呈現出高維的特征,直接利用GEP進行評價函數的挖掘是一件非常困難的事。為了更好地對這些高維綜合評價數據集進行有效的挖掘,首先要對這些高維要素集進行降維,而降維的方法很多,例如主成份分析方法[7]、奇異值分解法[8]及粗糙集[9]等。但前兩種方法不可避免地會造成原始數據信息的部分丟失,而基于粗糙集的屬性約簡在降維的同時,并沒有改變約簡后數據的決策規則。為此,本文提出了基于粗糙集的智能配電網低壓臺區綜合評價指標約簡算法(AR-CEILV)。
為了更好地描述問題,首先給出有關AR-CEILV算法中需要用到的相關定義。
定義1:綜合評價決策表(Comprehensive Evaluation Decision Table,CE-DT)。
設 T=<U,C∪D,V,f>,其中 U為配網臺區綜合評價要素集中的所有研究對象,C∪D=R為配網臺區綜合評價要素集的屬性集合,C={c1,c2,…,cn}為配網臺區綜合評價要素集中所有要素,D={d1,d2,…,dm}為配網臺區綜合評價要素集中的評價值集合,V=∪vr,r∈Rs是配網臺區綜合評價要素集中各類指標值及對應的評價值的集合,vr表示某一個屬性r∈R的范圍,f∶U×R→V定義一個信息函數,它指定U中每一對象x的屬性值,即對于?r∈R,x∈U,有 f(x,r)∈vr。稱滿足上述條件的 T為綜合評價決策表。
定義2:設綜合評價決策 T=<U,C∪D,V,f>,其中C∪D=R,D的C正域是U中所有通過用U/C表達的集合能夠確定地劃入U/D類的對象的集合,記為 POSC(D)。

整個基于粗糙集的智能配電網低壓臺區綜合評價指標約簡算法的描述如下所示:
算法1:AR-CEILV(T)
輸入:T=<U,C∪D,V,f>;
輸出:T′=<U,C′∪D,V,f>;
(1)C′=C;
(2)針對配網臺區綜合評價要素集C中的每一個要素c;
(3)根據定義2和定義3分別計算POSC-{c}(D)和 rC-{c}(D);
(4)若 rC-{c}(D)=1,則說明要素 c是可約簡的;
(5)返回約簡后的 T′。
整個算法的計算耗時集中在rC-{c}(D)的計算上,因此整個算法的時間復雜度大約為 O(Card(C))。
智能配電網低壓臺區綜合評價可以看成是影響低壓臺區綜合評價的指標與評價值之間的函數挖掘。通過基于粗糙集的智能配電網低壓臺區綜合評價指標約簡,可以對高維臺區綜合評價數據集進行有效地降維,由于粗糙集本身的特性,這種降維處理并沒有改變原來數據集固有的決策屬性和能力。因此在粗糙集屬性約簡的基礎上,再基于基因表達式編程進行智能配電網低壓臺區綜合評價函數挖掘和直接利用基因表達式編程進行臺區綜合評價函數挖掘的效果是一致的。
在實際應用中,挖掘數據之間蘊含的函數關系,有助于揭示數據的內在本質。傳統的回歸方法一般都假定了函數類型已知,然后借助最小二乘法[10]或者其改進的方法進行參數估計,最后確定函數關系式。這些方法過于依賴先驗知識,含有很多主觀人為因素,目前還不能解決復雜函數關系式的建立,而且對于復雜高維的樣本數據,計算量較大,算法復雜度較高,計算效率低下。為此,在文獻[11-12]中,作者使用遺傳編程(GP)來進行數學建模,得到了比較好的結果,同時還避免了傳統統計方法事先選定函數模型的不足。但是利用GP來挖掘函數模型的效率不高,文獻[13-15]提出了一種新的算法-基因表達式編程(Gene Expression Programming,GEP),它和GP一樣可以實現函數關系式的挖掘,在挖掘復雜函數關系式時,其效率高出傳統的GA和GP算法4-6個數量級。本文在AR-CEILV算法的基礎上,結合基因表達式編程算法的優勢,提出一種基于混合GEP的智能配電網低壓臺區綜合評價算法(CE-LVHGEP)。
整個基于混合GEP的智能配電網低壓臺區綜合評價算法的形式化描述如下。
算法2:CE-LVHGEP
輸入:綜合評價決策表T,種群大小PopSize,最大迭代次數MaxGen;迭代終止的適應值MaxFitness,選擇率 Ps,變異率 Pm,插串率 Pt,重組率 Pr;
輸出:最優的綜合評價函數BestEFun.
(1)T′←AR-CEOLV(T);
(2)根據約簡后的綜合評價決策表 T′初始化種群;
(3)While(fitness<=MaxFitness)or(genNum<=MaxGen)do;
(4)按照選擇概率Ps、變異概率Pm、插串概率Pt、重組概率Pr分別執行選擇、變異、插串及重組操作,并形成新的種群;
(5)評價新的種群;
(6)返回最優的綜合評價函數BestEFun。
為了更好地驗證本文所提出算法的可行性和有效性,在實驗室環境下做了大量的仿真實驗。整個實驗平臺為 Win7 Professional+Eclipse 3.2+Java1.7,所有的程序由Java語言實現。
本實驗的數據主要來源于國網南通市供電公司。首先分析影響南通市供電公司配電網低壓臺區評價的指標要素,得到相應的綜合評價要素集,并通過該綜合評價要素集中所有的值構造相應的綜合評價決策表。整個決策表中條件屬性(也即綜合評價指標要素)個數為20,決策屬性(也即綜合評價等級)個數為5(分別為較高、高、中、低、較低),數據個數為200條,其中其150條數據為訓練數據,后50條數據為測試數據。
實驗1:針對上述已知的智能配電網低壓臺區綜合評價決策表,表1給出綜合評價決策表基于ARCEILV算法進行指標約簡前后影響智能配電網低壓臺區綜合評價的指標個數變化。表2給出了AR-CEILV、PCA、SVD以及基于正域的屬性約簡算法((Attribute Reduction Algorithm based on Positive Region,ARPR))和基于分辨矩陣的屬性約簡算法(Attribute Reduction Algorithm based on Discernable Matrix,ARDM)求解出的最優屬性約簡。圖1顯示了在算法運行5次的情形下,FAR-BSA算法與 PCA、SVD、AR-PR、AR-DM求解一個最優屬性約簡的耗時比較。

表1 基于AR-CEILV的綜合評價指標的個數變化Tab.1 Change of the number of comprehensive evolution index based on AR-CEILV
我們知道,對于固定綜合評價指標個數而言,最優指標約簡不唯一,從表1中可以看出,AR-CEILV在求解一個最優屬性約簡是有效的。約簡后的綜合評價指標個數減少了70%,從而大大降低了后續綜合評價函數挖掘的復雜度。同時根據粗糙集理論,屬性約簡并沒有改變智能配電網低壓臺區綜合評價分析決策能力。

表2 各類約簡算法求解一個最優約簡比較Tab.2 Comparison of the optimal reduction of five algorithms
從表2中可以看出,AR-CEILV、AR-PR和 ARDM三種算法求解出的一個最優約簡中都包含6個條件屬性。PCA求解出的最優約簡中包含7個條件屬性,SVD求解出的最優約簡中包含8個條件屬性。其中AR-CEILV、AR-PR和AR-DM三種算法是基于粗糙集實現,求解出的最優約簡并不會造成原有智能配電網低壓臺區綜合評價決策表的信息損失,而PCA是基于統計分析,SVD是基于矩陣分解來進行約簡,不可避免都會造成原有信息的部分損失。


圖1 五種算法求解一個最優約簡的耗時比較Fig.1 Consuming time comparison of optimal reduction of five algorithms
實驗2:在實驗1的基礎上,針對約簡后形成的智能配電網低壓臺區綜合評價決策表,本實驗闡述了CE-LVHGEP的性能。整個實驗中GEP的參數如表3所示。圖2給出了GEP算法對約簡前后的智能配電網低壓臺區綜合評價決策表進行評價函數挖掘時的最優適應度與最大適應度值差值的比較。圖3顯示了在重復5次實驗,每次實驗算法運行10次的條件下,約簡前后GEP函數挖掘的平均耗時比較。圖4顯示了基于CE-LVHGEP挖掘得到的綜合評價函數模型對測試數據的模型值與真實值之間的比較。

表3 GEP參數Tab.3 GEP parameters
基于表3所示的GEP參數,挖掘得到最終的最優配電網低壓臺區綜合評價函數模型:


圖2 約簡前后GEP算法的最優適應度值與最大適應度值差值比較Fig.2 Comparison of difference between optimal and maximum fitness value before and after reduction

圖3 約簡前后GEP算法的平均耗時Fig.3 Average consuming time of GEP before and after reduction
從圖2中可以看出,針對本文所提供的實驗樣本數據集而言,約簡后比約簡前GEP算法進行智能配電網低壓臺區綜合評價函數挖掘所得到的最優適應度值與最大適應度值差值最大下降了約87.5%,根據定義6得到函數挖掘成功率最大達到約99.73%。這表明針對高維數據集,在不改變現有數據集決策分析能力的前提下,屬性約簡大大提高GEP函數挖掘的成功率。與此同時,圖3顯示,針對相同的智能配電網低壓臺區綜合評價決策表,約簡大大降低了GEP綜合評價函數挖掘的平均耗時,5次相同參數的實驗中平均耗時最大下降約66.43%。

圖4 綜合評價決策表中測試數據真實值與模型值比較曲線圖Fig.4 Comparison curves between the values of test data and model values in comprehensive evolution table
圖4反映了智能配電網低壓臺區綜合評價決策表中測試數據真實值與模型值之間的擬合程度。從圖4中可以看出,有關綜合評價測試數據基于式(2)計算得到的模型值與真實值之間最大的誤差為0.3,最小為0.01,R2的值為0.954。由此可以看出該模型具有較高的預測精度。
針對智能配電網低壓臺區綜合評價來說,基于CE-LVHGEP的綜合評價函數模型預測精度越高,對未來基于該模型進行智能配電網低壓臺區運行狀態的綜合評估和預測起到至關重要的作用。
隨著配電自動化、用電信息采集等應用系統的推廣應用,智能配電網低壓臺區的綜合評價對于整個配電網臺區的規劃、建設及運行具有重要的指導意義。本文提出基于混合基因表達式編程的智能配電網低壓臺區綜合評價算法(CE-LVHGEP)。在CELVHGEP算法中,為了對影響智能配電網低壓臺區綜合評價指標要素復雜多樣且數量眾多的問題,提出了基于粗糙集的智能配電網低壓臺區綜合評價指標約簡算法(AR-CEILV)。仿真實驗表明,CE-LVHGEP算法不僅可以快速挖掘出最優綜合評價函數模型,同時得到的模型還具有較高的預測精度。這為未來智能配電網低壓臺區運行狀態的綜合評估和預測奠定了良好地算法基礎。