董文娜,王增平,趙 喬,李鈺洋,辛忠良,陳玉蛟
(1.新能源電力系統國家重點實驗室(華北電力大學),北京 102206;2.國網河南省電力有限公司鄭州供電分公司,鄭州 450006)
配電網故障恢復是指當配電網發生永久故障時,通過網絡重構完成對失電負荷的供電恢復,故障恢復對實現電網自愈性、提升供電質量具有重要作用。現階段的配電網供電恢復決策主要采用在線運算的方式,通過某種智能算法生成轉供電方案[1]。在電網規模擴大、負荷供電要求嚴格的環境下[2],這種在線運算的方式將愈發難以滿足快速恢復供電的需求。免疫系統是生物體內高度復雜的自適應智能系統,近年來,蘊含在其中的諸多免疫機制被廣泛應用到工程領域中[3-5]。配電系統借鑒免疫系統的二次免疫應答思想,通過歷史或仿真故障案例構建事故預案集,將部分需要在線完成的供電恢復決策運算安排在故障發生前完成,使之在故障發生后立即根據網絡實際的故障狀態匹配事故預案,調用預案知識指導系統進行故障恢復決策,能夠提升故障恢復策略的生成速度。其中,配電網相似故障狀態匹配是實現該項技術的關鍵。
近年來,不同領域的學者對網絡相似性的度量開展了有益的探索。目前網絡相似性的研究主要依靠度量拓撲相似度與聚類兩個方向。度量拓撲相似度方法通過量化網絡的拓撲相似度來評估網絡的相似性。文獻[6]以網絡節點與邊重復率為標準來評估網絡的相似性;文獻[7]計算由兩個網絡的各子網絡鄰接矩陣特征值構成的向量之差的二范數作為衡量網絡相似性的依據;文獻[8]以拓撲共享度為相似性指標,建立拓撲相似性函數量化兩個網絡的相似性;文獻[9]將鄰接矩陣奇異值作為相似性分析指標,利用可靠性已知的配電網計算出與其相似的配電網可靠性。量化拓撲相似度方法選取的相似性評價指標僅對拓撲進行描述,而不結合具體應用領域,難以綜合反映相似網絡的特征。另一種網絡相似性分析思路是對拓撲結構進行聚類分析,根據某種距離計算規則將相似網絡劃分到同一類。文獻[10]依據節點間點不重復路徑對網絡進行聚類;文獻[11]基于對配電網結構、運行特點以及規劃工作的實際需要,將配電網拓撲結構進行概念聚類,用于指導配電網規劃問題;文獻[12]對配電網絡從宏微觀方面建立拓撲特征集,通過分層聚類實現配電網拓撲相似性分析。聚類方法依據樣本的自身特性對樣本進行相似性劃分,文獻[10-12]結合具體應用領域提出相應的聚類依據,選取的指標能夠較為全面地描述對象特征,但未對聚類初值對聚類效果的影響進行分析。
上述研究主要涉及配電網的規劃與可靠性評估領域,面向不同網絡的相似性分析,而故障狀態相似性分析則面向同一個網絡不同故障狀態下的供電恢復。相似故障狀態定義為某些故障狀態下故障恢復策略具有較強的相似性,因此,應面向故障恢復策略的生成特點構建故障相似特征指標體系。
針對上述問題,本文首先在分析供電恢復策略影響因素的基礎上,構建對故障樣本集相似性分析的特征指標體系;其次,鑒于聚類分析能夠根據樣本自身特征通過某種相似性度量方法對樣本集進行分類,在分析了不同聚類模型的基礎上,建立人工免疫聚類算法。該模型將免疫算法中的某些機制引入到k-means算法中,能夠彌補k-means聚類算法因對初值敏感易陷入局部最小值的不足。
在對樣本進行聚類之前,需建立能夠概括具有相似供電恢復策略的一類故障狀態的特征指標集。配電網供電恢復策略實質上是操作單個或一組聯絡開關,由備用電源實現對非故障失電區域負荷的轉供,供電恢復策略的生成主要與失電負荷大小、失電負荷分布情況及各源點的備用容量相關。因此本文將加權失電負荷量、各聯絡開關備用容量以及失電負荷-源點最短距離作為描述相似故障狀態的特征指標。
失電負荷量是指考慮負荷等級之后的等效失電負荷。故障發生后恢復非故障區域失電負荷的供電是供電恢復的主要目標,因此,失電負荷量是指導供電恢復策略生成的主要依據。失電負荷量主要由負荷等級和負荷大小兩個因素決定,其計算公式為

式中:ci為負荷i的等級系數;nl為失電負荷數;PNi為負荷Pi經歸一化處理后的標準值,且PNi∈[0,1],其計算公式為

式中:Pi為負荷i的有功功率;Pmax與Pmin分別為網絡中最大、最小負荷功率。
聯絡線備用容量表示的是各源點到與失電區域相連接的聯絡開關最短路徑上的額定功率與負載功率差額的最小值。該指標表征了各供電饋線對失電負荷的供電能力,若某條饋線的備用容量較大,則往往選擇閉合該饋線與失電負荷路徑上的聯絡開關實現供電恢復。因此,聯絡線備用容量是指導供電恢復策略生成的一個重要指標。
首先,利用潮流計算求出每條支路的實際電流值;其次,從故障位置處開始通過廣度優先搜索算法找到與其他饋線相聯系的聯絡開關,并通過Floyd算法求出源點到與失電區域相連的聯絡開關的最短路徑;最后,求出此最短路徑上的額定電流值與實際電流值的差值中的最小值,其計算公式為

式中:B為轉供電路徑上所有線路的集合;INi為線路i的額定電流;Ii為流過線路i的實際電流值;IM(s)為饋線s的備用容量,數據處理方式同式(2)。
若兩種故障狀態下各變壓器母線對失電負荷的供電能力情況相似,則二者在生成供電恢復策略時傾向于選擇用該聯絡線去恢復非故障區域供電,即表明這兩種故障狀態很大程度上具有相似性。
失電區域-源點最短電氣距離指的是變電站母線到失電負區域最短供電路徑。配電網中供電路徑延長往往伴隨著網絡損耗增加以及電壓質量下降等問題,在其他變電站能給所有失電負荷均勻供電的情況下,這些因素將對供電恢復策略的生成起指導性作用。
電源s的失電區域-源點最短電氣距離包括從源點到聯絡開關的最短距離DS以及從故障位置到聯絡開關的最短距離DF的兩部分。首先,以故障發生線路的末節點作為父節點,通過廣度優先搜索算法逐層搜索失電區域的聯絡點,并通過Floyd算法求出故障位置到聯絡點的最短距離DF;其次,由故障饋線的聯絡點出發,反向搜索可給失電區域進行轉供電的饋線,并計算出該饋線源點到聯絡點的最短距離DS。電源s的失電區域-源點最短電氣距離計算公式為

式中:N1為源點到聯絡點最短路徑上的支路條數;N2為故障支路末節點到聯絡點最短路徑上的支路條數;Zi、Zj分別為支路i、j的線路阻抗。
若某條饋線與失電區域不存在轉供電路徑,則該饋線的失電區域-源點最短電氣距離視為無窮大。因此,本文選用logsig函數將數據進行歸一化處理,如式(5)所示。

故障形態相似性判斷問題可轉化為考慮如何將相似故障狀態劃分到同一類別中。目前分類方法有人工智能領域中的神經網絡、Boosting等以及機器學習領域中的聚類分析。前者屬于有監督的分類學習方法,而聚類是一種無監督學習方式,訓練樣本的標記信息是未知的,目標是通過對無標記訓練樣本的學習來揭示數據的內在性質及規律,為進一步的數據分析提供基礎。而故障形態相似性判斷中故障樣本的所屬類別事先無從得知,即輸入樣本屬于無標記樣本。因此,選用聚類方法解決配電網故障狀態相似性判斷問題。
按聚類準則不同,聚類算法可分為基于模糊關系的聚類算法和基于目標函數的聚類算法[13]。后者應用最廣,本質是將聚類問題歸結為優化問題。對于優化聚類目標函數的算法,一般都采用梯度法求解極值,而梯度法的搜索方向總是沿著能量減少的方向,使得算法很容易陷入局部最小值,對初始中心點位置敏感是基于目標函數的聚類算法的一大缺點。免疫優化算法[14]采用全局搜索和局部搜索相結合的方法,對初始狀態不敏感,不容易陷入局部極小值,因此,將免疫優化算法與k-means聚類算法相結合,建立人工免疫聚類算法可彌補普通kmeans聚類算法的不足。
人工免疫聚類算法旨在將無標記的樣本故障網絡進行分類,將配電網故障恢復策略相似的樣本歸納成一個類型的子集,而故障恢復策略沒有共性的樣本則被分離。分類的準則是同類樣本間距離盡可能小,而不同類樣本間距離盡可能大,以此來提高該模型的聚類質量。在此基礎上,本文采用以離散度矩陣構造目標函數,不僅能反映同類樣本間的聚集程度,而且能反映不同類樣本之間的分離程度。
(1)定義類型i的離散度為


(2)定義類內離散度為

(4)定義類間離散度為

式中:mi為類別i的樣本中心點;mˉ為各樣本的特征指標均值。
為了提高聚類質量,要求類內離散度越小越好,類間離散度越大越好。因此,本文以式(9)作為人工免疫聚類算法的目標函數,即

該目標函數同時考慮了類內的離散度和類間的離散度,顯然,fT值越大,則聚類效果越好。
利用人工免疫聚類算法求解問題的流程如下。
(1)輸入初始化數據。如配電網絡的網絡結構、節點信息以及支路信息、聚類簇數k以及親和系數α等。
(2)隨機生成樣本。通過隨機選取o處故障位置及y種負荷變化情況,生成o×y個樣本故障網絡。
(3)樣本特征指標集。計算出每個o×y個樣本故障網絡的失電負荷量、饋線的可供電功率、失電區域-源點最短電氣距離,構建樣本特征矩陣XN×(2s+1)。其中,N=o×y,而s為配電網絡的饋線條數。
(4)編碼方式。設定抗體ci是一個一維行向量,每h位代表一個樣本中心點。其中,h=2s+1。人工免疫聚類算法的核心就是通過免疫機制調整樣本中心點的位置,以彌補k-means算法對初始值敏感的不足。
(5)目標函數的確定。本文以式(9)作為目標函數。
(6)初始抗體種群的產生。隨機產生R個初始子代群體,即R×k個初始樣本中心點。
(7)計算每個個體的適應度。
b.由式(7)和式(8)計算個體的類內距離 SI和類間距離SB。
c.由式(9)計算出每個個體的目標函數 fT。
(8)免疫濃度機制。免疫濃度機制控制和調節抗體的增殖方向,以確保搜索方向的多樣性,防止局部極大化。當抗體針對抗原有較高的親和度時,該抗體就增殖;當這個抗體的增殖濃度過高時就被抑制,即當某幾種分類方式極其相似且數量較多時,則該分類方式就應該被抑制。濃度概率的基本公式為

式中,pd為當抗體按濃度大小降序排列時的第t個個體的濃度概率;M為抗體總數。
抗體的濃度計算步驟如下。
a.采用Euclidean距離橫向抗體u和抗體v之間的結合強度,其定義為

式中:q為基因長度;q×k為抗體長度;ui、vi分別為抗體u和v的基因,依據第2節所述方法對ui、vi進行數據處理。
b.Auv是抗體u和v之間的親和力,定義為

式中,Huv為抗體u、v之間的結合強度,當Huv=0時,u和v的基因完全匹配,此時Auv=1。
c.抗體濃度是指某抗體及其相似抗體在群體中所占的比例,即

式中,λ為親和力常數,一般取(0.9,1.0)。
(9)變異算子。此處采用均勻變異算子,其操作過程如下:首先,依次指定抗體編碼串中每個基因作為變異點,即將樣本中心點的每一位作為基因變異點;然后,對每一個變異點以變異概率pm從對應基因值的取值范圍內取一個隨機數來代替原有基因值。

(10)群體更新。將第(9)步得到的N個個體作為下一代進化的初始群體。
(11)終止條件。終止條件設為兩次迭代適應度函數結果差值小于某個閾值時就停止迭代。若不滿足終止條件,更新進化代數計算器,t=t+1,返回步驟(5);若滿足終止條件,則輸出最佳個體,算法終止。
故障狀態相似性分析流程如圖1所示。

圖1 故障狀態相似性分析流程Fig.1 Flow chart of fault state similarity analysis
人工免疫聚類算法基于k-means聚類算法實現其功能,但k-means聚類算法需人為確定聚類簇數k,k值的選取將影響聚類效果。k值越大樣本被劃分得越精細,然而對于實際工程應用的借鑒價值則被大打折扣,因此在聚類之前要先確定“性價比”較高的k值。
“手肘法”是國際最常用于確定k值的方法,它的核心是誤差平方和SSE(sum of squared errors)。

式中:Cj為第j個簇;rc為Cj中所有樣本點;ci是Cj的樣本中心;SSE為所有樣本的聚類誤差,反映了聚類的效果。
手肘法的核心思想是隨著聚類簇數k的增加,樣本會被劃分得更加精細,每個簇的聚合程度會逐漸提高,則誤差平方和SSE自然也隨之減小。當k小于真實聚類數時,隨著k的增大SSE大幅下降,而當k趨于真實聚類數時,再增加k所得到的聚合程度回報會迅速變小,因此SSE的下降幅度驟減,隨后趨于平緩,也即,SSE與k值的關系曲線是一個手肘的形狀,而肘部對應的k值就是較為理想的聚類簇數。
本文以IEEE5饋線配電系統為例進行故障形態相似性分析。該配電系統有5條變電站母線,即有5個供電單元,網絡節點總數為39,包含34個負荷節點,支路38條,其中有4條支路以聯絡開關連接。IEEE 5饋線配電系統如圖2所示。

圖2 IEEE5饋線配電系統Fig.2 IEEE 5-feeder distribution system
由于在實際配電網中對聯絡開關的操作次數極少,配電網的網絡結構變化并不頻繁,而故障位置以及負荷波動均具有隨機性,因此,在生成故障樣本網絡時由隨機算法選取20條故障支路仿真故障發生,并隨機生成30種負荷變化情況模擬配電網運行方式的改變,由此隨機生成20×30=600個故障樣本網絡,如表1所示。其中,已排除無法由其他饋線進行轉供電的故障支路。

表1 故障樣本網絡集Tab.1 Fault sample network set
由第1節所述方法,依次計算600個樣本網絡的失電負荷量、聯絡線備用容量以及失電區域-源點最短電氣距離,結果如圖3、圖4和圖5所示。

圖3 故障樣本網絡的失電負荷量Fig.3 Power loss load of fault sample network

圖4 故障樣本網絡的聯絡線備用容量Fig.4 Reserve capacity of tie line for fault sample network

圖5 故障樣本網絡的失電區域-源點最短電氣距離Fig.5 Shortest distance between power loss area and source point of fault sample network
由手肘法確定聚類的簇數,其中,SSE與k值的關系如圖6所示。

圖6 SSE與k值的關系Fig.6 Relationship between SSE and k
顯然,k取5時是算例中故障樣本網絡的最佳聚類簇數。
確定聚類簇數為5后,對表1中的600個故障樣本網絡進行聚類,圖7是聚類結果的三維展示,距離度量方式采用的是歐氏距離。

圖7 故障樣本網絡的聚類結果Fig.7 Clustering results of fault sample network
由表2的聚類結果可以看出,在IEEE5饋線配電系統中,正常負荷波動對聚類結果影響較小,配電網故障恢復策略主要取決于故障發生位置。

表2 各類別中包含的樣本編號以及故障支路Tab.2 Sample numbers and fault branches included in each category
表2中,故障發生在支路7、9、27、30、31、32、33時所對應樣本歸為一類,分析圖2可知,當這些支路發生故障時,若僅操作一次聯絡開關,則對其失電區域進行轉供電的均為饋線3。支路24、26發生故障時,在聯絡開關操作一次的情況下,為其失電區域轉供電的為饋線1。仿真驗證和理論分析共同說明被劃分到同一類別中的故障樣本的供電恢復策略相似程度較高,可以互相借鑒。
在聚類算法中,通常選擇輪廓系數作為聚類性能的評估指標。圖8、圖9分別是k-means算法各樣本的輪廓系數以及人工免疫聚類算法各樣本的輪廓系數,可以看出,前者在[-0.2,0.8]范圍內波動,而后者主要在[-0.2,1.0]范圍內波動。表3列出了kmeans算法與用于人工免疫聚類算法的算法的平均輪廓系數的比較。可見,人工免疫聚類算法比kmeans聚類算法在聚類效果上更具優勢。

圖8 k-means算法各樣本的輪廓系數Fig.8 Contour coefficients of each sample in k-means algorithm

圖9 人工免疫聚類算法各樣本的輪廓系數Fig.9 Contour coefficients of each sample in artificial immune clustering algorithm

表3 平均輪廓系數比較Tab.3 Comparison of average contour coefficient
為實現事故預案的匹配,加快供電恢復策略的生成速度,本文提出了一種基于人工免疫聚類算法的配電網故障狀態相似性分析方法,所得結論如下:
(1)首先從影響供電恢復策略制定的因素入手,提取失電負荷量、饋線的剩余供電容量以及失電負荷到源點的距離作為故障網絡相似性評定的特征指標,當某條饋線的剩余供電容量大于等于失電區域的失電負荷量,并且距離失電區域較其他饋線都近,通常選擇閉合該饋線與失電區域的聯絡開關實現供電恢復;
(2)通過將免疫算法中的免疫濃度機制、變異機制引入到k-means算法中,使聚類中心點的調整方向更加多樣性,從而避免了k-means算法因對初始中心點選取不當而造成聚類效果不理想的問題;
(3)仿真驗證表明所提出的配電網故障狀態相似性分析方法表征配電網故障狀態的相似性,對供電恢復策略的匹配具有借鑒價值。