陳顥元,蔣瑋,韓俊
(1.東南大學電氣工程學院,江蘇 南京 210096;2.國網江蘇省電力有限公司經濟技術研究院,江蘇 南京 210008)
當前,分布式光伏發電在配電網中的滲透率逐年提升[1—7]。由于光伏發電系統輸出功率本身具有極強的隨機性和波動性,有效評估配網系統電壓風險的需求變得日益迫切。概率潮流計算是一種評估配網系統電壓風險的重要手段[8—11]。在使用模擬法進行概率潮流計算時,其準確性很大程度上取決于輸入變量建模的準確性[12—15]。因此,在光伏接入評估等計算應用時,應綜合考慮各因素對光伏電站輸出功率的影響,生成典型性的場景模型作為蒙特卡洛方法的抽樣對象[16—18]。
目前,配電系統的光伏輸出功率建模仍不完善,這是由于傳統使用的Beta、Weibull等概率模型往往不能真實地反映實際運行狀態[19—20]。在光伏高滲透率配電系統中,一個集中區域內往往存在多個光伏電站,其參數、地理位置和運行時間之間均存在相關性。為考慮電站之間的相關性,文獻[21—22]在光伏電站建模中分別引入了NATAF變換和Cholesky分解。文獻[23]使用Copula函數直接獲取各光伏電站輸出功率的聯合概率分布。文獻[24]提出混合Copula函數建模法,使用歐式距離判定最優Copula函數。該文獻指出:受氣象、光照、運行方式等外界條件影響,各光伏輸出功率之間的相關性可能會發生變化,單一的概率模型不能很好地應對外界條件的變化。文獻[25]提出利用K-means聚類和Copula函數來建立多場景概率模型,其中K-means聚類的參數確定常依賴經驗。
針對上述問題,文中引入了一種基于局部密度中心的聚類算法(local density clustering,LDC)。首先,提出考慮相關性的光伏輸出功率多場景模型建立方法。該方法結合LDC聚類方法、核密度估計法和Copula函數,將各光伏輸出功率聯合分布函數場景化。其次,對生成的多場景概率分布模型進行抽樣,對生成的樣本進行概率潮流計算。模型考慮多個光伏電站輸出功率間相關性以及輸出功率隨外界條件的變化,可實現配電網多個光伏輸出功率的精準建模。最后,為驗證文中方法的可靠性,將場景優化方法應用于某地區實際配電網結構的節點系統,進行算法性能分析。
為計算概率潮流,須獲得配電網光伏輸出功率以及負荷的概率分布。在估計未知隨機變量的概率密度函數時,須對已知概率密度函數的參數形式進行估計。由于Beta分布、Weibull分布等一些常見的概率密度形式往往不能準確反映實際概率分布,故文中采用核密度的方式進行估計。
核密度估計法要求使用平滑的峰值函數(即核函數)來擬合數據樣本。對于滿足獨立同分布的n個樣本點(x1,x2,…,xn),設其概率密度函數為f,則核密度估計函數為:
(1)
式中:K(·)為核函數;h為平滑參數,稱作帶寬;Kh(x)為縮放核函數,如式(2)所示。
(2)
核函數的選擇需要符合概率密度性質,常用的核函數包括方波函數、三角函數、雙峰曲線、三峰曲線、高斯曲線等。文中選用高斯核函數,即K(x)為高斯分布的概率密度函數,如式(3)所示。
(3)
作為一種非參數化方法,核密度估計法面對任意的概率分布無須預先假設已知的標準形式。由于該方法具有較好的預期準確度,因此可被用于估計光伏輸出功率和負荷的概率分布情況。
文中采用核密度估計法得出配電網中的各光伏輸出功率,推導出若干單個光伏輸出功率的概率模型。當配電網接入多個光伏電站時,場景生成建模應考慮模型間的相關性。因此,文中采用Copula函數理論獲取多個光伏電站的聯合概率分布。
Copula函數能將多維隨機變量的聯合分布函數與各自的邊緣分布函數連接起來,為求取聯合分布函數提供靈活的方法。
對于邊緣分布函數F1(x1),F2(x2),…,Fn(xn),存在一個Copula函數C滿足:
F(x1,x2,…,xn)=C[F1(x1),F2(x2),…,Fn(xn)]
(4)
當F1(x1),F2(x2),…,Fn(xn)連續時,Copula函數C唯一確定。文中將服從任意分布的xi轉換為均勻分布ui=Fi(xi)。
常用的Copula函數主要有高斯Copula 函數、t-Copula函數、Gumbel Copula函數、Clayton Copula函數和Frank Copula函數等。不同的Copula函數在描述隨機變量相關性方面具有明顯的差異[26]。Copula函數的構造步驟為:首先,確定各隨機變量的邊緣分布;然后,選取合適的Copula函數形式;最后,估計模型中的參數。
針對以上步驟,文中采用核密度估計的結果作為隨機變量的邊緣分布,選取歐式距離法確定最優的Copula形式以描述輸出功率的相關結構,并使用極大似然方法對模型進行參數估計。文中構建的基于Copula函數的概率模型可準確描述配電網多個光伏電站輸出功率的概率特性,并反映光伏輸出功率等隨機變量之間的相關性。
基于Copula函數的光伏電站建模方法考慮了多個輸出功率之間的相關性,但未考慮到相關性可能隨天氣、運行方式等外界因素影響發生的變化。因此,本節借助聚類這一數據挖掘方法,將單一的概率函數模型改進為多場景模型。文中使用核密度估計和Copula函數,對每個場景下的數據分別估計輸出功率的聯合概率分布,進行精細化建模。
聚類分析可挖掘數據樣本之間的內在規律,該方法已廣泛應用于電力系統的場景生成、故障篩選等領域。由于常見的K-means聚類方法存在對噪音和異常點敏感、依靠經驗確定類數等問題,文中使用LDC聚類算法來確定聚類中心,定義樣本的局部密度作為聚類依據。該方法可自動生成類數和聚類中心[27],并剔除異常點。光伏輸出功率LDC聚類流程如圖1所示。

圖1 光伏輸出功率LDC聚類流程Fig.1 Diagramfor LDC clustering of PVoutputs
LDC聚類算法的具體步驟如下:
(1) 假設配電網接入的光伏電站數量為N,獲取N個電站輸出功率的歷史數據構成原始數據集P。Pi=(Pi1,Pi2,…,PiN)為數據集P內的其中一個樣本點,表示某一時刻i下所有光伏電站的輸出功率,是一個N維向量。
(2) 對每個輸出功率樣本點Pi,定義每個樣本點的局部密度函數ρi為:
(5)
式中:dc為截斷距離,是預先設定的參數;dij為2個樣本點之間的距離。對于函數χ(a),當a>0時,其值為0,否則為1,如式(5)所示:

(6)
(3) 定義每個樣本點的距離偏量δi,其含義為所有局部密度大于樣本點Pi的樣本點到Pi的距離的最小值,即:
(7)
(4) 確定聚類中心。聚類中心需要滿足以下條件:樣本點本身的局部密度ρi大于周圍點的密度,且樣本的距離偏量δi應盡可能大。綜合考慮以上條件,建立指標ρi×δi。當該指標大于設定的閾值,判定該點為一個聚類中心。
(5) 對其余樣本點歸類。首先,對樣本點按ρi降序排列;其次,選取Pi,Pj,根據Pi的具體情況選取Pj,Pj滿足局部密度高于ρi且距離值dij最小,把Pj的類別標號賦給Pi;最后,根據局部密度的降序依次對樣本點進行類別賦值,形成多個場景。

文中建立一個多光伏電站輸出功率模型,該模型將各光伏電站輸出功率的相關性及相關性隨外界條件的變化考慮在內。在對數據進行LDC聚類后,通過核密度估計法和Copula函數獲取各光伏電站輸出功率聯合分布函數,并將其場景化。基于多場景模型的概率潮流計算流程如圖2所示。

圖2 基于多場景模型的概率潮流計算流程Fig.2 Probabilistic power flow calculation based on multi-scenarios model
場景生成的具體步驟如下:
(1) 獲取配電網絡下所有光伏電站的歷史數據,并進行數據清洗和預處理。
(2) 對數據集進行LDC聚類,產生N類場景,按照各場景建模,形成光伏輸出功率多場景模型。
(3) 使用核密度估計方法,按場景獲取各光伏電站的邊緣概率密度函數。
(4) 對每類場景的邊緣概率密度函數,構建各理論Copula函數,參數估計使用極大似然估計法。采用歐式距離法得到最優Copula函數,以此建模。
(5) 生成光伏輸出功率樣本。首先,使用拉丁超立方抽樣(latin hypercube sampling,LHS)采樣法[28—29]對每個場景下的Copula函數抽樣。假設總采樣數量為K,則每一場景下的采樣數量Ki根據各場景發生概率進行確定。其次,對每一類中抽取的樣本進行組合,生成全體光伏輸出功率樣本。
在進行配電網潮流計算時,除了光伏建模,還需考慮各負荷的概率分布。因此,使用核密度估計法進行估計時,先使用LHS采樣法對概率分布進行采樣,生成典型負荷樣本。根據光伏輸出功率和負荷樣本的典型場景,結合蒙特卡洛法實現各場景的概率潮流計算,進而評估配電網的運行狀態。

(8)
(9)
式中:μa,i,σa,i分別為基準方法的節點電壓均值和標準差;μc,i,σc,i分別為計算結果的節點電壓均值和標準差。

(10)
式中:k為運行次數。
文中采用的算例基于某地區某實際配電網結構,相關配電網參數來源于該實際電網。系統的接線如圖3所示。其中,2臺光伏電站(PV1、PV2) 位于圖1節點系統中的12、18號節點。

圖3 配電網系統接線Fig.3 Distribution test system
所有節點的基準功率為100 MV·A,除0號變電站高壓側節點的基準電壓為110 kV,其余節點系統的基準電壓為10 kV。發電機組的額定容量均為1 MV·A,發電機組實際輸出功率和各節點負荷的歷史數據來源于實際的用電信息采集系統。
對于PV1、PV2的輸出功率歷史數據進行LDC聚類,結果如圖4所示。

圖4 光伏輸出功率聚類結果Fig.4 Clustering Results for PV Output
由圖4的聚類結果可知,光伏輸出功率場景被分為5類,對應5個場景,黑色為離群點。每個場景下,2個光伏電站所有時刻有功輸出功率構成的向量分別為:Pk1,Pk2(k=1,2,3,4,5)。為了對比各個場景下數據的相關性變化,統計5個場景和原始樣本Pk1,Pk2之間的皮爾遜相關性系數ρPk1,Pk2。
(11)
式中:Cov(·)為協方差函數;σ(·)為標準差函數。
各場景的相關系數與原始樣本差異見表1。

表1 皮爾遜系數相關性分析Table 1 Pearson coefficient analysis
由表1可知,單一的建模方法往往只能反映部分樣本的相關性,無法適應所有樣本。基于LDC聚類的光伏輸出功率多場景生成方法有望解決這一問題。對各場景的輸出功率進行核密度估計,如圖5所示。
圖5為各光伏電站在各場景下的邊緣概率分布,其中坐標軸下方的黑線表示光伏輸出功率在各場景下的樣本,藍色陰影表示通過核密度估計得到的邊緣概率分布。根據各輸出功率的邊緣概率分布,按場景進行Copula 函數建模。使用歐式距離法得到該場景下的最優Copula函數,并統計各場景樣本占比,生成結果如表2所示。同時對各Copula進行LHS采樣,可得到概率潮流計算所需的樣本。


圖5 各場景下輸出功率邊緣分布Fig.5 PVs′ marginal distribution in different scenarios

表2 各場景Copula模型Table 2 Copula models of each scenario


表3 計算誤差指標對比Table 3 Computing error comparision %



表4 算法穩定性分析Table 4 Method′s stability index
根據計算得到的節點電壓概率分布,可以計算節點電壓的期望值和置信區間,從而評估電壓質量。根據國網經研院相關標準,電壓允許偏差為正負7%,據此可計算出各節點電壓的合格率和越限概率。
節點18在各場景下電壓幅值統計情況如表5所示。各場景下的電壓越限概率差距較大,其中電源輸出功率最大的場景5達到了19.38%。運行與規劃人員可根據各場景下電壓越限概率,采取相應的措施以保障系統安全經濟運行。

表5 節點18各場景電壓幅值分析Table 5 Voltage magnitude analysis of node 18 in each scenario


圖6 采樣規模對計算結果的影響Fig.6 Performance of different sampling number
由圖6可知,對于LDC聚類方法、K-means聚類方法以及傳統蒙特卡洛方法來說,取樣次數N越大,算法誤差越小。這3種方法均存在一個閾值,在采樣數量方面提升至閾值后,計算精度的提升十分有限。由圖6可知,文中方法的閾值小于基于K-means方法和蒙特卡洛法的閾值,且達到閾值所需的采樣規模最低。這意味著,為了達到較為滿意的精度,使用文中方法可采用更小的采樣規模,從而減小算法的計算負擔。在實際計算中,當誤差達到閾值后,可停止增加采樣數量。
文中提出了基于LDC聚類的多場景生成方法,用于計算含有光伏接入配電網的概率潮流,從而進行配電網狀態評估。該方法考慮了光伏輸出功率相關性隨電站運行方式等不同場景發生變化的情況,實現了更為精確的輸出功率建模。相比于K-means聚類的建模方法,文中方法在計算精度和算法穩定性方面均實現了提升。
文中在建立配電網模型時,作出了配電網拓撲不發生改變的假設。而在中長期配電網的規劃下,配電網拓撲將發生改變。因此,后續可以針對這一情況作出進一步研究。
本文得到國網江蘇省電力有限公司科技項目“考慮光伏接入的配電網電壓風險分析及最優接入容量規劃技術研究”(J2019057)資助,謹此致謝!