許長清,李科,孫義豪,皇甫霄文,馬杰
(國網河南省電力公司經濟技術研究院,河南鄭州 450052)
負荷過載將影響光伏配電網運行安全和電網調度能力,預測光伏配電網負荷過載能夠確保電力系統的安全穩定運行,降低光伏配電網的運行成本,對提高光伏配電網運行時的安全性有重要意義。
針對光伏配電網負荷過載預測問題,相關領域學者進行了相應的研究。文獻[1]根據光伏發電系統動態特性理論仿真分析,建立多項式等值模型,統一計算光伏發電系統、配電網靜態負荷,實現負荷過載預測。但是該方法計算量大,計算過程相對復雜。文獻[2]對影響光伏出力的各項指標進行統計與分析,采用層次分析法確定不同指標權重,通過模糊綜合評價法確認評價集,基于最小二乘支持向量機改進傳統粒子群算法,分配光伏出力情況。但是該方法成本高、準確率差,具有一定局限性。
模糊聚類法通過確定特征函數和聚類因子實現信息統計,具有統計范圍廣和精準度高的優點。該文基于模糊聚類法提出一種新的光伏配電網負荷過載預測方法。
通過模糊聚類確定數據信息,對論域中n個樣本分類,假設樣本數據集為M={m1,m2,…,mi},其中,i=1,2,…,n。對論域中的樣本進行二次細化分類,則有:
在樣本集中選取相似系數,根據確定的相似系數建立矩陣,按照光伏配電網因素,計算被分類對象間的相似系數riy,從而建立模糊相似矩陣Z[3-4],如式(2)所示:
在確定數據矩陣后處理數據,原始數據內部的異常數據導致處理結果準確度較低。為此,該文通過標準化處理剔除異常數據[5-6]完成信息挖掘,實現數據處理。
通過逐次平方法對式(2)中的模糊相似矩陣進行處理,獲得閉包關系矩陣L*,并取閾值μ,對其剪裁。對任意μ∈[0,1],記作t(L)μ=,從而獲得以下關系:
根據式(3)中的不同μ值,得到不同的分類和聚類結果。
根據聚類情況求得聚類中心,計算過程如式(4)所示:
其中,k為類別,k=1,2,…,m;p為樣本個數;表示得到的聚類結果;t表示聚類時間[7]。
綜合考慮不同樣本差異,統計不同樣本的相似性,根據相似性分析減少識別誤差,實現數據統計[8]。設P=(X,Y)為樣本X、Y間的相似程度,則計算公式為:
其中,γ和ε分別為E(X,Y) 和F(X,Y) 權重系數[9-10],且γ+ε=1。代入新樣本,確定相似度最大類別,并將其作為新樣本的類別。
在計算相似度過程中,需要采用平均加權算法,當離散度較大時,誤差較大,因此該文采用路徑分析方法分析權重,確定不同因子對結果的影響。權重分析過程中設自變量為a1,a2,…,ak,因變量為b。所以得到因變量序列為B={b1,b2,…,bn} 。根據因變量序列,得到自變量序列如式(6)所示:
根據序列關系得到自變量對因變量的直接路徑系數,如式(7)所示:
根據式(7)計算各自變量因子對因變量結果的影響情況,計算權重系數ρi:
在計算權重系數后,根據不同參數的權重系數排序,實現權重分析[12]。
通過模糊預測確定光伏配電網內部數據運行情況,由于運行過程會受到外界因素影響,因此光伏配電網數據會產生混亂,使模型的擬合性變差,該文通過提取預測特征,確保預測結果的準確性[13]。
該文采用替代法處理數據。記R={R1,R2,…,Rn}為含特征因子的數據序列,為含特征因子的平均數據序列,τ={τ1,τ2,…,τn} 為含特征因子的標準差序列,且R->3τ。數據元素式如式(9)所示,記Rij為Ri的第j個數據,則有:
光伏配電網具有周期性和波動性[14-15],溫度、濕度是影響光伏發電的主要因素,為了衡量兩個變量之間的相關強度,采用二維相關系數進行計算:
1)利用二維相關系數分析各特征與相關因子間的關系;篩選強相關關系,構建新特征。
2)比較分析1)中的新特征,并確認元素的相關性。
3)由于2)中存在過擬合風險,所以應避免過簡單線性擬合,具體流程如圖1 所示。

圖1 擬合流程
根據圖1 擬合流程得到最優數據,解碼最優數據,初始化樣本參數,利用模型處理樣本參數,并使用BP 神經網絡分析與優化數據。
考慮到光伏配電網中離散型和連續型數據狀態不同,因此需要綜合考慮配電網內部時間序列以及當前數據預測狀態,該文利用XGBoost+LightGBM模型,綜合考慮不同數據運行狀態,進行學習器訓練,提高數據融合的吻合性和準確性。融合負荷數據后處理與計算參數,得到優化參數,從而確定最佳新特征。
重復上述步驟,判定最終選擇是否保留組合特征,實現光伏配電網負荷過載預測。
為了驗證該文提出的基于模糊聚類法的光伏配電網負荷過載預測方法的實際應用效果,設計了相關實驗。分別在不同的天氣狀態下采用該文方法、文獻[1]基于高滲透率光伏等值建模負荷過載預測方法和文獻[2]空間負荷過載預測方法對某光伏配電網的負荷過載狀態進行預測。
不同天氣狀態下的光伏配電網參數如表1所示。

表1 光伏配電網參數
采用不同方法在不同的天氣狀態下預測,分析預測過程中的誤差,以平方絕對百分比誤差為指標判斷方法性能,計算公式如式(11)所示:
其中,eMAPE表示得到的平均絕對百分比誤差;N表示測試樣本數量;Zi表示光伏配電網輸出的實際功率;表示預測方法得到的光伏配電網輸出功率。
實際檢測過程中得到的預測結果如圖2-4所示。

圖2 晴朗天氣預測結果

圖3 多云天氣預測結果
觀察圖2 可知,在天氣狀態較好的情況下,三種預測方法都具有極好的預測能力,預測結果與實際結果基本一致。該文提出的預測方法相較于對比方法的預測功率與實際結果更接近,由此可知該文方法精度更高。
在多云狀態下,基于高滲透率光伏等值建模負荷過載預測方法的預測功率與實際值相差120 kW,空間負荷過載預測方法的預測誤差功率與實際值相差160 kW,信息傳遞受到嚴重障礙,工作人員需要花費大量時間剔除錯誤信息。該文提出的預測方法預測功率與實際值差值低于20 kW,受到天氣變化的影響較小。
觀察圖4 可知,暴雨天氣時,三種方法都存在一定的局限性。根據式(11)的計算結果,對比方法的光伏發電功率預測誤差已經達到20%以上,最高達到40%,信息的實際可借鑒能力極差,用戶無法判斷光伏配電網的實際工作狀態。該文提出的方法通過模糊聚類確定數據信息,使惡劣環境的影響降到最低,預測精度在95%以上,預測誤差低于5%,仍然具有很強的參考能力。

圖4 暴雨天氣預測結果
根據上述預測結果和誤差公式統計預測誤差如表2 所示。

表2 預測誤差結果
根據表2 實驗結果可知,隨著天氣不斷變化,對比預測方法預測能力出現明顯下降。綜上所述,該文提出的模型與算法,通過導入參數得到優化后的參數,對樣本處理更加準確,提高了該文方法的預測精度;對XGBoost+LightGBM 學習器模型進一步改善,使預測結果的普適性得到大幅提升,運算速度也得到較大改善。
文中基于模糊聚類法對光伏配電網負荷過載預測,分類識別光伏配電網負荷,得到不同因子對光伏配電網負荷過載的影響,提取樣本數據特征,進行模糊預測,增強了該文預測方法運算的準確性和普適性。結果表明,該文提出的預測方法預測精度較高,具有可行性以及實用性,對生產生活起到幫助作用。在之后的研究中,將進一步對數據特征嘗試更深層次的挖掘與處理。