王沛, 王翰林, 徐文濤, 路潔, 牛文浩
(國網寧夏電力有限公司, 寧夏 銀川 750002)
隨著經濟水平的快速發展,各工業領域對用電量的需求也持續上升。為充分滿足電力系統內各用戶端對電力使用需求量的增長,需對電力負荷進行準確預測,從而提前做好電力供應準備[1-3]。其中,短期負荷預測在當前電力網絡調度過程中發揮了重要作用,實際預測誤差將會直接影響全網系統的發電與供電預期安排[4-5]??紤]到當前大部分電力用戶都對供電能力提出了越來越高的標準,需達到穩定、經濟、高質量的多方面要求,在電網實時運行過程中會產生大量數據,并且存在多維度信息交錯的特征,為了對這些數據進行高效分析,需選擇具備優異聚類性能的模型[6-8]。以傳統數據挖掘模型進行分析時無法達到可視化的效果,嚴重制約了挖掘深度信息的過程[9-10]。
以神經網絡方法進行處理時會造成過擬合的結果,因此有學者重新設計了隨機權重神經網絡來消除傳統神經網絡需要進行梯度訓練的缺陷,實現訓練速率與泛化性能的大幅提升[11-14]。毛力[15]綜合運用結構風險最小理論以及最小二乘向量機對神經網絡進行了優化。此外還有研究人員利用權重神經網絡構建了特征映射網絡(SOM),通過對特征提取過程進行優化的方式來消除主觀盲目性產生的影響,從而適應更大范圍維數陷阱的條件,顯著提升了聚類分析性能,同時也獲得了更精確的模型預測結果[16]。根據以上研究結果,本文采用貝葉斯正則化方法構建SOM聚類算法,之后對其進行有效性驗證。
自組織特征映射網絡(SOM)作為一種高效自學習網絡,可通過非線性擬合的方式計算出多維數據的統計特征,同時還可以確保初始高維數據達到良好的拓撲性,由此實現可視化的效果。首先按照輸入與輸出2種結構層對SOM模型進行分類,再以權重向量完成各層神經元的連接,結構如圖1所示。

圖1 二維SOM結構
為獲得更高精度的SOM聚類分辨性能,本文進行權值調節的過程中加入了正則化方法并考慮了懲罰因子的影響,由此實現參數優化的效果,能夠顯著控制權值過度擬合的問題,最終通過以上處理方式獲得理想的聚類優化結果。
從整個算法流程考慮,權值優化是一個重要環節,對實際聚類性能存在顯著影響,通常根據神經元權值計算得到懲罰因子,再對其進行貝葉斯正則化轉換處理來實現權值調節的過程,從而得到以下優化結果,如式(1)。
wj(t+1)=wj(t)+αM(t),(j∈β(t))
M(t)=(m1(t),m2(t),…,mk(t),…,mn(t))
(1)
其中,mk表示對M進行調節的修正函數,根據這2個參數來得到包含各分布特征的目標函數,再利用以下表達式進行求解,如式(2)。
mk(t)=δEk(t)+δEw(t)
(2)
其中,Ek表示神經元在t時的經過修正后的權值。
各項超參數都是以隨機方式得到,按照以下式子計算出最大后驗概率對應的目標函數mk,如式(3)。
(3)
其中,λ表示修正系數。
利用SOM來完成貝葉斯正則化的計算如下所述。
1) 初始化網絡
設置初始學習率、神經元鄰域范圍以及最大迭代次數T;之后設置了判斷學習結束的條件,考慮到收斂準則受到多種因素的共同影響,需為其確定一個最大長度。
2) 競爭學習
對t時刻的各節點之間的歐式距離進行計算。按照隨機選擇參數的方式構建訓練樣本集Xi,以距離最近輸出節點作為最佳節點wj,構建計算式,如式(4)。
(4)
3) 修正值的優化
綜合運用Xi和神經元j確定最佳超參數,再通過校正處理形成新目標函數。
4) 更新權重
通過M計算出神經元j和BMU中的每個節點權重,計算式如式(5)。
wj(t+1)=wj(t)+αΔwij(t),(i∈β(t))
(5)
其中,wj表示t時j節點對應的權向量;a屬于取值介于0-1范圍內的訓練速率,以較緩慢的速率減小至0,通過式(6)進行計算。
Δwij(t)=xi-wj(t)
(6)
5) 迭代時先判斷是否符合設置參數條件,計算式如式(7)。
(7)
6) 在結果未達到最大訓練長度的情況下,應調整鄰域半徑,同時按照迭代的形式進行處理。直至兩次學習得到的權重誤差低于容許誤差時,學習結束。
輸出層拓撲屬于一種由二維網格組成的結構,該層內存在緊密關聯的節點與鄰域節點,能夠根據各自的特點開展學習,因此相鄰節點將會形成相近的權重,并達到與相近輸入節點的良好匹配性。
本文采用貝葉斯正則化的方式構建SOM聚類算法,選擇流程計算并確定以待測日和歷史日數據為數據庫。如圖2所示。

圖2 SOM聚類流程
總共設置了5個UCI數據集并驗證算法的可行性,這些數據集分別為Iris、Zoo、Wine、Balance-scale與Glass,本次測試的數據屬性及對其進行分類的結果,如表1所示。

表1 UCI數據集
評價算法效果時,同時考慮了聚類準確率以及凝聚度指標。
本文選擇寧夏某地區的電網作為測試對象,從中選出負荷樣本數據。為保證所有維度都能夠滿足負荷特征向量比較的要求,需先通過歸一化方法預處理,最終獲得的特征參數如表2所示。

表2 特征指標
在傳統Relief算法基礎上經過適當優化后計算獲得特征向量權值,經過適當選擇確定訓練和測試樣本,之后計算得到訓練樣本的Relief權重。利用以上程序總共運行3次獲得基本一致的結果,再計算得到權重均值。通過計算獲得由12個特征權重共同組成分布狀態,結構如圖3所示。

圖3 各特征權重分布圖
通過分析可知,4、8、10、12這些特征向量的權重值都達到了0.6以上,并且編號10峰時耗電率會明顯改變日負荷走勢的狀態。
將優化后的特征向量表示為T。通過改進后的Relief算法對電力系統負荷特征向量實施篩選,最終確定5個,大幅降低了特征量的數量。采用上述5項負荷特性指標得到日負荷曲線變化曲線,同時準確反饋特定點信息,達到簡化負荷描述的效果。
總共測試了3個存在顯著特征的用戶負荷(A類為高校用戶,B類為家庭用戶,C類為商業用戶),對其進行歸一化,結果如圖4所示。

圖4 用戶負荷曲線
完成參數的初始賦值后,再通過SOM神經網絡開展5次聚類,每次都按照同樣的分類方式進行,由此獲得平均準確率,如表4所示。

表4 SOM聚類結果
由圖4和表4測試結果可以看出,三類用戶的用電負荷在上班時間明顯處于高峰值,這符合實際情況。SOM算法準確率均在97%以上,驗證了本文模型的準確性。
通過改進后的Relief算法對電力系統負荷特征向量實施篩選,最終確定5個,大幅降低了特征量的數量,達到簡化負荷描述的效果。
測試了存在顯著特征的三類用戶負荷平均準確率,SOM算法準確率均在97%以上,驗證了本文模型的準確性。