李 婧, 田龍威, 王艷青
(上海電力學院 a.計算機科學與技術學院; b.電氣工程學院, 上海 200090)
電力系統穩定安全有效的運行關乎國計民生。文獻[1-2]的研究表明,電力系統短期負荷預測的準確性對電力系統合理運行具有十分重要的作用,是電網分配電能的重要依據。
電力系統中的負荷預測對電力企業來說十分重要,有助于合理規劃電力的生產輸送和傳輸分配。文獻[3]提出,由于諸多因素(比如季節、假期、周末和社會發展等)的影響,導致電力負荷的時序變化呈現不規則的曲線,因此必須全面分析各種因素對電力系統的影響,找出內在規律,才能建立合適的高精度的預測模型。國內外學者對此進行了大量的研究,常用的算法也有很多,比如神經網絡、時間序列、灰色模型、隨機森林等。文獻[4]提出了一種多變量時間序列的控制自回歸模型進行短期預測;文獻[5]提出了一種基于極限學習機的短期負荷預測集成預測模型并利用混合算法提升精度;文獻[6]利用電力系統負荷的局部特征并利用人工免疫算法進行短期負荷預測;文獻[7]考慮了多種因素,利用粒子群改進算法模型以提高預測的精度;文獻[8]在Spark分布式集群環境下搭建了并行隨機森林回歸算法模型進行預測,該算法表現出了良好的魯棒性;文獻[9]針對電力用戶,按用電特征“分層”得到了表征不同類型電力用戶用電特征的層負荷特性曲線,并以匯集方式回歸建模;文獻[10]采用改進誤差最小化的差分進化算法,以提高人工神經網絡的精度;文獻[11]最早提出了徑向基函數(Radial Basis Function,RBF)的概念;文獻[12]將RBF運用于神經網絡中,提出了3層RBF網絡模型;文獻[13-15]中的神經網絡以其快速的學習速度、良好的泛化能力被廣泛應用于各種分線性擬合、時間序列分析等問題。
針對RBF網絡在電力負荷預測中由層數引起的過擬合或欠擬合的缺陷,本文利用RBF模型優越的擬合能力和遺傳算法(Genetic Algorithm,GA)強大的進化尋優能力,提出一種GA-RBF電力系統短期負荷預測模型。并利用電力系統實測負荷數據,分析GA-RBF模型和RBF基本模型的預測效果,以驗證所提出的電力系統短期負荷預測模型的精確性。
基于電力系統負荷數據序列的非線性特征,利用RBF強大的擬合能力,能更好地尋找負荷數據的內部規律,采用GA優化RBF網絡中的層數,構成GA-RBF模型,優化傳統RBF模型的不足,實現更精確的預測。
GA是根據生物進化方式而產生的一種隨機化的啟發式算法模型。文獻[16]提到,GA通過對種群進行遺傳操作實現種群個體的迭代優化,以得到更好的適應度。其遺傳操作主要是對種群進行選擇、交叉、變異操作從而實現種群進化。
(1) 適度函數的選擇 適度函數的取值直接決定GA種群中個體的優劣。本文中GA主要對RBF網絡訓練以發現最優的隱藏層數,而種群的隨機性易使RBF預測模型產生過擬合。為避免過擬合,故選平均絕對百分誤差(Mean Absolute Percentage Error,MAPE)為適度函數。
(1)
式中:yi——第i次預測的值;


(3) 交叉和變異 交叉和變異都是根據事先定好的概率選擇相應的種群個體進行操作。交叉主要是兩條染色體根據交叉位點互換部分染色體進而產生新的個體;變異主要是對選擇的染色體上的某點進行取反變換,即0變成1或1變為0的操作。
圖1為一種高效的采用局部逼近方式的RBF神經網絡的3層結構圖。

圖1 RBF神經網絡結構
圖1中,x為神經網絡的輸入向量,x=(x[1],x[2],x[3],…,x[m]);w1,w2,w3,…,wn為網絡的隱藏層到輸出層的權值;y為輸出向量。RBF可以逼近任意非線性函數,在訓練中,相比其他神經網絡更加簡潔且有更快的收斂速度,并且Cover定理也保證了RBF神經網絡在數學上的合理性。
1.2.1 RBF神經網絡的基本構成
RBF網絡輸入層的選取直接影響著輸出結果的精確度。本文選取影響電力系統負荷預測的相關因素,如溫度、星期及延遲一階的數據等作為輸入層。
RBF網絡隱藏層的激活函數為徑向基函數——局部沿中心點徑向對稱增加或衰減的非負線性函數。由于高斯函數形式簡單且對多變量的輸入復雜程度也不增加太多,故本文選取常用的高斯函數作為其激活函數,即
(2)
式中:x——隱藏層節點的輸入向量;
ci——第i節點的中心向量;
σi——第i節點高斯函數的寬度;
‖‖——歐式范數。
RBF的輸出層即為預測結果,根據預測需求可以是單個預測值也可以是多個預測值。本文的預測結果為單個預測值,其表達式為
yi=WΦi
(3)
式中:W——權值向量;
Φi——隱藏層中心向量。
1.2.2 RBF神經網絡隱藏層的結構設計及權值修正策略
RBF神經網絡的兩個主要問題是網絡隱藏層的結構設計問題和輸出層的權值修正問題。RBF的結構設計就是采用非線性優化方法對隱藏層節點數的確定以及函數的參數優化問題,隱藏層的神經元數目應在一個合理的范圍內,過小通常會造成模型泛化嚴重,過大則會造成過擬合問題。一般情況下,其數量應在[n,m]范圍內(n是輸入層數量,m是樣本總數)。由于樣本總數較大,因此其數量應遠小于樣本總數。
首先,針對RBF神經網絡的結構設計,本文使用Kmeans聚類算法對數據進行分類。隱藏層的神經元數目N即為分類數據的k值,利用Kmeans算法可求出聚類中心ci和徑向基函數的寬度σi
(4)
數據分類過程中k值的好壞會直接影響RBF神經網絡的性能。本文將訓練數據集劃分為a和b兩部分,利用遺傳算法得到最優的N值,即得最優k值。
其次,采用負梯度下降方式更新權重。定義RBF神經網絡的誤差函數和性能函數分別為
(5)
(6)
RBF輸出層的權值調整策略為
(7)
式中:Wm——m次迭代的權值矩陣,m=0,1,2,…,imax,imax為最大迭代次數;
η——學習速率,0<η<1;
em——m次迭代的誤差矩陣。
定 理η為學習速率,則當0<η<1/N時神經網絡算法收斂。
證 明取Lyapunov函數為J(m)=0.5e2(m),則
ΔJ(m)=0.5e2(m+1)-0.5e2(m)
(8)

故可得
ΔJ(m)=0.5[e(m)+Δe(m)]2-0.5e2(m)=
Δe(m)[e(m)+0.5Δe(m)]=

(9)
(10)
又有
(11)
(12)
由式(9)和式(12)可知,0<η<1/N,即當學習速率滿足0<η<1/N時,ΔJ(m)<0,因此本文算法是收斂的。
改進的RBF神經網絡訓練基本步驟如下。
步驟1 初始化數據集:對實驗數據進行去噪和標準化處理,以減少不合理數據對預測的影響并減小計算量。以某地區3個月的歷史負荷為訓練數據集,實驗數據每1 h采集一次,一天共計24點的負荷數據。由于原始數據一般范圍比較大且其量綱不同,故對數據進行標準化處理以簡化計算。
(13)
步驟2 將訓練數據集劃分為a和b兩部分,其中b部分為選取訓練集某日的數據,a為訓練集中去除b部分的數據。
步驟3 利用GA生成初始種群。
步驟4 利用種群參數,令Kmeans算法中k=N將數據分類,根據分類結果得到分類中心,即為隱藏層徑向基函數的中心c。寬度σ可由式(4)計算得出。
步驟5 利用步驟4隱藏層個數N,徑向基函數的中心c及寬度σ構建RBF訓練模型,對數據集進行訓練,并利用負梯度下降法更新權重,直到精度滿足要求或迭代次數達到最大值。
步驟6 利用訓練好的RBF模型對訓練集中待預測日進行預測,然后計算每個種群的適應度,即MAPE。
步驟7 判斷條件是否停止。否,對種群根據各自適應度進行選擇交叉變異,然后轉向步驟4;是,進入下一步驟。
步驟8 按照訓練結果選擇種群中適應度最優的個體作為RBF的隱藏層層數N,對整個訓練集數據進行訓練,獲取GA-RBF神經網絡模型各參數。
步驟9 對待預測日進行預測,獲取待預測日的電力負荷數據。
本模型的流程圖如圖2所示。

圖2 模型流程示意
根據所建立的模型對某地區2009年5月16日(周末日期更具代表性)每小時的負荷數據(一天共計24個負荷值)進行預測。訓練數據取2月1日到5月15日的歷史數據。變量的編碼位數和種群數目為11和10,遺傳次數為50,交叉和變異概率分別為0.75和0.1。
利用GA-RBF神經網絡建立的負荷預測模型對訓練數據進行訓練,模型的適應度變化如圖3所示。

圖3 模型適應度的平均值和最優值變化曲線
由圖3可知,經過50代的遺傳變異,模型的最優適應度達到了1.113 4,對應最佳層數為956層,此時模型的泛化能力達到最佳狀態。
利用所建GA-RBF神經網絡預測模型和基本RBF模型分別對電力系統短期負荷進行預測。基本模型主要采用MATLAB內置net=Newrb()模型,通過定義其合適的隱藏層數進行預測。不同模型的預測結果曲線和預測誤差如圖4和圖5所示。

圖4 不同模型的預測曲線對比

圖5 兩種模型的預測誤差對比
由圖4可以看出,本文算法的預測效果更好,能以更小的誤差擬合待預測日的負荷曲線。從圖5可以看出,GA-RBF算法有效地減小了模型的預測誤差。
為了更精確對比兩種模型,本文選取兩種量化指標對預測效果進行分析,分別為MAPE和平均絕對誤差(Mean Absolute Error,MAE)。
(15)
對比模型是MATLAB中基本的RBF預測模型和GA-RBF模型。表1為2009年 5月16日每小時負荷預測結果對比,表2為量化指標結果對比。

表1 2009年5月16日每小時負荷預測結果對比

表2 量化指標結果對比
由表1可以看出,GA-RBF模型相對于RBF模型擁有更小的誤差;由表2可以看出,GA-RBF模型相比于基本的RBF模型的MAPE值降低了4.7%,同樣GA-RBF模型的量化指標MAE相較于RBF模型降低了60.27 kW。由此可知,改進的RBF模型能夠更加有效準確地對電力負荷進行預測,且相較于RBF模型擁有更高的精度。
每個日期及總的量化指標數據比較如表3所示。由表3可知,GA-RBF模型有更準確的預測結果,進一步驗證了該模型的有效性。

表3 量化指標結果對比
本文利用RBF高效的非線性擬合特性進行了電力系統短期負荷預測,提出了一種GA-RBF神經網絡的電力系統短期負荷預測方法。既能有效地確定網絡的最佳層數,又能避免網絡的過擬合問題。通過仿真結果可知,相比于傳統RBF神經網絡預測模型,GA-RBF神經網絡預測模型具有更準確的預測結果和良好的泛化能力。