徐建平 ,胡濟恒 ,孫衛哲
(1.國網浙江省電力有限公司金華供電公司,浙江 金華 321000;2.北京眾智新能科技有限公司,北京 100080)
電力負荷不僅受到氣象因素例如氣候、溫度、濕度的影響,也會受到消費者居住模式和生活方式的影響。氣象因素的變化莫測加上消費者的隨機和非線性行為均為電力負荷的預測工作帶來巨大的阻礙。在文獻中,電力負荷的預測方法主要分為兩類:經典的統計模型,具有預測效率高、模型構建容易的優點,但是也存在處理非線性時間序列能力較差、對數據質量要求高以及需要基于一定假設條件的缺點;機器學習模型,具有預測精度高,善于處理非線性時間序列的優點,但是其在處理非線性時間序列時也具有學習能力有限、容易陷入局部最優和過度擬合、靈活參數過多等問題。
鑒于以上問題,混合預測模型逐漸發展起來,郭威麟等人為了降低負荷序列的非線性,提出了基于集成經驗模態分解法(EEMD),BP神經網絡和遺傳算法的短期負荷預測法,實驗結果表明該模型預測精度更高,穩定性更強[1]。龍金蓮采用粒子群算法優化最小二乘支持向量機對短期電力負荷進行了預測,并得到了滿意的實驗結果[2]。李冬輝等人提出了一種將多種群的果蠅優化算法(MFOA)和廣義回歸神經網絡(GRNN)相結合的混合年電力負荷預測模型,實驗證明提出的模型預測性能優于其它對比模型[3]。
本文結合了分解技術與優化算法的優勢,提出了基于具有自適應噪聲的完整集合經驗模式分解(CEEMDAN)、多目標花授粉算法(MOFPA)和ELM 的混合模型。首先,利用CEEMDAN 將原始序列分解成若干IMF,然后剔除其中的高頻噪聲分量,重構負荷序列。最后以預測精度和預測穩定性為2個優化目標,用MOFPA 優化ELM,對江蘇省月度電力負荷進行預測。
經驗模態分解(EMD)是Huang等人[4]提出的一種自適應信號時頻處理方法,該方法根據數據本身在時間尺度上的特征對信號進行分解,而無需預先設置任何基函數。它將序列分解為有限數量的本征模態函數(IMF)。每個IMF分量在不同時間尺度上代表原始信號的不同特征。
EMD在處理非平穩和非線性信號方面具有很大的優勢,但是仍然存在“模態混疊”問題。通過將高斯白噪聲添加到信號中,集成經驗模式分解(EEMD)算法,在很大程度上消除了EMD 算法中的模態混疊問題。但是,EEMD算法無法在信號重構后完全消除高斯白噪聲,從而導致重構誤差。CEEMDAN作為EEMD的改進版本,更有效地消除了模態混疊,重構誤差幾乎為零,大大降低了計算成本[4]。
定義通過EMD獲得的第j個模態分量的算子E j(·),將w i(t) 設為具有正態分布N(0,1)的白噪聲。CEEMDAN算法的步驟如下。

式中:M表示IMF的總數量,IMF在不同的時間尺度上共同構成原始信號的特征。


與解決單目標問題不同,多目標優化問題無法通過算術關系運算符比較不同解決方案的優劣。為此,通常定義包括帕累托占優、帕累托最優性、帕累托最優集和帕累托最優前沿來解決多目標優化問題[5]。為了提高預測精度和穩定性,本文定義了2個目標函數如下:

極限學習機由Huang等人開發,是一種緊湊高效的單層前饋神經網絡學習算法,其學習效率和泛化能力均高于傳統的前饋網絡[6]。它具有結構簡單、預測準確性高、預測能力和實時學習能力強、計算速度快和訓練樣本需求少的特點。假定X是一個單標簽樣本,Y表示分類,其中X∈R d且Y∈R C。極限學習機的輸入層,隱藏層和輸出層分別有d、h和C個節點。該網絡的獨特之處在于,輸入層的權重和偏差會隨機初始化,并且不會進一步更新。模型過程可表示為:

式中:Y={y1,y2,…,y C},Z={z1,z2,…,z h} 表示隱藏層輸出;β表示隱藏層和輸出層之間維數為h×C的權重矩陣。進而,權重矩陣β可以表示如下:

式中:Z?表示Z的摩爾-彭羅斯逆。一旦獲得了權重矩陣β,極限學習機方法就已經完成了訓練階段,并準備進入測試階段。
機器學習模型通過對觀測值進行訓練學習,來擬合序列的復雜特征,進而提供較為精確的預測結果。因此,建立機器學習模型時往往需要基于一定量的歷史觀測值,具體觀測值的數量通常依據多次實驗經驗確定。現有研究證明混合預測模型在電力負荷預測方面具有良好的預測性能,基于文獻[7]的研究,本文提出了基于機器學習的混合預測模型,其在數據處理方面能更好地消除隨機噪聲的影響,且基于ELM 的機器學習預測模型計算效率顯著提高。提出的基于機器學習的混合預測模型框架主要可以分為2個階段.
第1階段:由于電力負荷數據固有的非線性和不穩定性特征增加了電力負荷預測的難度,為了減弱原始負荷數據中噪聲的負面影響并進一步提高最終的預測精度,提出的混合預測框架首先對電力負荷數據進行數據預處理。利用CEEMADAN 技術將原始序列分解為多個子系列,以捕獲和挖掘負荷時間序列的主要特征。通過剔除高頻成分來剔除噪聲影響,得到重構的負荷序列,為提高模型整體的預測精度做出了重要貢獻。
第2階段:模型的預測準確性和穩定性對于電力系統的平穩運行和高效調度是必不可少的,因此本文將預測精度和預測穩定性被定義為多目標花授粉算法的2個優化目標,具體如式(4)。鑒于ELM 出色的模擬與預測能力,本文利用優化的ELM 通過滾動預測形式對重構負荷序列的未來變化趨勢進行預測,預測過程中通過多目標優化確保最終預測結果的準確性和穩定性。
選取2011年1 月至2018 年12 月江蘇省月度工業用電量作為實驗數據集來驗證提出模型的良好性能。根據多次實驗,將訓練集與測試集的比例設為7:3。江蘇省工業用電量曲線見圖1,從圖1可以看出,序列整體呈上升趨勢,非線性特征和不穩定性特征顯著。

圖1 江蘇省工業用電量曲線
本文應用4個常見的誤差指標,包括平均絕對百分比誤差(MAPE),平均絕對誤差(MAE),均方根誤差(RMSE)和預測誤差標準差(Std),來評估提出模型的預測準確性和預測穩定性。具體地,MAPE,MAE和RMSE越小,表明預測準確度越高;Std越小表明預測穩定性越高。
從傳統的統計模型、機器學習模型和混合模型中選取了5個對比模型,來證明提出的混合預測模型優于傳統模型,不同預測模型負荷預測結果評價見表1,且提出的混合預測模型的每一個組成部分均為最終預測精度的提高做出了重大貢獻。

表1 不同預測模型負荷預測結果評價
表1列出了不同預測模型的預測精度與預測穩定性對比情況。從表1可以看出,BP,ELM 和ARIMA 的MAPE值分別為18.956 3%,18.304 2%和24.414 3%,BP 和ELM 表現相近,但是優于ARIMA 模型,說明機器學習模型在處理非線性時間序列方面具有一定優勢,ARIMA 模型不擅長預測非線性趨勢明顯且波動劇烈的時間序列。CEEMDAN-ELM 的MAPE為14.086 2%顯 著低于單模型,且與ELM 模型相比,降低了ELM模型MAPE的34.57%,說明CEEMDAN 在提取原始時間序列特征,剔除噪聲因素負面影響方面具有顯著成效,且非常有利于提高模型的預測精度。MOFPA-ELM 的MAPE,MAE和RMSE分別為14.382 8%,52.711 5億kWh和68.439 5億kWh,顯著優于ELM 模型,說明MOFPA 算法對于提高ELM 的預測性能具有重要的幫助作用。CEEMDAN-MOFPA-ELM 模型具有最小的MAPE,MAE和RMSE值,說明在眾多對比模型中,提出的模型具有最高的預測精度。
從Std的值可看出模型預測的穩定性,具體地,MOFPA-ELM 的Std為53.785 5 億kWh,而ELM 模型的Std為64.112 0億kWh,說明多目標優化算法在提高模型預測精度的同時提高了模型預測的穩定性。CEEMDAN-MOFPA-ELM 模型的Std為38.554 7億kWh,顯著低于其他對比模型的方差,說明提出的模型的預測穩定性最高。
圖2描繪了不同對比模型和提出模型的預測值情況。從圖2 可以看出,提出的CEEMDANMOFPA-ELM 模型的預測值與真實值更加接近,擬合效果更好。其它對比模型的預測值與真實值偏離較遠,說明模型的訓練與學習能力有限,無法提供準確的預測結果。

圖2 不同預測模型電力負荷預測結果折線
本文提出了一種基于機器學習的電力負荷混合預測模型,它結合了CEEMDAN 分解技術和MOFPA 優化算法,改進了傳統的極限學習機的缺陷,剔除了數據中的隨機噪聲對預測結果的負面影響。從實驗結果可以看出,混合預測模型的預測效果顯著優于傳統的統計模型ARIMA 以及機器學習模型BP和ELM,同時,提出的模型在所有混合對比模型中表現最優。因此,提出的混合模型顯著提高了預測精度和預測穩定性,可以為電網調度提供有力的信息支撐。