李松嶺
近年來,由于我國電力領域市場的建立、發展日趨完善,電力負荷的預測也逐步成為電力系統運行經濟化以及構建智能電網的主要模塊[1],同時也是電力領域里研究的重要課題。在如今的電力大數據環境下,電力工作者對電力負荷預測進行了大量的研究。目前常見的模型有:時間序列[2]、決策樹[3]、支持向量機[4]、灰色理論[5]、模糊理論[6]和人工神經網絡[7]等。但是,由于電力負荷的模糊性及非線性的特點,使這些方法在預測時已遠遠不能達到負荷預測的精度和實時性要求。因此,基于深度學習工具TensorFlow的深度學習LSTM循環神經網絡的處理方法應運而生。從目前看來,深度學習方法隨著計算機計算性能的提升,其方法在包括圖像分析、自然語言處理等各個領域大放異彩。該算法應用于電力負荷預測領域,在提升短期電力負荷預測精度方面對比傳統機器學習方法有較大提升。
在短期電力負荷預測中,分析及獲取影響短期負荷的特征因素極為重要。經過分析并參考大量的文獻[8,9],選取以下特征作為衡量負荷的關鍵因素:
(1)時間因素(粒度精確到15分鐘)。電力負荷的大小會隨用電時間的峰谷而顯著變化,因此,其屬于時間序列數據,這也是使用LSTM算法可以高精度預測的原因,它在處理時間序列數據上有優秀的成績。
(2)節假日因素。節假日對于用戶以及企業用電都有很大的差別,我們在處理時將其離散化,0表示工作日,1表示節假日。
(3)溫度因素。氣溫的變化也會顯著的影響發電量的多少,選取每天的最高氣溫、最低氣溫作為關鍵特征。
(4)降水量。濕度在很大程度上會使電廠在發電量上做出調整。
(5)是否極端天氣。當發生如雷暴等極端天氣時,會影響電力的供應,因此也會作為一個重要指標納入模型。
在進行電力負荷預測時,會獲取海量的歷史負荷數據,其中,往往會由于機器或人為的原因,使數據中出現一些偏差的離群數據以及缺失數據,這些“壞數據”的存在往往會極大地影響預測的精度,因此我們首先進行檢測并加以處理。
針對異常的數據,采用如下方法進行處理:
(1)概率統計法對非異常數據進行統計,通過統計出的置信區間,識別處理異常數據。
(2)曲線替換法對一些明顯異于正常負荷曲線的日負荷進行刪除替換處理。
(3)經驗修正法從經驗角度出發,通過對比正常負荷曲線,找到某一時間段的數據值。
(4)平均值填補法針對缺失數據,取相鄰數據的平均值代替。
此外,由于各項特征的量綱不同,如果將不同量綱的數據直接導入進行模型訓練,很容易會出現模型不收斂的結果,因此要對數據進行歸一化處理:

其中,Xnorm為歸一化后數據,X為原始數據,Xmax、Xmin分別為原始數據的最大值及最小值。
1.3.1 TensorFlow深度學習工具
TensorFlow是谷歌研發的第二代人工智能學習系統,它是一個依靠數據流圖進行數值計算的開源軟件庫。它可以用于包括機器學習和深度學習在內的各個方面的研究。由于其高度的靈活性、優良的可移植性以及多語言的支持,如今已成為最受歡迎的深度學習工具,本文的LSTM算法同樣基于TensorFlow工具進行試驗開發。
1.3.2 LSTM循環神經網絡
循環神經網絡(Recurrent neural networds,RNN)是一種處理和預測序列數據的神經網絡,可以充分地分析挖掘數據中的時序信息和語義信息。RNN將上幾個時刻隱藏層的輸出數據作為自身層的輸入,從而使時間維度信息得到保留。RNN的結構如圖1所示。模塊A輸入Xi,并輸出一個值Hi,循環使信息從當前步傳遞到下一步。

圖1 RNN結構圖
長 短 時 記 憶(Long short term memory,LSTM)型RNN模型是傳統RNN的改進。它主要解決了RNN模型的梯度爆炸和梯度彌散的問題。如圖2所示。LSTM接受上一時刻輸出,當前時刻系統狀態以及當前系統輸入,通過輸入門,遺忘門和輸出門更新系統狀態并輸出最終結果。

圖2 LSTM結構圖
如以下公式所示,輸入門為it,遺忘門為ft,輸出門為ot,輸入門決定當前時刻系統輸入,遺忘門決定遺忘的信息,輸出門決定最終數據輸出的部分。


1.1.4 模型評價指標
在評價回歸預測模型時,采用通用的平均誤差(mean absolute percentage error,MAPE)和均方根誤差(root-mean-square error,RMSE)來描述,計算的公式如下:

其中,xi為第i時刻負荷的實際值為對應的預測值。
我們對算法的實際效果進行評估,實驗在Ubuntu 16.04系統下利用TensorFlow 1.3.0開發完成。實際電腦配置為:英特爾酷睿i7-3770@3.40 GHz處理器,DDR3 800 M Hz,8GB內存。實驗數據為某市某發電廠一段時間內的發電負荷。
為了便于比較,我們同樣使用相同的數據,采用目前高精度傳統學習隨機森林算法和邏輯回歸算法對負荷進行預測,便于形成對比,以檢驗本文算法的優勢。

表1 相同數據量時不同算法的預測誤差百分比

表2 不同數據量時LSTM算法的誤差百分比
從表1和表2可以看出,本文提出的LSTM算法相對于傳統的隨機森林算法以及邏輯回歸算法具有更高的預測精度。由于深度學習算法在訓練海量數據的過程中,可以自主學習數據中隱藏的信息,并使其對于錯誤和離群點更加具有魯棒性。隨著數據量的增加,LSTM算法的預測精度會有進一步的提升。由此通過多次的迭代,最終訓練出高精度預測模型。
通過使用TensorFlow智能工具,結合目前最先進的深度學習LSTM算法對電力負荷進行預測,預測結果相對于傳統機器學習方法有顯著提升。同時,隨著數據化時代的到來,LSTM算法會在未來廣闊的空間發揮更大的作用。