王洪森,王廣府,黃 銳
(廣東電網揭陽普寧供電局有限責任公司,廣東 揭陽 525300)
為實現系統安全穩定運行,且降低運營成本,電氣企業必須做好電力需求預測,尤其是短期負荷預測。隨著智能電網建設進程的加快,電力系統運行要求不斷提高,對電力短期負荷預測結果與效率的要求也大大提升。
電力系統向自動化、智能化發展,采集的用電信息日益完善,涉及電力系統的監測數據、檢測數據、營銷數據及管理數據具有類型多、數量大及價值密度低的特點,與大數據典型特征相符。本文提出了基于大數據技術的短期負荷預測,通過特定的分析手段智能化挖掘海量數據,從而提高短期負荷預測的精度和效率,具有實用意義。
大面積推廣應用智能電表和用戶信息采集系統后,短期負荷預測要面對大量的信息。通過對用戶的用電規律和短期負荷的影響因素等進行基礎性分析,有助于短期負荷預測的有序開展。
電力用戶的用電數據與其用電行為習慣存在一定關聯。本文采用的是聚類分析法中簡明、實用的SOM算法,即通過假設輸入對象具有一定的順序和拓撲結構,可實現從n維到2維的降維映射,且映射的結果保持了拓撲性質,在理論上與大腦處理有較強的聯系[1]。例如,采用該算法對某電力用戶10-12月期間的負荷進行分析,發現聚類結果存在5種日負荷類型。第一類,因為包括國慶節,所以負荷曲線明顯不同于其他形狀;第二類,穩定用電模式,天數為51 d,比例接近50%;第五類,因為存在極端天氣致使用電異常,所以屬于異常模式;第三類和第四類因為與穩定用電模式相比幅度波動較大,所以屬于波動模式。
電力用戶的用電模式為研究短期負荷的影響因素提供了基礎,同時也為預測模型的設計提供了依據。如果用電負荷趨于穩定或者波動較小的變化規律可選擇用時間序列等簡單模型,否則需要結合波動原因借助神經網絡和支持向量機等模型加以分析。
短期負荷容易受到天氣變化、日期類型以及事件類型等諸多因素的影響,而且因為生產特性不一,所以不同用戶負荷之間差異明顯。這就需要分析兩者的相關性,篩選出主導影響因素,通過縮小考慮因素的范圍降低數據處理工作量。本文在Spearman方法的幫助下對某地區10-12月份用戶負荷數據進行了相關性分析。其中定序型數據包括溫度、風速、降雨及濕度等數值。分析結果發現,溫度和濕度在很大程度上可以決定負荷分類,而降雨和風速則為間接影響,但因素對用戶負荷變化的影響具有優先次序以及閾值。為判斷影響因素的重要程度,采用CRT決策樹算法進行了計算和分析,結果證明其具有良好的分析效果和較高的準確度[2]。影響規則的分析有助于進一步闡述聚類結果,可以幫助工作人員確定用電模式與影響因素之間的定量關系,進而為研究負荷特性、優化預測參數及調整預測結果提高可靠參考和依據。
Hadoop是一個用于運行和處理大規模數據的軟件平臺,可對海量數據進行分布式計算,可適用于大量、復雜電力數據的提取和分析。因此基于Hadoop提出了短期負荷預測系統。該系統主要包括整合用戶用電數據、Hadoop處理數據以及分析與預測負荷三大層級和功能。其中,數據的整合指的是抽取、存儲及轉換采集的用戶用電信息,用戶涵蓋了居民、商業及工業等多種行業。經整合后的數據會統一匯集至Hadoop的數據處理模塊,并以業務應用為標準進行分別處理,形成多用戶、多日數據的分布式存儲與計算,實現個性化的用戶數據。由于Hadoop屬于大數據平臺,連接的分布式服務器不只一臺,所以處理效率非??捎^,具體流程圖1所示。

圖1 短期負荷預測基本流程
基于以上系統架構,需要借助一系列合理的大數據技術實現對短期負荷的預測。既要考慮用戶負荷需求,又要兼顧系統網損,以提高負荷分析與預測結果的真實性與準確性。具體地,可以選擇電力用戶用電模式的類型作為預測模型的基礎,選擇用戶用電影響因素的分析結果為模型參數,參數的設置需要參考實際情況。如果預測日中的氣溫、降水量及日類型等因素的累積效應對用戶負荷有影響,則需要基于影響因素優化預測參數,并賦予其中主導因素以較大的權值[3]。為改善短期預測模型的適用條件和范圍,還應切實考慮電力用戶之間用電模式的差異性。因此,對短期負荷預測系統設計了適用于平穩序列的ARIMA(自回歸移動平均模型)以及適用于易受外界因素干擾的一元回歸、模式識別以及神經網絡模型,共4個模型。
為驗證該短期負荷模型的預測結果,營造測試環境時選用了4臺內存為500 G的PC服務器,配以Mapreduce程序改寫并分布至4個接點用于負荷分析與預測計算任務的并發執行。設定某地區電力用戶為120萬,采集的用電負荷信息時間跨度為3年,基于15 min的采樣間隔獲得了1.2 T左右的數據,其中典型任務如用電規律和影響因素離線分析以及用戶負荷在線預測的測試規模分別為120萬用戶3年和120萬用戶單戶,測試完成所需時間分別為24 min和110 s,具體計算流程如圖2所示。

圖2 用戶負荷分析與預測的具體流程
分析測試結果發現,基于Hadoop架構的分布式處理技術,能夠很好地勝任大規模負荷數據的分析與預測,且隨著節點數量的增加,處理能力也在線性增長。同時,基于1個月內用電數據的統計,日平均預測精度和最低精度分別為98.6%和97.4%,比傳統的預測方法結果穩定且準確。這是由于全面考慮了短期負荷預測的影響因素,細化了預測對象,并使用了先進高效的數據挖掘技術。
合理預測短期負荷意義重大,但實際操作中卻面臨諸多影響因素。因此,需要工作人員與時俱進,借助大數據技術挖掘有效的價值信息,為短期負荷預測提供重要的數據支持。需注意結合實際,以大數據技術為媒介構建適用性強、算法精確的短期負荷預測模型,實現快速、準確的預測,以保障精細化的電力調度和經濟可靠的電網運行。