石 佳,丁 俊,張納川
(國網蘇州供電公司,江蘇 蘇州 215004)
合理的電網規劃對電網的投資、運行、效益等方面有著重要意義。電網是電力系統的重要組成部分,電網能否合理運行直接取決于規劃是否科學經濟,因此電網規劃是一個尤為重要的問題。電力電量平衡是電力規劃設計的重要組成部分,根據系統負荷預測和機組出力情況,得到連續多年的電力盈虧[1-2]。在系統水電容量比重大時,需要進行電量平衡分析,分析結果可以幫助規劃人員了解未來的裝機進度以及檢修安排是否合理,并做相應調整,以保證電力電量的生產使用。
電力電量平衡是規劃的基礎工作,數據量大,工作繁雜,現在多采用人工經驗和計算軟件相結合的方式開展該項工作。面對電力系統迅速膨脹的數據量,規劃人員如何從中挑選有用信息,摒棄冗余數據,也是電力系統建設的一項艱巨任務。在當今互聯網時代,數據來源廣,信息獲取速度快,這就要求工作人員合理利用工具進行業務分析[3-5]。數據挖掘技術的提出與應用為數據分析提供了強有力的技術支持,便于發現數據深層的相似性和差異性[6-7]。
本文對數據挖掘技術在電力電量平衡中的應用進行初步探索。通過實際電網歷史數據對不同方法在負荷預測的適用性進行對比,分析不同類型機組檢修計劃和電力平衡結果之間的關聯性。
數據挖掘是為了在大量數據中獲取事先未知的信息或規則而進行的選擇、探索和建模過程。對一特定領域采用該技術,使用者要對分析的數據有深層理解和認識,才能挖掘出有意義的結果。這一技術依托數據庫[8-10],對其中數據進行處理,利用有關算法獲取隱藏信息。
數據挖掘主要步驟有數據的預處理,數據挖掘和后處理三部分(見圖1):首先,對數據進行特征的篩選、規范;其次,基于不同任務選取合適的方法去挖掘其中信息;最后,獲得結果后過濾無用數據,將結論用圖表形式可視化展現。

圖1 數據挖掘過程
預測是通過構建和使用模型學習標號樣本的規則來評估無標號樣本,或者對給定樣本所具有的值區間或者屬性值進行評估[11-12]。因此,預測的主要問題是分類和回歸,分類多用于預測標稱值或者離散值,回歸多用于預測有序值或者連續值[13-15]。負荷可以看作是一組按時間排序的隨機序列,即時間序列,間隔可取分鐘,日,周,月,年等。不同于典型的預測,時間序列強調一種自然的時間順序,比一般的數據集多一個時間戳字段。
關聯是用以發現隱藏在大數據集中有意義的關系,反映一個項目與其他項目之間的依賴性。多個項目之間關聯關系較多,可以采用支持度和置信度兩個指標來評判最為重要的關聯規則。為了獲得包含最小覆蓋量的屬性組合,現多用Apriori算法、FP增長算法和PCA算法來獲取項集[16-17]。對于關聯規則的挖掘,需要將數據進行二元表示,即忽視數值,采用有無或是01來表示數據。
電力電量平衡中,最高發電負荷和電量是可以通過負荷預測得到的。而負荷預測受到國民經濟發展等因素影響,是一項極為復雜的工作,現有的電力軟件都是通過各種預測模型來實現的。本文利用平臺數據庫中的歷史最高發電負荷數據作為訓練集,通過數據挖掘中的時間序列預測算法,來預測未來一年的負荷曲線。
該平臺中已存有電網6年的電力電量平衡數據,可通過接口獲取其中五年的最高發電負荷作為訓練集,用于預測未來的負荷曲線,與實際的數據作平均相對誤差分析。
WEKA在時間序列預測中提供了如下算法:正態隨機過程 (GaussianProcesses,GP)、 線性回歸(Linear Regression,LR)、多層感知器 (Multilayer Perceptron,MLP)、SMOreg。四種算法的預測分析見表1至表3。

表1 預測12個月負荷

表2 預測6個月負荷

表3 預測3個月負荷
對這四種算法得到的預測誤差對比總結如表4所示。

表4 不同算法的平均相對誤差對比
從表4可以看出,MLP算法的誤差過大,不適合用于電力平衡的負荷預測。在預測時訓練數據少,需要預測序列長時,使用GP算法精度更高,訓練數據多,預測序列短時,使用SMOreg算法精度更高。
機組檢修安排在遵循一定的基本原則下,多由人工安排機組檢修時間段。如果考慮不全,安排不恰當,電力平衡計算結果就會出現虧損。
以數年電力平衡結果為輸入數據,但需要對數據進行預處理,將數值形式轉化為二元形式,才能提供給WEKA使用。通過數據平臺接口,將電力平衡計算后盈余月份標記為y,虧損月份標記為n。機組檢修計劃按照機組類型歸類,將煤電、氣電和水電在各月的檢修狀態也用二元變量表示,機組的檢修狀態為y,運行狀態為n。
處理后的數據存入表格的對應項目中,作為挖掘的輸入文件。以五年的電力平衡結果為輸入數據,使用Apriori、FP-Growth等算法分析電力平衡盈虧和機組檢修計劃間的關聯性。
選取最小置信度為0.9時,得到的最佳關聯結果反映了電力盈虧主要與火電、水電和氣電機組檢修狀態相關。
當水電不檢修,電力盈余時,火電處于檢修狀態;
當火電不檢修,電力盈余時,水電處于檢修狀態;
當水電不檢修,氣電檢修,電力盈余時,火電處于檢修狀態。
從這些結果可以看出,為保證電力盈余,應該盡可能地安排水電和火電不在同一時段(單位為月)檢修。
本文對數據挖掘技術在電力電量平衡中的應用進行了初步探索。通過實際電網歷史數據對比分析了不同方法在負荷預測的適用性,得出訓練數據少,需要預測序列長時,使用GP算法精度更高,訓練數據多,預測序列短時,使用SMOreg算法精度更高。本文通過分析某省歷年不同類型機組檢修計劃和電力平衡結果之間的關聯性,發現不同類型機組應安排在不同時間段檢修,以保證電力平衡。
參考文獻:
[1] 蒲天驕,陳乃仕,葛賢軍,等.電力電量平衡評價指標體系及其綜合評估方法研究[J].電網技術,2015,39(1):250-256.
PU Tianjiao,CHEN Naishi,GE Xianjun,et al.Research on Evaluation Index System and Synthetical Evaluation Method for Balance of Electric Power and Energy[J].Power System Technology,2015,39(1):250-256.
[2]朱澤磊,周京陽,潘毅,等.考慮電力電量平衡的安全約束經濟調度[J].中國電機工程學報,2013,33(10):168-176.
ZHU Zelei,ZHOU Jingyang,PAN Yi,et al.Security constrained economic dispatch considering balance of electric power and energy[J].Proceedings of the CSEE,2013,33(10):168-176.
[3]宋亞奇,周國亮,朱永利.智能電網大數據處理技術現狀與挑戰[J].電網技術,2013,37(4):927-935.
SONG Yaqi,ZHOU Guoliang,ZHU Yongli.Present status and challenges of big data processing in smart grid [J].Power System Technology,2013,37(4):927-935.
[4]VJ D.High information content database generation for data mining based power system operational planning studies[C]//IEEE Power and Energy Society General Meeting,2010.
[5]廖志偉,孫雅明.數據挖掘技術及其在電力系統中的應用[J].電力系統自動化,2001,25(11):62-66.
LIAO Zhiwei,SUN Yaming.Data Mining Technology and its Application on Power System[J].Automation of Electric Power System,2001,25(11):62-66.
[6]廖志偉,孫雅明.基于事件序列數據挖掘原理的高壓輸電線系統故障診斷[J].電力系統自動化,2004,28(4):22-27.
[15] LIAO Zhiwei,SUN Yaming.A new data mining approach for fault diagnosis of HV transmission line system based on sequence of events[J].Automation of Electric Power Systems,2004,28(4):22-27.
[7]邱鳳翔,徐治皋,司風琪,等.基于主元分析的關聯規則挖掘及在電廠中的應用[J].電力系統自動化,2009,33(16):81-84,107.
QIU Fengxiang,XU Zhigao,SI Fengqi,et al.Association Rules Mining Based on Principal Component Analysis and Its Applications in Power Plant[J].Automation of Electric Power System,2009,33(16):81-84,107.
[8]Mori H.State-of-art overview on data mining in power systems [C]//IEEE Power Engineering Society General Meeting, Canada, 2006.
[9]陳健,萬國成,孫冠男,等.GIS平臺電網規劃輔助決策系統開發與應用[J].電力系統及其自動化學報,2010,22(6):99-103.
CHEN Jian,WAN Guocheng,SUN Guannan,et al.Development and Application of GIS Platform Decision-making Support System for Power Network Planning[J].Proceedings of the CSU-EPSA,2010,22(6):99-103.
[10]陶文偉,吳文傳,王俏文,等.基于EMS的電網規劃分析系統的設計與實現[J].電力系統自動化,2006,30(14):87-91.
TAO Wenwei,WU Wenchuan,WANG Qiaowen,et al.Design and Implementation of Transmission Network Planning Analysis System Based on EMS[J].Automation of Electric Power System,2006,30(14):87-91.
[11]李翔,高山,陳昊,等.基于變結構協整理論的中長期電力負荷預測模型[J].電網技術,2007,31(9):48-52.
LI Xiang,GAO Shan,CHEN Hao,et al.A New Medium-and Long——term Load Forecasting Model Based on Variable Structure Cointegration Theory[J].Power System Technology,2007,31(9):48-52.
[12]薛萬磊,于繼來.分形外推插值算法在電力負荷預測中的應用[J].電網技術,2006,30(13):49-54.
XUE Wanlei,YU Jilai.Application of Fractal Extrapolation Algorithm in Load Forecasting[J].Power System Technology,2006,30(13):49-54.
[13]林順富,郝朝,湯曉棟,等.基于數據挖掘的樓宇短期負荷預測方法研究[J].電力系統保護與控制,2016,44(7):83-89.
LIN Shunfu,HAO Chao,TANG Xiaodong,et al.Study of short-term load forecasting method based on data mining for buildings[J].Power System Protection and Control,2016,44(7):83-89.
[14]CHATURVEDI D K,SINHA A P,MALIK O P.Short term load forecast using fuzzy logic and wavelet transform integrated generalized neural network[J].Electrical Power and Energy Systems,2015,67:230-237.
[15]康重慶,夏清,劉梅.電力系統負荷預測[M].北京:中國電力出版社,2007.
[16]馬瑞,周謝,彭舟,等.考慮氣溫因素的負荷特性統計指標關聯特征數據挖掘[J].中國電機工程學報,2015,35(1):43-51.
MA Rui,ZHOU Xie,PENG Zhou,et al.Data Mining on Correlation Feature of Load Characteristics Statistical Indexes Considering Temperature[J].Proceedings of the CSEE,2015,35(1):43-51.
[17]于之虹,黃彥浩,魯廣明,等.基于時間序列關聯分析的穩定運行規則提取方法[J].中國電機工程學報,2015,35(3):519-525.
YU Zhihong,HUANG Yanhao,LU Guangming,et al.A Time Series Associative Classification Method for the Operation Rule Extracting of Transient Stability[J].Proceedings of the CSEE,2015,35(3):519-525.