劉晟東 陳以
摘要:在智能電網發展趨勢下,電力網絡規模與復雜性不斷增加,傳統電力拓撲分析方法難以滿足全景大電網對實時性的需求,本文提出一種基于大數據框架Apache Spark的全景電網拓撲分析系統,實現復雜電網的實時拓撲分析計算。實驗表明拓撲實時分析性能明顯高于傳統方法。
關鍵詞:電力系統;大數據;拓撲分析;Apache Spark
中圖分類號:TM711 文獻標識碼:A 文章編號:1007-9416(2018)04-0155-01
電力系統拓撲分析作電力系統分析的基礎,是電力系統狀態估計與仿真的重要組成部分[1]。智能電網的發展使電網的可靠性需求進一步提高,傳統拓撲分析方式已經無法滿足智能電網的需求[2]。為實現全景電網的快速拓撲分析,提出了一種基于Spark平臺的全景電網拓撲分析系統。該系統能夠處理多廠站互連的全景電網系統,在處理復雜電網時性能與效率優于傳統拓撲分析系統。
1 Apache Spark
Spark是一個基于內存分布式計算的集群計算框架,相較于MapReduce框架,Spark引入了彈性分布式數據集(RDD)的概念,將數據存儲在內存中,提高了計算效率[3]。本文所提出的的基于Spark平臺的全景電網拓撲分析系統綜合Spark Streaming與Spark Graphx組件來對復雜電力系統進行拓撲分析。
2 基于Spark平臺的全景電網拓撲分析系統
電網拓撲分析系統主要包括數據采集傳輸模塊,消息傳輸模塊,分布式流式計算模塊,以及輸出模塊。
2.1 數據采集與消息模塊
對于節點規模較大的電力系統,傳統電力系統數據采集系統SCADA會出現性能不足的問題,采用kafka分布式消息系統與數據采集系統結合的方式,能夠提高系統的吞吐量與響應速度。采集系統收集廠站內部的拓撲信息,按照時間間隔上傳給kafka消息系統,Kafka系統將數據進行解析分區,傳輸給流計算模塊。
2.2 拓撲分析與流計算模塊
運行在Spark集群上的流式計算模塊是本文系統核心部分。流計算程序分為三個步驟:
步驟1:讀取Kafka系統傳輸數據,對于輸入信息中包含各個地區信息的Dstream進行處理,得到包含全網拓撲信息的Dstream。
步驟2:對步驟1生成的Dstream進行操作,構建edgesRDD與verticesRDD并構造出拓撲圖,采用GraphX的connect components算法,對拓撲圖進行并行迭代,劃分出拓撲圖的聯通片。
步驟3:將步驟2中得出的結果進行解析存儲。
3 實驗與分析
3.1 實驗環境
采用CDH平臺搭建了一個由六臺服務器組成的實驗集群,輸入不同規模的數據對系統進行實驗測試。
3.2 實驗內容與結果分析
以五個不同規模的電力系統對系統進行測試,分別通過深度優先搜索法,廣度優先搜索法,關聯矩陣法與提出的系統進行對比。拓撲分析的耗時對比情況如表1所示,從表中可以發現,對于節點數較多的電力系統,基于Spark的全景電網拓撲分析系統的計算效率優于傳統算法。對于規模越大的拓撲數據,基于Spark平臺的拓撲分析系統的計算處理優勢越明顯。
4 結語
本文提出一種基于Spark 平臺的全景電網拓撲分析系統,采用大數據處理技術分析大型電網拓撲。通過實驗分析,本系統可提高復雜電網的拓撲分析效率,并且具有良好的拓展性。
參考文獻
[1]徐巖,宋艷爭,張亞剛,等.基于廣域測量系統的改進電網拓撲結構識別[J].電網技術,2010,34(9):88-93.
[2]陳國平,李明節,許濤,等.關于新能源發展的技術瓶頸研究[J].中國電機工程學報,2017,37(1):20-26.
[3]Zaharia M, Chowdhury M, Franklin M J, et al. Spark: cluster computing with working sets[C]// Usenix Conference on Hot Topics in Cloud Computing. USENIX Association, 2010:10-10.