洪凱
(國家電投集團黃河上游水電開發有限責任公司 青海省西寧市 810008)
隨著智能電網建設進程的不斷推進,電力設備運行數據呈現出了指數增長規模,所有信息集中到調控中心,給數據分析存儲工作帶來了不小的壓力。在此背景下,傳統調控分析手段已經無法滿足實際需求,研究和推廣大數據分析系統勢在必行。
電力設備運行過程中,常會因為設備缺陷、信號干擾、不良天氣等因素的影響,出現超負荷運行、跳閘等情況,為整個系統的運行埋下安全隱患,而利用大數據技術,設備運行參數得以被實時傳輸到監控終端,工作人員只需要對系統傳回的圖像進行查看和分析,就可以發現這些異常,大大提升可監測工作的靈敏度。其次,在日益激烈的競爭環境下,電力企業的發展需求也在日益高漲,通過大數據設備運行數據分析系統,企業方可以深入挖掘消費者用電需求,為戰略發展計劃的制定提供科學的數據支撐,同時為班組工作、運維計劃等的安排提供依據。再者,通過大數據技術的分析,還可以實現對用戶停電情況的監測,通過繪制停電原因、時間等因素的關系圖,便于工作人員了解用戶停電實況。
隨著社會經濟的發展,我國對電力能源的需求規模不斷擴大,大部分地區的電網都進入了不停機狀態,給電力設備帶來運行壓力的同時,故障動態分析工作也受到了不小的阻力。應用大數據分析技術,一是可以提升主線故障分析效率,當主線開關跳閘時,大數據分析系統可以直接對系統展開由上至下的拓撲分析,從而完成信息直采。當主線出現故障,但并未出現跳閘情況時,大數據系統也可以以各分支線路數據為基礎[1],以電源和開關為起點開展閉環拓撲分析,從而構建出停電模型,得出主線故障原因。二是可以對支線故障進行動態分析,支線的分析方式與主線有異曲同工之處,系統不僅可以在故障線路中完成拓撲分析,也可以以告警方式在整個線路中進行系統分析。此外,利用大數據分析系統,還可以檢測出設備失電故障和接地故障,為檢修工作提供依據。
本文采用Hadoop 作為基礎技術框架,它具有較強的延展性與穩定性,適用于多種場景下的異構性數據處理。在電力設備運行數據分析系統中,HDFS 負責存儲用戶數據、設備參數等,MapReduce 則負責分析處理這些數據。分布式存儲模式下,多個數據節點的使用能有效保障數據安全,客戶端識別功能還可以提高數據讀取效率,結合操作日志文件與元數據鏡像文件的使用,操作更新記錄也得以實現,大大減少了系統崩潰帶來數據丟失的風險。應用分布式并行處理系統,則可以同時完成設備變配電情況、網線運行、用電負荷等變化劇烈數據的處理,同時,任何一個map 的故障都不會影響其余節點運行,整個框架運行更加順暢和穩定。此外,利用MapReduce 還可以實現大數據挖掘,通構建相關性模型,有助于挖掘停電設備、停電區間、影響因素等項目之間的內在關聯度,從而有效地規避風險,以防代修,提升電網運行穩定性。
在宏觀設計思路中,電力設備運行數據分析系統大體可以被分為數據采集層、管理層、訪問層以及應用層,采集層為基礎環節,主要負責獲取設備運行狀態數據;管理層為核心環節,可以通過OLPA 完成倉庫數據提取[2],負責數據存儲和分析;訪問層則是應用環節,集統計、查詢與分析為一體,同時通過用戶接口提供數據訪問功能,應用層則主要負責實現面向用戶進行查詢統計、數據挖掘等,以提升變配電、售電決策的科學性,詳見圖1。具體設計中:我們采用了B/S 系統結構,服務器部署于Hadoop 之上,信息內容則通過tomcat 發布,運用RESTful Web 作為服務器和瀏覽器之間的通信工具。實際操作過程中,工作人員只需要登錄瀏覽器,并點擊相應板塊的頁面,就可以發出內部資源共享申請,工作完成后,Hadoop 會以MapReduce 作為基本編程模型,同時借助聚類算法等調取數據庫內部資源,重新使網站回到電力設備狀態評估頁面。作為遠程通信的主要技術,RESTful Web 可以將數據以JSON 的格式打包,發送給分析層,經過數據統計和挖掘,將結果傳輸回業務平臺,一旦落實確認,就可以再次以JSON 格式打包發回客戶瀏覽器,以直觀的表格形式呈現在頁面上。

圖1:基于大數據技術的電力設備運行數據分析系統設計思路
分析系統中一共設有五個功能模塊,一是用戶管理模塊,用戶可以通過輸入賬號和密碼的方式完成登錄,基于主體不同,該模塊還進行了差異化設計,分為消費者和電力主管部門,可以根據實際需要進行權限賦予。在實際應用過程中,要注意保護用戶隱私,對用戶個人信息采取加密處理,同時簡化頁面信息,方便客戶尋找使用板塊,提升系統便捷性。二是電池性能檢測模塊,它可以對電力設備備用電源指標進行智能化分析,并自動產生重組方案,以達到延長適應時間,提升運行穩定性的目的。三是數據監測模塊,這一模塊架構可以在輸變電系統內部進行數據收集和監測,并將數據實時更新記錄到數據庫中,方便管理人員查看。以電壓等級分析為例,工作人員可以借助系統對油色譜、溶解氣體產生率等進行大數據分析,結合GIS 系統,還能快速定位故障點。四是設備檢測模塊,當監測模塊發現數據異常時,就可以啟用這一模塊,對一定范圍內的電力設備進行地毯式排查,準確顯示故障發生點,為檢修工作提供依據。五是設備信息管理模塊,主要負責對設備的型式、出廠日期、維修保養信息等進行記錄、修改、刪除,在電力設備全生命周期的管理工作中意義重大。
電力設備數據分析系統的建立讓嵌入式數據采集方式成為了可能,電力設備運行過程中,先由互感器對大電流進行預處理,然后由嵌入的單片機以周期性的工作方式定期完成采樣工作,并借助RESTful Web 向遠程調控中心傳輸信息。在B/S 架構中,單片機采集系統只能面向特定的客戶黑匣子采集數據,不能進行智能刪減,因此采集對象眾多,采集數據體量也極大。針對這一情況,本設計中采用了多線程數據采集和處理技術,對動態化網絡地址以及多個電力設備[3]進行數據采集,這樣一來數據采集壓力被分解,且不同數據之間的獨立性也能得到有效保障。信息采集既包含設備技術參數屬性、交接試驗數據、缺陷臺賬記錄等直接反映設備狀態的信息,又包含諸如氣象信息、帶電檢測數據等間接數據,數據采集附帶時空標志,方便電力企業進行橫向、縱向對比。
Hadoop 領域中,常見的數據存儲方案主要有三種,具體對比可見表1。對于臺賬信息、搶修記錄等較為傳統的結構化數據,可以采用Hive、Impala 等數據庫工具進行存儲,以提升其處理速度。而對于電氣設備在線測試、云慈寧宮狀態等半結構化或非結構性數據,則可以使用分布式HBase 數據庫進行存儲。

表1:常見的數據儲存方案
由于電力設備運行數據體量龐大,其中還存在著大量的冗雜數據,因此在大數據挖掘之前,必要要經歷數據預處理工作,保留電壓、電流等價值數據,提升數據質量。數據清理之后,同樣會發回HBase 存儲,不會覆蓋元數據,為新舊數據對比分析奠定基礎。在實際分析挖掘階段,工作人員首先要將HBase 中的樣本數據下載到本地存儲器中,并根據電力設備信號特點進行提取,通過迭代法提取聚類中心,通過一定算法得出結果,完成模型構建,實現分析結果的可視化。
異常處理機制主要是為了對用戶的違規輸入進行中止和提醒,以降低系統崩潰機率。在本次電力設備數據分析系統設計中,主要是從以下幾個方面開展異常處理設計的:一是異常持久化,當用戶出現違背數據庫或程序的操作時,系統會自動記錄異常產生時間、類型、級別以及代碼位置,在此基礎上形成二進制流文件[4],傳送到數據庫中。數據持久化則借助了PROTOBUF 技術,以蛇形間隙法對序列節點進行分配間隔,在優先級規則的約束下完成節點存儲,并建立映射關系,完成異常信息的序列化。二是異常分析,系統可以根據異常類型,從數據庫中調取與異常相對應的編號和提示,并根據以往經驗解析異常的詳細內容,如果數據庫中沒有與之相匹配的項目,則按照通用異常處理。
大數據技術是近年來極為流行的一種前段科技,代表著企業甚至國家的軟實力水平,神經網絡算法、遺傳算法等都是大數據技術中常用的算法類型,將之應用于電力設備運行數據分析系統,可以大幅度提升數據采集、處理效率,保障電網平穩運行。因此,電力部門應當充分重視大數據技術在電力設備運行狀態分析中的重要性,積極探索和改進大數據分析系統,提升電網運行效率。