谷向麗 溫艷磊
(國網河南省電力公司汝陽縣供電公司,河南 汝陽 471200)
電力通信網是承載智能電網信息交互業務的通信專網,承載著電網運行和經營管理的核心業務,是智能電網發展的重要基礎設施,是電網安全、穩定、經濟運行的重要保障。電力通信網承載的業務與公司生產經營密切相關,例如繼電保護、穩定控制、配電自動化、用戶電量采集等,一旦發生故障將對電網的安全穩定運行造成嚴重威脅。
現階段電力通信網監管多采用事后報警的方式進行網絡維護,無法有效保證電力通信網絡的高效穩定運行,制約了電力系統的業務的開展。隨著電力通信網信息化程度的不斷加深,資源管理、設備運行、實時監控等方面的海量數據已經逐步積累下來,其中蘊藏了巨大的價值亟待挖掘。開發電力通信網大數據應用場景,將大數據技術應用于電力通信網精益化管理迫在眉睫。
大數據在其定義中有著一定的分歧,至今并為有一個統一的解釋。麥肯錫認為“大數據是指其大小超出典型數據軟件抓取、儲存、管理和分析范圍的數據集合”;Gartner認為“大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產”。在大數據中,4個主要特征(即4v特征):(1)大量,主要是擴大了數據的規模,把數據從TB升級到pb,其換算的單位為1PB=1024TB=1048576GB,其中數據量越大所包含的信息就越多。(2)多樣性,數據的種類以及來源都很多,其中主要包含了結構的多樣化,非結構的多樣化,語音以及文本的多樣化等。(3)速度指的是獲取數據的速度,并且提高數據處理的時序,實現2級簡單的查詢和時間水平的復雜分析。(4)價值。數據的價值密度低。在大量的數據中,只有小的部分很有用。因此,數據的質量也是價值的關鍵。
電力通信中使用的大數據主要分為兩個部分:內部和外部,在內部的使用主要是對電力設備的以及系統中的信息以及運行的狀態進行記錄,同時對數據進行分析發現在系統運行過程中所遇到的問題。大數據的數據解析過程從數據的采集中集成,提取數據的安全檢查和分析的完整鏈條。在該鏈輪中,可能發生在各個鏈接中丟失的數據、被泄漏、篡改、不被許可的接入的可能性。
(一)通信網可靠性分析
通過對影響電力通信網可靠性的因素進行分類和整理,并運用特征篩選、數據挖掘等算法,得到影響因素的集合;運用相關性分析算法對該集合進行一步過濾和整理,并結合不確定性層次分析法,確定指標權重,得到最終的可靠性指標評價模型,指導電力通信網可靠性分析評價。
(二)設備全壽命周期分析
基于通信設備臺賬、缺陷單、缺陷報告等數據,運用文本挖掘技術,提取設備缺陷記錄關鍵信息,挖掘設備缺陷與廠商、投運年限、運行工況以及環境等因素之間的關聯關系和發展規律,對設備總體缺陷率變化趨勢進行分析和預測,并通過廠家設備缺陷率及質量因素分析,構建廠家產品質量評價模型,為設備運維策略優化、設備選型/采購、設備退役報廢策略制訂等工作提供參考依據。
(一)數據存儲技術
數據存儲技術是指采用多種存儲方式并存,根據數據類型以及數據處理的要求選擇不同的數據存儲方式。結構化數據采用傳統關系型數據庫來存儲,對于半結構化和非結構化數據采用HDFS存儲,同時結合Hive和HBase來實現。
對引入的外部數據源,如傳輸網性能數據、數據網流量數據,由于其年存儲量在TB級別,需要通過分布式存儲技術完成。
(二)離群點分析技術
離群點(Outlier)是指數據集中可能包含一些數據對象,它們與數據的一般行為或模型不一致,這些數據就是離群點。在對傳輸網設備性能與數據網流量進行監測時需要進行離群點分析。例如,對于傳輸網設備的誤碼率進行分析,可以通過基于密度的聚類,找出偏離其他正常值的異常數據,對明顯不合理的數據,可以判斷為錯誤數據,在統計計算中需要剔除其影響,對于其中異常但屬于合理范圍內的數據,需要及時進行預警。
(一)通信光纜性能監測及預警分析。通過光纜性能數據、氣象數據的采集,實現對光纜衰耗情況的實時監視,分析光纜衰耗的原因和趨勢,為光纜狀態檢修提供參考;對光纜氣象災害故障進行預警,預防光纜氣象災害導致的故障風險。主要功能包括:光纜性能動態監測,光纜性能劣化分析預警及狀態檢修策略,光纜覆冰、舞動、雷擊、結冰監測預警。
(二)通信傳輸網性能監測及預警分析。通過光設備性能的采集,實現對傳輸網性能變化情況的實時監視,分析光路與光設備性能數據變化趨勢,為光設備故障或告警提供分析參考依據。主要功能包括:傳輸設備與光路性能動態監測、傳輸設備與光路預警分析、設備運行環境評價。
綜上所述,本文首先對大數據做了簡單的概述,其次分析了電力通信大數據及其所面臨的問題以及電力同行的特征,最后對大數據在電力同行中的運用做了簡單的探析。從中發現電力通信大數據容易透露客戶的隱私以及數據的保存存在著不安全性。