田園++楊東寧++李少龍++楊廣文++劉星++余其超
[摘 要] 電網資產管理貫穿了供電企業的諸多生產業務范圍,其覆蓋范圍廣、體系種類龐雜、數量龐大等特點。在電網資產信息化管理建設進程中,針對電網“數據豐富,信息缺乏”的現狀,提倡應大力研究數據挖掘技術,將數據挖掘技術應用于電網建設、運行生產,為電網的建設和運行提供更科學、更可靠的支撐。文章探討了數據挖掘技術在電網企業中的應用,并提出了相關建議。
[關鍵詞] 數據挖掘;信息系統;資產管理
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 15. 079
[中圖分類號] TP311;V242.3 [文獻標識碼] A [文章編號] 1673 - 0194(2017)15- 0177- 03
0 引 言
隨著信息技術的不斷發展,各行業大量數據隨之產生,為從大量的數據中挖掘出潛在的價值,為生產生活提供支撐,數據挖掘技術逐步發展起來,已在電網信息化管理業務中得以應用。
云南電網信息化建設工作經過多年的實施開展,取得了巨大的成果。2015年,云南電網有限責任公司集中資源,以人資數據先行,協同推進營銷、資產、財務和GIS平臺業務強關聯系統,而由于互聯網通信等技術的發展,營銷、資產等業務系統的全面實施推廣實現了對業務應用有效支撐的同時。這些系統采集、處理、積累的數據越來越多,數據量增速越來越快,以至用“海量、爆炸性增長”等詞匯已無法形容數據的增長速度。海量數據需要且已得到存儲,如電網設備的狀態數據、運行數據、電費計量數據、用戶數據、電量數據以及各部分運行參數指標數據等。
同時,因實施推廣涉及單位眾多、業務廣,而各應用單位管控點及方式存在一定差異,如何從多源大數據中及時挖掘出隱藏信息和有效數據,如何及時掌握各業務系統在各單位的應用情況問題,給數據分析處理帶來了巨大的挑戰,因此,借用數據挖掘技術對各業務數據信息進行分析,實時掌握資產設備情況,提升資產管理水平變得尤為迫切。
1 數據挖掘技術在電網資產管理應用中的必要性
電網資產數據自身存在特點:一是電網企業是一個規模相當龐大的企業,電網資產更是覆蓋社會的各個角落及各行各業,電網資產管理的數據不僅多,而且緯度高,數據列多,很難整理;二是在電力資產管理系統中,采集到的數據中包含著諸如設備型號、功能位置、生產廠家、生產日期、投運日期等諸多參數,又兼有專業覆蓋層次廣等特點,因此,資產數據質量管理較差,嚴重影響企業資產管理水平;三是電網資產管理企業較多,涉及專業教廣,對電網資產屬性層級的管理較為混亂,上級企業無法對下屬公司資產透徹了解掌握,無法掌握自身家底,數據管理模式比較單一,不同部門的數據信息由各個部門自行處理,只進行簡單參考或統計工作,沒有匯總到一起進行系統、全面的分析挖掘,導致大量有價值的信息被埋沒。因此電網企業迫切需要能夠充分合理地進行數據處理的數據挖掘平臺。
同時,電網企業產生的數據量大、質量不高,但又對數據要求較高,這就意味著電網企業迫切需要數據挖掘技術來處理海量數據,并發現數據間的潛在聯系。
2 數據挖掘技術在電網資產管理中的應用
2.1 數據挖掘的流程及方法
數據挖掘(Data Mining,簡稱DM)可以應用在各個不同的領域。數據挖掘是一個利用各種分析工具在海量數據中發現模型和數據間關系的過程,使用這些模型和關系可以進行預測,尋找數據間的潛在關聯,發現忽略因素。
2.1.1 數據挖掘流程
CRISP-DM為跨行業的數據挖掘提供了一個完整周期的綜合展示,形成閉合環,是不斷反饋不斷完善的動態過程,具體包括6個階段:商業理解、數據理解、數據準備、建立模型、模型評估和模型部署。
(1)商業理解。從商業的角度上了解項目的要求和最終目的,從目的為切入點,并將這些目的與數據挖掘的定義以及結果結合起來。
(2)數據理解。對可用的數據進行評估和數據標準的選取。(3)數據準備。對可用的原始數據進行一系列的組織以及清洗,使之達到建模需求。
(4)建立模型。在這個階段可能需要選擇和應用不同的建模技術,同時校準模型參數。該階段主要建立的模型包括關聯規則、分類與預測、聚類、異常檢測等。
(5)模型評估。該階段重點挖掘結果與商業目的的吻合度。(6)模型部署。模型部署可以是生成一份報告,或者是一個可重復的數據挖掘過程。
2.1.2 數據挖掘方法
數據挖掘涉及的學科領域和方法很多,以下是幾種常用方法。
統計分析:統計分析提供了一種基于多維度、大量歷史數據的判別方法,有回歸分析、方差分析等。統計分析是根據已有數據對事件運行規律的探索,推斷出因果線性關系,計算出線性回歸方程。統計分析的優勢在與對有確定影響因素的事件,有相對準確的影響因子效力分析。
神經網絡:神經網絡是模仿人腦神經網絡的結構和工作機制而建立的一種計算模型,包括前饋式網絡、反饋式網絡和自組織網絡模型。神經網絡的優勢是其具有良好的自組織、自適應、并行處理、分布存儲和高度容錯等特性。
決策樹:決策樹一般都是自上而下的來生成的。每個決策或事件都可能引出兩個或多個事件,導致不同的結果,把這種決策分支畫成圖形很像一棵樹的枝干,故稱決策樹。決策樹對比神經元網絡的優點在于可以生成一些規則,對解決多維數據的分類問題很有效,但也會隨著分支數的增多,管理難度加大。
粗糙集:粗糙集理論認為知識是有粒度的,利用相對核的概念進行知識關聯性分析。該理論能夠在缺少相關數據的先驗知識的情況下,基于數據的分類能力,解決模糊或不確定性數據的分析處理。
可視化:可視化提供給用戶一個人機交互的平臺,使數據展示更加清晰、簡潔。endprint
2.2 數據挖掘在電網資產管理中的應用
隨著云南電網有限責任公司資產管理系統的不斷深入應用,可獲取的電網資產數據包括電力基礎類數據和生產營銷類數據。基礎類數據包括GIS、用戶基礎信息、電網資產設備信息、基建管理信息、物資管理信息、生產管理信息等;生產營銷類數據包括輸、變、配三個維度設備全生命周期數據及過程管控中的各類業務管理數據。充分利用這些基于電網資產管理的實時和歷史數據,可提供大量高附加值的服務,實現更科學的需求側管理。在電網內部,不僅能夠從生產、營銷、管理等領域提高服務質量,還能確保電網的安全可靠運行;在電網之外,無處不在的電網數據與行業外數據整合,為企業管理、客戶服務、安全生產產業發展等方面提供決策支撐。
隨著數據挖掘和決策支持系統技術的不斷完善,為管理決策者提供各種參考價值的生產安全運行方案。如將生產管理和地理信息GIS系統中分散的大量數據,以及外部環境數據(氣象信息)等資源進行組合、聚類、排序、抽取等加工,提煉升華為有價值的、支持決策的電力生產智能大廈。可以通過變電站、線路、設備、高壓用戶、氣象等不同角度來分析關鍵業務和生產技術指標,掌握設備的運行狀態和特性,了解設備的缺陷;對發生的事故、故障及停電進行分析跟蹤,挖掘深層原因,從而控制電力生產的風險;指導基層保證設備完好率,支持和輔助基層做好設備更新技術,提高運行水平,降低事故發生率,提高供電可靠率和無故障運行時間;輔助支持負荷轉移決策、設備檢修或更新決策,讓業務專責、生產主管、企業決策者做出準確的判斷,使得電力企業取得最佳的社會效益和經濟效益。
通過數據挖掘,對云南電網資產管理信息系統中的各類業務數據(如:設備管理、檢修管理、運行管理、缺陷管理、停電管理、基建項目管理、其他項目管理)等信息進行分析,提取滿足各管理階層的業務數據及關聯數據,從大量的數據中挖掘出潛在的價值,為電網且生產生活提供決策支撐。
2.3 電網資產管理在數據挖掘中的跨行業應用
電網資產管理數據除對電力內部業務作支撐以外,在其他領域也能發揮巨大的作用,涉及到城市的多業務多領域,從基礎設施、公共服務、城市管理、能源使用以及產業發展等方面全方位的支撐著智慧城市的發展,電力通信網搭建起城市的“神經網絡”,使城市運行更高效、居民生活更便捷、產業發展可持續。
2.3.1 城市基礎設施智能化
城市建設規劃管理:在城市規劃領域,分布式能源、應急災害指揮系統及輸變電設備狀態監測裝置可以提供空氣溫度、濕度、風速、氣壓、噪聲等環境監測指標,結合電網GIS數據,可對一定區域環境展開多角度監測,并根據區域地理環境,為具體區域全方位提供數據監測指標,配合城市環境對標數據,對某一區域屬性做出明確標識,為城市規劃提供數據支持,通過數據指標可反映出某一區域是否宜居,是否適合建立工業園區,或者應側重綠化建設公園等。
2.3.2 城市管理精細化
區域群體行為分析:美國加州大學洛杉磯分校的研究者就根據“大數據”理論設計了一款“電力地圖”,將人口調查信息、電力企業提供的用戶實時用電信息和地理、氣象等信息全部集合在一起,制作了一款加州地圖。該圖以街區為單位,展示每個街區在當下時刻的用電量,甚至還可以將這個街區的用電量與該街區人的平均收入和建筑物類型等相比照,從而得出更為準確的社會各群體的用電習慣信息。
3 結 論
本文介紹了數據挖掘技術,以及各種技術在電網資產管理中的應用。與傳統的統計數據相比,數據挖掘具有對潛在問題和規律更高的預見性、計算能力和管控能力。電力系統的數據挖掘除了對系統內發、輸、變、配、用、調度等各個環節進行有效的支撐和輔助決策以外,與系統外部數據的整合和挖掘是智能電網對智慧城市支撐的重要體現,從數據層面輔助城市實現智慧和綠色的特點,數據挖掘不僅能夠為政府管理、人們生活和產業發展決策作支撐,也可通過反饋機制不斷收集數據,更新數據庫,提升數據挖掘的可用性、確定性,進一步為城市發展提供支撐和助力。
主要參考文獻
[1]Jiawei Han,Micheline Kamber,Jian Pei.數據挖掘:概念與技術[M].范明,孟小峰,譯.北京:機械工業出版社,2012.
[2]黃杰晟,曹永鋒.挖掘類改進決策樹[J].現代計算機:專業版,2010(1).
[3]陳星鶯,張曉花,瞿峰,等.數據挖掘在電力系統中的應用綜述[J].電力科學與技術學報,2007(9):22.
[4]曾碧波,黃小紅,趙健伍,等.TPS SCADA系統中基于電能分析的數據倉庫模型設計[J].工業控制計算機,2009(9).
[5]周廣惠.對企業用電量分析與預測的數據挖掘[J].裝備制造技術,2009(9).
[6]Sforna M. Data Mining in a Power Company Customer Database[J].Electric Power Systems Research,2000,55(3):201-209.
[7]荀挺,張珂珩,薛浩然,等.電網調控數據綜合智能分析決策架構設計[J].電力系統保護與控制,2015(11):121-127.
[8]牛東曉,邢棉,孟明.基于聯合數據挖掘技術的神經網絡負荷預測模型研究[J].電工技術學報,2004,19(9):62-68.
[9]柴立和.多尺度科學的研究進展[J].化學進展,2005,17(2):186-196.endprint