尹壽垚,宋 鑫,郭 駿,張 勇,張 哲,王茂海
(1.國網電力科學研究院,江蘇 南京 211106;2.國家電網公司華北分部,北京 100053)
多維數據建模在電網調控一體化系統中的應用
尹壽垚1,宋 鑫1,郭 駿2,張 勇2,張 哲2,王茂海2
(1.國網電力科學研究院,江蘇 南京 211106;2.國家電網公司華北分部,北京 100053)
目前調控一體化系統所使用數據模型全部是關系型模型,關系型模型具備良好的擴展性,通用性強,但難以支持多維觀察、數據鉆取以及復雜的多維數據集運算等功能。對BI技術的建模思想進行介紹,然后結合電網調控系統的目前數據結構方式以及存在的不足進行分析,并提出基于BI的建模思想對電網調控的數據模型進行重新構造,建立一種電網調控多維方式的數據模型,同時分析多維數據模型在電網調控中應用的優勢,為電網調控數據建模方式以及分析方式提供參考。
多維建模;BI技術;數據鉆取
BI(Business Intelligence)即商務智能,它是一套完整的解決方案,用來將企業中現有的數據進行有效的整合,快速準確提供報表并提出決策依據,幫助企業做出明智的業務經營決策。
商業智能的關鍵是從許多來自不同的企業運作系統的數據中提取出有用的數據并進行清理,以保證數據的正確性,然后經過抽取、轉換和裝載,即ETL過程,合并到一個企業級的數據倉庫里,從而得到企業數據的一個全局視圖,在此基礎上利用合適的查詢和分析工具、數據挖掘工具、OLAP工具等對其進行分析和處理,最后將知識呈現給管理者,為管理者的決策過程提供支持。
目前,智能電網[1]調度技術支持系統的建設尚處在試點和初步發展階段,偏向于基本、常規的功能,智能化程度不高。隨著電力系統的飛速發展,人們對電網運行數據的監控、分析的要求越來越高。此外,調控一體化系統大多采用關系模型,關系模型具備良好的擴展性,通用性強,但難以支持多維觀察、數據鉆取以及多維數據[2]集運算等功能。
商務智能在中國[3]的發展尚處于起步階段,大部分企業對商務智能仍然缺乏必要的了解。國內雖然有寶鋼、中國海關以及大型銀行和電信公司進行過或正在進行數據倉庫和數據挖掘項目[4],但是大部分企業在這方面的應用還幾乎為零。商業智能目前在國內應用的主要問題如下。
a.起步較晚
商務智能在國外,尤其是歐美發達國家,已有一段較長的發展歷史。但在國內,商務智能正處于起步的階段,國外商務智能產品逐漸深入數據的挖掘與分析,但成功率不高。而國內的商務智能產品的功能還有待完善,國內商業智能市場[5]還沒有形成高中低端搭配、渠道健全、功能完整的局面。
隨著國內企業信息化趨向成熟,目前最突出的問題是大量業務數據的分析,還有知識在企業內以及供應鏈上下游企業之間的共享。商務智能將不再是簡單的查詢和報表,而成為集數據整合、分析和應用于一體的平臺,它需要分析數據背后的規律,把數據轉換成真正有價值的信息和知識。可以預見,商務智能將成為國內企業信息化建設不可或缺的一部分,幫助企業積極應對日益激烈的市場競爭。
b.差距較大
目前國內各行業商務智能的發展水平仍是參差不齊,不同規模的企業應用商務智能的差距也在拉大。商務智能在國內的發展呈現區域以及行業的分布不均。在區域上,華北、華東和華南地區商務智能軟件占據了絕大部分的市場份額。而在行業上,電信、金融、服務業等領域的很多企業都建立了部門級數據集市以及簡單的前端展示系統,正繼續向企業級的商務智能應用發展。此外,目前國內市場應用商務智能的企業并不多,應用深入的企業更少,成熟、專業的商務智能實施顧問短缺。
商用BI軟件功能強大,但使用復雜、難以掌握,且難以融合到具體的應用系統中,因此幾乎無法在電力生產管理系統中看到商用BI軟件的應用。利用智能電網調度技術支持系統的BI軟件將充分挖掘電力系統中的海量數據,全面提升智能電網調度系統在輔助決策,可視化展現,數據分析與挖掘等多個方向的技術突破,值得進一步研究。
目前調控一體化系統所使用的模型絕大多數為關系型模型,而且基本上一直都是使用關系型模型,其有自身的優勢。
a.數據結構單一。關系模型中,不管是實體還是實體之間的聯系,都用關系來表示,而關系都對應一張二維數據表,數據結構簡單、清晰。
b.關系規范化,并建立在嚴格的理論基礎上。構成關系的基本規范要求關系中每個屬性不可再分割,同時關系建立在具有堅實的理論基礎和嚴格數學概念基礎上。
c.概念簡單,操作方便。關系模型最大的優點就是簡單,用戶容易理解和掌握,一個關系就是一張二維表格,用戶只需用簡單的查詢語言就能對數據庫進行操作。
關系型模型也有自身的不足之處,如難以支持多維觀察、數據鉆取以及復雜的多維數據集運算等功能,多維處理功能以及前端查詢速度比較慢,查詢語句比較復雜,因此在電網調控一體化系統海量數據的今天,利用關系型數據使用戶很難全面、準確地對關鍵性指標[6]進行分析。
因此需要對調控一體化系統現有的數據模型進行分析,設計出通用的維度,并整理出適合不同應用分析場景的多維數據分析模型,并在此基礎上進行多維展示、數據鉆取以及數據挖掘運算等功能,利用現有的關系型模型的海量數據結合BI建模的思想,建立多維數據模型,方便用戶進行指標數據的全面分析并提供簡單的數據查詢的方式。
電網調控一體化系統多維數據建模方法,其基本思想是利用使用經典的星形模式和雪花模式[7],可以根據分析人員的要求快速、靈活地進行電網調控多維場景的設計,然后進行豐富的維度定義,最后定義相關調控場景關鍵指標的事實表并形成結構良好的電網調控多維數據模型[8]。采用星型模式和雪花模型設計的數據模型有利于提高查詢的效率,而且星形模式和雪花模型比較直觀,通過分析星形模式和雪花模型,很容易組合出各種查詢,使得前端可以展現出更多的查詢主題。多維數據建模后使用轉換軟件進行數據的抽取、轉換和加載,將智能電網調度技術支持系統現有的關系型模型的數據無縫加載到多維數據模型中,實現了多維數據模型的建模。
BI多維數據模型的建立為數據的分析和展現提供了多個角度,針對每個核心指標可以從電力系統的時間,廠站、區域、電壓等級、責任區等多個維度去分析指標的內涵。BI多維數據也可以提供數據在各個維度間的聯動,利用上卷和下鉆的手段可以實現對指標的全面分析[9]。上卷可以從指標的細節角度逐步向上分析,研究指標的宏觀內涵。而下鉆是從指標的高層內涵逐步向細節[10]進行分析,一點點的展現指標的各個方面。
電網調控一體化系統多維數據建模方法,可分為以下幾個步驟。
a.設計電網調控系統常用的主題
b.設計電網調控系統常用的多維模型的維度
需要結合電網調控系統主題以及電網調控數據分析,設計電網調控系統常用的維度。根據調控一體化系統的數據,分析出主要的維度:日期、日間、電壓等級、區域、廠站、責任區、告警類型、越限類型、五類分組等主要的維度,并分別為各維度建立維度表。有了豐富的維度表可以對電網調控系統主要指標從多個維度進行分析。
由圖1可以看出,此模型支持從時間維度進行“年→月→日”鉆取,支持從設備維度進行“區域→廠站→設備”鉆取,從越限類型維度可以進行全部統計或對某類越限進行統計或在多個維度上進行切片、切塊操作。

圖1 多維模型示例
c.設計和加載電網調控系統常用的多維模型的事實表并形成多維數據模型
電網調控總體狀況多維模型設計思路,主要是依賴于EMS系統的相關表結構和電網調控系統常用的主題,建立電網調控一體化系統分析主題的多維模型。多維模型包含維度表和事實表,由維度表和事實表一起構成了多維數據模型的基礎,事實表主要存儲的是調控各主題的關鍵指標,電網調控關鍵指標包括遙測越限時間、遙控次數、事故發生次數、斷面越限時間、母線電壓越限時間、數據不刷新時間、數據跳變次數、電量值、負荷值等。多維數據模型的事實表建立后利用ETL工具將電網調控一體化系統中的數據加載到相應主題的事實表,實現了電網調控一體化系統關系型數據模型無縫轉換成多維數據模型。
利用上述步驟完成電網調控關系型模型轉變成多維數據模型,電網調控一體化系統多維數據建模充分考慮利用BI建模思想并結合電網調控的特點,完成了對電網調控多維數據模型體系建立的實質性研究。利用已建立的多維模型的數據支撐,可以實現電網調控各分析主題的全面展示。
基于母線電壓越限多維模型設計了母線電壓越限DashBoard,可以從時間、區域、廠站、母線等多個維度對母線電壓越限持續時間的指標進行全面和多維展示,并且實現了由區域到廠站,由廠站到母線的多維數據鉆取(見圖2)。電網調控各主題的多維模型建立為指標全面展示提供了豐富的數據源和數據支撐。
由于年齡偏小,無法用言語表達具體的不適,患病期間情緒不好,容易哭鬧;護理人員應該輕撫患兒,增加安全感;給家長宣傳小兒腹瀉的相關知識,緩解家長緊張不安的心理壓力,促使其積極配合治療,避免過度焦慮與醫生產生矛盾。

圖2 母線電壓越限的多維展示
綜上所述,基于BI技術的多維數據建模,將現有系統中關系型數據模型無縫轉換成多維數據模型,解決了關系型模型難以支持多維觀察、數據鉆取以及多維數據集運算等功能。多維數據模型的建立為電網調控領域提供了豐富的多維數據,為電網調控領域的海量數據分析[11]提供了豐富的分析數據源。對推進電網調控的科學發展,提高電網調控的管理水平具有重要意義。
參考文獻:
[1] 劉國民,宋 雨,周慶捷.智能電網信息化體系架構研究[J].東北電力技術,2012,33(2):15-17.
[2] Erik Thomsen.Olap Solutions:Building Multidimensional Infor?mation Systems[J].U.S.:John WILEY&SONS,2004,32-50.
[3] 高 濤,鄧 玲.智能電網及其國內外發展概述[J].東北電力技術,2012,33(2):5-10.
[4] 段云鋒,吳唯寧,李劍威,等.數據倉庫及其在電信領域的應用[M].北京:電子工業出版社,2003.
[5] 楊 超.商務智能的中國攻略[J].每周電腦報,2004,30(4):51-52.
[6] 孫 峰,司紅代,孫曉非.智能電網多指標綜合評估體系研究[J].東北電力技術,2011,32(9):1-7.
[7] 徐義峰,徐云青,陳春明.雪花模型在OLAP多維建模中的應用[J].科技情報開發與經濟,2005,8(2):45-47.
[8] 嚴任遠.基于數據倉庫的企業OLAP多維模型的設計與實現[J].情報雜志,2006,2(3):32-34.
[9] J.W.Han,J.Pei,G'Dong and K.Wang.Efficient Computa?tion of Iceberg Cubes with Complex Measures[J].U.S.:SIGMOD,2001,167-233.
[10] 毛秀麗,彭明霞,陳明昭.OLAP中多維數據庫旋轉的應用[J].計算機應用,2002,11(2):38-49.
[11] J.Han.Towards On-Line Analytical Mining in Large Databas?es[J].U.S.:ACMSIG-MOD,1998,17-23.
Application of Multi?dimensional Data Modeling in EMS System
YIN Shou?yao1,SONG Xin1,GUO Jun2,ZHANG Yong2,ZHANG Zhe2,WANG Mao?hai2
(1.State Grid Electric Power Research Institute,Nanjing,Jiangsu 211106,China;2.The North China Branch of China State Grid Corp,Beijing 100053,China)
Multi?dimensional modeling methods of BI technology,to change the current EMS system using the data model is the rela?tional model.The relational model has good expansibility,strong universality,but it is difficult to support multi?dimensional data,multi?dimensional observation,data drill and complex set of operations and other functions.The modeling idea of BI technology is in?troduced,and analysis is made combining with the current EMS system data structure mode and the existing shortcomings,Recon?struction of the grid regulation data model based on BI modeling is put forward,a multi?dimensional way of regulating the grid data model is established.At the same time the application analysis of multi?dimensional data model in grid control advantages is made,providing the reference for the data modeling and analysis of grid control mode.
Multi?dimensional modeling;BI technology;Data mining
TM73
A
1004-7913(2015)02-0038-04
尹壽垚(1984—),男,碩士,工程師,從事電力調控系統研究與開發工作。
2014-11-25)