(東南大學 電氣工程學院, 南京 210096)
摘 要:
將本體的概念引入電力領域知識表達,構建了一個可以被各業務系統所共享的電網運行知識庫。通過具有事件引擎的本體知識鏈結構,將物理本體與事件本體有機結合,基于語義和邏輯順序客觀描述了電網運行的靜態和動態特性。知識庫中的事件引擎檢索方式極大提高了信息查詢的效率。
關鍵詞:數據集成; 本體; 知識表達
中圖分類號:TM734; TP182; TP311.132 文獻標志碼: A
文章編號:10013695(2008)12361403
Construction and research of power grid operation repository based on ontology
YU Jie, WANG Lei , XIA Anbang
(School of Electrical Engineering, Southeast University, Nanjing 210096, China)
Abstract:
This paper introduced the ontology for knowledge representation of power domain. Constructed power grid operation repository to be shared by each application software system. Ontology knowledge chains with event engine comprised tow parts:substance ontology and event ontology. Based on semantics and logic sequence, described static and dynamic characteristics of power grid. The search way using of event engine would greatly improve efficiency of information inquiry.
Key words:data integration; ontology; knowledge representation
0 引言
支撐電網運行的各個業務系統(如SCADA、EMS、TMR等)基本上都是在不同時期、不同自動化水平下建設的。這些系統采用不同的數據庫、操作平臺和開發語言,它們之間的數據溝通與信息集成越來越成為制約自動化水平提高的瓶頸。業界工程師在此方面做了大量實際工作,取得了很大成效[1]。文獻[2~6]描述了幾種常用的電力信息集成方式,其主要采用數據倉庫、數據平臺和CORBA中間件技術。 但這些集成方法均面臨如何更好地解決不同數據模式在結構語義上的異構性問題。
在知識工程領域,異構信息交互越來越多地采用本體模型[7~9]。本體(ontology)原先是一個哲學的概念,近年來成為信息學和知識系統研究的熱點。概而言之,本體提供了對于某一問題域的普遍而且共享的知識表示,并且這種知識能夠在異構且分布的業務應用系統中進行交流和理解,從而實現不同系統之間的信息溝通與共享。
本體自被提出以來就引起了國外眾多科研人員的關注,并在許多領域得到廣泛的應用。目前,本體在電力領域的應用研究并不多,文獻[10]設計了基于本體的電力調度軟件結構,文獻[11]構造了面向本體的電力地理信息系統。本文將本體的概念引入電網運行知識表達,構建了基于各業務系統數據與信息統一整合的電網運行知識庫。通過物理本體和事件本體描述電網的靜態特征和動態行為,并將其有機結合為具有事件引擎的本體知識鏈結構,使各業務系統能夠簡潔、快速、一致地檢索、查詢和調用電網數據。
1 本體的概念
本體的概念起源于哲學領域,用于描述事物的本質,是對客觀存在的系統的解釋或說明。在近一二十年來,本體被計算機領域所采用,用于知識表達、知識共享及重用。許多學科和研究均在使用“本體 這個術語,但存在不同的定義。研究者們普遍接受的呈現高引用率的本體定義是T. Gruber 于1993 年提出的[12]:“本體是對共享的概念化進行形式的顯式規范說明?!逼渲校焊拍罨乾F實世界中現象的抽象模型,明確標志與現象相關的概念;顯式指概念的類型以及概念在使用中的約束應該明確地定義出來。形式的意思即本體應該是機器可讀的;共享是反映本體中的知識是中立的、一致認可的。
本體的目標是捕獲相關領域的知識,提供對該領域知識的共同理解,確定該領域內共同認可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術語) 和詞匯間相互關系的明確定義。本體形式化的描述可用六元組來表示。
Ontology_Name={C,AC,R,AR,H,X}。其中:C={c1,c2,c3…};
AC={AC(c1),AC(c2),AC(c3)…};
R={r1(c1,c2),r2(c1,c2),r3(c4,c2)…};
AR={AR(r1),AR(r2),AR(r3)…};
H={(c1,c2),(c1,c4),(c2,c3)…};
X={x1,x2,x3…}。
C表示概念或者是類的集合;AC表示每個類的屬性集合;R表示關系的集合;H表示類的分類體系;X表示公理的集合。ci是類的一系列對象,并能由AC(ci)標志的屬性來描述;ri(cx,cy)是cx和cy的二元關系,并能被AR(ri)的屬性來描述;(cx,cy)∈H的cx是cy的父類;xi是對AC、AR的屬性的值以及R對象關系的限制。
本體是語義級的知識表示,實現了不同應用之間的翻譯和互操作。利用本體表示電力領域中的專業知識,可以統一術語和概念,實現知識共享。同時,本體可以重用,從而避免知識表達的重復,為異構電力業務系統之間的數據集成打下基礎。
2 電網運行知識庫
知識庫是結構化、易操作、易利用、全面有組織的知識集群, 是針對某一領域問題的需要,采用某種知識表示方式在計算機存儲器中存儲、組織、管理和使用的互相聯系的知識片集合。
本文所構建的電網運行知識庫儲存與電網運行相關的知識,獨立于業務應用系統(如SCADA、EMS等),為這些業務系統提供知識查詢、調用等服務,如圖1所示。
圖1中的知識源表示各業務系統的數據庫、記錄文本(如SOE)以及圖形文件(如SVG)等與電網運行相關的數據與信息。由各業務系統的知識源可以提取出局部本體。局部本體是針對某個業務系統的概念與術語的描述,并不適用于其他業務系統。因此,需要將局部本體整合成全局本體,形成對每個業務系統通用的概念模型。全局本體是對電網運行的術語和概念的統一描述,是各業務系統對該領域知識的無二義性理解。無二義性既是信息集成的目標,也是信息共享的基礎。
全局本體之間進行鏈接組合后,形成電網運行知識庫,不僅能儲存電網結構這樣的靜態知識,突出特點是能儲存電網運行中的動態知識。可見,本體知識庫能夠消除各業務系統中的數據冗余,支持統一查詢和調用,實現了信息共享。
本文著重介紹本體知識庫中的知識表達方式,如何進行本體的提取與整合將另文論述。
3 本體知識表達
電網運行知識庫采用基于電力領域的全局本體進行知識表達。根據電網運行知識的靜態與動態特性,將全局本體分為物理本體與事件本體。
31 物理本體
物理本體也稱為靜態本體,描述電力知識模型中靜態的概念、概念屬性、公理或約束條件以及概念之間的關系。在電力領域本體模型中,物理本體指客觀上、物理存在的電力系統中的實體,如元件、設備以及各種設備間的連接拓撲,也即通常所說的一次設備、二次設備以及各種計量設備。IEC61970系列標準[13]已翔實地定義了該范圍內的絕大部分數據模型與部分數據訪問接口。
311 CIM模型
在概念建模的意義上,IEC61970標準定義的CIM模型相當于電力應用領域內的物理本體的定義。CIM 由包組成,包是將相關模型元件人為分組的方法,每一個包都是一組類的集合,每個類包括類的屬性和與此類有關系的類。CIM模型中的包相當于是物理本體中位于類圖根部的超類,等價于上位本體。CIM 301包括九個包。這些包中定義了一些通用的類,由屬性給定類型名,根據需要實例化具體的對象類型。
312 類的關系
物理本體中的類按照客觀世界中的概念進行定義,類反映了客觀存在的物質或物體,類之間的關系則揭示了它們之間是怎樣相互構造的。CIM模型中類的關系主要有繼承、關聯、聚合幾種。
1)繼承
繼承是一個較普遍的類(父類)與一個較具體的類(子類)之間的一種關系。子類可以從它上層的父類繼承屬性和關系。
2)關聯
關聯是類之間的一種概念上的聯系。每一種關聯均有兩個作用。每一個作用表示了關聯中的一種方向,表示目標類作用和源類有關系。作用給定為目標類的名字,可以帶或不帶動詞。每個作用還有重數/基數,用來表示有多少對象可以參加到給定的關系中。
3)聚合
聚集是關聯的一種特殊情況。聚集表明類與類之間的關系是一種整體—部分關系。整體類由部分類構成或包含部分類,而部分類是整體類的一部分。
以CIM中描述的發電機組類簡要說明各類之間的關系如圖2所示。
圖2中,發電機組類與同步發電機類是簡單關聯的關系,一個同步發電機屬于0或1個發電機組,一個發電機組可以包含1~n個同步發電機。水電機組類和火電機組類從上層的發電機組類中繼承其屬性和關系。發電費用曲線類與發電機組類是聚集的關系,一個發電機組包含0~n個發電費用曲線。
32 事件本體
事件本體也稱為動態本體,描述電網運行的動態知識,也即由突發事件引起的事物或概念的運動和變化。在電力知識建模中,事件本體定義為系統中所發生的各種引起狀態變化的事件,主要體現為電力系統中的各種擾動,如故障的發生、異常的出現等。本文對事件本體的描述是基于情景演算邏輯的(situation calculus)[14]。
321 情景演算
從直觀上看,世界是處于一種既定的初始情景σ0,一個情景可以通過一系列事件或動作而變換為另一個情景。情景的結構是樹狀的,一個事件和它的不同后繼事件或動作產生不同的情景,所以最終的情景是由一系列事件或動作實現的。根據這種上下文的關系可以定義約束狀態(status)概念,表示在一種情景下所具有的情景依賴特性。這種情景依賴特性稱之為流F(fluent),一個狀態對應一個流集。
在情景演算中,若關系σ1<σ2為真,即情景σ2發生在情景σ1之后,當且僅當存在一個動作序列a1,a2,…,ak并且存在
σ2=do([a1,a2,…,ak],σ1)(1)
該公理表明在情景演算中,所有情景依次處于同一分支上,不相鄰的兩個情景總是通過一系列動作演化而來。
322 事件本體中的基本類
可見,情景演算對于描述嚴格串行的活動是非常適合的。電力系統中的突發事件是發生在多個時空點上的復雜事件,因而事件是由一系列的動作組成的活動序列。這些活動序列將電力系統由初始狀態或情景σ0變換為最終狀態或情景σ′。下面對電力領域的事件本體中的幾個基本概念或類進行說明。
1)異常事件類
異常事件類定義電力系統中各種可能出現的擾動、故障或異常。該類可根據不同的故障分為各個子類,每個子類分別描述某種類型的故障或擾動。
2)連鎖反應類
連鎖反應類表征突發的異常事件后系統自動地反應動作,如合閘、重合閘等。
3)控制類
控制類表示通過改變電網的運行方式而對系統運行狀態進行控制的措施,分為預防控制、緊急控制、矯正控制幾個子類,各個子類根據具體的操作不同劃分為更具體的類??刂祁愖饔糜谂c其相關的物理本體中的設備類。
4)系統狀態類
系統狀態類描述系統從初始狀態,經過一系列的事件和動作后到達的最終狀態。本文參照L.H.Fink等人[15]在文中給出的系統狀態定義,將其分為正常狀態、警戒狀態、緊急狀態、極端狀態(瓦解狀態)、恢復狀態幾個子類。各個狀態之間通過突發事件、連鎖反應、控制等一系列動作相互轉換。
323 類的關系
事件本體表現的是電網運行的動態過程。通過事件本體的描述,可以很直觀地表現動態事件過程。這里將電網的初始狀態定義為情景演算中的初始情景σ0,最終狀態定義為σ′。在狀態變化過程中的一系列事件、控制和連鎖反應定義為動作序列a1,a2,…,ak,則電網動態運行過程必然符合式(1)。事件本體中類的關系表明動態過程中各事件或動作的邏輯順序關系,以及相互作用關系。
1)順序
事件本體中類的順序關系遵循情景演算式(1)的定義,初始狀態在一系列動作或事件作用下,演變為最終狀態。這些表示動作的類必須符合順序關系。
2)作用
作用關系發生在事件本體類與物理本體類之間,事件本體類的動作或控制措施作用于物理本體類,如事件本體中的短路類作用于物理本體中的線路類,形成一個短路動作。
33 本體知識鏈
電網運行知識庫中,將物理本體與事件本體相結合,形成一個由事件引擎驅動的本體知識鏈。每一個動態事件對應一條知識鏈,在調用動態知識時,只需按照事件引擎檢索到相應的知識鏈,即能得到與該事件相關的設備、動作、系統狀態等一系列信息。以下通過對單相短路故障進行描述,說明本體知識鏈的表達形式。
單相短路事件過程:初始狀態——線路L單相短路——保護裝置動作(開斷/重合閘)——斷路器動作(切線路)——最終狀態。其中,最終狀態是否穩定由故障的實際情況和保護裝置的動作時間等決定。
這個過程涉及到的物理本體有線路L、線路L的保護裝置、線路L兩端的斷路器;涉及的事件本體有系統狀態類(初始狀態和最終狀態)、異常事件類(單相短路)、連鎖反應類(保護裝置動作)、控制類(斷路器動作)。如圖3所示。
4 應用
基于本體的電網運行知識庫以本體知識鏈結構存儲動態知識,并采用事件引擎檢索方式,使業務功能系統能夠方便地調用相關知識。在電網事故模擬和培訓仿真方面,其應用的優點表現得尤為明顯。
以SCADA事故反演為例,現有的SCADA系統均是將事故斷面的各種數據存儲在數據庫的不同表中,如事故發生時的刀閘狀態在開關刀閘表中,線路潮流數據在線路表中等,而且記錄同一事故的數據有時保存在不同的業務系統數據庫中。在執行事故反演功能時,需要到各個表、甚至不同數據庫的表中取出相對應的數據,然后進行事故模擬計算。而本體知識庫已經將不同業務系統數據庫中的相關數據信息加以整合,并連接成知識鏈結構,只需根據事件引擎,搜索出知識庫中與之對應的本體知識鏈,即可將事故初始數據、過程數據以及事故后的狀態數據都提取出來,用于事故仿真計算以及結果對比分析。表1將原有的數據查詢方式與本體知識庫的方式進行了對比。
5 結束語
基于本體的電網運行知識庫按照電網的客觀物理屬性進行靜態知識表達,并按照事件發生的邏輯順序進行動態知識表達,清晰地表現出電力系統中由突發事件或各種控制措施引起的事物或概念的運動和變化。其中,知識可被各個業務系統所調用,具有通用性。基于事件引擎檢索的知識鏈式使動態知識與靜態知識融為一體,反映了真實的電網運行情況,從知識語義層面實現了電網運行知識的無歧異共享與可重用性。本文知識庫構建的難點在于如何從各種知識源中提取出局部本體,并由局部本體整合全局本體,這也是筆者下一步的研究重點。
參考文獻:
[1]王繼業,張崇見.電力信息資源整合方法綜述[J].電網技術,2006, 30 (9):8387.
[2] 王為國,曾偉民,代偉.基于數據倉庫的一體化電力調度自動化系統[J].電力系統自動化,2003, 27 (12):6770.
[3] 王繼業.基于網格技術的電力信息資源整合方案[J].電力系統自動化,2006, 30 (20):8487.
[4] 王曉波,樊紀元.電力調度中心統一數據平臺的設計[J].電力系統自動化,2006, 30 (22):8992.
[5] 林峰,胡牧,蔣元晨.電力調度綜合數據平臺體系結構及相關技術[J].電力系統自動化,2007, 31 (1):6164.
[6] 劉波,朱傳柏,張燦,等.基于CORBA消息中間件的電力企業信息集成研究[J].繼電器,2006, 34 (13):5662.
[7]GRUBER T R. Towards principles for the design of ontologies used for knowledge sharing[J].International Journal of Humarr Computer Studies,1994, 43 (56):907928.
[8] SU Xiaomeng, HAKKARAINEN S, BRASETHVIK T. Semantic enrichment for improving systems interoperability[C]//Proc of ACM Symposium on Applied Computing. 2004:1417.
[9] 田磊,覃征,衡星辰,等.基于本體的多源異構XML數據近似查詢方法[J].西安交通大學學報,2007, 41 (6):702706.
[10] 馬騫,楊以涵,郭金智.基于本體的調度決策支持軟件系統的設計[J].電力系統自動化,2004, 28 (20):5762.
[11] 王建州,李廉,汪映海.面向ontology的電力信息系統的研究[J].北京郵電大學學報,2005, 28 (z1):116120.
[12] GRUBER T. A translation approach to portable ontology specifications[J].Knowledge Acquisition,1993, 5 :199220.
[13] IEC TC57 wS13. Draft IEC 61970, Energy management system application program interface(EMSAPI)[S].2001.
[14] McCARTHY J. Programs with common sense[C]//MINSKY M. Proc of Semantic Information.[S.l.]: MIT Press, 1968:403418.
[15] FINK L H, CARLSEN K. Operating under stress and strain[J].IEEE Spectrum,1978, 15 :4853.
[16] WILLEM N B. Construction of engineering ontologies for knowledge sharing and reuse[D]. Netherlands: University of Twente, 1997.
[17] CHANDRASEKARAN B, JOSEPHESON J, BENJAMINS V R. Ontologies: what are they? why do we need them?[J].IEEE Intelligent Systems,1999, 14 (1):2026.
[18] USCHOLD M, GRUNINGER M. Ontologies: principles, methods and applications[J].Knowledge Engineering Review,1996, 11 (2):93155.
[19] IEC TC57. IEC 618507, Communication networks and systems in substations[S]. 2003.
[20] 王萍,王利軍,王險峰.面向對象電網知識庫系統的研究與實踐[J].電力系統自動化,2002, 26 (11):6265.
[21] 劉昕鵬.Ontology理論研究與應用建模[EB/OL].[2003].http://gis.pku.edu.cn/Resources/TR.
[22] 徐振寧,黃凱歌,張維明,等.Ontology建模方法研究[J].計算機科學,2002, 29 (1):6871.