肖 波,文必龍,邵 慶
(1.成都理工大學 能源學院,四川成都 610059; 2.中國石油化工股份有限公司 信息系統管理部,北京 100005;3.東北石油大學 計算機與信息技術學院,黑龍江 大慶 163318)
基于業務模型的油氣勘探開發數據標準體系設計
肖 波1,2,文必龍3,邵 慶3
(1.成都理工大學 能源學院,四川成都 610059; 2.中國石油化工股份有限公司 信息系統管理部,北京 100005;3.東北石油大學 計算機與信息技術學院,黑龍江 大慶 163318)
石油工業信息標準中,數據技術標準占很大的比例,但大量的數據技術標準之間缺少協調一致的機制.采用綜合標準化方法,提出由業務層和系統層標準構成的石油數據標準體系架構.在業務層,以業務模型為核心集成業務層的數據標準;在系統層,按數據的生命周期,設計數據的采集、傳輸、存儲、管理、服務和應用等系列標準.采用模型驅動的思想,實現業務層與系統層之間標準的銜接,并用元模型對系統層不同數據標準進行統一描述、統一管理,形成一個可高度集成的石油數據技術標準體系.
綜合標準體;業務模型;數據標準;模型驅動;元模型
在石油工業信息標準中,數據標準占絕大多數.以石油行業標準為例,當前石油信息行業標準共發布37項標準,其中數據類標準為29項.隨著數字油田、智能油田建設的深入,系統規劃或設計油氣勘探開發數據標準體系成為石油工業信息標準化方法研究的重點.
景瑞林[1]提出以業務流、數據流為主線索,進行調研和分析的石油天然氣勘探開發數據標準體系研究方法,梳理源頭數據和代碼體系,設計數據元和元數據、分類與編碼、源點信息采集、業務模型、圖形格式、數據交換標準等標準分類.趙豐年等[2]結合石油勘探開發數據采集、管理與服務,從技術和管理方面及數據元、元數據和管理標準3個維度建立石油勘探開發數據標準模型.王輝等[3]提出FOL數據標準體系,從數據標準內容的擴展性方面,按照固定(Fixed)、開放(Open)和本地化(Local)3個層級進行油田數據標準體系設計,有效解決數據標準的適用性問題.Energistics從數據操作角度提出數據模型、數據存取、數據交換、數據服務等系列石油數據標準[4].為了描述數據標準,Zcollection定義資源集合組織、檢索開發框架,該框架有良好的框架結構和可擴展性,能夠很好地描述集合、對象,以及它們之間關系的元數據[5-6].這些研究雖然從各自的角度提出定義和管理數據標準化框架,但過于單一,難以形成系統化的、嚴謹的體系架構.綜合標準化方法具有綜合性、成套性、整體協調性等特點[7-8],對系統化地設計數據標準體系具有參考價值.
筆者在總結中國石化數據標準制訂過程的技術和經驗基礎上,采用綜合標準化方法的思想,提出基于業務模型的數據標準體系,設計數據標準綜合體和油氣勘探開發數據標準框架;提出油氣勘探開發的業務模型,將數據標準的各個內容集成到業務模型的各個單元;給出面向數據集成的模型驅動架構,實現業務層與系統層之間標準的銜接.
油田信息系統建設是一個復雜的系統工程,石油數據標準體系應與油田信息系統架構保持一致,標準之間達到高度協調,因此,石油數據標準體系應該有一套成熟的方法.在傳統標準化中,特別是在政府直接管理標準化時,由于受上下機構的影響,存在“多而散”的特點,要求必須采用新的方法——綜合標準化.

圖1 基于數據體系結構的數據標準綜合體Fig.1 The data standard-complex based on data architecture

圖2 基于數據生命周期的數據標準綜合體Fig.2 The data standard-complex based on data life cycle

圖3 勘探開發數據標準框架Fig.3 The data standard framework for petroleum exploration and production
兩個數據標準綜合體將數據標準分為業務層和系統層.數據采集和應用是聯接業務層和系統層的兩個關鍵接口.數據標準綜合體的結構存在問題:(1)業務層面的各數據標準的關聯;(2)業務層與系統層之間標準的銜接;(3)系統層的各數據標準之間的集成.這些問題是實現勘探開發數據標準之間相互協調、集成為一個有機整體的關鍵.因此,提出油氣勘探開發業務模型和數據集成的模型驅動架構,其中業務模型用來集成業務層的數據標準;模型驅動架構用來集成業務層與系統層,并對系統層數據標準進行集成化管理.
業務模型(Business Model)是一種通過定義組成活動及活動之間邏輯關系描述企業經營生產過程的模型.油氣勘探開發業務建模是將石油勘探開發生命周期中涉及的業務抽象為一個完整的業務功能結構,在系統地、本質地、概括地抽象勘探開發功能結構的同時,還要建立每一個業務功能相關的數據、知識、軟件等的關聯關系[9].
業務分析與建模過程從形式上可分為4個階段:一是業務領域劃分;二是分業務領域建模;三是業務模型集成;四是業務模型標準化.
業務模型采用“業務域—業務分類—業務活動”三層結構(見圖4).由圖4可以看出,將油氣勘探開發所有業務劃分為多個業務域,每個業務域建立多級業務分類,每個分類中定義一個或多項最基本的業務活動.

圖4 油氣勘探開發業務模型的體系構架Fig.4 The architecture of business model for petroleum exploration and production
業務域(Business Domain)是對企業中的一些主要業務活動領域的抽象,而不是現有機構部門的照搬.對油田業務域的劃分可以根據某一主題進行.業務領域的劃分原則:(1)根據專業劃分業務領域;(2)根據油氣田勘探、開發生命周期劃分業務領域;(3)根據油氣田勘探、開發管理階段劃分管理業務域.業務領域的劃分參照三種原則,盡量符合油氣田勘探、開發管理的約定俗成的管理習慣,做到不同業務域間的業務不重復,并保證能覆蓋所有的勘探、開發業務.因此,將油氣勘探開發業務領域劃分為“物化探”、“井筒工程”、“分析化驗”、“綜合研究”、“油氣生產”、“地面工程”等六大業務領域.
業務是由一系列業務活動組成的,對業務活動的描述按照“6W”模式進行[9],即活動是由誰(Who)發起的、在什么時間(When)發起的、在哪里(Where)發起的、為什么(Why)要發起這個活動、在這個活動中都涉及到哪些(Which)對象、這些對象的特性是什么(What).采用業務單元定義參與業務活動的基本元素及元素之間的關系.一個業務單元包括八類元素:1個業務活動、該活動作用的1個業務對象、實施該活動的組織機構、1組結果對象(輸出)、1組參與對象(輸入)、業務規則、相關對象的特性和對象之間的關系(見圖5).
業務單元中,“特性”定義業務活動需要的數據、業務活動相關的知識,是數據規劃梳理的重點;“參與對象”包括各種人員、軟件、數據、設施、材料和方法等;“作用對象”包括區塊、油藏、井、層位、油田和企業等;“結果對象”可以是油井等油田實物對象,也可以是文檔、方法和研究成果等技術性對象.
基于“6W”的業務模型的建模通過在統一的業務域分類架構下,對單一業務活動的業務單元進行描述,沒有進行專門的業務流程梳理;由于業務單元中描述業務活動參與對象與結果對象,即定義活動的輸入與輸出,以這些對象為中介,很容易自動形成業務流、數據流和知識流等流程.
業務活動與數據之間的關系可以用“CUR”矩陣描述.矩陣中,行對應業務活動,列對應數據元.如果業務活動中創建某一項數據,則行列對應的值標識為“C”(Create);如果業務活動對數據進行更新,則標識為“U”(Update);如果業務活動引用某一項數據,則標識為“R”(Read).對“CUR”矩陣,可以檢查某一數據是否有惟一的創建源頭,保證數據源頭的惟一性.根據CUR關系,可以自動形成數據流.
2007年全球金融危機爆發后,國內外經貿格局發生了深刻變化,集中表現為以下幾個方面:一是經過三十多年的高速發展,我國社會經濟全面發展,整體技術水平、企業管理能力、資本累積、工業體系、人均收入水平以及總體供給能力與整體消費實力顯著提高,引領我國開放發展由“引進來”邁向“引進來”與“走出去”并重的新格局;二是西方國家開始著手構建以“競爭中立”“管制一致性”等為內核的新的全球經貿規則體系,將開放發展的談判與改革議題拓展至海關之外的“非關稅”領域;三是我國比較優勢體系發生結構性變遷,傳統的勞動力成本優勢逐步喪失;四是西方發達國家發展趨緩,需求萎縮。
除了數據外,業務活動還可與知識、軟件等關聯;通過這些關聯,形成以業務模型為基礎的企業標準化的數據管理、知識管理和軟件服務等信息技術標準化體系.
這里的業務模型是一種邏輯模型,與現實中的油氣勘探開發業務并不是一一對應的.一個實際的油氣勘探開發業務通常由一個或多個業務活動組成,因此,可以將業務模型看作是一個標準化的業務活動組件庫.在將實際工作中的業務與業務模型中的多個業務活動對應起來時,所需要的數據、報表、成果、軟件和方法可自動推理出來,快速實現數據服務、知識推送和應用激活等業務支持.

圖5 業務單元的結構Fig.5 The structure of business unit
所謂模型驅動是指為實現系統的目標,將系統分為若干個層級,在每一個層級上通過模型描述該層級上的實體,建立不同層級上模型之間的映射關系.根據模型間的映射關系,人工或計算機可以完成從源模型到目標模型的變換,從而達到系統運行的目標[10].在數據的生命周期中,每一個環節都可以用相應的模型進行描述,如數據采集模板、數據存儲模型、數據交換模型等,解決不同模型之間的變換,實現數據的流轉,從而解決勘探開發業務中的問題.
為了實現不同模型之間的轉換,MOF定義4層元數據體系結構,分別用M0~M3表示:M0為信息層,M1為模型層,M2為元模型層,M3為元元模型層[11-12].按照模型驅動理論,設計面向油氣勘探開發數據集成的模型體系(見圖6).
由圖6可以看出,M0指存儲在各類數據庫中的具體數據,包括結構化數據和非結構化數據.
M1指各種模型.除數據采集規程、數據管理規程和資料管理規程等規范人的操作行為的標準外,其他的數據標準可以采用模型進行定義.業務模型中,與業務單元關聯的每一種模型都可表達為對數據的需求,表達成用戶數據視圖.在用戶數據視圖和邏輯數據模型之間可建立映射關系,不同結構的物理數據模型之間也可建立映射關系,映射關系即模型映射字典.用投影描述邏輯數據模型與物理數據模型之間的轉換,各種模型轉換構成從業務到數據的映射路線[13].
為了描述和管理各類模型,包括業務模型和數據模型,設計勘探開發元模型(M2),并建立勘探開發元數據庫,業務模型和數據模型以元數據的形式保存在元數據庫中,這些元數據與各模型是等價的.

圖6 油氣勘探開發數據集成的模型體系Fig.6 The model architecture of data integration for petroleum exploration and production
基于元模型,業務模型和各類數據模型有統一的描述方式,因此可以對模型進行統一的管理[13],包括模型的注冊、發布、模型與數據庫的一致性檢查、模型培訓等.對已經發布為標準的模型,采用元數據進行管理具有特點:
(1)所有標準除發布標準文本外,提供與標準一致的元數據及元數據服務,方便標準的應用,減少標準應用過程中由技術原因產生的不一致問題.
(2)增加采用相同標準的系統間的互操作性和集成性.由于采用相同元模型和元數據,不同系統之間可交換和共享元數據,在基于相同元模型的組件間可進行無縫集成.
(3)在業務層和系統層之間建立映射關系,可實現兩個不同層級間數據的模型驅動.可將業務層的數據操作自動轉換為對系統層的數據操作,業務層的應用減少對系統層的依賴,將系統層的實現方式透明化,因此,可提高業務層對數據操作的靈活性和可擴展性.
(4)系統層的不同模型之間通過映射,可實現數據流不同環節的模型驅動.通過對源頭數據庫、數據中心主數據庫、項目數據庫等數據庫模型之間建立映射關系,利用數據遷移工具和數據訪問服務可輕松實現異構數據庫間的數據流動和相互訪問,實現異構數據庫集成.模型之間的映射關系可通過人工進行定義,也可以通過數據模型語義進行自動映射[14-15].
該標準體系架構在中國石化得到實際應用,形成中國石化數據標準體系[16].
按照綜合標準化方法,設計基于數據體系結構的和基于數據生命周期管理過程的數據標準綜合體,提出油氣勘探開發數據標準體系架構,該體系由業務層和系統層的標準構成.以業務模型為基準,將不同的數據標準集成到統一的業務模型,保證不同石油專業間數據需求的一致性.采用模型驅動的思想,有效地實現業務層與系統層之間標準的集成,采用元模型對不同的數據模型進行統一描述、統一管理,形成一個可高度集成的石油數據技術標準體系.
基于業務模型的標準體系架構不僅適合于石油勘探開發數據標準體系的設計,同樣適合其他石油信息標準體系的設計.以石油勘探開發業務模型為基礎,開展智能油田標準體系的建設是未來研究的重點.
[1] 景瑞林.石油天然氣勘探開發數據標準體系研究[J].標準科學,2012,49(4):42-46.
Jing Ruilin.Research on oil and gas exploration and development data standard system[J].Standard Science,2012,49(4):42-46.[2] 趙豐年,曲壽利.石油勘探開發數據標準體系分析[J].石油物探,2010,49(2):198-202.
Zhao Fengnian,Qu Shouli.Analysis of petroleum exploration&development data standard system[J].Geophysical Prospection For Petroleum,2010,49(2):198-202.
[3] 王輝,徐鵬,徐金蘭,等.基于FOL方法的數據標準體系建設[J].石油工業技術監督,2012,28(7):29-31.
Wang Hui,Xu Peng,Xu Jinlan,et al.Building data standard system based on method of FOL[J].Technology Supervision In Petroleum Industry,2012,28(7):29-31.
[4] Energistics.POSC E&P cataloguing reference standards[EB/OL].http://w3.energistics.org/epicat/epicat.shtml,2004-02-03.
[5] Library of Congress.Z39.50 profile for access to digital collections[EB/OL].http://www.loc.gov/z3950/agency/profiles/collections.htm,1996-05-03.
[6] Meg Sweet,David Thomas.Archives described at collection level[EB/OL].http://www.dlib.org/dlib/september00/sweet/09sweet.html,2000,6(9).
[7] 董曉媛,趙朝義,逢征虎,等.綜合標準化工作指南(GB/T 12366-2009)[M].北京:中國標準出版社,2009.
Dong Xiaoyuan,Zhao Chaoyi,Peng Zhenghu,et al.Guideline for the work of complex standardization(GB/T 12366-2009)[M].Beijing:China Standards Press,2009.
[8] 李春田.現代標準化方法:綜合標準化[J].中國標準導報,2011,7:4-7.
Li Chuntian.Modern standardization method:Complex standardization[J].China Standards Review,2011,7:4-7.
[9] 肖波,景帥,吳建軍,等.基于模型驅動的中國石化企業數據中心模型架構[J].大慶石油學院學報,2012,36(1):78-82.
Xiao Bo,Jin Shuai,Wu Jianjun,et al.Architecture based on MDA of oilfield enterprise data center in SINOPEC[J].Journal of Daqing Peroleum Institute,2012,36(1):78-82.
[10] 王志寶.基于模型驅動的企業應用軟件開發方法研究[D].大慶:大慶石油學院,2007.
Wang Zhibao.Research on the enterprise applied software development methods based on model driven[D].Daqing:Daqing Peroleum Institute,2007.
[11] Kleppe Anneke.MDA explained[M].Beijing:Posts&Telecom Press,2004:2-33.
[12] OMG.Documents associated with meta object facility(MOF)version 2.4.2[EB/OL].http://www.omg.org/spec/MOF/2.4.2/PDF/formal-14-04-03.pdf,2014-04-03.
[13] 文必龍,肖波,陳新榮.石油勘探開發數據元管理技術[J].大慶石油學院學報,2012,36(1):83-87.
Wen Bilong,Xiao Bo,Chen Xinrong.Research on management technology of petroleum explortion and production data element[J].Journal of Daqing Peroleum Institute,2012,36(1):83-87.
[14] 秦善華,史春波,邵慶.基于數據元的數據模型語義描述[J].大慶石油學院學報,2009,33(3):100-103.
Qin Shanhua,Shi Chunbo,Shao Qing.Based on the data elements to describe the semantic data model[J].Journal of Daqing Peroleum Institute,2009,33(3):100-103.
[15] Wen Bilong,Zhang Li.Defining semantics for data element with semantic tree[C].Proceedings of 2008 International Symposium on Information Science and Engineering.Shanghai,2008:524-527.
[16] 李劍峰,肖波,段鴻杰.中國石化油田企業數據中心總體框架設計[J].大慶石油學院學報,2012,36(1):73-77.
LI Jianfeng,XIAO Bo,Duan Hongjie.Design of architecture for oilfield enterprise data center in SINOPEC[J].Journal of Daqing Peroleum Institute,2012,36(1):73-77.
TP311
A
2095-4107(2014)04-0086-06
DOI 10.3969/j.issn.2095-4107.2014.04.013
2014-05-23;
劉麗麗
國家科技重大專項(2011ZX05023-005-012)
肖 波(1963-),男,博士,高級工程師,主要從事油田企業信息技術方面的研究.