陳柯宇 孫韻 官慶 劉新 任曉翠

摘 要 基于西南油氣田公司頁巖氣數據集成共享需求,本文在結合各業務系統業務現狀及頁巖氣特殊業務分析基礎上,確定了頁巖氣主數據范圍及標準,構建了數據治理框架體系,并依托公司主數據管理系統,實現了公司層面各業務系統頁巖氣主數據的完整性、唯一性、規范性、一致性、關聯性。并且通過應用實踐,有效支撐了智能分析平臺數據業務。
關鍵詞 頁巖氣;主數據;數據治理;方法應用
引言
主數據是指在整個企業范圍內被多個應用系統共享的、相對靜態的、核心的、高價值的數據,也稱企業基準數據。主數據能夠創建和維護相關領域各業務及系統數據的一致性、完整性、相關性和準確性。因此頁巖氣主數據治理是實現頁巖氣數據集中管理與共享核心任務,為油氣田“智能頁巖氣田建設”夯實數據基礎。
1頁巖氣主數據治理流程設計
主數據治理流程分為三大部分,分別為數據質控、數據入庫、數據分發。
①數據質控:主數據經過問題發現、問題整改、數據庫修改3個階段來發現數據質量問題、治理問題數據,確保主數據的唯一性、準確性。②數據入庫:將質控正確的主數據通過ETL工具,加載到主數據管理平臺數據庫。③數據分發:借助公司主數據管理平臺,將正確的頁巖氣主數據分發至各個業務系統,實現各個業務系統頁巖氣數據一致性[1]。
2頁巖氣主數據治理實施
2.1 頁巖氣主數據治理評估
(1)主數據范圍確定:對各業務系統頁巖氣業務數據使用情況進行梳理,然后由數據治理專家組結合頁巖氣實際數據使用情況和頁巖氣特色業務進行分析,形成分公司范圍內一致的、完整的、準確的頁巖氣核心業務數據。
(2)主數據標準規范:依托分公司主數據管理平臺,建立頁巖氣主數據命名規范、模型標準規范、編碼規范、主數據關聯關系及主數據準確性、完整性業務邏輯規則,制定全生命周期的質量管理流程。
列:井名命名規范:①井號最長不能超過50個字符;②命名結構:井名+井號;③井號若出現重復時,需進行重復處理;若某一構造中一個井號重復需更改時,則這一構造上的所有井號應按相同原則全部更改。④井號中的阿拉伯數字、英文字母或特殊字符(如“-”)保持不變。⑤井號中的羅馬數字需轉變成相應的阿拉伯數字;如Ⅰ、Ⅱ分別轉變成1、2。
(3)主數據差異分析:對不同類型的主數據,各確定一個相對權威數據源系統,然后將其他各業務系統的數據,依次與權威源系統數據進行對比分析,將權威源系統缺失的信息或疑似一致的信息(列:主數據名稱命名不規范,實為同一個主數據;如‘寧209H27-1和‘寧209H27-1實為同一口井)梳理總結,形成差異分析報告以及差異分析表。
(4)主數據信息收集:將主數據差異分析結果派發至各業務單位,由各業務單位確認反饋。
(5)主數據問題整改:將各單位反饋的主數據進行整理清寫,并在數據庫臨時環境中進行更新完善。
(6)主數據治理評估:按照數據治理的規范流程從完整性、唯一性、規范性、一致性、關聯性五個方面對更新后的數據開展數據治理評估工作,對評估結果不滿足的主數據再次進行信息反饋確認。
2.2? 頁巖氣主數據入庫管理
(1)主數據管理系統入庫:數據治理技術組通過ETL工具,將確認后的權威主數據信息從臨時環境加載到主數據管理系統。
(2)業務系統入庫:借助主數據管理平臺,將分公司頁巖氣主數據信息分發至各業務系統。至此,實現了公司所有業務系統頁巖氣主數據的完整性、唯一性、規范性、一致性、關聯性[2]。
3結束語
數據質量是保證數據應用的基礎,本文通過對頁巖氣主數據進行治理,確保主數據規范“五性”,即:完整性、規范性、唯一性、準確性、關聯性。避免各應用系統相互共享數據形成網狀結構,同時能夠保證對外提供準確、一致的數據。通過數據治理提升數據質量,為生產態勢感知提供精準數據支撐,通過建立數據標準、規范,構建數據治理架構,實現和完善數據共享機制從而幫助油田單位通過數據分析和復用降低成本提高效益。
參考文獻
[1] 續瑾成.淺談數據治理在數據質量管理中的作用[J].中國管理信息化,2016,31(18):192.
[2] 張瓊文.試論數據治理在數據質量管理中的作用[J].通訊世界,2017,28(3):140-141.
作者簡介
陳柯宇(1987-),男;畢業院校:西南石油大學,專業:電信科技,學歷:學士學位,職稱:工程師,現就職單位:中國石油西南油氣田公司通信與信息技術中心,研究方向:信息系統研發和運維。