陳惟國 易建鋒 張捍衛 付培晨 李 濤 楊曉燕
1.中國石化中原油田分公司 2.中國石化中原油田普光分公司
數據是企業的重要資產,已越來越成為社會的共識。數據是大數據分析、機器學習訓練、智能分析預測的基礎;數據既是價值的源泉,也是創新的基礎。數據資源共享中心是普光智能氣田建設的基礎。普光氣田業務崗位涵蓋勘探、開發、集輸、凈化、安全環保、生產經營和管理等各個方面,業務流程長,涉及專業多,數據來源多,數據量大[1-3];主要數據來源包括靜態(文檔類)數據、SCADA/DCS實時數據、崗位采集數據。崗位數據采集是數據資源中心的重要組成部分。
在進行崗位數據采集和應用系統建設的過程中,首先進行了業務的梳理和調研,發現影響普光崗位業務應用的關鍵因素是數據流分析部分[4],主要存在5點不足:①數據無法全覆蓋普光氣田生產管理業務;②數據本身沒有進行數據流分析,數據的流向不清楚,無法明確數據的采和用;③數據流程不明確,依賴各系統內部管理流程進行質量控制,造成多頭采集,數據一致性差;④數據標準(各崗位)不統一,沒有明確C/R關系,無法合理高效存儲,實現數據唯一;⑤數據共享困難,跨系統數據難以交互,缺少統一的查詢、管控、發布機制。
在普光智能氣田建設規劃頂層設計階段,首先遇到的難題就是數據的規范化和標準化問題。普光智能氣田的首要任務就是面向崗位的全業務鏈提供數據服務和應用,厘清數據的來源與去向,組成完整的數據鏈,建成數據資源共享中心。采取全新的面向崗位數據流分析方法,實現數據有源、流向有序、應用明確、環環相扣數據標準和流程,在崗位采集和應用中實現數據采集、存儲、審核、應用一體化、規范化和標準化,為普光智能氣田建設奠定堅實的數據資源基礎。
通過對普光業務崗位預分析,自下而上地調研與找出存在問題,并結合普光氣田實際進行分析研究,形成了一套適合油氣田崗位數據流分析方法[5],編制了《崗位業務數據流分析指南》。
崗位數據流分析介于業務流程分析和數據元素分析之間[6-7],它以緊密相關的一組數據作為數據集合,來分析數據的傳遞和相互間的作用。既要描述原始數據的語義特征,又要描述數據集的整體特征。數據集分解的粒度大小[8],不僅關系到崗位數據整體準確表現,而且還為數據結構的提取和抽象提供便捷實現途徑。
在普光工作流程、業務崗位分析的基礎上,對崗位產生的資料進行結構化、標準化、規范化加工處理和優化整合,形成可用于建庫的“普光氣田數據模型標準”,成為數據模型和應用系統的關鍵橋梁。為普光一體化服務平臺的數據采、存、管、用提供數據結構支持,滿足普光業務應用的需要。
1.1.1 數據流分析模板設計
1.1.2 崗位業務數據集提取
普光氣田一個崗位通常就是一個應用場景,即一個業務單元,對于操作崗可能有多個業務單元,每個業務單元產生/使用多張報表,每張報表可劃分出一個或多個數據集。從崗位描述入手,參照崗位使用和產生資料,定義每個數據集來源和流向、頻次,以數據集為單位有序流動并提取可物理實現的數據字典[8]。數據集取之于報表,來源于崗位,滿足崗位采集與應用的需要,數據集比較穩定,不因崗位變動而變化[9];滿足邊用邊采,一次采集,共享使用。與普光智能氣田項目業務劃分成果進行對接,形成普光業務模型[2](圖1)。
數據集包含崗位屬性和時空特性,具備流向和類型特征,更加符合崗位特性。數據集劃分應以不割裂崗位完整性為原則[10],按照不同時間維度、不同業務類型、不同設備裝置等進行劃分,同一崗位業務單元中數據集劃分的維度保持一致[8];數據集粒度以數據的關聯程度、崗位間便于傳遞為尺度,通過標準化的流程和工具對數據進行處理可以保證一個預先定義好的高質量分析結果。

圖1 數據集與凈化業務對接圖
借鑒中石化勘探開發數據模型,結合普光氣田業務實際,定義了28項數據集內容。數據集提取原則使用二維數據表結構,但為了滿足普光業務數據三維或多維數據存儲的規范化、標準化,需要增加附錄代碼表進行約束,對量綱標準化[11]。數據集中數據項高聚集,數據關聯性較強,數據單一;數據集組合可以實現普光各種崗位業務需求,與其他數據庫融合較為容易;并可通過崗位交叉驗證,保證數據的完整性和準確性;增加計算數據項描述,為應用提供指導。
1.1.3 數據模型設計
普光氣田崗位分為基層操作崗、技術管理崗、綜合管理崗等,一般來說基層操作崗面向的數據(報表)比較單一,它產生的數據來自各種監控、監視、檢測設備,向技術管理崗提供數據;技術管理崗一般制定、審核、平衡、匯總各類數據,向下(操作崗)發送各項指標、向上(綜合管理崗)分發統計數據;綜合管理崗根據統計數據,結合實物價值量,提供各種可供決策量化經濟指標數據,供更高層次管理者決策。根據普光崗位業務劃分模板和數據集定義模板,分析數據集的流向,利用數據項的C/R分析及驗證,追溯數據在每個崗位中所處的生命周期狀態(Creat、Read、Update、Delete)[12],從而實現崗位數據的采集、應用和監控。
通過對普光崗位業務流及數據流分析,編制數據集數據字典,建設數據模型[12],厘清了普光數據流轉流程及崗位之間依賴關系[13],保證數據質量,為普光氣田數據管理、數據流控制、數據應用打下了基礎(圖2)。

圖2 計量化驗站部分崗位依賴圖
通過對普光凈化廠業務關系確定及數據報表的上下驗證分析,可確定數據來源和流向,理順了凈化廠崗位之間數據關聯及引用關系[14],為數據唯一性、完整性、準確性打下了基礎。
較強的統一性是ERP系統本身所具備的特性,也正是因為這個特性保證了企業管理工作的順利開展,提高了企業管理工作的效率與速度,降低了在實際管理過程中可能出現的工作失誤概率,使企業在信息數據的收集與傳遞過程中所使用的方法更加多樣化。將ERP系統應用到企業管理中,不僅使企業內部的信息數據在實際的溝通交流過程中變得更加便捷,還使企業的管理者和其他員工都能在第一時間全面掌握企業的實際運營情況,從而及時對企業在運營過程中產生的問題采取適當的解決對策,以推動企業的健康穩定發展。
凈化業務崗位數據流分析數據集,可以直接作為數據庫結構來實現數據存儲,也為數據存儲優化提供了基礎(圖3)。
1.1.4 數據流分析編碼規則制定
參照中石化勘探開發數據模型編碼標準,制訂了一套中國石化中原油田普光分公司(以下簡稱普光分公司)崗位名稱、數據集名稱、數據項名稱編碼規則。
崗位名稱、崗位分類使用普光分公司崗位說明書的標準名稱,崗位分類沿用普光分公司人力資源部設定的崗位分類。崗位編碼和數據集編碼兼顧系統性、通用性、可擴延性、可識別性。
以普光氣田業務模型編碼根據部門(二級)和單位(三級)設計,崗位編碼采取11位編碼,數據集采用15位編碼(11位崗位碼+4位數據集碼)[14]。
數據集作為崗位中最基本業務單元,不僅為獨立完整數據表存儲數據,也為數據應用、數據管理、數據傳遞搭建最基本的場景。數據集提取和命名原則上采用三段式方法:數據核心對象(可含數據所屬組織機構)+時間維度(頻度)+數據類型(動賓結構)[9]。
數據項是數據集中不可再分基本元素。數據項代碼可由數據項中文名漢語拼音首字母組成,字母相同則尾部可后綴一個數字以示區別。數據項代碼避免使用SQL語句默認字符串;數據項代碼最長位數在10位以內。
崗位業務數據流分析方法在普光智能氣田各崗位數據流分析中全面應用,基于對普光采氣廠、凈化廠、應急救援中心、生產服務中心及外包生產單位254個關鍵崗位的業務和數據流程進行梳理和分析。通過業務數據建模與標準化,共提取到數據集611個,提取附錄代碼表74張,標準化量綱134個。并在普光氣田崗位數據采集及應用系統中部署實施,得到驗證,見到了較好的效果。

圖3 計量化驗站崗位數據流圖[12-13]
通過普光氣田崗位數據采集及應用系統,實現基層崗位的數據采集、崗位數據計算處理、匯總、崗位報表生成、崗位數據查詢等功能。每個崗位具有獨特應用場景,通過業務流程分析和定制,按照原有工作模式,提交表格完成數據采集和入庫。由原來的逐級錄入轉變為固定模板計算機處理高效流程,建立了數據一次采集支持多級應用的功能。改變了原來多種模板錄入、定時抄取數據、郵件上報后的重復粘貼、人工計算匯總的工作方式,解決了數據共享的及時性和準確性問題,同時減輕了基層崗位人員數據上報的負擔,杜絕了數據重復錄入,提高了基層生產運行和協同效率。崗位數據采集基本實現普光氣田崗位基礎數據采集數字化、報表生成自動化。
以普光天然氣凈化廠計量日報為例,計量化驗站的化驗取樣崗首先提交取樣確認單報表至氣體分析技術崗,錄入天然氣組成測定原始記錄報表;計量交接崗錄入凈化廠供采氣廠用氣量報表,凈化車間的工藝技術崗錄入凈化車間天然氣處理情況報表,數據都提交至計量技術崗進行審核匯總,最后提交至技術辦的工藝技術崗進行審核并使用。
通過對普光氣田崗位數據流統一分析,建立了普光氣田數據流分析方法和數據模型,覆蓋了普光氣田勘探、開發、凈化、生產保障全業務鏈的崗位,為數據的標準化和數據傳輸轉換提供了依據。崗位應用系統的數據采集錄入直接進入普光中心數據庫,作為業務數據進行存儲。數據流分析為數據的完整性、齊全性、唯一性、安全預警應用打下了堅實基礎。
普光智能氣田崗位業務數據流分析方法研究成果,為實現普光氣田各部門、直屬單位統一的數據分析、數據建模、數據采集、數據應用提供了技術路線、可行方法和標準模板。滿足面向崗位數據采集、應用、管理的需求,實現數據的完整閉合,交叉驗證,為今后油氣田的崗位數據分析工作積累了寶貴的經驗,有力推動了信息化與業務的深度融合。
普光智能氣田業務崗位數據流分析方法,補充了混合天然氣勘探開發業務模型,完善了中石化業務模型。可在類似油氣田進行推廣復用,并為智能氣田建設的主數據管理和崗位應用建設提供借鑒。