劉 歆,胡長(zhǎng)軍,李 揚(yáng),賈麗娜
(北京科技大學(xué) 計(jì)算機(jī)與通信工程學(xué)院,北京100083)
本文提出了一套采油工程領(lǐng)域基于本體的數(shù)據(jù)服務(wù)系統(tǒng) (an oil production engineering ontology-based data service system,OPODSS),OPODSS提供了一個(gè)語(yǔ)義豐富的全局語(yǔ)義數(shù)據(jù)模型和高級(jí)查詢功能。OPODSS屏蔽了底層數(shù)據(jù)源的差異,用戶和上層應(yīng)用程序不必知道數(shù)據(jù)的來(lái)源和復(fù)雜性,可以利用OPODSS 以無(wú)處不在、即需即用[1,2]的方式,直接訪問(wèn)實(shí)時(shí)更新的底層數(shù)據(jù)資源。OPODSS還有語(yǔ)義推理功能,可以推理出復(fù)雜語(yǔ)義關(guān)聯(lián)關(guān)系的數(shù)據(jù)中隱含的知識(shí)。
OPODSS首先使用本體學(xué)習(xí)的方法,抽取油田分布的各專業(yè)數(shù)據(jù)庫(kù)的數(shù)據(jù)模式,建立局部本體,通過(guò)本體演化、本體合并、約束推理,建立一個(gè)語(yǔ)義豐富的全局本體,雖然各個(gè)油田公司的數(shù)據(jù)具有異構(gòu)特性,但是每個(gè)油田公司都有基礎(chǔ)數(shù)據(jù)、生產(chǎn)數(shù)據(jù)、設(shè)備數(shù)據(jù)、地質(zhì)數(shù)據(jù)等這些數(shù)據(jù)類型,因此該全局本體適用于各個(gè)油田公司;然后建立直接訪問(wèn)底層數(shù)據(jù)源的數(shù)據(jù)接口,屏蔽底層數(shù)據(jù)源的分布、異構(gòu)、語(yǔ)義關(guān)聯(lián)復(fù)雜等特性,提供統(tǒng)一、透明的語(yǔ)義數(shù)據(jù)查詢與數(shù)據(jù)共享服務(wù),實(shí)現(xiàn)語(yǔ)義數(shù)據(jù)集成。
實(shí)踐結(jié)果表明,數(shù)據(jù)服務(wù)系統(tǒng)可以為油氣井生產(chǎn)決策提供全面、實(shí)時(shí)的數(shù)據(jù)支持,為優(yōu)化設(shè)計(jì)與診斷提供可靠數(shù)據(jù)服務(wù),進(jìn)而提高產(chǎn)量和采收率、延長(zhǎng)檢泵周期,產(chǎn)生巨大經(jīng)濟(jì)效益。
Michael J.Carey等[3]調(diào)研了3種比較流行的數(shù)據(jù)服務(wù),分別是采用服務(wù)的數(shù)據(jù)存儲(chǔ)、集成的數(shù)據(jù)服務(wù)和云數(shù)據(jù)服務(wù),但是這3種數(shù)據(jù)服務(wù)都沒(méi)有考慮語(yǔ)義之間的關(guān)聯(lián)。
Andreas Bender等[4]提出了科學(xué)工作流中面向服務(wù)的領(lǐng)域數(shù)據(jù)集成框架,該框架建立了領(lǐng)域數(shù)據(jù)模型,讓分布、異構(gòu)的數(shù)據(jù)源與應(yīng)用程序橋接起來(lái),但是文章中的領(lǐng)域數(shù)據(jù)模型不是根據(jù)數(shù)據(jù)源分布、異構(gòu)的特性,從數(shù)據(jù)源學(xué)習(xí)而來(lái),而是領(lǐng)域?qū)<彝ㄟ^(guò)圖形化的界面手工構(gòu)建的,帶有一定的主觀性,而且數(shù)據(jù)元素之間缺乏語(yǔ)義關(guān)聯(lián)。
Raji Ghawi等[5,6]提出了關(guān)系型數(shù)據(jù)庫(kù)到本體的映射的語(yǔ)義互操作,利用DB2OWL工具自動(dòng)從關(guān)系數(shù)據(jù)庫(kù)模式產(chǎn)生本體,但是它沒(méi)有考慮多個(gè)分布、異構(gòu)的數(shù)據(jù)源映射為一個(gè)本體的情況。
Anish Das Sarma等[7]在分析了在大量、異構(gòu)的表中找關(guān)聯(lián)表的問(wèn)題,提出了使用計(jì)算模式相似度的方法查找相關(guān)聯(lián)的表的方案。Li Qian等[8]提出了樣本驅(qū)動(dòng)的模式映射系統(tǒng),但這種方法帶有一定的不準(zhǔn)確性,而且是針對(duì)字符串樣本的模式映射。
OPSDS (Oil production engineering semantic-based data integration system)提供給用戶和上層應(yīng)用程序語(yǔ)義豐富的全局本體和用戶查詢、接收底層數(shù)據(jù)源數(shù)據(jù)的API,有基于函數(shù)的和基于查詢的兩種類型的API。用戶和上層應(yīng)用程序只需要根據(jù)全局本體或數(shù)據(jù)接口進(jìn)行數(shù)據(jù)查詢即可。OPSDS的實(shí)現(xiàn)架構(gòu)如圖1所示。

圖1 OPODSS的實(shí)現(xiàn)架構(gòu)
采油工程領(lǐng)域的數(shù)據(jù)庫(kù)遍布全國(guó),存儲(chǔ)模式和數(shù)據(jù)結(jié)構(gòu)各不相同,數(shù)據(jù)之間存在復(fù)雜的關(guān)聯(lián)關(guān)系,不利于石油領(lǐng)域?qū)<液蜕蠈討?yīng)用程序的使用。因此,迫切需要一個(gè)能針對(duì)異構(gòu)數(shù)據(jù)源和領(lǐng)域術(shù)語(yǔ)的數(shù)據(jù)集成系統(tǒng),屏蔽底層數(shù)據(jù)的差異,通過(guò)領(lǐng)域的全局本體即可訪問(wèn)底層數(shù)據(jù)。
全局本體構(gòu)建時(shí),首先,根據(jù)需求進(jìn)行數(shù)據(jù)篩選,對(duì)需要的數(shù)據(jù)初步分類、整理、歸納,得到系統(tǒng)所需要的數(shù)據(jù)類型,數(shù)據(jù)實(shí)體等。然后,采用自底而上的策略,抽取數(shù)據(jù)庫(kù)的模式信息,建立初始局部本體,再根據(jù)油氣井工程領(lǐng)域的概念集中概念的關(guān)系,將初始局部本體修正為語(yǔ)義更為豐富的局部本體;再通過(guò)各局部本體的演化、合并形成全局本體,然后通過(guò)增加語(yǔ)義約束、細(xì)化和完善,形成一個(gè)完整的、語(yǔ)義豐富的全局本體。
用戶和上層應(yīng)用程序,根據(jù)全局本體或函數(shù)接口,提交查詢請(qǐng)求Request。OPODSS首先解析查詢請(qǐng)求Request,將查詢請(qǐng)求轉(zhuǎn)化為可對(duì)本體進(jìn)行查詢的SPARQL 語(yǔ)句。然后將SPARQL查詢語(yǔ)句重寫(xiě),轉(zhuǎn)換為SQL 語(yǔ)句對(duì)底層數(shù)據(jù)源訪問(wèn),數(shù)據(jù)庫(kù)的查詢結(jié)果根據(jù)規(guī)則庫(kù)的數(shù)據(jù)處理規(guī)則進(jìn)行清洗、轉(zhuǎn)換,Result以統(tǒng)一的格式返回。
SPARQL查詢語(yǔ)句重寫(xiě)轉(zhuǎn)換,是把用戶基于全局本體的語(yǔ)義查詢請(qǐng)求,轉(zhuǎn)換為可以對(duì)底層數(shù)據(jù)源訪問(wèn)的SQL 語(yǔ)句,全局本體到數(shù)據(jù)源的映射,有一對(duì)一和一對(duì)多兩種形式,包括3種方式:
(1)需要的數(shù)據(jù)來(lái)自一個(gè)數(shù)據(jù)源的一張表;
(2)需要的數(shù)據(jù)來(lái)自一個(gè)數(shù)據(jù)源的多張表;
(3)查詢需求需要多個(gè)數(shù)據(jù)庫(kù)的多張表協(xié)同完成。
語(yǔ)義查詢過(guò)程如圖2所示。

圖2 語(yǔ)義查詢過(guò)程
語(yǔ)義查詢的具體實(shí)現(xiàn)步驟如下:
(1)獲取用戶的查詢請(qǐng)求Request,生成全局查詢語(yǔ)句QueryG(QG),QG采用SPARQL描述。
(2)利用邏輯推理機(jī)進(jìn)行推理,將查詢語(yǔ)句QG中的全局本體中的類/屬性名稱轉(zhuǎn)換為相應(yīng)局部本體中的類/屬性名稱。
(3)查詢分解器將查詢QG分解為針對(duì)每個(gè)局部本體的子查詢SubQueryL,SubQueryL= {SQL1,SQL2,…… ,SQLn},其中,n是局部本體的個(gè)數(shù)。
(4)查詢重寫(xiě)器將SubQueryL重寫(xiě)為針對(duì)每個(gè)數(shù)據(jù)源的本地子查詢SubQueryD,SubQueryD= {SQD1,SQD2,…… ,SQDn},SQD采用SQL描述。
(5)執(zhí)行本地子查詢,返回查詢結(jié)果SubResultD,Sub-ResultD= {SRD1,SRD2,…… ,SRDn}。
(6)結(jié)果轉(zhuǎn)換器將查詢結(jié)果SubResultD根據(jù)規(guī)則庫(kù)的規(guī)則,進(jìn)行清洗和轉(zhuǎn)換后,得到規(guī)范化的子查詢結(jié)果。
(7)結(jié)果合并器將規(guī)范化的SubResultD合并,形成最終的查詢結(jié)果Result并返回。
從采油工程領(lǐng)域?qū)?shù)據(jù)的需求出發(fā),開(kāi)發(fā)了OPODSS系統(tǒng),對(duì)油田生產(chǎn)數(shù)據(jù)庫(kù)、勘探數(shù)據(jù)庫(kù)、設(shè)備數(shù)據(jù)庫(kù)、井下作業(yè)數(shù)據(jù)庫(kù)、測(cè)井?dāng)?shù)據(jù)庫(kù)、工藝措施數(shù)據(jù)庫(kù)等多個(gè)專業(yè)數(shù)據(jù)庫(kù)進(jìn)行語(yǔ)義數(shù)據(jù)集成。OPODSS屏蔽了底層數(shù)據(jù)庫(kù)的分布、異構(gòu)、語(yǔ)義關(guān)聯(lián)復(fù)雜等特點(diǎn),可以為用戶和上層應(yīng)用提供更好的數(shù)據(jù)的交互和共享服務(wù)。
目前,OPODSS已經(jīng)可以為多個(gè)上層應(yīng)用提供數(shù)據(jù)服務(wù),其中,比較典型的是采油優(yōu)化設(shè)計(jì)與決策支持系統(tǒng)。采油方案的優(yōu)化設(shè)計(jì)是該系統(tǒng)的重要功能之一。方案優(yōu)化設(shè)計(jì)的作用是,通過(guò)對(duì)抽油機(jī)、抽油桿、抽油泵以及扶正器等抽油設(shè)備的調(diào)整,以產(chǎn)量,泵效,系統(tǒng)效率等為目標(biāo)進(jìn)行綜合評(píng)判,產(chǎn)生不同條件下的采油方案,用戶可以根據(jù)需求選擇最佳方案。
油田進(jìn)行采油時(shí),有多種類型的井。下面以抽油機(jī)井的優(yōu)化設(shè)計(jì)為例,說(shuō)明OPODSS的系統(tǒng)實(shí)現(xiàn)。一口抽油機(jī)井進(jìn)行優(yōu)化設(shè)計(jì)時(shí),根據(jù)井的基礎(chǔ)數(shù)據(jù)、生產(chǎn)數(shù)據(jù)、地質(zhì)(勘探)數(shù)據(jù)等,搭配不同的采油設(shè)備,產(chǎn)生不同條件下的抽油機(jī)井優(yōu)化設(shè)計(jì)方案[9]。采油設(shè)備涉及到抽油機(jī)型號(hào)選擇、桿柱的組合、扶正器設(shè)計(jì)、抽油泵型號(hào)選擇等多個(gè)方面。圖3是進(jìn)行優(yōu)化設(shè)計(jì)時(shí),涉及到的數(shù)據(jù)及其物理分布。
抽油機(jī)優(yōu)化設(shè)計(jì)涉及到多方面的數(shù)據(jù),這些數(shù)據(jù)種類繁多,格式多樣,數(shù)據(jù)信息海量,并高速增長(zhǎng),并存儲(chǔ)于不同的物理數(shù)據(jù)庫(kù)。一方面,一種數(shù)據(jù)可能來(lái)自一個(gè)數(shù)據(jù)庫(kù),也可能來(lái)自多個(gè)數(shù)據(jù)庫(kù);可能來(lái)自一個(gè)數(shù)據(jù)庫(kù)的一張表,也可能來(lái)自一個(gè)數(shù)據(jù)庫(kù)中的多張表。另一方面,這些數(shù)據(jù)庫(kù)的環(huán)境、硬件平臺(tái)各不相同,數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)的存儲(chǔ)模式也不同,這就造成了結(jié)構(gòu)異構(gòu)、語(yǔ)義異構(gòu)、數(shù)據(jù)關(guān)聯(lián)關(guān)系復(fù)雜、難以實(shí)時(shí)交互信息等問(wèn)題。比如,抽油桿結(jié)構(gòu)數(shù)據(jù)體現(xiàn)了典型的異構(gòu)問(wèn)題,分為結(jié)構(gòu)異構(gòu)和語(yǔ)義異構(gòu)。語(yǔ)義異構(gòu)表現(xiàn)為,JH 井號(hào)這一字段,在不同的數(shù)據(jù)庫(kù)中,存儲(chǔ)的名稱不同。在D1數(shù)據(jù)庫(kù)中是JH,在D2數(shù)據(jù)庫(kù)中,存為well_name,在D3數(shù)據(jù)庫(kù)中,存為well。一口井需要一組抽油桿數(shù)據(jù),每根抽油桿包含桿級(jí)數(shù)、桿長(zhǎng)、桿徑等信息,不同的桿級(jí)數(shù)對(duì)應(yīng)不同的桿長(zhǎng)。對(duì)于一個(gè)三級(jí)抽油桿,D1把三級(jí)桿長(zhǎng)組合起來(lái),存成一個(gè)字段;D2 根據(jù)不同的桿級(jí)數(shù),將桿長(zhǎng)分為3行記錄存儲(chǔ);D3是用一行記錄中的3個(gè)字段來(lái)表示,這種抽油桿結(jié)構(gòu)數(shù)據(jù)的存儲(chǔ)方式,體現(xiàn)了典型的結(jié)構(gòu)異構(gòu)。如圖4所示。

圖3 抽油機(jī)井優(yōu)化設(shè)計(jì)

圖4 異構(gòu)的抽油桿數(shù)據(jù)
再比如,井型數(shù)據(jù),體現(xiàn)了數(shù)據(jù)間的關(guān)聯(lián)關(guān)系,因?yàn)榫褪歉鶕?jù)井斜角數(shù)據(jù)計(jì)算而來(lái)。我們把井斜角小于5°的井,當(dāng)作直井;把井斜角大于75°的角當(dāng)作水平井;把井斜角在5°和75°之間的井,看作是斜井[10]。
優(yōu)化設(shè)計(jì)涉及到基礎(chǔ)數(shù)據(jù)、生產(chǎn)數(shù)據(jù)、地質(zhì)數(shù)據(jù)、抽油機(jī)數(shù)據(jù)等多種類型的數(shù)據(jù),這些數(shù)據(jù)存儲(chǔ)在不同的物理位置,存儲(chǔ)在不同的數(shù)據(jù)庫(kù)中,存儲(chǔ)模式也各不相同。語(yǔ)義異構(gòu)、結(jié)構(gòu)異構(gòu)、復(fù)雜的關(guān)聯(lián)關(guān)系等問(wèn)題,使得采油工程領(lǐng)域的數(shù)據(jù)服務(wù)越來(lái)越迫切和重要。
3.2.1 基于函數(shù)接口的服務(wù)
采油方案的優(yōu)化設(shè)計(jì),是典型的利用OPODSS提供的函數(shù)接口,實(shí)現(xiàn)訪問(wèn)數(shù)據(jù)的數(shù)據(jù)服務(wù)方式。上層應(yīng)用程序根據(jù)OPODSS提供的優(yōu)化設(shè)計(jì)函數(shù)接口,即可訪問(wèn)所需的數(shù)據(jù)資源,不必關(guān)心數(shù)據(jù)實(shí)際存儲(chǔ)的物理位置,存儲(chǔ)于哪種類型的數(shù)據(jù)庫(kù),及數(shù)據(jù)的存儲(chǔ)模式。圖5 (a)是抽油機(jī)優(yōu)化設(shè)計(jì)功能的界面,界面上有方案優(yōu)化設(shè)計(jì)所涉及到的數(shù)據(jù),這些數(shù)據(jù)可以通過(guò)OPODSS提供的優(yōu)化設(shè)計(jì)的函數(shù)接口,函數(shù)查詢?nèi)直倔w,然后再映射到數(shù)據(jù)源取得。圖5(b)展示了方案優(yōu)化設(shè)計(jì)所需的部分?jǐn)?shù)據(jù),通過(guò)函數(shù)查詢的方式,映射到的本體,及全局本體與數(shù)據(jù)源的映射關(guān)系。
“我也這么認(rèn)為過(guò)?!庇⒏衤鞠履_,回過(guò)頭對(duì)閉著的大門(mén)說(shuō),“后來(lái)發(fā)現(xiàn),對(duì)你們來(lái)說(shuō),激怒不激怒,結(jié)果都一樣?!?/p>

圖5 油機(jī)優(yōu)化設(shè)計(jì)模塊實(shí)現(xiàn)
圖5 (a)中,Essential Parameters部分需要的數(shù)據(jù),通過(guò)圖5 (b)所示的本體的類well_name、well_class等,映射到生產(chǎn)數(shù)據(jù)庫(kù)取得的,而圖5 (a)中Pumping Unit、Pumping Rod和Defueling Pump部分需要的數(shù)據(jù),是通過(guò)本體類映射到設(shè)備數(shù)據(jù)庫(kù)取得,實(shí)現(xiàn)了分布數(shù)據(jù)的集成,并為上層應(yīng)用程序所用。
圖5 (b)中,生產(chǎn)數(shù)據(jù)庫(kù)中井的名稱為well_name,設(shè)備數(shù)據(jù)庫(kù)中名稱為well,這是典型的異名同義的異構(gòu)現(xiàn)象,我們使用PeDSOnto:hasSynonymy把這兩個(gè)類的語(yǔ)義進(jìn)行關(guān)聯(lián)。這個(gè)例子中,類well和類well_name映射的實(shí)例都是9L106-05。而Pumping Rod部分,體現(xiàn)了結(jié)構(gòu)異構(gòu)的問(wèn)題,OPODSS可以將圖5 (b)中組合存儲(chǔ)的抽油桿結(jié)構(gòu)數(shù)據(jù),處理為圖5 (a)抽油桿結(jié)構(gòu)數(shù)據(jù)的格式,以呈現(xiàn)給用戶和應(yīng)用程序。
圖6是點(diǎn)擊圖11 的 “優(yōu)化設(shè)計(jì)”按鈕,利用這些數(shù)據(jù),進(jìn)行計(jì)算后的結(jié)果,OPODSS對(duì)底層數(shù)據(jù)源的數(shù)據(jù)進(jìn)行重用和共享,為工程所用,實(shí)現(xiàn)了數(shù)據(jù)的 “增值”。

圖6 抽油機(jī)優(yōu)化設(shè)計(jì)的結(jié)果
3.2.2 基于查詢的服務(wù)
OPODSS提供了基于查詢的數(shù)據(jù)服務(wù),可實(shí)現(xiàn)數(shù)據(jù)的語(yǔ)義查詢。
圖7中,勾選左邊的數(shù)據(jù)源,其下方可以看到數(shù)據(jù)源的數(shù)據(jù)物理分布。既可以查詢整個(gè)油田的數(shù)據(jù),也可以通過(guò)勾選的方式,選擇油田中采油廠、區(qū)塊等部分?jǐn)?shù)據(jù)。右邊的現(xiàn)實(shí)字段,可以選擇想要查詢的字段名稱,通過(guò)條件選擇,限制所需查詢的字段的條件,點(diǎn)擊 “增加條件”按鈕,即可把要查詢的字段及其限制條件,添加到右邊的已選條件中。依次,可以添加多個(gè)查詢字段及其查詢條件。點(diǎn)擊 “查詢數(shù)據(jù)”按鈕,即可顯示查詢結(jié)果,及其對(duì)應(yīng)的數(shù)據(jù)源。

圖7 OPODSS的數(shù)據(jù)查詢服務(wù)
圖8是查詢結(jié)果和相應(yīng)的數(shù)據(jù)源的模式。產(chǎn)油量和含水率,分別來(lái)自冀東和大慶的生產(chǎn)數(shù)據(jù)庫(kù);抽油機(jī)型號(hào)字段,冀東油田、大慶油田和總公司的數(shù)據(jù)庫(kù)中都有,但是冀東和大慶油田的該字段,對(duì)應(yīng)的實(shí)際的井號(hào),總公司的設(shè)備數(shù)據(jù)庫(kù)中,該字段對(duì)應(yīng)的是抽油機(jī)型號(hào)的具體參數(shù),而用戶查詢時(shí),這些字段的數(shù)據(jù)都需要,所以,OPODSS就實(shí)現(xiàn)了不同的物理數(shù)據(jù)庫(kù),同一數(shù)據(jù)庫(kù)中,不同表之間的聯(lián)合查詢。

圖8 查詢結(jié)果和數(shù)據(jù)源
冀東、大慶和總公司存儲(chǔ)數(shù)據(jù)所用的數(shù)據(jù)庫(kù)各不相同,這就造成了系統(tǒng)異構(gòu)。字段井號(hào)、產(chǎn)油量、含水率在冀東油田和大慶油田的存儲(chǔ)形式不同,這就造成了語(yǔ)義異構(gòu)。而含水率,冀東存儲(chǔ)的是百分比,而大慶存儲(chǔ)的是小于1的小數(shù),動(dòng)液面的數(shù)據(jù)兩個(gè)油田存儲(chǔ)的精度不同,這就造成了數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)的異構(gòu)。由于油田公司物理數(shù)據(jù)庫(kù)中的數(shù)據(jù),每天都是實(shí)時(shí)更新的,通過(guò)全局本體到底層數(shù)據(jù)庫(kù)的逐級(jí)映射,用戶和上層應(yīng)用程序,可以獲得最新的數(shù)據(jù)。OPODSS可以屏蔽底層數(shù)據(jù)庫(kù)紛繁復(fù)雜的異構(gòu)性和物理的分布性,通過(guò)全局本體,逐步映射到底層的數(shù)據(jù)庫(kù),經(jīng)過(guò)數(shù)據(jù)的查詢轉(zhuǎn)換、數(shù)據(jù)清洗,將查詢結(jié)果以統(tǒng)一的格式返回給用戶。
OPODSS屏蔽底層數(shù)據(jù)源分布、異構(gòu)、語(yǔ)義關(guān)聯(lián)復(fù)雜的差異,建立采油工程領(lǐng)域的全局語(yǔ)義數(shù)據(jù)模型,并提供數(shù)據(jù)的查詢和共享服務(wù),使分布的數(shù)據(jù)無(wú)縫鏈接,使上層應(yīng)用程序在OPODSS上平滑移動(dòng)。
以O(shè)PODSS為核心的采油優(yōu)化設(shè)計(jì)與決策分析系統(tǒng)已經(jīng)在CNPC多個(gè)油田得到應(yīng)用,已經(jīng)為3萬(wàn)余口油氣井的生產(chǎn)監(jiān)控和措施效果評(píng)價(jià)提供全面和實(shí)時(shí)的數(shù)據(jù)服務(wù)。使用OPODSS后,與傳統(tǒng)的數(shù)據(jù)使用方法相比,取得了良好的工程應(yīng)用效果,其中,最突出的效果一個(gè)是延長(zhǎng)檢泵周期,另一個(gè)是提高采收率。
在采油工程領(lǐng)域,檢泵周期是指從上次各種措施后下泵正常抽油開(kāi)始,到這次抽油裝置失效而停止抽油的間隔天數(shù)。OPODSS可以使已有的數(shù)據(jù)資源得到充分利用,提高檢泵周期。井岔74-124的檢泵周期低于100 天,在950 m 和1800m 處頻繁桿斷,系統(tǒng)通過(guò)查詢這口井的歷史數(shù)據(jù),對(duì)已有數(shù)據(jù)進(jìn)行計(jì)算,發(fā)現(xiàn)兩處側(cè)向力達(dá)到6KN,所以優(yōu)化扶正器配置和加重桿長(zhǎng)度后,檢泵周期從100天延長(zhǎng)到122天。再者,系統(tǒng)對(duì)井東3-10使用的抽油機(jī)參數(shù)進(jìn)行調(diào)整,降低電流平衡度、等值扭矩、電流變化后,發(fā)現(xiàn)系統(tǒng)效率從9.8%提高到18.6%,提高了8.8%。調(diào)整前后的對(duì)比見(jiàn)表1。

表1 井東3-10參數(shù)調(diào)整前和調(diào)整后的對(duì)比
使用OPODSS 的采油優(yōu)化設(shè)計(jì)與決策支持系統(tǒng)(PetroPE)已經(jīng)在大慶、吉林、冀東、大港、華北油田推廣應(yīng)用,在華北和冀東油田現(xiàn)場(chǎng)試用軟件,對(duì)356 口井進(jìn)行優(yōu)化和診斷,其中,對(duì)95口井進(jìn)行有桿泵優(yōu)化,系統(tǒng)效率從21.3%提高到26.9%,平均提高5.6%;對(duì)50口井進(jìn)行螺桿泵優(yōu)化,系統(tǒng)效率從30.2%提高到36.7%,平均提高6.5%,前后對(duì)比的柱狀圖如圖9所示。

圖9 系統(tǒng)效率對(duì)比
據(jù)統(tǒng)計(jì),系統(tǒng)效率平均提高1%,不但產(chǎn)油量有明顯的增加,而且年節(jié)電4 億度。所以,OPODSS充分利用數(shù)據(jù)資源,成為了提高產(chǎn)量、減低成本的有效手段。
對(duì)錯(cuò)綜復(fù)雜的領(lǐng)域數(shù)據(jù)進(jìn)行語(yǔ)義數(shù)據(jù)集成,是目前研究與應(yīng)用的熱點(diǎn)。本研究利用本體技術(shù),對(duì)分布、異構(gòu)、語(yǔ)義關(guān)聯(lián)復(fù)雜的數(shù)據(jù)源建立全局語(yǔ)義數(shù)據(jù)模型,提供全面、實(shí)時(shí)的數(shù)據(jù)服務(wù),是一種可行、有效的方法。
對(duì)于數(shù)據(jù)密集型的工業(yè)領(lǐng)域,建立基于領(lǐng)域本體的全局語(yǔ)義數(shù)據(jù)模型,實(shí)現(xiàn)基于語(yǔ)義的數(shù)據(jù)集成,并為上層生產(chǎn)應(yīng)用服務(wù),可以得到很好的應(yīng)用效果。
石油領(lǐng)域是典型的數(shù)據(jù)密集型領(lǐng)域,OPODSS在生產(chǎn)實(shí)踐中起到了關(guān)鍵的作用。OPODSS實(shí)現(xiàn)了數(shù)據(jù)的共享和重用,上層應(yīng)用程序直接通過(guò)OPODSS就可以即需即用地訪問(wèn)分布、異構(gòu)、關(guān)聯(lián)復(fù)雜的數(shù)據(jù)資源,并得到規(guī)范化的數(shù)據(jù),為工業(yè)生產(chǎn)所用。在應(yīng)用需求的驅(qū)動(dòng)下,OPODSS將生產(chǎn)、學(xué)習(xí)和科研緊密結(jié)合,這是推動(dòng)科技進(jìn)步,實(shí)現(xiàn)科學(xué)技術(shù)是第一生產(chǎn)力的有效途徑。
在下一步的工作中,OPODSS 會(huì)在更多的油田使用,并且到推廣勘探、地震等石油方面的其它領(lǐng)域。
[1]Mahmoud H A,Aboulnaga A.Schema clustering and retrieval for multi-domain pay-as-you-go data integration systems[C]//Proceedings of the ACM SIGMOD International Conference on Management of Data,2010:411-422.
[2]GE J,HU C,LI Y,et al.An intermediate view for data integration,management in cloud computing [J].Journal of Computational Information Systems,2013,9 (9):3611-3618.
[3]Carey M J,Onose N,Petropoulos M.Data services [J].Communications of the Acm,2012,55 (6):86-97.
[4]Bender A,Poschlad A,Bozic S,et al.A service-oriented framework for integration of domain-specific data models in scientific workflows[J].Procedia Computer Science,2013,18:1087-1096.
[5]Zhang L,Li J.Automatic generation of ontology based on database[J].Journal of Computational Information Systems,2011,7 (4):1148-1154.
[6]Ghawi R,Cullot N.Building ontologies from XML data sources[C]//DEXA Workshops,2009:480-484.
[7]Sarma A D,F(xiàn)ang L,Gupta N.Finding related tables[C]//Proceedings of the ACM SIGMOD International Conference on Management of Data,2012:817-828.
[8]Qian L,Cafarella M J,Jagadish H V.Sample-driven schema mapping [C]//Proceedings of the ACM SIGMOD International Conference on Management of Data,2012:73-84.
[9]Liu X,Hu C,Li Y,et al.The advanced data service architecture for modern enterprise information system [C]//International Conference on Information Science and Applications.IEEE,2014:1-4.
[10]Jia L,Hu C,Li Y,et al.A semantic-based data service for oil and gas engineering [C]//Proceedings of the 10th Interna-tional Conference on Web Information Systems and Technologies,2014:131-136.