施冬,張春生,施斌全
(1.長江大學地球科學學院,湖北 荊州 434023;2.中國石化勝利油田鉆井工藝研究院,山東 東營 257017)
低電阻率油層主要是指油層電阻率小于或接近其圍巖電阻率或鄰近水層電阻率,含油飽和度一般小于50%的油層。采用常規測井解釋方法進行低電阻率油層的識別時,由于其在電性上所表現的特殊性,常常會出現油水層誤判的問題。同時,在評價過程中,通常都是根據所研究的油田特征選取不同的判別指標進行油水層的識別,而這些判別指標的選擇存在較大的經驗性[1]。
粗糙集Rough Set(RS)理論是Z.Pawlak教授在1982年提出的一種完全數據驅動的多指標綜合評價方法[2]。它可分析不完整的數據,找出數據間的關系,從而提取有價值的屬性。該方法克服了以往評價參數選擇的主觀性,但也存在容錯和推廣能力相對較弱、只處理量化數據等問題。而灰色系統恰恰具有相對較強的容錯和推廣能力,但存在不能選擇條件屬性組合等缺點。因此,將粗糙集與灰色系統相結合解決低電阻率油層評價問題具有較強的互補性,可以獲得很好的判別效果。由此,本文提出了基于粗糙集和灰色關聯相結合的方法識別該類儲層。
粗糙集理論[3-5]是一種研究不精確或不確定性知識的數學工具。屬性約簡就是在保持分類能力不變的前提下,通過對知識的約簡獲得分類的規則,以便人們做出快速而準確的決策。
定義1:信息系統S=(U,A),其中,U={x1,x2,…,xn}為論域,是所有樣本的集合;A是有限屬性集,分為條件屬性集P(反映對象特征)和決策屬性集Q(反映對象類別),即A=P∪Q,P∩Q=Φ。
定義2:當2個不同的對象由相同的屬性描述時,這2個對象在該系統中被歸于同一類,它們的關系稱之為不可分辨關系(indiscernibility relation),即對于任一屬性子集P?A,如果對象xi,xj∈U,?r∈P,當且僅當f(xi,r)=f(xj,r)時,xi與xj是不可分辨的,簡記為ind(P)。
定義3:給定論域U,對于每個子集X?U和一個等價關系R∈ind(S),定義2個子集

分別稱它們為X的R下近似集和上近似集。POSR(X)=稱為X的R正域。
定義4:令R為一等價關系,且r∈R,若有ind(R)=ind(R-r),則稱r為R 中可省略的;否則,稱r為R中不可省略的。P中所有不可省略關系的集合,稱為P的核,記作CORE(P)。即
CORE(P)=∩red(P),其中red(P)是P 的所有簡化族。
定義5:知識的依賴性可形式化地定義如下:令S=(U,R)為一知識庫,且P,Q?R,k=γp(Q)=稱知識Q是k度依賴于知識P的(0≤k≤1),記作P?kQ。系數k或γp(Q)可看作Q和P間的依賴度。
定義6:根據粗糙集理論屬性重要度的概念,定義指標a在指標體系中的重要性為

式中,P為條件屬性的集合;Q決策屬性的集合。
指標r的權重為

式中,ωa為指標a的權重;i為指標集合P 中的指標。
粗糙集重要性算法步驟見圖1。

圖1 屬性重要性算法步驟
首先利用相對正域求出信息系統的核,然后,以屬性的依賴度定義屬性的重要度,選擇重要度大的屬性加入約簡集,直到滿足終止條件為止,假設依賴度閾值為ε。
灰色系統理論認為,任何隨機過程都是在一定幅值范圍和一定時域內變化的。對于油、氣、水層,油、氣、水層的各類特征參數均不是確定值,而是在一定范圍內變化,即為灰數。由它們的界限值組成的信息系統,數據離散、雜亂,包含了多種影響因素,對此很難作出定量描述,但它們作為灰色信息系統來講是一個整體,是有序的[6-7]。
依據有效厚度標準的結果列出油層、油水層、水層、干層等的評價數據列X0,根據上述Rough set簡化后得到被比較數據列Xi和相應的權值數據列T,表示為

式中,i=1,2,…,N,N為油水層的分類總數。若將儲層分為油層、水層和油水層,則N=3;n為評價參數的個數。若評價標準有地層電阻增大率、可動水飽和度、電阻率等3個參數,則n=3。
關聯性實質上是曲線間幾何形狀的差別,因此將曲線間插值的大小作為關聯程度的衡量尺度。采用層點標準指標絕對值的極值加權組合放大技術計算灰色關聯系數

式中,|X0(k)-Xi(k)|=Δi(k),k=1,2,…,n,i=1,2,…,N;Pi(k)為X0與Xi在k 點(參數)的關聯系數;Δi(k)為第k點X0與Xi的標準指標絕對差;為標準指標兩級最小差|X0(k)-Xi(k)|為標準指標兩級最大差;T(k)為第k點的權值;A為灰色分辨系數,一般在0.5~1之內選取,通常取0.5。
可以得到關聯系數序列

由于關聯系數較多,信息過于分散,不便于比較優選。為此采用綜合歸一技術,將各個判別類型的關聯系數集中為一個值,一般采用求平均值的方法。關聯度的一般表達式為

式中,Pi為灰色多元加權歸一系數的行矩陣。
得到關聯度序列

最后,利用矩陣作數據列處理,根據最大隸屬度原則

式中,Pmax為灰色多元加權歸一系數行矩陣最大隸屬值,相對應的油水層類型就是樣品點的評價結果。
用于儲層含油性評價的定量參數很多,在這些參數中如何選取在儲層含油性評價中起關鍵作用的評價參數是油氣層評價的關鍵。應用粗糙集理論的屬性重要性判斷方法,將儲層的采樣點作為研究對象,各測井曲線和儲層參數作為對象的屬性,測井值及參數值作為屬性值,對樣本點的含油性判斷作為決策屬性;通過對多個采樣點的研究可以判斷測井的響應值在含油性判斷中哪些是重要的,以及重要曲線的相對重要程度,刪除多余信息。再利用灰色關聯方法對含油性作出判斷。基于粗糙集油氣層灰色評價的過程見圖2。

圖2 基于粗糙集的低電阻率油層灰色識別過程
首先對輸入數據的特征屬性進行預處理,然后利用粗糙集理論屬性重要性方法對預處理后的多個屬性進行約簡,消除冗余,再采用灰色關聯法對約簡后的屬性樣本進行判別分類,實現對低電阻率油層的識別。
(1)低電阻率油層識別參數的選取。低電阻率油層的識別是利用多種對低電阻率儲層敏感的測井參數進行判別的過程。
(2)測井曲線的預處理。在測井的過程中,由于測量環境和測井儀器刻度會給測井數據帶來誤差。為了消除或減少這些誤差,須對測井數據進行歸一化處理,其實質是消除量綱的影響。數學表達式為

式中,X為測井響應值;Xmin為測井響應最小值;Xmax為測井響應最大值;X′為歸一化處理后的響應值。
(3)建立低電阻率油層識別系統。以儲層采樣點作為研究對象的數據集合U,以測井曲線為識別特征集(對象屬性),以儲層含油性為識別結果集(結果屬性),以處理過的測井響應值為屬性值集,建立低電阻率油層識別系統。
(4)屬性重要性判斷、屬性約簡。應用粗糙集理論對各評價屬性的重要性進行判斷,得出重要屬性的最少組合,同時得到各個屬性的相對重要性。
(5)構造評價矩陣,進行含油性灰色評價。通過上述方法得到的最優屬性組合作為灰色評價的評價參數列,構造評價矩陣R。應用灰色系統理論對屬性選擇后的儲層進行含油性評價。
選取了某油田18口有測試資料的井共計30個小層進行實證研究。
通過對研究區低電阻率油層及水層的測井參數統計,選擇了5個影響該地區低電阻率油層識別的初始評價參數(見表1)[8],分別為地層電阻率(Rt)、可動水飽和度(Swm)、泥質含量(Vsh)、孔隙度(φ)和電阻增大率I(電阻率指數)。把這30個樣本集合以U={1,2,…,30}表示,將這5個初始評價參數作為樣本集合U 上的特征屬性P,P={Rt、Swm、Vsh、φ、I},記為 P={a,b,c,d,e}。

表1 初始評價的原始數據
針對該研究區的特點,將這18口井的所有樣本數據進行預處理,以減少因各屬性量綱不一致對結果的影響。
根據測試資料的分析,歸納出該地區儲層的含油性評價標準(見表2)。儲層含油性類型主要有油層、油水層、水層3種,即決策屬性Q有3個,Q={qi},i=1,2,3。

表2 含油性評價標準
以儲層采樣點作為研究對象的數據集合U,以所選擇的特征參數:地層電阻率、可動水飽和度、泥質含量、孔隙度、電阻增大率作為識別特征集(對象屬性),即P={a,b,c,d,e}為條件屬性集;以儲層含油性為識別結果集(決策屬性),Q={f}為決策屬性集,該集合中只有一個決策屬性。條件屬性集中均為定量數據,故可根據該地區含油性評價標準將它們劃分為相應的水平,建立低電阻率油層識別系統。
運用粗糙集重要性方法進行屬性約簡。表3為條件重要性方法處理的結果。表3中σP(Q′)表示各條件屬性子集Q′的重要性。由表3的屬性重要性可以看出,就單個條件屬性而言,可動水飽和度b對低電阻率層的油水層類型f的影響最大,電阻增大率e的影響次之,地層電阻率a第3,泥質含量c第4,孔隙度d影響最小;同時考慮2個條件屬性,則{b,e}對油水層類型f 的影響最大,{c,d}的影響最小;就3個條件屬性來講,{a,b,e}對油水層類型f的影響最大,{a,c,d}的影響最小;對4個屬性而言,{a,b,c,e}對油水層類型f的影響最大,{a,c,d,e}的影響最小。經粗糙集約簡后測井屬性參數由原來的5個約簡為3個:地層電阻率(Rt)、可動水飽和度(Swm)和電阻增大率(I)。

表3 條件屬性子集的重要性
選取了研究區的18口井,其中試油結果為純油層的9口井共17個小層,試油結果為油水同層的5口井共7個小層,4口井6個小層的測試結果為水層。利用上述方法處理這些井,并通過與測試結果比較表明(見表4),用該方法識別低電阻率油層具有較高的識別率。該方法不僅消除了多個評價信息間的信息重疊,通過降維大大提高了運算速度;同時將粗糙集和灰色關聯法結合,利用其互補性在低電阻率油層的識別中取得了較好的評價結果。

表4 低電阻率油層評價效果對比
(1)通過對粗糙集和灰色關聯方法的分析,提出了基于粗糙集的低電阻率油層灰色識別方法。
(2)利用粗糙集的屬性約簡降低了灰色關聯輸入評價參數矩陣的維數,減小了識別過程的計算復雜性,利用灰色關聯方法識別低電阻率油層得到了較高的效果。
(3)實驗結果表明,基于粗糙集和灰色系統方法在油水層識別中具有更好的分類能力。
[1]中國石油勘探與生產公司.低電阻率油氣藏測井識別評價方法與技術[M].北京:石油工業出版社,2006.
[2]黃廣龍.基于粗糙集理論的多因素數據分析[J].浙江大學學報:自然科學版,2000,35(5):23-26.
[3]張文修,吳偉志,梁吉業,等.粗糙集理論與方法[M].北京:科學出版社,2004.
[4]汪杭軍,張廣群.粗糙集屬性約簡算法的實現與應用[J].計算機工程與設計,2007,28(4):777-779.
[5]Richard Jensen,Qiang Shen.Semantics-preserving Dimensionality Reduction:Rough and Fuzzy-rough-based Approaches[J].IEEE Transactions on Knowledge and Data Engineering,2005,17(1):1457-1471.
[6]宋子齊,譚成仟.灰色理論油氣儲層評價[M].北京:石油工業出版社,1995:3-26.
[7]施冬.油氣層灰色綜合地理信息系統GlS評價方法研究[J].測井技術,2005,29(1):30-32.
[8]施冬,張春生,郭甲世.灰色綜合評判法在低電阻率油氣層中的應用[J].地球物理學進展,1998,13(1):73-78.