馮向東,張玉琴,韓紅偉,張建亮
(成都理工大學 工程技術學院,四川 樂山 614007)
地球物理曲線的分層研究對勘探和開發(fā)油氣資源是一種重要手段,是在認識油氣層的地質面貌和剖析油氣藏量的內在規(guī)律等方面的一種較為有力的武器。測井的第一步就是需要利用各種各樣的儀器與設備,來對各種巖層中所含的物理參數(shù)進行測量,例如放射性、導電性、以及聲學特性等,第二步則需要對測井曲線進行研究與分析,從而可以較好地得到巖性信息與地質信息[1]。現(xiàn)階段較為常用的測井方法有放射測井、成像測井、電測井和聲波測井等等,其所得到的各種參數(shù)結果,從某一側面都能夠反映相應的地質特性。當然,假如想對地質的構造及變化進行全面的研究,那么就必須綜合多種測井參數(shù)。
測井曲線的層序劃分在油井勘測開發(fā)中必不可少,在對地層進行劃分、對地層的巖性進行判別、對儲層進行預測等方面都具有非常重要的意義。長期以來,在進行地質分層時,不僅僅考慮曲線的形態(tài),還需要根據(jù)曲線反映的各種信息通過分層人員豐富的知識來獲得最優(yōu)解,可是這不僅需要具備豐富的知識積累和熟練程度,而且費時費力,主觀性還很強,并且由于沒有一個統(tǒng)一的分層準則,每個人都使用自己的分層方式,導致結果的差異性過大,出錯率也較高。而與人工分層相比,自動分層不僅可以規(guī)避人為分層的隨意性,還可以較大程度地提高工作效率并且避免一定的失誤率[2]。
現(xiàn)階段,通過測井曲線來進行地質面貌的分析時,主要方法還是按照層來進行分析的,因此第一步就必須完成曲線的分層分析。由于每個物理層的地質特征應該是相似或者相同的,因此首先可以通過相似的曲線來把剖面劃分成若干個小層。這樣做的目的,不僅可以有效降低非地層因素的干擾,同時也可以突出地層與地層中所擁有的流體物質的變化,進而大大地提高了解釋的精度。在過去較長的一段時間里,基本上都是測井人員人工先對曲線的形態(tài)變化進行觀察,再依據(jù)自身所積累的經(jīng)驗來找出曲線中每一段所含有的半幅點位置,用來劃分地層。顯然由于測井人員自身所積累的經(jīng)驗的高低,以及熟練程度的差異,其所得到的分層結果必然會有特別大的誤差,最終導致了準確率的降低。
隨著計算機技術逐步應用到測井的解釋中,自動分層技術[3-5]也獲得了較快的發(fā)展,不僅減少了以往那些人工解釋中含有的人為因素所造成的分層誤差,同時大大提高了工作效率?,F(xiàn)有的利用曲線來自動劃分地層的方法,按照數(shù)學分類的準則主要是數(shù)理統(tǒng)計方法和非數(shù)理統(tǒng)計方法,以及人工智能算法[2]。而這些數(shù)學方法也都各有優(yōu)缺點。
數(shù)理統(tǒng)計方法主要有方差分析法、聚類分析法[6-11]等,但如果在細致分層時使用這種方法,其計算量將會非常大,普通的家用計算機根本無法承受這樣的計算量。非數(shù)理統(tǒng)計方法是以小波變換方法[12-13]和活度函數(shù)法為主。人工智能算法主要還是使用BP神經(jīng)網(wǎng)絡[14-17],可是如果使用神經(jīng)網(wǎng)絡并且想要保證分類結果的正確性,就需要有大量的樣本才能實現(xiàn),同時還有可能會陷入局部最優(yōu)解,因此其分類結果有較大的可能性會存在誤差。
另外,大量的支持向量機改進算法[18-20]被用于分類,同時支持向量機在測井解釋中的應用[21-22]也被陸續(xù)提出,但所需的分類問題中應該是大量的多分類問題,而支持向量機本身其實是二類的分類算法,所以如果利用支持向量機來處理多分類問題,這將是一個需要值得深入進行研究的課題。
針對聚類分析和BP神經(jīng)網(wǎng)絡算法存在的問題,通常采用的做法是主成分分析降維或者是選取有代表性的幾條曲線來實現(xiàn)。但是無論哪一種做法,都會使得有用信息缺失,造成分層錯誤。該文將結合自組織神經(jīng)網(wǎng)絡,來對油氣層的識別進行數(shù)據(jù)的分析。
在收集的某地區(qū)測井數(shù)據(jù)中,首先在采用放射測井時,可能會遭受到來自核外電子、核衰變、伽馬量子等方面的隨機作用,許多與地質特性根本沒有關系的起伏變化會出現(xiàn)在測得的曲線上;同時,由于聲波會經(jīng)過多次的折射與反射、測井探頭會遭到隨機碰撞等原因,曲線上必將出現(xiàn)大量帶有毛刺的干擾。顯然如果在進行測井解釋時,直接使用這些帶有干擾的曲線來進行,其分類的結果必然會含有很大的誤差。以自然伽瑪數(shù)據(jù)為例,見圖1。所檢測的7 482個數(shù)據(jù)中,有375個異常數(shù)據(jù)點。

圖1 原始數(shù)據(jù)
因此對于這些與地質無關信息的干擾,必須設法濾除;同時曲線上能反映地質特性的有用成分,也必須最大限度地保留。通常出現(xiàn)這樣的情況,不少工作人員會采取去除異常點或者前后兩點取平均值的方法來解決。但這樣無形中給自動分層加入了人為因素。
由于同一層物質的連續(xù)性,因此同一指標應該是連續(xù)變化的,采用三次樣條插值的方法進行測井曲線平滑處理,修正以后的數(shù)據(jù)曲線見圖2。同時也為后續(xù)地層劃分和測井分析提供了正確、有力的數(shù)據(jù)支持。

圖2 修正以后的數(shù)據(jù)
自組織神經(jīng)網(wǎng)絡算法是一種在沒有監(jiān)督學習的狀態(tài)下神經(jīng)網(wǎng)絡映射的過程,它是通過神經(jīng)元之間的相互競爭與學習來完成的。在整個學習的過程中只需存在有一些學習的樣本,而不用去提供理想的目標與輸出。通過輸入樣本的特征,該網(wǎng)絡會自組織地進行映射,同時對訓練的樣本進行自動分類[23-25]。自組織神經(jīng)網(wǎng)絡主要是由輸入層與競爭層所構成。在模式識別問題中,該網(wǎng)絡的輸入向量是能反映油氣模式的訓練樣本,在訓練網(wǎng)絡的過程中,權值向量與輸入向量中,誰最接近神經(jīng)元,就會在競爭中最終獲勝。當然該神經(jīng)網(wǎng)絡也會根據(jù)自身的學習規(guī)則,及時對這個獲勝的神經(jīng)元進行權值的調整,獲勝神經(jīng)元的權值向量在修改后,也能夠更加接近當前的輸入向量。最終可以將任意維的輸入向量,變換到一維或二維離散的網(wǎng)絡上,同時保持一定的拓撲有序性。

(1)
其次就是需要確定最佳匹配單元的領域,該領域是隨迭代次數(shù)n的變化而變化的,故稱此為領域函數(shù)Λi(n)。當然,這里還需要一個在Λi(n)內的單元例能夠修改權值的公式。為此將加入一個遺忘項—g(yj)wj,其中g(yj)是單元j的輸出的非負的標量函數(shù),而且滿足:
yj=0,g(yj)=0,?j
(2)
這樣,用微分方程來表示權值的學習:
(3)
網(wǎng)絡的學習目的,就是在最佳的匹配單元周圍形成一定的“氣鼓”,在這里選取:

(4)
由式(2),有:
(5)
帶入式(3),有:
(6)
為了進一步簡化,取α=η,η為學習步長,則式(6)變?yōu)椋?/p>
(7)
對離散的情況:
wj(n+1)=
(8)
SOM算法的步驟大致可以歸納如下,主要由競爭過程、協(xié)作過程和自適應調整過程組成:
Step1:初始化權值向量,選用較小的隨機數(shù)對各個權值向量賦初值wj(0),而各個節(jié)點的權值必須取為不同的值。
Step2:在樣本集合中任意選取一個樣本x作為輸入向量。
Step3:在時刻n,選取最佳的匹配單元i,即:
Step4:確定領域函數(shù)Λi(n)。
Step5:修正權值
wj(n+1)=
Step6:n←n+1,返回Step2,直到形成有意義的映射圖。
在分析數(shù)據(jù)過程中,需要結合工程應用中的實際需要來對指標進行篩選。在某地區(qū)的3號井中,選取了自然伽馬(GR)、聲波時差(AC)、密度(DEN)、深側向(RLLD)、微球形狀聚焦(RMSF)等19個指標,共計7 478×19個數(shù)據(jù)。以水層、油層、油水同層和干層等四種層位進行研究。
按照前面提到的算法步驟,采用自己編寫的MATLAB程序:
clc,clear,
A=load('shujuLG022.txt');
X=A';
[n,p]=size(X);
m=4;%要求輸出4個神經(jīng)元
K=5 000;% 最大訓練次數(shù)
a=0.5;%初始比例系數(shù)
a1=min(A);a2=max(A); A1=repmat(a1',1,m);A2=repmat(a2',1,m);
W=unifrnd(A1,A2);%隨機產生權值
for k=1:K
r=floor(5*(K-k)/K);%修改鄰域半徑
b=a*(K-k)/K;%修改比例系數(shù)
for t=1:p
for j=1:m
Y(j)=norm(X(:,t)-W(:,j));
end
i=find(Y==min(Y));
i=i(1);%尋找獲勝單元
for j=1:m
if abs(j-i)<=r
W(:,j)=W(:,j)+b*(X(:,t)-W(:,j));%修改權值
end,
end,
end,
end
W
for i=1:p
c=X(:,i);
CC=repmat(c,1,m);
AA=CC-W;
SSS=sqrt(sum(AA.^2));
k=find(SSS==min(SSS));
T(i)=k;
end
T
經(jīng)過計算,7 478個數(shù)據(jù)的分層結果中,在四種層位分別所占比重見圖3。油水同層所占比重最小,只占到3%,水層次之,有16%,而油層最多,占到了41%。并從中選出10個原始數(shù)據(jù)的分類結果,放在表1里。

圖3 各層在原始數(shù)據(jù)中所占的比重

表1 部分數(shù)據(jù)的分類結果
為了驗證以上分類結果的正確性,就需要對各層的物性及含油性進行評價,同時掌握各層中不同曲線所能展示出來的不同特征。
油層的特征包括微電極的曲線幅度中等,帶有明顯的正幅度差,如果滲透性變差則幅度差將會變??;自然電位曲線會顯示出正異常或負異常,伴隨泥質含量的增加其異常幅度隨之變??;長、短電極將視電阻率曲線呈現(xiàn)有高阻的特征;感應曲線顯示出明顯的低電導;而聲波的時差值處于中等,曲線平緩也將呈現(xiàn)平臺狀。
油水層的特征有微電極曲線幅度處于中等,正幅度差明顯,但若與油層相比較,其幅度會相對降低;自然電位曲線同樣顯示有正負異常,但異常幅度值將會比油層要大;短電極視電阻率曲線的幅度較高,但是長電極視電阻率曲線幅度將會較低,高電導值會顯示在感應曲線中;聲波的時差數(shù)值同樣處于中等,且呈現(xiàn)平臺狀,而井徑通常會小于鉆頭的直徑。
干層的特征為極淺電阻率曲線幅度處于中等,帶有明顯的正幅度差;若與油水層比,其幅度又會再次降低;自然電位曲線和油水層一樣,展現(xiàn)出正異?;蜇摦惓?,但其異常幅度值會比油水層大;在聲波的時差曲線中,伴有明顯的數(shù)值增大、周波跳躍的現(xiàn)象,而中子伽瑪?shù)那€幅度比油層更高。
水層呈現(xiàn)有極淺電阻率,曲線幅度中等,正幅度差明顯,其幅度比油層要低;自然電位曲線依然會顯示有正負異常,而異常的幅度值比油層要大。
以人工分層準則的結果作為標準,自組織神經(jīng)網(wǎng)絡算法所的結果,準確率達到82.17%。說明自組織神經(jīng)網(wǎng)絡算法基本上滿足分層的要求,能夠較為成功地識別該組數(shù)據(jù),并且利用計算機所花時間大大少于人工分層所用時間。
該文主要是通過采用自組織神經(jīng)網(wǎng)絡來對油氣數(shù)據(jù)的分層應用進行聚類研究。通過自己編寫的MATLAB程序算法對網(wǎng)絡進行優(yōu)化設計和處理,并將測井的數(shù)據(jù)和最終的數(shù)據(jù)處理結果,都放在了同樣的一個系統(tǒng)之中,使其能夠自動完成測井數(shù)據(jù)和得到油氣分層識別之間的一個高度映射關系,充分反映出輸入的測井曲線信號特征和油氣層之間的內在聯(lián)系,為油氣層網(wǎng)絡的自動識別創(chuàng)造了條件。而在數(shù)據(jù)輸入初期,通過插值的方式,消除該測井數(shù)據(jù)隨機干擾帶來的噪聲,同時也保留了數(shù)據(jù)的完整性和代表性;最后,與該地區(qū)的地質資料進行對比,結合人工分層的結果加以驗證,以保證利用自組織神經(jīng)網(wǎng)絡識別的結果能夠更加客觀和可靠。
研究結果表明,采用自組織神經(jīng)網(wǎng)絡進行油氣層識別是可行的,該方法的可操作性強,原理簡單易于實現(xiàn),參數(shù)與網(wǎng)絡結構容易調整,識別率比較高,是研究測井曲線的一種有效的手段。該方法不僅能夠對國內現(xiàn)有的油氣田進行油氣層的識別,還可以對原有的舊井進行再次復查,以便能夠發(fā)現(xiàn)是否存在新的油氣層位,提高油氣產量。
當然,該方法僅僅是在數(shù)據(jù)分析基礎上建立的,沒有能夠結合地質學中相關的知識。從最后與人工分層的結果驗證來看,如果在此算法的基礎之上,能夠再依據(jù)地質學中的專業(yè)知識,那么將是對測井曲線進行了更加科學的分析,也必將得到更加合理的分層結果。