韓 建 李 婧 曹志民 高 攀
(東北石油大學(xué)物理與電子工程學(xué)院 大慶 163318)
(東北石油大學(xué)黑龍江省高校共建測試計量技術(shù)及儀器儀表研發(fā)中心 大慶 163318)
測井?dāng)?shù)據(jù)是進(jìn)行油氣資源勘探與開發(fā)過程中最主要的油藏描述基礎(chǔ)數(shù)據(jù)。然而,在實(shí)際應(yīng)用中,由于井筒擴(kuò)徑、泥漿或泥餅干擾等問題,經(jīng)常會出現(xiàn)部分井段測井?dāng)?shù)據(jù)失真或缺失的情況,甚至出于經(jīng)濟(jì)可行性考慮而放棄獲取某些測井曲線(如密度測井曲線)的情況[1]。因此失真或缺失測井曲線復(fù)原對目標(biāo)油藏描述及油藏區(qū)域相態(tài)變化及連通性分析等應(yīng)用都具有重要意義。近年來,許多研究者通過多元回歸分析、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)等方法對缺失測井曲線進(jìn)行預(yù)測[2—4]。Wang等人[3]以多元線性回歸模型為基礎(chǔ),推導(dǎo)了非線性回歸模型進(jìn)行測井曲線的預(yù)測和校正。Salehi等人[4]應(yīng)用多層神經(jīng)網(wǎng)絡(luò)建立了一套測井曲線預(yù)測的智能模型,得到了較好的預(yù)測結(jié)果。Rolon等人[5]利用廣義回歸神經(jīng)網(wǎng)絡(luò)生成人工測井曲線并與多元回歸結(jié)果進(jìn)行比較,實(shí)驗(yàn)結(jié)果表明神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果具有更高的準(zhǔn)確性。然而,現(xiàn)有方法大多只是通過測井曲線間直接(全局或局部)非線性映射關(guān)系分析的角度出發(fā)來設(shè)計缺失測井曲線復(fù)原方法,沒有充分考慮儲層非均質(zhì)地質(zhì)變化造成的測井曲線本質(zhì)關(guān)聯(lián)關(guān)系的變化情況,進(jìn)而造成局部過擬合及全局欠擬合的問題,極大地限制了測井曲線復(fù)原的精度[6]。顯然,解決這一問題的關(guān)鍵在于如何實(shí)現(xiàn)不同測井曲線間關(guān)聯(lián)關(guān)系的魯棒表征[7,8]。
基于以上分析,為了實(shí)現(xiàn)測井曲線復(fù)原性能的提升,圖像處理領(lǐng)域常用的灰度共生矩陣(Gray Level Co-occurrence Matrix,GLCM)具有良好的信號共生關(guān)系表示能力[9]。通過多尺度灰度共生關(guān)系描述實(shí)現(xiàn)了測井曲線間橫向關(guān)聯(lián)關(guān)系的有效表征,進(jìn)而結(jié)合LSTM[10,11]網(wǎng)絡(luò)的縱向(即深度向)語義信息挖掘能力,實(shí)現(xiàn)了一種新的測井曲線復(fù)原方法。
對于測井曲線復(fù)原問題,與因變量(目標(biāo)曲線)相關(guān)的自變量(母曲線)往往不止一個[2]。具體地,對于大慶油田陸相坳陷盆地內(nèi)齊家凹陷工區(qū),根據(jù)測井曲線的實(shí)際情況,選用了井徑(CALiper,CAL)、自然伽馬(natural Gamma Ray, GR)、深側(cè)向電阻率(LateroLog Deep, LLD)、聲波時差(ACoustic, AC)、自然電位(Spontaneous Potential,SP)作為母曲線,密度(DENsity, DEN)作為目標(biāo)曲線,用實(shí)際測試數(shù)據(jù)進(jìn)行測井曲線復(fù)原,復(fù)原模型圖如圖1所示。

灰度共生矩陣是1973年由Haralick等人[12]提出一種特征提取方法,它通過研究灰度的空間相關(guān)特性來描述圖像的紋理特性。具體地,灰度共生矩陣被定義為從灰度為i的像素點(diǎn)出發(fā),離開某個固定位置(相隔距離為d,方位為θ)的點(diǎn)上灰度值為j的概率,即所有估計的值可以表示成一個矩陣的形式,以此稱為灰度共生矩陣。它能夠反映圖像灰度關(guān)于方向、相鄰間隔、變化幅度等綜合信息,從而分析出圖像的局部模式和它們排列規(guī)則的基礎(chǔ)。


除了通過引入多尺度灰度共生關(guān)系完成對不同測井曲線間橫向關(guān)聯(lián)信息的表征以外,考慮到測井?dāng)?shù)據(jù)是序列數(shù)據(jù),其變化趨勢中含有顯著的語義信息,所以結(jié)合LSTM網(wǎng)絡(luò)的縱向(即深度向)語義信息挖掘能力,以實(shí)現(xiàn)測井曲線集縱橫向語義信息的全面利用。其中,LSTM網(wǎng)絡(luò)[13]是特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),能夠解決序列長期依賴性的深度學(xué)習(xí)模型,它不僅能夠像標(biāo)準(zhǔn)循環(huán)神經(jīng)網(wǎng)絡(luò)那樣從序列數(shù)據(jù)中提取信息,還能夠保留來自先前較遠(yuǎn)步驟的具有長期相關(guān)性的信息。利用LSTM的縱向語義信息挖掘能力,最終實(shí)現(xiàn)了如表1所示的基于LSTM多尺度共生關(guān)系挖掘的測井曲線復(fù)原方法。

表1 基于LSTM多尺度共生關(guān)系挖掘的測井曲線復(fù)原算法
為更好地評價復(fù)原數(shù)據(jù)與實(shí)測數(shù)據(jù)間的關(guān)系,本文引入常規(guī)的誤差函數(shù)以及相關(guān)系數(shù),另外,為了能夠更客觀地評價復(fù)原結(jié)果,更清晰地分析出測井曲線的頻率分量,同時引入譜分析作為評判復(fù)原效果的標(biāo)準(zhǔn)。其定義如下。
皮爾遜相關(guān)系數(shù)(Pearson Correlation Coefficient,PCC)用于表示預(yù)測數(shù)據(jù)與真實(shí)數(shù)據(jù)之間的相關(guān)程度;均方誤差(RMSE)[14]表示預(yù)測誤差平方的平均值,能夠反映一個數(shù)據(jù)集的離散程度;平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)表示絕對百分比誤差的平均值,常用于衡量預(yù)測的準(zhǔn)確性;平均絕對誤差(Mean Absolute Error,MAE)表示絕對誤差預(yù)測的平均值,能夠準(zhǔn)確反映實(shí)際預(yù)測誤差的大小。引入這4個評價方式能更好地反映預(yù)測數(shù)據(jù)與真實(shí)數(shù)據(jù)的實(shí)際情況。其中,均方誤差表達(dá)式為

短時傅里葉變換(Short-Time Fourier Transform,STFT)[15]:研究非平穩(wěn)頻域信號的一種分析方法,它的主要目的就是將這些信號進(jìn)行變換之后能夠得到更好的頻域性分析。表達(dá)式為

小波變換(Wavelet Transform, WT)[16]是應(yīng)用于多領(lǐng)域的時頻域變換方式,它提供了一個隨頻率變換的時間頻率窗口。應(yīng)用于測井?dāng)?shù)據(jù)上,進(jìn)而可以明確地分析出測井曲線的高頻、低頻特征,其表達(dá)式為

本文以目標(biāo)工區(qū)44口井?dāng)?shù)據(jù)為基礎(chǔ),每口井均包含CAL, GR, LLD, AC, SP, DEN。選取A1、A2井測井?dāng)?shù)據(jù)作為測試集,A1井測深為1230~2278 m,A2井測深為1200~2206 m,采樣間隔為0.125 m,在剩余42口井中選取井口數(shù)據(jù)作為訓(xùn)練集,其中選取A地質(zhì)層中的井作為局部近鄰井,B,C地質(zhì)層中的井作為非局部近鄰井。為了評估本文所提測井曲線復(fù)原方法的有效性,設(shè)計了如下兩組實(shí)驗(yàn):
(1)利用局部近鄰井?dāng)?shù)據(jù)進(jìn)行多尺度灰度共生關(guān)系構(gòu)建,以實(shí)現(xiàn)目標(biāo)井缺失DEN曲線復(fù)原;
(2)利用非局部近鄰井?dāng)?shù)據(jù)進(jìn)行多尺度灰度共生關(guān)系構(gòu)建,以實(shí)現(xiàn)目標(biāo)井缺失DEN曲線復(fù)原;
具體地,每組實(shí)驗(yàn)中,灰度尺度分別設(shè)置為32, 64, 128, 256,局部近鄰井和非局部近鄰井?dāng)?shù)目分別設(shè)為1, 3和5,進(jìn)行24組實(shí)驗(yàn)。然后,將多尺度信息輸入到LSTM網(wǎng)絡(luò)中,最終得到6組實(shí)驗(yàn)結(jié)果,選取最好的一組實(shí)驗(yàn)結(jié)果,采用BP神經(jīng)網(wǎng)絡(luò)法、隨機(jī)森林法、GBDT、深度森林、LSTM法和本文方法進(jìn)行對比分析。實(shí)驗(yàn)中,各方法的超參數(shù)設(shè)置如表2。

表2 各個方法超參數(shù)設(shè)置表
假設(shè)A1井、A2井整個井段測井?dāng)?shù)據(jù)DEN全部缺失,利用該井的未缺失的其他測井?dāng)?shù)據(jù)以及訓(xùn)練井的全部測井資料重構(gòu)缺失測井曲線DEN,即對A探區(qū)A1、A2井缺失的DEN進(jìn)行4個尺度下的復(fù)原得到多尺度下DEN復(fù)原結(jié)果,并將多尺度的信息進(jìn)行融合得到一組近鄰點(diǎn)的復(fù)原結(jié)果。由于篇幅有限,文中僅對A探區(qū)A1井、A2井的部分實(shí)驗(yàn)結(jié)果進(jìn)行展示分析。A1井多尺度下局部近鄰井為1時的DEN曲線復(fù)原結(jié)果如圖2所示。由圖2可知,在4個尺度下的復(fù)原數(shù)據(jù)與實(shí)測數(shù)據(jù)雖然存在一定的偏差,但是,能夠較好地復(fù)原出測井曲線的整體趨勢。而且,在不同尺度下,復(fù)原的效果也存在一定的差異。表3代表A1、A2井在不同尺度下局部近鄰井為1時復(fù)原數(shù)據(jù)與實(shí)測數(shù)據(jù)的評價結(jié)果,可以看出相關(guān)系數(shù)均在0.72以上,且A1井比A2井的復(fù)原結(jié)果要好。因此,在測井曲線復(fù)原過程中應(yīng)充分考慮不同井在多尺度下對復(fù)原結(jié)果造成的影響。

表3 A1、A2井多尺度下DEN測井曲線復(fù)原定量結(jié)果

圖2 A1井多尺度下DEN測井曲線復(fù)原結(jié)果
另外,為比較不同近鄰井對測井曲線的復(fù)原情況,利用LSTM網(wǎng)絡(luò)將多尺度的復(fù)原結(jié)果進(jìn)行融合,得出6組近鄰井的復(fù)原結(jié)果。圖3表示6組近鄰井復(fù)原出A1井缺失曲線DEN的結(jié)果,從左至右依次表示局部近鄰井為1, 3, 5時和非局部近鄰井為1,3, 5時的DEN復(fù)原結(jié)果,可以看出利用LSTM網(wǎng)絡(luò)將多尺度的復(fù)原結(jié)果進(jìn)行融合得到的復(fù)原結(jié)果,要比4個尺度下的復(fù)原結(jié)果更精確,更貼合真實(shí)的測井曲線。6組近鄰井對A1井DEN復(fù)原定量結(jié)果見表4。由表4可以看出經(jīng)過多尺度信息融合得到的結(jié)果與實(shí)測數(shù)據(jù)的相關(guān)系數(shù)均在0.83以上,且MAPE均下降到3.6%以下。當(dāng)局部近鄰井為5時復(fù)原效果最好,相關(guān)系數(shù)高達(dá)0.8475,而且整體上局部近鄰井要比非局部近鄰井的復(fù)原效果好。因此,在測井曲線復(fù)原過程中應(yīng)考慮多尺度信息融合以及局部和非局部近鄰井不同數(shù)目對復(fù)原結(jié)果的影響。

表4 A1井6組近鄰點(diǎn)DEN復(fù)原定量結(jié)果
為了進(jìn)一步分析多尺度灰度關(guān)系構(gòu)建復(fù)原測井曲線的效果,將A1, A2井6組近鄰井預(yù)測結(jié)果最好的一組與BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、GBDT、深度森林、LSTM網(wǎng)絡(luò)預(yù)測結(jié)果分別繪制如圖4所示。從圖中可以看出通過本文方法復(fù)原的DEN與實(shí)測的DEN雖然存在一定的誤差,但測井曲線整體趨勢對應(yīng)較好,能夠預(yù)測出測井曲線的實(shí)際變化趨勢,尤其是在測井?dāng)?shù)據(jù)沒有發(fā)生突變的情況下,復(fù)原結(jié)果更好地對應(yīng)實(shí)際測量值。而且,在A1井1900~2060 m以及A2井1750~2000 m測井?dāng)?shù)據(jù)發(fā)生突變的情況下,本文方法預(yù)測結(jié)果明顯優(yōu)于其他對比方法,更好地預(yù)測了這1階躍變化的趨勢。表5代表不同模型復(fù)原測井曲線的定量結(jié)果,從表5可以分析出本文方法及其對比方法的復(fù)原結(jié)果與實(shí)測數(shù)據(jù)均有較高的相關(guān)性和較小的誤差,但本文方法明顯優(yōu)于其他5種方法。其中,A1井缺失的測井曲線DEN復(fù)原結(jié)果與實(shí)測數(shù)據(jù)相關(guān)系數(shù)高達(dá)0.8475,與對比方法相比,PCC分別提高了8.42%,3.67%, 2.86%, 1.47%, 3.34%,RMSE分別下降了21.43%, 21.43%, 8.33%, 15.38%, 8.33%,MAPE分別下降了22.47%, 21.23%, 14.81%, 16.88%,10.85%,MAE分別下降了23.64%, 20.47%,16.13%, 18.74%, 10.69%。A2井缺失測井曲線DEN預(yù)測結(jié)果與真實(shí)數(shù)據(jù)相關(guān)系數(shù)為0.7860,與對比方法相比,PCC分別提高了32.15%, 4.09%,13.22%, 0.70%, 0.65%,RMSE分別減小了26.67%,35.29%, 56.00%, 31.25%, 8.33%,MAPE分別減小了32.70%, 40.07%, 64.62%, 38.36%, 9.27%,MAE分別減小了34.49%, 42.53%, 62.25%, 36.52%,8.78%。
除了常見的相關(guān)函數(shù)及誤差函數(shù)的評價方式之外,本文還將不同模型復(fù)原的結(jié)果和實(shí)測值分別進(jìn)行短時傅里葉變換和小波變換,進(jìn)行進(jìn)一步分析評價。由于篇幅原因,僅針對A2井部分頻譜進(jìn)行繪制,本文方法復(fù)原值與實(shí)測值經(jīng)變換后的頻譜如圖5所示。從圖中可以看出,本文方法復(fù)原值經(jīng)變換后的頻譜與實(shí)測值的頻譜具有相似的特性。不同模型的復(fù)原DEN經(jīng)變換得到的頻譜與真實(shí)值頻譜的定量結(jié)果見表6。從表6可以分析出本文方法預(yù)測的結(jié)果經(jīng)STFT、WT變換后的頻譜與實(shí)測值頻譜PCC相對更高,MAE相對較小。這些數(shù)據(jù)表明本文方法相比于對比方法精度更高,穩(wěn)定性更強(qiáng)。

圖5 A2井DEN預(yù)測結(jié)果的頻譜分析圖

表6 不同模型DEN譜分析定量結(jié)果
因?yàn)锽P神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林和GBDT是構(gòu)建同一深度輸入與輸出之間的非線性映射關(guān)系,來實(shí)現(xiàn)缺失測井曲線段的復(fù)原,它們未考慮測井?dāng)?shù)據(jù)之間的共生關(guān)系以及隨深度變化的前后聯(lián)系。深度森林、LSTM網(wǎng)絡(luò)雖然能夠有效提取在空間上具有長期相關(guān)性的測井曲線的模式,并基于這些模式對測井曲線進(jìn)行預(yù)測。但是,它們僅考慮了隨著深度變化測井?dāng)?shù)據(jù)間的時序性特征。本文所建立的模型是在基于神經(jīng)網(wǎng)絡(luò)測井曲線復(fù)原方法的基礎(chǔ)上,通過引入多尺度灰度共生關(guān)系的測井曲線復(fù)原方法,該方法不但能利用測井曲線間的橫向表征,還能學(xué)習(xí)到測井曲線隨深度變化的特性,能有效將橫縱向語義信息全面利用。因此,利用本文方法進(jìn)行測井曲線的預(yù)測比BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、GBDT、深度森林、LSTM網(wǎng)絡(luò)具有更高的準(zhǔn)確度和穩(wěn)定性。
本文介紹了一種基于LSTM多尺度共生關(guān)系挖掘的缺失測井曲線復(fù)原方法。該方法從測井曲線數(shù)據(jù)出發(fā)利用生成的多尺度灰度共生矩陣提取測井曲線間共生關(guān)系,再結(jié)合LSTM網(wǎng)絡(luò)挖掘測井曲線的縱向信息最終復(fù)原出目標(biāo)曲線。該方法避免了經(jīng)驗(yàn)公式和統(tǒng)計分析預(yù)測測井曲線的局限性,有助于提高預(yù)測的精確度,更準(zhǔn)確地建立地質(zhì)分布模型。經(jīng)對比不同模型的預(yù)測結(jié)果,本文方法經(jīng)多指標(biāo)評價結(jié)果均優(yōu)于BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、GBDT、深度森林和LSTM網(wǎng)絡(luò)方法,可有效提高對缺失測井曲線復(fù)原的準(zhǔn)確性。