翟曉巖,高剛*,李勇根,陳冬,桂志先,王之楨
(1. 油氣資源與勘探技術教育部重點實驗室(長江大學),湖北武漢 430100;2. 長江大學地球物理與石油資源學院,湖北武漢 430100;3. 中國石油勘探開發研究院,北京 100083;4. 中國石化石油勘探開發研究院,北京 100083)
在地震資料定量解釋中,密度(DEN)和聲波時差(AC)測井曲線是地震巖石物理學和地震反演技術中的兩條關鍵曲線,能夠提供可靠的時深關系,使深度域測井數據與時間域地震數據相互標定,是巖石物理建模技術必不可少的巖石彈性和物性信息曲線。但實際測井中,井徑的擴縮對聲波和密度測井影響較大,導致部分井段出現畸變、失真,甚至缺失,為后續綜合解釋帶來一定困難,曲線重構技術是測井數據校正和預測的主要方法[1-2]。
傳統的測井曲線重構方法主要有三種:經驗模型法、多元擬合法、巖石物理建模法。由于經驗模型法效率最高、最易推廣,因此針對橫波速度測井曲線缺失問題,提出了許多縱波和橫波之間的線性或非線性經驗關系[3-4],但受到地區和巖石類型的限制。黃小平等[5]論述了Gardner 公式不適用于井壁垮塌處DEN 曲線校正,原因在于井壁垮塌對DEN 和AC 曲線都有影響。陳鋼花等[6]論證了 Faust 公式需要保證地層電阻率和AC 曲線具有很好相關性,儲層中流體對電阻率有較大影響的地層并不滿足該公式的假設條件。
雖然不同測井曲線的測量原理不同,但它們都是反映巖石某一方面的特征,因此不同測井曲線一般存在一定相關性。多元擬合法基于曲線相關性特征,采用線性或非線性關系式擬合目標曲線與其他曲線的關系,完成目標曲線重構,該方法精度高于經驗模型法,但礦物成分復雜的巖石使目標曲線與其他曲線的非線性關系增強,多元擬合關系式泛化能力不足,擬合的目標曲線精度不高[7-8]。
巖石物理建模法(Xu-White、Cemented、Krief 模型等)假設飽和流體巖石主要由巖石基質、孔隙結構、流體三部分組成,而這三部分的參數是根據受井眼影響較小的測井曲線(自然伽馬(GR)、自然電位(SP)、電阻率(RT)、中子孔隙度(CNL)等)解釋的孔隙度、泥質含量、含水飽和度由不同巖石物理模型構建,通過迭代調整巖石孔隙縱橫比參數,求解縱、橫波速度和密度。Yang等[9]針對巖石礦物成分復雜的情況,拓展了Xu-White 模型,形成了考慮石英、黏土、方解石三種礦物的Xu-White 模型,重構的灰質發育區砂泥巖地層的橫波速度精度較高。針對頁巖、碳酸鹽巖等各向異性較強的巖石,桂俊川等[10]提出了考慮包含裂縫等多種孔隙類型的橫向各向同性介質的橫波速度預測方法。這些巖石物理建模法方法重構的橫波速度精度依賴于孔隙度、孔隙類型、礦物成分、含水飽和度等儲層地球物理參數的計算精度,然而這些參數難以高精度獲取。巖石物理建模法重構的目標曲線精度高于前兩類方法,但一般在縱波速度和密度已知情況下重構橫波速度,在縱波速度和密度曲線存在誤差時,該方法重構的目標曲線精度明顯下降。
深度學習具有建立輸入與輸出之間的復雜非線性映射關系的能力,因此在人臉識別、機器翻譯、圖像分類等領域得到了廣泛的應用[11-13]。近年來,深度學習被引入地學領域[14-15],在巖石物理建模、巖性識別、儲層參數反演等領域取得了一定的研究成果。在測井曲線重構方面應用最為廣泛的為橫波速度重構。有學者提出利用長短時記憶(Long Short-term Memory,LSTM)網絡解決橫波速度缺失問題[16-17]。該方法充分考慮了測井數據的時序特征,并在碳酸鹽巖和砂巖儲層中取得了較好的重構效果。為了提高深度學習網絡重構橫波速度的精度,Chen等[18]提出使用二維卷積神經網絡(2DCNN)和門控循環單元(Gated Recurrent Unit,GRU)的混合網絡預測橫波速度。該方法分別利用2DCNN、GRU 提取輸入數據的空間特征(地層的不同屬性特征,如自然伽馬、自然電位、中子孔隙度、地層電阻率等)和時序特征(測井數據深度方向的變化特征),能夠建立輸入與輸出之間復雜的非線性關系。Han 等[19]將深度學習和機器學習相融合,揭示輸入與輸出之間更復雜的非線性關系。實驗結果表明,與決策樹、隨機森林和深度學習網絡相比,該方法在缺失曲線重構方面更具優勢。近年來,融合注意力機制的神經網絡可提高網絡對重要特征的敏感度,已應用于機器翻譯、智能電網、地學等不同領域[20-23]。Kavianpour等[24]開發了融合注意力機制的CNN-BILSTM(雙向LSTM)網絡并用于地震預測,取得了良好的效果。Bai 等[25]提出了一種基于注意力機制的長短期記憶全卷積網絡(LSTM-FCN)模型并用來提取地震數據之間的時序特征,以提高地震事件檢測和定位的準確性;馬國慶等[26]提出了基于自注意力機制的深度學習網格化方法,實現了高精度重磁數據網格化和濾波處理。
測井是油氣開發和勘探行業最重要的觀測技術之一。在實際應用中,校正和預測缺失測井曲線是節約油氣勘探開發成本的有效途徑之一。由于儲層的結構復雜性和非均質性,測井曲線之間存在較強的非線性關系[19]。相比于現有的經驗模型法、多元擬合法、巖石物理建模法,已成功應用于地震相識別、巖性預測、儲層參數反演等地球物理領域的深度學習具有構建輸入與輸出之間復雜非線性關系的能力。針對測井曲線自相關性和互相關性的不同,本文構建了融合注意力機制的二維卷積深度學習網絡(STACNN),該網絡主要包括輸入層、二維卷積層、空間注意力層、時序注意力層和全連接層。以準噶爾盆地超深層致密砂巖為研究對象,通過試驗分析了時、空注意力層權重與測井曲線自相關性和互相關性的關系。然后開展了應用該網絡、GRU、2DCNN 和多元擬合重構AC 和DEN 測井曲線試驗,并進行參數優化。最后通過井震匹配關系的提升驗證了AC 和DEN 測井曲線校正和缺失重構的效果。
卷積神經網絡(CNN)是深度學習領域經典的網絡之一,隨著深度學習網絡的快速發展,已廣泛應用于圖像、醫學、地球物理等領域。CNN 通常由輸入層、卷積層和全連接層組成,其核心部分為卷積層,當數據輸入到卷積層后,卷積核可以挖掘數據局部間的高維空間特征,作為下一層的輸入。
式中:Xt是當前層t個d×m維的輸入數據;XT代表經過T個卷積核提取的特征向量;WT是當前層尺寸為i×j的權重矩陣;B1是當前層的偏置系數;σ是Relu激活函數,可以提高網絡的非線性描述功能。
神經網絡借鑒了人類的注意力機制。人們在觀察圖像時,會專注于圖像的目標區域,以挖掘圖像的重要信息。雖然各條測井曲線測量機理不同,但它們都反映了同一巖石不同方面的性質,AC、DEN 與其他測井曲線的互相關性及自相關性不同,因此提出將注意力機制融合到2DCNN 中,達到提升深度學習網絡捕捉測井數據自相關性和互相關性特征的能力。空間注意力層的輸出結果可表示為
時序注意力層的輸出結果可表示為
式中:SD為ST在第二層2DCNN 中經過D個卷積核提取的特征向量;是將第二層卷積結果SD經過橫向壓縮得到的D個d×1維的時序注意力層權重。
由于AC、DEN 測井曲線與其他曲線的互相關性、自相關性不同,且它們之間的非線性關系復雜,因此本文提出了一種基于時空注意力機制的CNN 融合網絡。其網絡組成(圖1)為:

圖1 STACNN 的網絡結構
(1)輸入層,將訓練測井數據集輸入STACNN;
(2)第一2DCNN 層,卷積核尺寸為3×3,輸入通道數為1,輸出通道數為16,用于提取測井數據的空間特征;
(3)空間注意力層,用于提高網絡對空間特征的敏感性;
(4)第二2DCNN 層,卷積核尺寸為5×3,輸入通道數為16,輸出通道數為32,用于提取測井數據的時序特征;
(5)時序注意力層,用于提高網絡對時序特征的敏感性;
(6)Dropout層,在訓練時以一定的概率p使神經元失活;
(7)全連接層,輸入通道數為32,輸出通道數為1,用于提高輸入層和輸出層之間的非線性關系擬合能力;
(8)輸出層,輸出STACNN 的預測結果(AC 或DEN 曲線)。
本文網絡訓練和預測的過程如下(圖2)。

圖2 STACNN 的訓練和預測流程
(1)數據預處理。使用StandardScaler 和Min-MaxScaler函數對測井數據進行標準化和歸一化處理以消除不同數據量綱之間的差距。
(2)將訓練測井數據集輸入STACNN。
(3)訓練STACNN。本文將均方誤差(MSE)作為損失函數,同時選用自適應矩(Adam)優化算法進行網絡優化,直至損失函數收斂。
(4)將測試集的測井數據輸入到STACNN。
(5)網絡評估。 本文用可決系數(R2)對STACNN 進行定量評估
式中:M表示樣本個數;yi為第i個真實值;代表預測值;為樣本均值。
R2用來度量一個統計模型的擬合優度,取值范圍為[0,1]。R2越接近1,說明回歸直線對觀測值的擬合程度越高;R2的值越接近0,說明回歸直線對觀測值的擬合程度越低。
本文選取準噶爾盆地M 工區gd-1、gd-2、gd-5、gd-13 等井致密砂巖儲層為研究對象,且數據集都為白堊系同一目的層段,保證數據集測井曲線橫向特征具有一定的相似性。樣本集中輸入的特征曲線為GR、SP、CNL、RT,標簽集為AC 和DEN 曲線。在測井曲線的深度方向采用多對一(多個采樣點對應一個標簽)的方式對樣本集進行劃分,既充分保證了測井曲線的自相關性,又體現了地層的連續漸變特征。gd-2井的測井曲線(圖3)表明該井在黑框處出現了嚴重的擴徑現象,AC、DEN 曲線存在嚴重的測量誤差,即AC 值周期跳躍、DEN 值偏低。因此在分析目標測井曲線與其他測井曲線相關性時,在井徑(Cal)曲線約束下將測井數據分為兩類,即非擴徑段和擴徑段。用非擴徑段目標曲線與其他曲線的交會圖分析它們之間的互相關性(圖4)。與AC 曲線的相關性從高到低依次為CNL、RT、GR、SP 曲線,R2值分別為0.5688、0.4043、0.3594、0.1535。與DEN 曲線的相關性從高到低依次為GR、CNL、RT、SP 曲線,R2值分別為0.6712、0.3511、0.2307、0.0174。雖然AC、DEN 都屬于典型的孔隙度解釋曲線,但AC、DEN 與其他常規測井曲線相關性是不同的。使用自相關函數(ACF)分析測井數據的自相關性。各曲線的ACF皆隨滯后距的增加而不斷減小(圖5),但各曲線減小的速率不同。當滯后距小于10 個樣點時,自相關性都能達到40%以上,說明地下沉積地層是連續漸變的。

圖3 gd-2 井的測井曲線

圖4 AC、DEN 曲線與其他測井曲線的交會圖

圖5 測井曲線的自相關系數
上述分析表明,其他測井曲線的時空特征與AC、DEN 曲線有一定的相關性。同時,由于SP 曲線與AC 和DEN 曲線的相關性都較低,因此在重構目標曲線時,選用相關性較高的GR、CNL、RT 曲線作為深度學習網絡的輸入樣本。
為了驗證注意力機制能夠加強深度學習網絡對重要時空特征的敏感性,分別構造了有、無時空注意力機制的兩種網絡,其中,未加入時空注意力機制的網絡結構由一個全連接層(Dense)組成,加入時空注意力機制的網絡結構由一個全連接層(Dense)和一個時空注意力層(Attention)組成。圖6 為測井數據有、無空間注意力層的權重分布。當標簽為AC 時,空間注意力層的權重分布由大到小分別為CNL、RT、GR曲線(圖6a),當標簽為DEN 曲線時,權重分布由大到小分別為GR、CNL、RT 曲線(圖6b),這與圖4中的互相關性分析一致。而未加入注意力機制的網絡權重分布卻無此規律。當標簽為AC 曲線時,CNL 曲線被空間注意力層賦予最大的權重,達到0.43,因為CNL、AC 、DEN 曲線都是用于測量巖石的孔隙度;當標簽為DEN 曲線時,GR 曲線被空間注意力層賦予最大的權重,達到0.52,因為二者都屬于放射性測井,皆可用于巖性解釋。

圖6 標簽為AC(a)和DEN(b)曲線時測井數據的空間特征權重分布
圖7為測井數據有、無時序注意力層的權重分布。選取常規測井數據中的15 個采樣點作為樣本,并將第8 個點的AC 或DEN 值作為標簽,在預測AC 或DEN 時,位于標簽位置的樣本數據被時序注意力層賦予了最大的權重,分別達到了0.1314 和0.1137,說明與標簽位置相同的樣本對AC 或DEN 值的影響最大。隨著與標簽的距離增加,注意力權重的總體趨勢是減小的,這與圖5 中測井數據的自相關性分布相一致。以上這些現象驗證了在深度學習網絡中加入時空注意力機制的合理性。

圖7 標簽為AC(a)和DEN(b)曲線時測井數據的時序特征權重分布
為了驗證STACNN 的預測性能,分別與2DCNN、GRU 和多元擬合法的結果進行了對比。2DCNN 組成為:兩個二維卷積層(卷積核尺寸分別為3×3、5×3,通道數皆為16)、一個Dropout層(丟棄率p=0.25)、一個全連接層(通道數為1);GRU 網絡的組成為:兩個GRU 層(門控循環單元個數分別為16和32)、一個全連接層(通道數為1)。所有網絡都采用Adam 優化算法,結合了AdaGrad 和RMSProp 算法的優點,在處理大規模數據、參數優化和非穩態目標方面具有較強的優勢。同時,添加舍棄層,隨機丟棄神經元,以增加網絡的泛化性。
選取gd-13 井測井數據對2DCNN、GRU 網絡和本文的STACNN 進行訓練。整體上本文網絡的AC、DEN 曲線預測結果都優于其他兩個網絡,更優于多元擬合的預測結果(圖8 黑虛線框所示),這表明在捕捉目標曲線與其他曲線復雜的非線性關系方面,深度學習網絡具有明顯的優勢。三個網絡預測AC、DEN 曲線的損失函數如圖9 所示,都隨訓練次數的增加而不斷減小,最終達到一個穩定的值,即網絡達到最優狀態。本文網絡訓練一次后的損失函數值明顯低于其他兩個網絡,而且達到穩定狀態時的損失函數值也最小。原因在于STACNN 可以更好地挖掘其他測井曲線的時、空特征與AC、DEN 曲線之間的相關性,提高了網絡對時、空特征的敏感度。GRU、CNN、本文網絡AC 曲線預測結果的R2值分別0.7199、0.8192、0.8940,DEN 曲線預測結果的R2值分別為0.7528、0.8396、0.9570,同樣驗證了注意力機制能夠提升深度學習網絡的預測性能。

圖8 gd-13 井四種方法AC(a)、DEN(b)曲線的預測結果(紅色點線)與真實曲線(黑色實線)的對比

圖9 預測AC(a)、DEN(b)曲線時STACNN、CNN 和GRU 網絡的損失函數曲線對比
為了更好地用本文網絡完成目標曲線校正和缺失重構,分別將樣本劃分時窗長度,即采樣點數設為5、15、25,采用同樣的訓練參數,網絡的預測結果如圖10所示。AC 曲線預測結果的R2值分別為0.7305、0.9128、0.8945,DEN 曲線預測結果的R2值分別為0.8834、0.9674、0.9469。可見,樣本劃分時窗長度為15時,本文網絡預測性能最佳。

圖10 時窗長度為5(左)、15(中)、25(右)時AC(a)、DEN(b)的預測結果(紅色點線)與真實曲線(黑色實線)的對比
在鉆井過程中受地層巖性的影響,有些井段產生了擴徑或縮徑現象,導致AC、DEN 測井曲線存在測量誤差。由圖11 中gd-2 井的井徑曲線可以看出,該井段井孔質量較差,其中大段擴徑有一段(5520~5530 m,黑框所示),還有一些小范圍擴徑段。

圖11 gd-2 井AC、DEN 曲線校正分析
使用井徑曲線作為約束條件將gd-2 井測井曲線劃分為擴徑段和非擴徑段兩部分,用非擴徑段樣本集訓練本文網絡,并預測了所有樣本的AC 和DEN 曲線(校正結果),預測結果與真實曲線的R2值分別為0.8472、0.8755。AC、DEN 測井曲線校正前、后在小范圍的擴徑井段的數值略有差異,而在大范圍的擴徑井段的數值差異較大(黑框區域)。根據地層的沉積演變規律,同一塊具有相同沉積背景的巖性段,其物理性質基本相近,校正后的曲線形態變化比較平緩,而校正前的聲波受井徑擴徑的影響具有明顯的周期跳躍現象。
將擴徑段與非擴徑段同時參加網絡訓練的預測結果,AC、DEN 曲線校正前、后在擴徑井段的數值基本吻合,產生這種現象的原因在于擴徑段的數據參與了網絡的訓練和監督。
與校正前的合成記錄相比,校正后的合成記錄與真實的地震記錄吻合度更高,尤其在5490~5540 m(圖11c 黑框區域)內,校正后的合成記錄的振幅相對關系與真實地震記錄基本一致。因此在AC、DEN 曲線同時存在測量誤差時本文網絡的重構效果明顯。
由于井孔條件的限制,有些情況會出現AC、DEN 曲線都缺失。選取準噶爾盆地gd-1、gd-2、gd-5、gd-13 等井致密砂巖儲層測井曲線為研究對象,其中gd-2、gd-5、gd-13 井作為訓練集,gd-1 井作為測試集,且數據集都為白堊系同一目的層段,保證數據集測井曲線橫向特征具有一定的相似性。為減少擴徑對AC、DEN 的影響,選用前三口井非擴徑段樣本進行訓練,建立了兩個網絡分別預測gd-1 井的AC、DEN 曲線(圖12)。預測結果與真實曲線的R2值分別為0.8446、0.8598,略低于圖11 的預測結果,原因在于圖12 驗證數據完全沒有參與網絡訓練,而圖11 是用同一口井非擴徑段進行訓練。由圖12可見,本文網絡的AC、DEN 預測值與真實值相關性要強于多元擬合預測的結果。此外,受擴徑的影響,AC、DEN 曲線的預測結果與真實值略有差異,校正前、后的合成記錄與實際記錄基本一致,但校正后的合成記錄與真實值的相關系數略高于校正前的合成記錄。而多元擬合預測結果的合成記錄與實際地震記錄相關性較差的原因在于多元擬合得到的聲波速度與真值差異較大,造成井震時深轉換及計算的反射系數都出現了較大的誤差。

圖12 gd-1 井AC、DEN 曲線校正預測分析
由于準噶爾盆地致密砂巖儲層的孔隙結構復雜,且常規的測井曲線重構方法難以捕捉測井曲線之間的較強的非線性關系,因此本文提出了一種基于時空注意力機制的CNN 網絡重構AC 和DEN 測井曲線,得出以下幾點結論。
(1)測井曲線的交會分析表明不同測井曲線之間的相關性不同,AC 與CNL 曲線相關系數達到了0.57,DEN 與GR 曲線相關系數達到了0.67,證明了利用其他測井曲線重構AC 和DEN 測井曲線的可行性。
(2)基于AC、DEN 測井曲線與其他測井曲線相關性不同,提出在2DCNN 提取特征的基礎上增加注意力層,達到提高網絡對重要時空特征的敏感性。深度學習網絡的權重分析表明注意力層權重分布與測井曲線自相關、互相關特征規律一致。
(3)GRU、CNN 及本文的STACNN 的AC、DEN測井曲線重構效果優于多元擬合法,合成記錄時深標定效果驗證了本文網絡在AC、DEN 測井曲線校正、缺失重構方面的效果最優。