牛永斌,趙佳如,鐘建華,王敏,徐資璐,程夢園
1)河南理工大學資源環境學院,河南焦作,454003;2)中國石油大學(華東)地球科學與技術學院,山東青島,266580;3)中國石化勝利油田分公司勘探開發研究院,山東東營,257015
內容提要:塔里木盆地塔河油田奧陶系生物擾動碳酸鹽巖儲集層非常發育,但利用常規測井數據識別生物擾動儲集層發育段和準確預測孔隙度難度較大。本文在對研究區16口取芯井奧陶系巖芯上生物擾動區域擾動等級劃分的基礎上,通過巖性標定測井,優選常規測井參數,基于BP神經網絡模型分別建立了適合研究區生物擾動碳酸鹽巖儲集層識別和孔隙度預測的模型,并對建立的模型進行了有效性檢驗。結果表明:① 選擇自然電位、自然伽馬、井徑、深側向電阻率、淺側向電阻率、補償中子和密度等常規測井數據作為生物擾動碳酸鹽巖儲集層識別模型輸入層的參數值,生物擾動指數(Bioturbation Index,BI)作為輸出結果;選取rprop、sigmoid symmetric和sigmoid stepwise函數分別作為訓練函數、隱含層和輸出層的激活函數,建立節點數為3、層數為3的神經網絡識別模型,識別效果好,適用于研究區奧陶系生物擾動碳酸鹽巖儲集層的識別。② 選擇自然電位、自然伽馬、井徑、聲波、補償中子和密度值等常規測井數據作為輸入層的參數值,對應深度上巖芯柱塞孔隙度測試結果和利用孔隙度樣品檢驗模型計算得出的孔隙度結果作為輸出結果,選取incremental、gaussian和sigmoid分別作為訓練函數、隱含層和輸出層的激活函數,建立節點數為4,層數為3的生物擾動碳酸鹽巖儲集層孔隙度預測模型,預測效果良好,適用于研究區奧陶系生物擾動儲集層孔隙度的預測。該研究對定量表征研究區生物擾動儲層特性、儲量估算、油藏描述和儲層地質建模等具有重要的借鑒意義。
塔里木盆地塔河油田是我國第一個古生界海相億噸級大油田(金強等,2020),傳統認為塔河油田奧陶系油藏是典型的“縫—洞型”油藏;溶洞、裂縫、小型溶蝕孔洞、礁灘粒間孔等是該油氣藏的主要儲集空間(閻相賓等,2001;林忠民,2002;Mao Cui et al.,2014;趙建等,2015)。然而,近幾年的研究還發現塔河油田奧陶紀適宜的沉積環境、生態條件、良好的時空物質匹配和充足的生物擾動作用時間,多期次的生物潛穴疊加形成了橫向連片、垂向連通的大規模生物擾動碳酸鹽巖。這些生物擾動碳酸鹽巖具有較好的孔隙度和滲透率,是潛在的油氣儲集層(郭建華等,1994;毛毳等,2014;牛永斌等,2017,2018,2020),但由于生物擾動碳酸鹽巖儲集層非均質性強、含油氣性不均勻和油氣層與水層測井響應差異小等特征,致使從常規測井曲線上識別生物擾動儲集層難度大。
孔隙度是表征儲層特性、儲量估算、油藏描述和建立儲層地質模型最重要的參數之一,準確獲取儲集層的孔隙度是進行地層解釋和降低石油天然氣開采工程風險的基礎和關鍵(連承波等,2006)。因此,尋找有效的計算生物擾動碳酸鹽巖儲集層孔隙度的方法是當前石油工作者的一項艱巨任務(Jamialahmadi and Javadpor,2000;Jamshidian et al.,2015;Ben-Awuah and Padmanabhan,2017;Urang et al.,2020;Mahmoodpour et al.,2021)。目前,石油工作者獲取孔隙度的方法主要有直接測定法和間接計算法,直接測定法利用巖芯和巖屑測定分析,不但成本高且所獲取的巖石樣本資料往往比較單一不利于準確估量儲層參數;間接計算法利用測井數據通過經驗公式擬合得到,具有成本低、效率高,且在實際環境中直接測得的資料更能反映儲層的真實情況(連承波等,2006)。
目前,不少學者基于聲波時差的Wyllie-Clemenceau方程建立了一些孔隙度估算模型(Kamel et al.,2002),還有不少學者建立了其他的孔隙度預測模型(Iturraran-Viveros and Parra,2014;趙建等,2015;甘宇等,2018;孫岐峰等,2020;譚偉等,2020;Urang et al.,2020),但利用這些模型進行塔河油田奧陶系生物擾動碳酸鹽巖儲集層孔隙度預測時與實際測試結果偏差較大。因此,筆者等在總結前人測井孔隙度計算方法的基礎上,將生物擾動指數(BI)引入密度測井孔隙度計算模型中,提出了基于巖芯資料和常規測井數據的儲集層孔隙度計算樣本檢驗模型,彌補現有常規孔隙度模型的不足。但是該模型引入的生物擾動指數(BI)需要從巖芯資料中獲取,由于受取芯井數量的限制,該模型在油田的勘探開發實際應用過程中具有一定的局限性(趙佳如等,2020)。故還需在該樣本檢驗模型所能提供的巖芯或擬巖芯樣本數據的基礎上建立一種測井曲線與儲層參數之間非線性智能模型。前人眾多研究表明:人工神經網絡(ANN)是解決非線性地質問題的一種有效的計算技術,其中誤差反向傳播算法(BP模型)是人工神經網絡(ANN)技術中最流行的一種(曹思遠等,2002;楊立強等,2003;連承波等,2006;彭志方,2006;鄭慶生等,2007;Iturraran-Viveros and Parra,2014;Ben-Awuah et al.,2017;Urang et al.,2020;魏杰等,2020)。
本文按照Knaust(2012)推薦的適合描述巖芯上生物擾動等級的劃分標準(0~5級),對研究區16口奧陶系取芯井巖芯上的生物擾動區域進行了生物擾動等級的劃分,通過巖芯標定測井,優選與生物擾動碳酸鹽巖儲集層發育段最為相關的常規測井參數,建立了適合研究區生物擾動碳酸鹽巖儲集層的BP神經網絡識別模型。然后,以生物擾動儲集層發育段巖芯柱塞孔隙度測試結果和已建立的孔隙度樣品檢驗模型得出的孔隙度計算數據作為訓練數據,基于BP神經網絡模型建立了一種適用于研究區生物擾動儲集層孔隙度預測模型,并對模型的有效性進行了檢驗。該研究對定量表征研究區儲層特性、儲量估算、油藏描述和儲層地質建模等具有重要的意義。
塔河油田面積近2400 km2(金強等,2020),位于新疆維吾爾自治區塔里木盆地北緣,地處輪臺縣和庫車縣境內(艾合買提江·阿布都熱合曼等,2010;鐘建華等,2010;毛毳等,2014;圖 1a)。目前,三疊系、石炭系、泥盆系和奧陶系均為其含油氣層位;其中,奧陶系碳酸鹽巖中的油氣儲量占其總探明儲量近90%以上(閻相賓等,2001;林忠民,2002);研究區依據油藏特征可細劃分為12個小區(圖1b),鉆井揭示奧陶系地層由下到上發育有蓬萊壩組、鷹山組、一間房組、恰爾巴克組、良里塔格組和桑塔木組,其中鷹山組和一間房組在早—中奧陶世的沉積過程中,形成了厚度達300 m的碳酸鹽巖(圖1c)。傳統主流觀點認為塔河油田奧陶系油藏是典型的縫洞型碳酸鹽巖油氣藏,溶洞和裂縫是其主要的儲集空間(閻相賓等,2001;林忠民,2002;艾合買提江·阿布都熱合曼等,2010;鐘建華等,2010;毛毳等,2014;金強等,2020),而對其他儲集空間類型研究較少。碳酸鹽巖基質沉積物由于原始物性較差常被認為難以形成有效的儲集層(Rashid et al.,2015),但生物擾動可對其組構和物性進行顯著的改造(Gingras et al.,2004a,b,2012;Pemberton and Gingras,2005;Cunningham et al.,2009;Baniak et al.,2013;La Croix et al.,2013;Baniak et al.,2014a,b,2015;Hsieh et al.,2015,2017;Dey and Sen,2017;Friesen et al.,2017;Golab et al.,2017a,b;La Croix et al.,2017;Adam et al.,2018;Eltom et al.,2019;Liu Hangyu et al.,2019;Eltom et al.,2020)。近期研究發現塔河油田奧陶系鷹山組和一間房組含有大量生物擾動發育段,油浸和油斑分布現象明顯,是未來潛在的油氣儲集層。因此,開展塔河油田奧陶系鷹山組和一間房組生物擾動碳酸鹽巖儲集層的識別和孔隙度預測研究對定量表征研究區儲層特性、儲量估算、油藏描述和建立儲層地質模型等具有重要的現實意義。

圖1 塔里木盆地塔河油田地理位置、區域劃分和奧陶系地層柱狀圖(據牛永斌等,2020,有修改)Fig.1 Geographic position,regionalism and Ordovician stratigraphic column of the Tahe oilfield,Tarim Basin (modified from Niu Yongbin et al,2020&)(a)塔河油田構造位置;(b)塔河油田區塊劃分;(c)塔河油田奧陶系巖性柱狀圖 (a)structural location;(b)block division;and (c)Ordovician lithological column
通過對研究區16口取芯井 982 m奧陶系巖芯詳細觀測和統計發現,巖芯上生物擾動區域表現為扁圓形橢圓狀、斑狀、網狀或綢帶狀等形態(圖2a);根據生物潛穴外觀形態和部分生物潛穴交叉處具有明顯的膨大現象等特征,可識別出主要生物擾動類型有兩大類:Thalassinoides類和Planolites類,以Thalassinoides類最為常見和最為發育,生物擾動面積比為5%~100%,Planolites類生物擾動厚度相對較小。偏光顯微鏡與陰極發光顯微鏡觀測結果表明生物潛穴充填物主要由白云石礦物晶體組成,白云石晶體以半自形晶—自形晶為主,它形白云石晶體較為少見,晶體之間可見未白云化的殘留灰泥(圖2b,c,d);生物潛穴充填物內部的白云石晶間孔發育,是這類儲集層的主要儲集空間,除此之外還有生物鑄模孔,圍巖基質儲集空間不發育。此外,在生物擾動區域邊界常發育有原油浸染或瀝青充填的微裂隙或縫合線(艾合買提江·阿布都熱合曼等,2010;鐘建華等,2010)。

圖2 塔里木盆地塔河油田奧陶系生物擾動碳酸鹽巖儲集層巖芯照片與顯微照片Fig.2 Ordovician core photo and micrograph of the bioturbated limestone from the Tahe oilfield,Tarim Basin(a)塔河油田奧陶系S80井巖芯照片,5629.75 m,生物擾動區域被瀝青浸染。(b)S77井,5566.27 m,單偏光顯微照片,生物擾動區被白云石充填,晶間孔發育;圍巖基質為泥晶灰巖,基質孔隙不發育。(c)S77井,5569.90 m,單偏光顯微照片,生物擾動區被白云石充填,晶間孔發育;圍巖基質為泥晶灰巖,基質孔隙不發育。(d)陰極發光顯微照片(視域同c),生物擾動區域白云石顆粒呈紫紅色的陰極發光,“亮邊霧心”現象明顯,揭示為成巖白云化作用形成,晶間孔發育;圍巖基質為泥晶灰巖,不具有陰極發光,基質孔隙不發育(a)The Ordovician core photo from the Well S80 in the Tahe Oilfield,5629.75 m,the bioturbated zone was stained by asphalt.(b)The Well S77,5566.27 m,polarizing micrograph.Dolomite intercrystalline pores are developed in the bioturbated zone,the host rock matrix is mudstone,and the matrix pores are not developed.(c)The Well S77,5569.90 m,polarizing micrograph.Dolomite intercrystalline pores are developed in the bioturbated zone,the host rock matrix is micrite,and the matrix pores are not developed.(d)The cathodoluminescence micrograph (the same field of view as c).Dolomite particles in the bioturbated zone show purple-red cathode luminescence,the phenomenon of “bright edge fog center”is obvious,suggests that it is formed by diagenesis dolomitization.The intergranular pores are developed;the host rock matrix is micrite without cathode luminescence,and the host matrix pores are not developed
為了減小環境因素和儀器刻度的不確定性造成的測井數據誤差,本文在選擇測井參數前,首先對選取的測井數據進行了標準化處理。標準化過程中選取塔河油田16口取芯井具有相同沉積環境的厚層泥晶灰巖段的測井數據,分析每口井標準層的測井數據的頻率分布特征(如平均數),求出校正系數;在測井數據標準化基礎上,選取整體上能反映該地區地質特征的變化趨勢,井眼條件好,測井系列完善且測井質量好,取芯及錄井資料齊全的4692個測井數據作為學習和檢驗樣本。結合不同生物擾動指數(BI)下相同測井曲線值的變化幅度,選擇了對生物擾動碳酸鹽巖儲集層預測效果較好的自然電位、自然伽馬、井徑、淺側向電阻率、深側向電阻率、補償中子值、密度值作為BP神經網絡輸入層的參數值,生物擾動指數(BI)為輸出層的參數。
利用“邁實神經網絡”商用軟件建立BP神經網絡模型,模型由輸入層、隱含層和輸出層組成,其中隱含層可以有多個。當含有1個隱含層時將其稱為3層BP神經網絡,隨著隱含層的層數的增加以此類推。一般認為,增加隱含層的層數可以提高模型精度、降低網絡誤差,但同時也會使網絡變得復雜化,從而增加了網絡的訓練時間和出現“過擬合”的傾向(王嶸冰等,2018)。此外,通過增加隱含層的節點數也可以獲得較低的誤差,且其訓練效果要比增加隱含層的層數更容易實現。因此,本次通過增加隱含層的節點數的方式來降低神經網絡誤差,即選擇3層BP神經網絡對模型進行訓練,得到了相同隱含層個數下不同隱含層節點數的均方差、最大迭代次數及訓練誤差。由表1可知,隨著節點數的增加,模型均達到了最大迭代次數500000次,訓練誤差總體呈遞減趨勢,以均方差最小為原則、訓練誤差為參考,確定模型隱含層的節點數為3(圖3)。

圖3 生物擾動碳酸鹽巖儲集層識別模型的網絡結構圖Fig.3 Network structure diagram of identification model of the bioturbated carbonate reservoir

表1 不同隱含層節點數對生物擾動碳酸鹽巖儲集層識別模型的影響Table 1 The influence of different hidden layer nodes on the identification model of the bioturbated carbonate reservoir
除BP神經網絡模型隱含層的層數和節點數外,不同模型參數(訓練函數、激活函數)的選取也會影響模型的精度和收斂速度。本文所采用的“邁實神經網絡”商用軟件共提供了5種常用訓練函數(incremental、batch、rprop、quickprop、sarprop)和18種常用激活函數(linear、linear piece、linear piece symmetric、threshold、threshold symmetric、sigmoid、sigmoid stepwise、sigmoid symmetric、sigmoid symmetric stepwise、gaussian、gaussian symmetric、gaussian stepwise、elltot、elltot symmetric、sin、sin symmetric、cos、cos symmetric)。在確定了BP神經網絡識別模型的學習樣本和隱含層的層數及節點數之后,首先選取以上5種訓練函數對模型分別進行訓練,訓練結果見表2;其次在確定模型的訓練函數后,對隱含層和輸出層分別設置不同的激活函數進行模型的訓練,由于隱含層和輸出層的激活函數種類相同,理論上共有324(18×18)種選擇方案,表3是訓練效果相對較好的激活函數對生物擾動碳酸鹽巖儲集層識別模型的影響統計表。以均方差最小為選擇原則、訓練誤差為參考。由表3可知,當訓練函數為rprop時,模型的均方差和訓練誤差最小,當隱含層的激活函數為sigmoid symmetric、輸出層的激活函數為sigmoid stepwise時,模型的訓練效果最好。故最終選取rprop為識別模型的訓練函數,sigmoid symmetric和sigmoid stepwise分別為識別模型隱含層和輸出層的激活函數。

表2 不同訓練函數對生物擾動碳酸鹽巖儲集層識別模型的影響Table 2 The influence of different training functions on the identification model of the bioturbated carbonate reservoir

表3 不同激活函數對生物擾動碳酸鹽巖儲集層識別模型的影響Table 3 The influence of different training functions on the identification model of the bioturbated carbonate reservoir
為了檢驗模型的有效性,隨機選取了取芯井T208井(5577.5~5578.0 m,BI=0;5516.0~5516.5 m,BI=1;5624.0~5624.5 m,BI=2;5629.5~5630.0 m,BI=3;5628.5~5629.0 m,BI=4)和S77井(5572.875~5573.375 m,BI=5;5543.0~5543.5 m,BI=5)不同生物擾動強度的數據進行了模型檢驗。圖4為BP神經網絡模型預測的生物擾動指數(BI)與實際巖芯描述中生物擾動指數(BI)的交會圖。從圖4可知,模型誤差符合精度要求,預測結果較好;因此建立的生物擾動碳酸鹽巖儲集層適用于研究區奧陶系生物擾動碳酸鹽巖儲集層發育段的識別和預測。此外,如果生物擾動碳酸鹽巖儲集層識別模型預測生物擾動強度結果大于5,根據部分測井曲線所對應巖芯照片檢驗結果分析認為該段測井數據對應的地層可能裂縫或者大的溶蝕孔洞發育。

圖4 生物擾動碳酸鹽巖儲集層識別結果與巖芯上生物擾動指數(BI)交會圖Fig.4 The cross-plot of the bioturbation index (BI)from the identification model of the bioturbated carbonate reservoir and the bioturbation index from the geological cores
利用常規測井曲線參數計算研究區奧陶系生物擾動儲集層孔隙度時,由于相關性差的測井數據與孔隙度存在較多不相關信息會降低孔隙度的計算精度(周雪晴等,2017),故首先需要選取與孔隙度相關性高的測井曲線增加孔隙度的計算精度。本文以取芯井(S77井)為例分析對生物擾動發育段各常規測井曲線參數與柱塞孔隙度進行相關性分析,分析結果如表4所示。為了減小和消除環境因素和儀器刻度的不確定性造成的測井數據誤差,本文在選取測井數據前,也對選取測井數據進行標準化處理。在完成上述數據的預處理后,提取出了對生物擾動碳酸鹽巖儲集層孔隙度預測效果較好的自然電位、自然伽馬、井徑、聲波、補償中子、密度6條測井曲線共計4692個測井數據和982個巖芯柱塞數據作為生物擾動碳酸鹽巖儲集層孔隙度預測模型的訓練與檢驗樣本。

表4 常規測井參數與巖芯孔隙度相關性分析結果Table 4 Correlation analysis results of conventional logging parameters and core porosity
利用測井曲線建立BP神經網絡孔隙度計算模型時,需要確定模型隱含層的層數和節點個數、訓練函數和激活函數。目前,大多數神經網絡模型多采用直接賦值法并沒有對其拓撲結構做深入的分析研究,導致獲得的模型穩定性差,極大地降低了模型的準確性和真實性(周雪晴等,2017)。為了提高BP神經網絡孔隙度計算模型的預測精度,首先選取3層BP神經網絡并通過增加隱含層的節點數來降低網絡誤差,對建立的基于BP神經網絡的孔隙度預測模型進行了訓練,訓練結果如表5所示;其次在確定BP神經網絡孔隙度預測模型的學習樣本和主體結構(隱含層的層數和節點數)之后,對以上網絡參數(訓練函數和激活函數)分別進行模型的訓練,訓練結果如表6和表7所示。由表5可知,當隱含層的節點數為 4 時,模型的均方差和訓練誤差最小,最大迭代次數也相對較小;由表6和表7可知,當訓練函數為incremental時,模型的均方差和訓練誤差同樣最小,當隱含層的激活函數為gaussian、輸出層的激活函數為sigmoid時,模型的均方差、訓練誤差以及最大迭代次數同時達到最小,模型訓練效果最好。故最終選取BP神經網絡孔隙度模型的隱含層節點數為4(圖5),訓練函數為incremental,輸入層和輸出層的激活函數分別為gaussian和sigmoid。

表5 不同隱含層節點數對生物擾動碳酸鹽巖儲集層孔隙度預測模型的影響Table 5 The influence of different hidden layer nodes on the porosity prediction model of the bioturbated carbonate reservoir

圖5 生物擾動碳酸鹽巖儲集層孔隙度預測模型的網絡結構圖Fig.5 Network structure diagram of porosity prediction model of the bioturbated carbonate reservoir

表6 不同訓練函數對生物擾動碳酸鹽巖儲集層孔隙度預測模型的影響Table 6 The influence of different training functions on the porosity prediction model of the bioturbated carbonate reservoir

表7 不同激活函數對生物擾動碳酸鹽巖儲集層孔隙度預測模型的影響Table 7 The influence of different training functions on the porosity prediction model of the bioturbated carbonate reservoir
為了檢驗建立的BP神經網絡孔隙度計算模型的有效性,隨機選取T208井(5616.375 m,BI=1;5622 m,BI=2;5629.625 m,BI=3;5628.87 m,BI=4)和S77井(5453.375 m,BI=0;5573.375 m,BI=5;5543.375 m,BI=5)不同生物擾動強度的測井孔隙度預測結果和柱塞樣品的測試結果數據進行檢驗。圖6為生物擾動碳酸鹽巖儲集層孔隙度預測模型預測結果與實際巖芯孔隙度的交會圖,從圖6中可知所建立的BP神經網絡孔隙度模型的預測效果良好,誤差也符合精度的要求,可以用于研究區奧陶系生物擾動儲集層孔隙度的計算和預測。

圖6 生物擾動碳酸鹽巖儲集層預測孔隙度與巖芯柱塞測試孔隙度交會圖Fig.6 The cross-plot of the porosity from the prediction model of the bioturbated carbonate reservoir and the porosity from core plug measure
此外,為了對比兩種孔隙度計算模型預測效果,本文還隨機選取了T208井5625~5631 m生物擾動儲集層段的測井數據作為樣本數據,對比分析了利用樣本檢驗模型孔隙度計算模型與BP神經網絡孔隙度計算模型的計算結果,分析結果如圖7所示。當用樣本檢驗模型和BP神經網絡模型分別預測同一段生物擾動碳酸鹽巖儲集層的孔隙度時,兩者的預測結果總體來說與巖芯柱塞孔隙度實測結果較為接近,說明兩種模型的預測效果均較好。實例分析還表明BP神經網絡孔隙度計算模型的預測精度遠大于以往孔隙度預測模型,能更好地滿足塔河油田奧陶系生物擾動儲層孔隙度計算的精度要求,證實了本次所建立的生物擾動碳酸鹽巖儲集層孔隙度預測模型的可靠性。需要說明的是,在對研究區生物擾動發育段982個柱塞樣品的孔隙度測試結果統計來看,孔隙度介于0.1%~10.8%之間。如果利用BP神經網絡孔隙度計算模型預測結果大于11%,根據選擇樣本所對應巖芯照片分析認為該段測井數據可能是受對應的地層裂縫或者大的溶蝕孔洞發育的影響。

圖7 T208井5625~5631 m不同孔隙度預測方法對比圖Fig.7 Comparison between the different porosity prediction methods of 5625~5631 m in the Well T208
(1)依據巖芯標定測井的思路,選擇自然電位、自然伽馬、井徑、淺側向電阻率、深側向電阻率、補償中子、密度值等常規測井數據作為BP神經網絡模型輸入層的參數值、生物擾動指數作為輸出層的結果值,建立了適合于塔里木盆地塔河油田奧陶系生物擾動碳酸鹽巖儲集層的BP神經網絡生物擾動儲集層識別模型,并檢驗了模型的有效性。該模型層數和節點數為3,訓練函數為rprop,隱含層和輸出層的激活函數分別為sigmoid symmetric 和sigmoid stepwise。本模型生物擾動指數識別結果誤差符合精度要求,識別效果較好。
(2)選擇自然電位、自然伽馬、井徑、聲波、補償中子、密度值等常規測井數據作為BP神經網絡輸入層的參數值,對應深度上的巖芯柱塞孔隙度測試結果和利用孔隙度樣品檢驗模型得出的孔隙度結果作為輸出層的結果值,建立了適用于塔河油田奧陶系生物擾動碳酸鹽巖儲集層的BP神經網絡孔隙度預測模型,并檢驗了模型的有效性。該模型層數為3,節點數為4,訓練函數為incremental,輸入層和輸出層的激活函數分別為gaussian和sigmoid。本模型孔隙度預測結果誤差符合精度要求,預測結果較好。