孫欽帥 宋延杰 唐曉敏
1. 中海油田服務股份有限公司, 河北 廊坊 065201;2. 東北石油大學地球科學學院, 黑龍江 大慶 163000
基巖一直是遼河凹陷重要的勘探領域之一。“十一五”以來,通過深化勘探,興隆臺、高升、中央凸起等領域取得了多項重大發現與突破,為近十幾年遼河油田增儲穩產提供了重要的支撐點[1-3]。其間發現的含油氣層系遍及太古界、中上元古界、古生界、中生界等前古近系各個層系,巖性包括不同變質程度的變質巖(混合花崗巖、石英巖、板巖、片麻巖等)、砂礫巖、巖漿巖、碳酸鹽巖等[4-7]。
近十幾年來,變質巖潛山已成為遼河凹陷油氣勘探的重要開發領域,變質巖潛山儲集層儲集空間類型多樣,包括風化淋濾孔(縫)、構造裂縫和礦物顆粒晶內裂縫等[8-11],且變質巖巖性直接或間接影響著裂縫發育狀況和溶蝕作用等原生因素,因此研究區層位的巖性識別和預測任務對于下一步的儲層預測與評價有極其重要的意義。本次研究通過對X潛山變質巖類測井響應機理分析,優選了對變質巖敏感的響應參數,建立了巖性識別圖版,同時利用決策樹(Decision Tree,DT)模型與支持向量機(A Library for Support Vector Machines,LIBSVM)模型對巖性進行了判別,建立了變質巖定性識別模型,以期為研究區變質巖巖性識別提供參考依據。
變質巖的測井響應主要是指巖性(化學成分、礦物成分)、物性和含油氣性的綜合響應[12]。X潛山變質巖的主要造巖礦物按顏色和化學成分大體可分成兩類:一類主要礦物成分為堿性長石類、斜長石類及石英的淺色礦物系列,其測井特征值普遍表現為相對低密度、低中子、低光電吸收截面指數,且具有較高的自然伽馬值;另一類主要礦物成分為角閃石、黑云母、輝石的暗色礦物系列,這類礦物的密度較高,同時因角閃石、黑云母等暗色礦物中含有較多的結晶水或結構水,礦物中氫元素含量高,中子孔隙度較高,自然伽馬值較低。因此,根據主要造巖礦物組成和含量以及礦物的物理性質,可知混合花崗巖、混合片麻巖、片麻巖、角閃巖的密度和中子值依次增大,混合花崗巖、混合片麻巖、片麻巖的自然伽馬為高值,角閃巖的自然伽馬為低值。
由于混合花崗巖、混合片麻巖、片麻巖、角閃巖的密度和中子響應不同,因此,混合花崗巖、混合片麻巖、片麻巖、角閃巖的視石灰巖刻度的中子密度孔隙度差值也應不同。這里從理論上分析混合花崗巖、混合片麻巖、片麻巖、角閃巖的視石灰巖刻度的中子密度孔隙度差值變化情況。
X=φD-φN
(1)
對于純巖石,巖石的密度和中子測井響應為:
(2)
圖1為理論模擬的混合花崗巖、混合片麻巖、片麻巖、角閃巖的視石灰巖刻度的中子密度孔隙度差值與孔隙度值交會圖。為了更接近研究區真實的物性條件,圖2為孔隙度5%時,理論模擬的混合花崗巖、混合片麻巖、片麻巖、角閃巖視石灰巖刻度的中子密度孔隙度差值曲線圖。從圖2可以看出,混合花崗巖、混合片麻巖、片麻巖、角閃巖的中子密度孔隙度差值具有一定差異。

圖1 變質巖中子密度孔隙度差值與孔隙度模擬圖Fig.1 Simulation diagram of PDNC and porosityof metamorphic rocks

圖2 變質巖巖性剖面中子密度孔隙度差值響應模擬圖(孔隙度5%)Fig.2 XPDNC response simulation diagram of lithologic profileof metamorphic rock(The porosity is 5%)
基于變質巖測井響應機理分析,優選出自然伽馬曲線及視石灰巖刻度的中子密度孔隙度差值曲線作為敏感響應曲線,利用X潛山14口井212個巖層的測井數據,建立的變質巖中子密度孔隙度差值—自然伽馬巖性識別圖版見圖3,圖版精度為86.8%,并給出了其巖性判別標準見表1。

圖3 變質巖中子密度孔隙度差值—自然伽馬識別圖版Fig.3 XPDNC-GR identification chart of metamorphic rocks

表1 變質巖巖性判別標準表
DT模型作為一種經典的數據挖掘分類算法,因其具有優秀的非線性分類能力和簡單易懂的分析原理及結果在地質勘探領域得到了廣泛應用[13-14]。通常DT模型的建立包括建樹和剪枝兩步。建樹階段常用算法包括ID3、C4.5、CART、QUEST和CHAID。各種算法在學習過程中為了盡可能正確地對樣本集進行分類,需要不停對節點進行劃分,結果就是整棵樹分支過多,即導致了過擬合現象。剪枝的目的就是為了避免DT模型的過擬合,常用的方法包括預剪枝和后剪枝:預剪枝就是在DT模型構造過程中,先對每個節點在劃分前進行估計,若當前節點的劃分不能帶來模型泛化性能的提升,那么就不對該節點進行劃分并將其標記為葉節點;后剪枝就是先把整棵DT模型構造完畢,然后自下向上對每個非葉節點進行考察,若將該節點對應的子樹換為葉節點能夠帶來泛化性能的提升,則把該節點替換為葉節點。
測井參數的選擇對于測井巖性識別的準確率具有很重要的影響,基于測井響應機理分析結果,選取對變質巖反應靈敏的自然伽馬、經井徑校正后的補償中子、補償密度及視石灰巖刻度的中子密度孔隙度差值作為測井參數,混合花崗巖、混合片麻巖、片麻巖、角閃巖巖性標簽分別用1、2、3、4代表,選取X潛山14口井212個巖層的測井參數為樣本集,并隨機抽取160個測井參數樣本作為訓練集,剩余樣本作為測試集。利用訓練集進行建樹階段,采用了C4.5算法及后剪枝方法,最終得到了基于DT模型的巖性分類器,見圖4。其重采樣誤差為0.057,交叉驗證誤差為0.138 4。利用建好的DT模型對52個測試集樣本進行了仿真測試,預測類別與真實類別對比結果,符合率為86.54%,見圖5。利用模型對整個樣本集判別,其符合率為92.0%。

圖4 變質巖巖性識別DT模型圖Fig.4 Decision tree model for lithology identification ofmetamorphic rocks

圖5 DT模型測試集預測結果圖Fig.5 The prediction results of the test set of the decisiontree model
LIBSVM作為一種有監督的機器學習方法,具有極優的分類能力[15-20],常用的核函數有線性核函數、多項式核函數、Sigmoid核函數和徑向基(Radital Basis Function,RBF)核函數。其中,RBF核函數能夠實現非線性映射且參數相對較少,穩健性明顯高于其他核函數,這在測井巖性識別時優勢明顯。對于多分類問題,LIBSVM將其轉換成二分類問題,常用的方法有一對多和一對一。一對多方法中,訓練時把k類樣本中某一個歸為一類,其余歸為一類,使用二分類的LIBSVM訓練出一個二分類器,同理遍歷每一個樣本使其自己為一類,其余樣本為另一類,這樣最終就會得到k個二分類器組成k分類器。對未知樣本分類時,分別用k個二分類器進行分類,將分類結果出現最多的類別最為最終的分類結果。對于一對一方法,訓練時任意兩類樣本都會得到一個二分類器,最終得到k×(k-1)/2個二分類器共同組成k分類器。對未知樣本分類時,使用k×(k-1)/2個二分類器進行分類,將出現最多的那個類別作為這個樣本的最終分類結果。下面是基于LIBSVM模型的巖性定性識別步驟。
1)模型測井參數的選取。選取對變質巖反應靈敏的自然伽馬、經井徑校正后的補償中子、補償密度及視石灰巖刻度的中子密度孔隙度差值作為測井參數,混合花崗巖、混合片麻巖、片麻巖、角閃巖巖性標簽分別用1、2、3、4代表。
2)樣本集的簡單縮放。為了避免大數值區間的屬性過分支配小數值區間的屬性,將樣本集的每種屬性利用極差標準化的方法縮放到[-1,1]區間。
3)選用RBF核函數作為映射函數。由于樣本個數遠大于測井參數個數,且RBF核函數能實現非線性映射且比多項式核函數參數少,可以降低模型復雜程度、減小計算量同時縮短運行時間,因此選用RBF核函數較為合適。
4)采用網格搜索及交叉驗證方法求取最佳參數——誤差懲罰系數C與RBF核函數參數λ。為了評估統計分析、機器學習方法對獨立于練習數據的數據集的泛化能力,避免過擬合,采用網格搜索及5折交叉驗證的方法得到滿足精度要求的一組最佳參數為C=42.22,λ=1。
6)對測試集進行模型仿真測試。利用建立的LIBSVM模型對測試集數據進行了測試,測試集樣本的分類正確率為84.615%,均方根誤差為0.153 8,平方相關系數為0.765 5,見圖6。

圖6 LIBSVM模型測試集預測結果圖Fig.6 The prediction results of the test set of theLIBSVM model
利用圖版法、DT模型及LIBSVM模型對hg1井太古界巖性進行了識別,見圖7。第八道為圖版法識別巖性,第九道為DT模型識別巖性,第十道為LIBSVM識別巖性,第十一道為由鉆井取心和錄井分析得出的實際巖性。在2 497.0~2 515.4 m、2 515.4~2 529.4 m、2 532.4~2 541.3 m、2 561.8~2 564.2 m、2 564.2~2 568.5 m、2 568.5~2 580.1 m井段3種方法識別巖性均與實際巖性一致。在2 529.4~2 532.4 m井段,圖版法與DT模型識別巖性均為混合片麻巖,LIBSVM模型識別為片麻巖,實際巖性為片麻巖。在2 541.3~2 558.6 m井段,圖版法與LIBSVM模型識別巖性均為混合片麻巖,DT模型識別為片麻巖,實際巖性為片麻巖。在2 558.6~2 561.8 m井段,圖版法識別巖性為混合片麻巖,DT模型與LIBSVM模型識別巖性均為混合花崗巖,實際巖性為混合花崗巖。DT模型與LIBSVM模型識別符合率均為88.89%,圖版法識別符合率為66.67%。識別結果表明DT模型及LIBSVM模型對研究區變質巖巖性判別具有一定的可靠性與適用性,在缺少鉆井取心資料的深度段可以有效進行變質巖巖性識別。

圖7 三種巖性識別方法應用效果對比圖Fig.7 Comparison of application effects of three lithology identification methods
1)基于錄井巖性、巖石薄片及測井響應特征將研究區變質巖類歸為了混合花崗巖、混合片麻巖、片麻巖及角閃巖4類,通過測井響應機理分析,構造了視石灰巖刻度的中子密度孔隙度差值這一組合參數,并優選出了變質巖的敏感測井響應為補償中子、補償密度、自然伽馬、中子密度孔隙度差值。
2)在變質巖類敏感測井響應優選基礎之上,建立了中子密度孔隙度差值—自然伽馬巖性識別圖版及其識別標準,基于C4.5算法及后剪枝方法建立了變質巖識別DT模型,給出了變質巖識別樹狀結構圖。以RBF核函數為映射函數,采用網格搜索方法優化了誤差懲罰系數C與RBF核函數參數λ,進而建立了變質巖識別LIBSVM模型,DT模型與LIBSVM模型精度均高于圖版法精度。
3)分別利用圖版法、DT模型及LIBSVM模型對研究區單井進行巖性識別,并與鉆井取心巖性進行對比,結果表明DT模型與LIBSVM模型分類能力更優,符合率也更高。與圖版法相比,DT模型與LIBSVM模型避免了人為性,保證準確率的同時增加了可操作性,具有廣闊的應用空間。