杜陳宇,吳施楷
(成都理工大學地球物理學院,四川 成都 610059)
測井數據的研究在油氣儲層預測中的作用舉足輕重,是開展后續工作和研究的基礎。因此,其對準確識別各類巖性具有重要的現實意義。在地球物理領域,對測井數據的研究多使用機器學習的方法,比如聚類分析、淺層神經網絡等方法對復雜的巖性進行了分類。
支持向量機是一種非常強大和多功能的機器學習模型,能夠執行線性或非線性分類、回歸,甚至異常值檢測。支持向量機的基本思想是將兩個線性可分的數據集用直線分開,分類器找到決策邊界,決策邊界非常接近這些模型在新實例上可能不會表現的情況。分類器的決策邊界不僅分離了兩個類別,而且盡可能遠離最接近的訓練實例。支持向量機可以對小樣本數據進行學習。同時,基于概率統計的模型能夠在高維空間中找出最優超平面,從而對數據進行分類。因此,支持向量機在面對非線性的小樣本數據及高維數據的模式識別時,具有優秀的泛化性能。針對四川盆地沉積巖的特點,應用了支持向量機的分類能力,對四川中部某處測井數據進行了巖性識別的研究。
支持向量機的本質是個凸二次優化問題,確保模型能夠找到一個極值解,即全局最優解。對數據進行分類時,求解兩類樣本的最優分類面,使得最優分解面不但能將兩類樣本正確分開,同時使分類間隔最大。分類要在n維數據中找到一個超平面,該超平面的方程為ωTx+b=0,定義函數間隔(用

利用Lagrange對偶性將最優分類面問題變為對偶變量的優化問題。通過給每個約束條件加上一個拉格朗日乘子α,

本文數據來自四川盆地中部地區龍馬溪組地層,使用了其中2口井數據作為訓練集,總體樣本總數為2 894個;剩余1口井作為測試集,樣本數為811個。井數據均來自同一工區,且具有與深度相對應的巖性數據,作為最后測試集的驗證數據。根據以往的研究經驗,同時,根據PCA降維結果,選取與巖性數據相關的參數(聲波AC、自然伽馬GR、中子系數CNL、無鈾伽馬KTH、釷TH、鈾U)。將這6個參數作為輸入的特征值,對每一口井中的不同的深度進行儲層巖性識別。由于不同特征的區間值不同,因此,在訓練之前,將所有的特征值都進行了歸一化處理。

圖1SVM訓練誤差

圖2 Moxi22井響應DAZ-CNL交會圖
訓練中,將測試集的80%用于訓練,同時,在訓練前按照對應深度進行了隨機亂序處理。剩余的20%用作交叉驗證集合,導出SVM參數C-svm和sigma。SVM使用高斯核而不是簡單的邏輯回歸作為其核函數。完成SVM分類后,從最置信度最高的SVM中選擇結果,并應用了核函數的輸入樣本的列向量。目前,能夠在測試集上獲得84.73%~88.6%的準確度。SVM訓練誤差如圖1所示,Moxi22井響應DAZ-CNL交會圖如圖2所示。
基于Matlab平臺,編譯并調試了SVM程序,用于研究儲層描述的智能數據分析模型。模型基于SVM回歸模型,使用默認的權衡參數。結果表明,SVM模型在對測井數據的分類結果上是非常有競爭力的。在大多數SVM研究中,不同的內核在不同的研究對象中被有不同的效果。未來,需要研究的其他內核,比如線性、多項式或S形。內核的選擇是一個SVM研究中長久以來的研究內容,它往往取決于具體問題。因此,需要進一步研究來確定測井數據的準確預測的最佳選擇。
參考文獻:
[1]汪海燕,黎建輝,楊風雷.支持向量機理論及算法研究綜述[J].計算機應用研究,2014,31(05):1281-1286.
[2]曾水玲,徐蔚鴻.基于支持向量機的手寫體數字識別[J].計算機與數字工程,2006,34(10):104-106.
[3]丁世飛,齊丙娟,譚紅艷.支持向量機理論與算法研究綜述[J].電子科技大學學報,2011,40(01):2-10.
[4]任立輝,李文東,慈興華,等.基于LIBSVM 的石油錄井中巖屑巖性識別方法研究[J].中國海洋大學學報,2010,40(09):131-136.
[5]吳施楷,曹俊興.基于連續限制玻爾茲曼機的支持向量機巖性識別方法[J].地球物理學進展,2016,31(02):821-828.
[6]基于SVN測井數據的火山巖巖性識別[J].地球物理學報,2015,58(05):1785-1793.
[7]余輝,趙暉.支持向量機多類分類算法新研究[J].計算機工程與應用,2008(07):185-189,212.
[8]唐耀華,張向君,高靜懷.基于地震屬性優選與支持向量機的油氣預測方法[J].石油地球物理勘探,2009,44(01):75-80.
[9]沈加剛,宋宗平,關曉巍.基于地震屬性的支持向量機河道砂體厚度預測[J].西南石油大學學報(自然科學版),2014,36(03):75-81.
[10]金龍,陳小宏,王守東.基于支持向量機與信息融合的地震油氣預測方法[J].石油地球物理勘探,2006(01):76-80.
[11]李可,陳洪亮,張生偉,等.基于SVM的霧天圖像分類技術研究[J].電光與控制,2014,23(11):1-7.