何 旭 陸智卿 袁 翔
(中國石油大學(華東)計算機與通信工程學院 青島 266580)
測井資料分析與解釋是進行沉積相、巖相和地層層序等地質構造分析判斷的重要步驟,而測井相的識別工作是其中的關鍵環節。測井相是由斯倫貝謝測井專家在20 世紀50 年代提出的[1],作為確定某一部分沉積巖并區別于周圍巖體的一組測井的原始或分析數據,測井相也被看做是測井信息與沉積學之間的橋梁。利用測井資料進行分析的主要原理就是選取一組或多組能夠反應該地區地層特性的測井資料,通過與錄井資料對比,從而提取并分析其形態、數值和變化趨勢等特征,最終得到具有價值的地質結論,這是一種耗費時間和體力的人工分析模式[2]。隨著智能算法,尤其是機器學習的發展,判別分析法、聚類法、模糊識別法、決策樹、支持向量機和神經網絡等方法被逐漸應用到測井相的識別與分析領域[3]。
Lim、Sang 和汪忠德等用智能算法對測井相識別分析進行了許多研究和應用,然而上述使用現代智能算法進行測井相分析的模型存在著許多不足:首先,特征提取復雜,需要將數據融合并進行歸一化等操作,不同的歸一化方法對模型訓練結果也有影響,而且在進行識別時選用的數據還需要進行維度調整;其次,泛化能力不足,上述工作都是基于定量分析的模型,這涉及到模型選用數據的地區問題,只有在地層信息接近、相同沉積環境下的數據才可以被使用,離開此限定條件,模型就不再適用。
近年來,人工智能技術火熱發展,其中深度學習在計算機視覺、語音識別和自然語言識別等領域都取得了優異的成果[9~14],在某些領域已經勝過人類。在測井相識別領域,雖然沒有使用人工智能技術進行突破性的創新工作,但是已經得到了地質和計算機研究人員的廣泛關注。本文選用東海某氣田的砂質辮狀河三角洲沉積環境下的測井數據,按照地質工作思維,從測井曲線形態角度考慮,選取自然伽馬(GR)作為訓練數據,使用深度卷積神經網絡提取特征、支持向量機進行多分類,并首次應用于測井相分類識別問題中。
通過在某氣田實際數據中的應用,并與其他分類算法進行比較,實驗結果證明:本文提出的卷積神經網絡-SVM 模型能夠有效分類識別,在精確度和泛化能力上優于其他算法;能夠利用模型識別結果在實際沉積相分析應用中取得良好結果。
自從20 世紀80 年代,卷積神經網絡(Convolu?tional Neural Network,CNN)被提出并被應用到手寫數字的識別中[15~16],就開始了其飛速發展。卷積神經網絡的主要結構由五個部分組成,分別是:輸入層、卷積層、池化層、全連接層和輸出層構成,卷積層與池化層兩兩相連。上述五個部分也可看做是由特征提取器和分類器組成,輸入層、卷積層和池化層構成特征提取器,全連接層和輸出層構成分類器。
卷積層是由多個特征映射組成,而特征映射又由多個神經元組成,每個神經元與上層相連,通過卷積的方式進行操作[17],一般卷積計算如下所示:

其中,n×n為卷積核大小,xi是特征映射內第i個點的輸入值,wi是對應的權值矩陣,b是引入的偏置,經過卷積計算得到這一區域的輸出值y。
卷積計算時每次使用一個卷積核對整個特征映射進行計算,這使得權值得到共享,極大地減少了網絡參數,減少了計算資源。卷積計算結束使用激活函數將輸出正規化,并作為下一層的輸入

f(· )是激活函數,有多種形式,在實際實驗中可以根據情況自行選擇,x是激活函數的輸出,也是下一層網絡的輸入值。
池化層也是有多個特征映射組成,其特征映射與上一層是一一對應的。以最大池化為例:

其中,x為池化區域的每個點的值,yi為從n×n個點中選取的最大值,也就是池化操作的輸出。
池化操作將特征映射的分辨率降低,從而獲得具有平移、旋轉不變形的特征[18],并且減少了神經元個數,從而降低了模型的復雜度,提高了泛化能力。
支持向量機(Support Vector Machine,SVM)是在特征空間上找到最優分離超平面使得訓練集上正負樣本間隔最大的有監督學習算法[19]。標準SVM是一種二分類學習算法,通過求得下式的最優解找到最大分隔超平面,但是無法直接處理多分類問題。

其中,w為權值矩陣,yi為第i個樣本的標簽,xi為第i個樣本的值,N為樣本總數。
而通過有序地求取多個最大分隔超平面就可處理多分類任務,常用的多分類方法有兩種,分別為“一對一”和“一對多”。前者是一種投票法,通過依次選取所有類別中的兩類進行分類,直到所有類別均被處理;后者是按照總的類別數建立分類邊界,每次判定一種類別,本文選用的多分類SVM 就是“一對多”方法。
本文提出一種基于卷積神經網絡和支持向量機的測井相分類模型,如圖1,主要分為兩個部分,即左邊的特征提取部分和右邊的特征分類部分;特征提取部分主要講輸入圖像進行多層卷積池化操作,利用卷積神經網絡將輸入的圖像特征提取出來,再講提取出的特征作為輸入,利用支持向量機進行多分類。

圖1 模型結構
本文選用東海凹陷某氣田的砂質辮狀河三角洲沉積環境下的測井數據進行研究。測井曲線在形態上反應了地層沉積環境,其對應不同沉積環境具有相應的曲線特征,所以在進行測井相識別之前需要基于本地區的沉積環境確定測井曲線的基本形態。自然伽馬測井曲線是由地層中天然放射性得到的,對黏土礦物具有很強的指示性,不僅能夠區分泥巖和砂巖,還能反應垂向序列中泥巖和砂巖的相對含量。綜上所述,自然伽馬測井曲線能夠較好地反應沉積環境,所以本文選用自然伽馬測井曲線的形態來反應沉積微相類型。
不同的沉積環境會使得測井曲線形態變換,通常,自然伽馬測井曲線形態有箱形、鐘形、漏斗形和復合形態,復合形態是前面兩種或多種形態的組合。在本文選用數據的沉積背景下,鐘形和箱形能夠反映水下分流河道沉積微相,漏斗型能夠反映河口壩沉積微相[20]。

圖2 訓練數據集樣例
本文選用圖2 所示的是那種自然伽馬測井曲線興塔作為特征,將文本格式的原始數據轉換成二維圖像形式。從四口井,共計10000m 的原始數據中獲取無歧義特征,經過人工截取和標定,再使用數據增強方法,如添加高斯噪聲、旋轉、歸一化等,對圖像進行擴充處理,最終建立包含著三種測井曲線形態總計3000余張的測井相數據集。
根據測井相具有特定模式的特點,本文構建了一種基于卷積神經網絡和支持向量機的測井相分類模型。整個CNN網絡模塊有7層所組成:第1、第3 和第5 層為卷積層;第2 和第4 層為池化層;第6和第7 層為全連接層。經過CNN 模塊的特征提取以后,將第7 層輸出的特征向量作為輸入送進支持向量機進行分類。
在CNN 模塊中,選用ReLU 作為激活函數,其公式如下:

其中,x為該點數值,f(x)是經過激活函數得到的輸出。
其他常用的激活函數還有Sigmoid激活函數和tanh激活函數,他們的函數曲線如圖3和圖4所示,由于本文的圖像形式主體為白色,特征部分為黑色,在計算的時候選用Sigmoid 和tanh 容易造成梯度消失和梯度爆炸[21],所以本文選用更容易求導的不飽和非線性激活函數ReLU。

圖3 Sigmoid和Tanh激活函數

圖4 ReLU激活函數
由于數據量不是很大,為了避免過擬合,本文在設計網絡結構時加入了隨機數據丟失(dropout)、局部響應歸一化(Local Response Normalization,LRN)和L2 正則策略。Dropout 是在每層網絡結算結束后以一定概率將某個神經元的值置為0,使其不參加前饋過程,從而減少網絡參數,達到增強魯棒性的目的;LRN 通過建立競爭機制,使得其對響應強烈的神經元的效果增強;L2 范數是所有向量平方和的平方根,在目標函數后添加L2 范數,求解最優解時會同時最小化L2 范數,最終會使得模型的參數更加接近0,使得模型的泛化能力更強。
在SVM 模塊中,為了使標準SVM 具有實現多分類任務的能力,本文使用合頁損失函數(hinge loss function)[22],函數如下所示:

其中,si為第i個樣本所對應類別的得分,sj為判定為其他類別的得分,Li為第i個樣本的總得分。
實際的自然伽馬測井數據是一段深度與自然伽馬的對應數值,所以在識別之前需要將測試數據進行分割,再轉化為圖像形式經過模型識別。經過分析,本文提出一種極值分割方法分割測井數據:首先以120 為閾值,找出全段測試數據中高于120部分的所有極大值,以這些點進行分割;再分別以100 和85 為閾值,依次重復分割數據;最后將所有分割出的數據轉化為二維灰度圖像。
為了驗證本文提出的基于卷積神經網絡和支持向量機測井相分類模型的有效性,在文中構建的數據集上,與傳統分類算法:BP 神經網絡、支持向量機和普通卷積神經網絡(AlexNet)進行了比較,結果如表1 所示,通過不同模型的分類準確率可以看出,本文提出的模型再準確率和泛化能力上更優。

表1 不同算法分類對比
本文構建的卷積神經網絡-支持向量機模型在其中加入了dropout、LRN和L2策略,相比較傳統的卷積神經網絡,在訓練過程中,迭代到2000 代時普通網絡已經出現過擬合,而本文所構建的模型在2000 代以后趨于穩定并達到最高準確率,說明了模型的泛化能力和精確度高于普通模型。
經過數據分割方法,再使用本文模型對某段實際自然伽馬測井數據進行識別,結果如圖5 所示,模型的識別結果與人工判斷基本一致,驗證了本文提出的測井相識別方法的有效性。

圖5 識別結果
本文基于深度學習技術,提出了基于卷積神經網絡和支持向量機的測井相識別方法,映入了L2范數、dropout 和LRN 從而有效地提高了模型的泛化能力,獲得了98.89%的模型分類準確率,實現了測井曲線形態的自動高精度分類識別,大大減少了人工識別所花時間,提高了工作效率;但是,即使是支持向量機這種能夠使用小樣本量訓練的模型也需要較為清晰的特征,而卷積神經網絡模型在提取特征時受訓練數據的影響較大,數據處理不得當,會導致交叉的結果。因此,如何對數據進行更有效的增強和擴充,提高小樣本量下卷積神經網絡特征提取的準確度是未來的工作。總地來說,本文創新性地構建了一種可行的測井相識別方法,能夠為地質工作人員提高效率,提供參考,并作為分析沉積相的基礎。