單 博 張繁昌* 丁繼才
(①中國石油大學(華東)地球科學與技術學院,山東青島 266580; ②中海油研究總院,北京 100027)
橫波速度是開展疊前地震反演特別是蝸牛道集反演所必須的基礎數據,是重要的儲層巖性信息。但常規測井通常只能得到縱波速度數據,橫波速度需要利用各種復雜的方法進行估算[1-2]。Greenberg等[3]、Castagna等[4]提出利用縱、橫波速度的經驗關系式估計橫波速度,這類方法受實際地質條件影響較大,容易產生較大誤差。目前常用的方法是基于巖石物理模型估算橫波速度。Xu-White模型[5-6]把巖石的縱、橫波速度與其孔隙度和孔隙縱橫比聯系起來,以此為基礎預測橫波速度; Xu等[7]和Payne等[8]通過分析不同孔隙結構對彈性參數的影響,建立了Xu-Payne模型進而預測碳酸鹽巖的橫波速度; 張秉銘等[9]在縱波速度約束下,將剛性孔隙與柔性裂縫的體積分數引入原始Xu-Payne模型,取得了更好的預測效果; 張元中等[10]分析了基于Greenberg-Castagna公式、近似Gassmann方程和Xu-White模型三種方法預測砂泥巖地層橫波速度的基本思路,給出了對比結果及應用效果; 羅水亮等[11]利用變型P-L模型及矩陣方程迭代在精細橫波預測中取得較好的效果; 唐杰等[12]、林凱等[13]均通過改進各種巖石物理模型預測橫波速度。
基于巖石物理模型的橫波速度預測方法需要依次建立巖石基質彈性模量模型、填充孔隙后得到的干巖石骨架彈性模量模型,以及填充流體得到的飽和流體模型等物理模型,再以彈性參數為中間變量,最后估算出橫波速度。建模過程需要大量的中間參數,比如巖石礦物組分、孔隙結構特征等,這些參數是建模過程必需的,但都不易獲得。此外,基質模量是通過礦物幾何平均、算數平均等方法估算,加之多種巖石物理模型各自具有不同的假設條件、建模過程復雜等,諸多因素都對巖石物理模型的實際應用產生影響。
隨著深度學習技術的發展,神經網絡被廣泛應用于油氣地球物理勘探領域,以解決實際應用中的非線性數學問題[14-18]。其中,BP網絡[19-20]、循環神經網絡[21]等傳統網絡模型已成功應用于橫波速度預測。這些網絡以實際測井資料為輸入、橫波速度為期望輸出,采用端到端的網絡結構,由已知測井數據直接預測橫波速度,摒棄構建復雜巖石物理模型的諸多環節,簡化了復雜的運算過程,同時取得了很好的效果。
本文構建了一種橫波速度預測的二次型尋優網絡。盡可能簡化網絡結構,在全連接網絡的基礎上,使用二次型尋優算法進行誤差反傳(從輸出層傳至隱藏層和輸入層)。通過與Adam[22]算法對比,驗證了該優化算法預測效果更好、效率更高。此外,采用正交試驗法[23]選取最顯著影響橫波速度預測效果的網絡參數及訓練策略,以達到提高預測精度的目的。網絡訓練選用橫波速度的敏感參數(自然伽馬、孔隙度和縱波速度)作為輸入,真實橫波速度作為輸出,訓練網絡模型實現橫波速度預測。最后應用實際測井數據進行測試,結果表明該方法能夠高效、高精度地預測橫波速度。
二次型尋優網絡是在全連接網絡的基礎上構建而成,其結構與全連接網絡結構相似。全連接網絡是根據多層感知機結構構建的神經網絡,它在輸入與輸出之間加入一個或多個隱藏層,上、下兩層之間的神經元相互連接,且下層神經元需要與上層所有神經元相連接,層內的神經元互不相連,其結構如圖1所示。

圖1 全連接網絡結構
全連接神經網絡具有端到端的特性,僅對輸入與輸出敏感,只需給定一組儲層參數作為輸入即可直接映射到橫波速度上。全連接網絡的學習過程是根據誤差反傳算法,調整神經元之間的權值和閾值的過程:樣本數據輸入到網絡中經歷正向傳播(從輸入層經隱藏層傳至輸出層)計算輸出數據與期望數據的誤差; 然后將誤差反傳計算誤差梯度,根據梯度調整連接權和閾值; 最后經過反復迭代,直至訓練出穩健的神經網絡。
根據梯度調整連接權和閾值的方法稱為神經網絡的優化算法。優化算法是訓練神經網絡的核心,在提高網絡訓練效率的同時,可以提高網絡的預測精度。二次型尋優算法即為一種優秀的優化算法,其衍生于牛頓迭代算法,并結合了二次型優化問題[24]。在神經網絡訓練中,使用均方誤差(MSE)作為準則,則網絡的代價函數定義為
(1)
式中:m為樣本個數;f表示網絡輸出;x表示輸入特征,含有3個分量,分別為自然伽馬、縱波速度和孔隙度;β為n維向量,表示網絡連接權值和閾值,即網絡參數;y表示橫波速度的真實值。
網絡的優化目標為最小化S(β)。令r=f(x;β)-y,進而求得
(2)
式中:J表示Jacobi矩陣;H表示Hessian矩陣;o是近似為零的向量。
二次型尋優算法結合了牛頓迭代法的思想。如圖2所示,首先在初始點β(0)附近將目標函數展開為二階泰勒公式,通過求此二階泰勒公式的最優解得到步長Δβ,進而解出第二個迭代點β(1)。第二步迭代用β(1)處的二階泰勒公式近似目標函數求解β(2)。經過反復迭代,即可求得目標函數的最優解。

圖2 泰勒展開示意圖
在第t次迭代中,用S(β)在點β(t)處的二階泰勒展開式近似S(β),可將式(1)轉化為二次型問題
F(β)=S[β(t)]+{?S[β(t)]}T[β-β(t)]+

(3)
通過求此二次型問題的最優解,可得到下一個迭代點β(t+1)。近似二次型的三維曲面如圖3所示。

圖3 近似二次型三維曲面
令A=?2S[β(t)],b=?S[β(t)],γ=-?F(Δβ),同時Hessian矩陣是對稱矩陣,對F(β)求導后得到簡化公式
γ=AΔβ-b
(4)
在迭代中,梯度的反方向為目標函數下降最快的方向,即-?F(Δβp)方向。根據一維搜索確定步長α,同時利用如下迭代公式找到二次型問題的最優解
γp=-?F(Δβp)=AΔβp-b
(5)
Δβ(p+1)=Δβ(p)+αγ(p)
(6)
根據一維線搜索的鏈式法則可求得
(7)
利用式(5)~式(7),即可得到式(3)所示二次型問題解的擾動量Δβ,進而求出β(t+1)=β(t)-Δβ。再經過嵌套循環、最小化代價函數等步驟,完成神經網絡的訓練過程。
此外,由式(4)可以看出,若矩陣A為非正定矩陣,則算法可能陷入局部最優,導致預測精度降低。此時可加入Levenberg-Marquardt[20]修正項,即G=A+ηI(I為單位矩陣,η為修正系數,η≥0),使其代替A。只要η足夠大,就可以保證G為正定矩陣。
影響神經網絡預測效果的因素有優化算法、每層神經元個數等,選擇其最優組合能夠提高神經網絡的預測精度及效率,本文采用正交試驗法進行篩選。統計學上,將試驗所考慮的因素(如優化算法)稱為因子,因子包含的所有情況(如Adam算法和二次型尋優算法)稱為因子水平。正交試驗法根據因子數和因子水平數選擇相應的正交表,再依托正交表的正交性,從中挑選少數典型數據進行試驗,即可實現通過最少的試驗次數達到與全部試驗相同的效果,進而分析出最優組合方案。
正交表是正交試驗法的重要工具,它列舉了一次試驗所用的全部因子水平組合。其表達形式有L4(23)、L8(27)、L12(31×24)等,其中L表示正交表,每個數字各有不同含義。以L4(23)為例,它表示最多可安排3個因子(A、B、C),每個因子均有2個水平(1、2),共需做4次實驗。L4(23)正交表如表1所示。

表1 L4(23)表
以上述正交表為基礎的正交試驗共需進行4次即可分析出較優方案。根據方差分析模型[23]及L4(23)表可知
(8)

將因子A中水平1的兩次試驗結果相加,有
z1+z2=2μ+2a1+ε1+ε2
(9)
類似地,將因子A中水平2的兩次試驗結果相加,并記為
(10)
上式中隨機誤差的平均值可近似為零,因此可將因子A的主效應估計為
(11)
正交試驗將不參與比較的因子B和C置于同等條件并消除其影響,達到只比較因子A的目的。
若將式(11)中兩式相減,可得
(12)
式中RA稱為因子A的極差,反映因子水平變化對試驗結果的影響,即因子的重要程度,值越大表示因子越重要。類似地可以計算出RB、RC。將RA、RB、RC由大到小依次排列,即可知因子主次。位于首位的因子,其水平變化對試驗結果貢獻最大,因此應當優先考慮; 位于末位的因子,其水平變化對試驗結果貢獻較小,其影響可最后考慮。
自然伽馬、縱波速度和孔隙度是測井數據中較易獲得的曲線。在典型砂泥巖地層中,這些數據均能反映地下介質的具體特征,是評價儲層物性的重要參數,且與橫波速度存在密切聯系。自然伽馬值能夠反映地層骨架的泥質含量,在曲線上砂、泥巖呈現不同特征,由自然伽馬與橫波速度交會圖(圖4a)可知,兩者呈正相關。縱波速度和橫波速度均與巖石骨架性質密切相關,由縱波速度與橫波速度交會圖(圖4b)可見,縱波速度與橫波速度也存在較強的正相關性。孔隙度作為影響地震波速度的重要因素之一,同樣可以反映地下介質的結構特征,與橫波速度存在必然聯系。由孔隙度與橫波速度交會圖(圖4c)可見,兩者存在負相關性。

圖4 儲層參數與橫波速度交會圖(a)自然伽馬與橫波速度; (b)縱波速度與橫波速度; (c)孔隙度與橫波速度
選用8口井的實際測井數據進行橫波速度預測,其中a1~a6井作為訓練集,b1、b2井分別做為驗證集和測試集。井數據包括自然伽馬、孔隙度、縱波速度以及橫波速度,訓練集樣本共2094組,驗證集和測試集均為561組數據。圖5為a2井各參數曲線,其中輸入數據為自然伽馬、縱波速度和孔隙度,輸出數據為橫波速度。對輸入數據進行特征縮放處理,對標準輸出數據取對數處理,并設MSE為損失函數。

圖5 a2井各參數曲線
正交試驗中,參與試驗的網絡參數及訓練策略包括每層網絡的神經元個數、隱藏層數、激活函數、優化算法以及訓練集井數,表2列出各因子的水平。
以表2所列的因子水平為依據,試驗選擇了L16(43×22)正交表。表中安排5個因子,因子A、B、C有4個因子水平,因子D、E有2個因子水平,需進行16次試驗篩選出最優的因子水平組合。將所有16種情況的因子水平組合安排在正交表上,并譯成試驗方案表(表3)。

表2 正交試驗因子水平表
以第5次試驗為例,它表示在A、B、C、D、E五個因子上分別取第2、第1、第2、第2和第2個水平,具體解釋為該次試驗中每層網絡的神經元個數為8個,構建1層隱藏層,激活函數為ReLU函數,采用二次型優化算法,合并a1、a2、a3和a4共四口井的數據作為訓練集,試驗結果得到其相關性評分為13.49。表3中的相關性評分由相關系數經簡單計算得來,它與相關系數類似,均反映預測結果與真實結果的相關性。使用相關性評分的目的是運算簡便,在一定程度上放大了相關系數的數值,削弱了因數值過小引起的誤差。
由表3中16次試驗得到的相關性評分結果計算出因子極差(R),得出較優因子水平并按因子主次排序。統計結果見表4。

表3 L16(43×22)正交試驗方案表

表4 試驗結果表
表4中ki等于某一個因子的第i個水平在16次試驗中得到的相關性評分之和再除以該水平的重復次數。例如:表4中A因子的k1為13.29=(12.34+13.69+13.17+13.96)/4。表中多水平因子的極差R取某一個因子中任意兩個ki間差值的最大值。例如:表4中A因子的極差R計算方法為2.42=max(|k1-k2|,|k1-k3|,|k2-k3|)。
分析表4可知,D2位于因子主次序列的首位,說明優化算法對橫波速度預測的影響最大,使用二次型尋優算法能夠提升預測結果的準確性。因子C位于第2位,激活函數對網絡預測效果的影響較大,選擇合適的激活函數能夠對預測準確性起到積極的作用。每層神經元個數(因子A)與網絡層數(因子B)對網絡預測有一定的影響,選擇更大的網絡模型效果不一定更優,例如第16次試驗中,構建4個隱藏層,每層15個神經元,最終得到相關性評分僅為1.37,遠低于其他網絡,這是由網絡模型過于復雜導致過擬合造成。最終,采用的二次型尋優網絡的參數及訓練策略為:每層10個神經元、2個隱藏層、ReLU激活函數、二次型尋優算法、合并6口井的數據作為訓練集。
訓練時間也是評判網絡模型優劣的重要標準,表3展示了每次試驗的訓練時間。由于試驗設置了損失函數閾值,達到閾值的幾組試驗會提前終止訓練,訓練時間明顯減少。過于復雜的網絡模型及過于簡單的模型在訓練時均不能達到閾值,故訓練時間較長。此外,Adam算法與Tanh激活函數搭配使用時,同樣不能達到閾值,訓練提前結束,且預測效果欠佳; 但當二次型算法與Tanh激活函數搭配時,結果恰恰相反,網絡收斂速度快且評分更高,其效果與ReLU激活函數相當。說明激活函數與算法相互影響,Tanh和ReLU激活函數更適用于二次型算法。最終網絡選用ReLU函數進行橫波速度預測。
2.3.1 算法預測效果對比
選取二次型算法和Adam算法分別用驗證井b1進行對比試驗。分析過程中利用根均方誤差(RMSE)作為網絡評判標準
(13)

表5統計了兩種優化算法預測結果的ξ、MSE和訓練時間,圖6顯示兩種優化算法得到的預測曲線對比。數據顯示Adam算法和二次型算法的ξ分別為19.67和14.97,二次型算法的ξ明顯降低近24%,說明二次型尋優算法預測精度更高。從圖6方框中可直觀地看出,使用二次型尋優算法訓練模型得到的橫波速度預測曲線與真實值曲線擬合程度更高,說明該方法在橫波速度預測中適用性更強。

圖6 兩種優化算法預測曲線對比(a)Adam優化算法; (b)二次型算法
在訓練效率方面,由表5訓練時間統計結果可知,二次型尋優算法訓練時間只有Adam算法的十分之一,顯然效率更高。從圖7損失函數下降曲線對比可見,二次型算法經過近100次迭代即可將損失函數值降低至接近零值,而Adam算法則需要近500次迭代才能達到相同效果。因此,于牛頓迭代算法基礎上衍生而來的二次型尋優算法,同樣具備收斂迅速的優點。

表5 兩種優化算法預測結果對比

圖7 損失函數下降曲線對比
2.3.2 測試井預測效果分析
用測試井b2進行預測效果分析,使用正交試驗優選后的網絡進行橫波速度預測。圖8a顯示二次型尋優網絡的橫波速度預測曲線與實際曲線吻合程度較高,圖中兩曲線幾乎重合,RMSE為15.56; 同時,圖8b的絕對誤差曲線顯示誤差的絕對值小于50m/s,表明兩條曲線具有較高的匹配度。預測成果表明二次型尋優網絡在橫波速度預測中精度高、結果穩定。

圖8 二次型尋優網絡的橫波速度預測成果圖(a)真實(紅)與預測(黑)值曲線對比; (b)真實與預測值絕對誤差曲線
本文構建了一種端到端二次型尋優網絡進行橫波速度預測,同時,為了提高預測精度,利用正交試驗法優選出網絡參數及訓練策略的最優組合,提高了網絡的訓練速度及預測效果。通過實際測井數據的訓練和預測結果得出以下結論。
(1)采用正交試驗法進行橫波速度預測的網絡結構優選效果良好。只需進行16次正交試驗,就能篩選出最優的網絡參數及訓練策略。 最終確定最優網絡參數及訓練策略為:每層10個神經元、二次型尋優算法、ReLU激活函數、合并6口井的數據作為訓練集、2個隱藏層。使用優選網絡預測的橫波速度精度高,預測結果穩定。
(2)相對于Adam算法,二次型尋優算法不僅預測效果好,且訓練效率高。從兩種算法的RMSE對比結果可知,二次型算法比Adam算法降低近24%,說明基于二次型尋優算法的橫波速度預測精度高。從訓練過程的誤差曲線及兩種算法結果對比表可看出,二次型尋優算法的迭代次數和訓練時間遠小于Adam算法,說明二次型尋優算法具有更高的訓練效率。
需要說明的是,二次型尋優算法在靠近極小值時收斂速度會變得緩慢,此時單純增加訓練次數只會降低計算效率,并不能明顯提高預測精度,根據訓練誤差合理地設置閾值可以緩解這個問題。