路鵬飛 杜文龍 李 麗 程丹華 郭愛華
(①東華理工大學信息工程學院,江西南昌 330013;②山東省煤田地質局第三勘探隊,山東泰安 271000;③中國石油青海油田分公司勘探開發研究院,甘肅敦煌 736202;④中國石油冀東油田分公司勘探開發研究院,河北唐山 063004)
在含油氣盆地中,高、低序級斷層[1-3]之間有密切的成因聯系,高序級斷層決定著含油斷塊的產狀、形狀和構造趨勢,低序級斷層則進一步控制局部微幅度構造,分割含油斷塊并使其中油水關系復雜化。對于油田的勘探開發以及水平井的部署、鉆探而言,低序級斷層的準確識別尤為重要。
目前,斷層識別方法和技術主要有相干體[4-5]、邊緣檢測[6-7]、曲率[8-9]、譜分解[10-12]、螞蟻體[13-14]、分頻處理[15]、多屬性融合[16-18]等,這些技術極大地提高了斷層識別的效果和精度。然而,上述方法對地震資料品質要求較高,并且對低序級斷層不甚敏感,因此對斷距較小的低序級斷層識別效果不佳。
基于卷積神經網絡(Convolutional Neural Network,CNN)深度學習方法的人工智能技術為地震斷層識別特別是低序級斷層識別提供了新的途徑。Ronneberger等[19]在挖掘醫學圖像信息時,結合CNN提出了UNet網絡結構。Huang等[20]根據現有地震數據具有的大數據特點,提出了一種應用地震屬性(特別是斷層概率體屬性)識別斷層的CNN方法。Guo 等[21]、Xiong等[22]、任雄風等[23]、王紫蕊等[24-25]分別提出基于CNN的斷層識別方法。Araya-Polo等[26]利用深度神經網絡(Deep Neural Network,DNN)把地震數據映射到斷層數據空間進行斷層識別。Chang等[27]提出利用UNet識別斷層的方法。Wu 等[28]利用UNet網絡進行斷層智能識別。Zhou等[29]利用迭代深度學習方法識別斷層。張政等[30]將深度殘差網絡與遷移學習結合并應用于斷層識別。吳吉忠等[31]提出基于全卷積神經網絡(Fully Convolutional Neural Network,FCN)結構的低序級斷層識別方法。常德寬等[32]在UNet網絡結構的基礎上結合ResNet的思想,提出了SeisFault-Net結構。楊午陽等[33]提出一種基于UNet深度學習網絡的地震數據斷層檢測方法,在網絡結構中結合UNet和殘差模塊ResNet50,構建了新的ResUNet網絡。王作乾等[34]嘗試將基于特征壓縮激活UNet的卷積網絡結構用于識別斷層。
Milletari等[35]處理醫學圖像信息時,在UNet的基礎上提出了VNet結構的思想。通過調研發現,UNet網絡結構在下采樣過程中丟失了信號的部分細節信息,而VNet網絡結構可以在下采樣過程中增大信號的感受野,盡量保留信號細節信息。
本文根據低序級斷層的地震地質特征,編制了基于VNet網絡深度學習架構的低序級斷層識別程序,通過模型數據訓練、驗證,并應用到油田實際地震數據中。斷層識別結果顯示,相對以往方法,提取的信息更加豐富,表明本文方法在識別低序級斷層方面有效。
高序級斷層指用常規地球物理方法能夠識別的斷層;低序級斷層是由高序級斷層派生的且用常規地球物理方法難以識別的小斷層,具有較強的隱蔽性。低序級斷層在地震剖面上可以斷開標準反射層,或者標準反射層有明顯錯動;也可能在地震剖面上表現為標準反射層稍微扭曲或者僅在非標準反射層中有所錯動,此種輕微錯動常與巖性變化引起的反射層同相軸變化相混淆。
在常規勘探地震資料中,低序級斷層具有以下特點:
(1)利用通常的斷層識別標準難以發現,在經過嚴格常規處理后的地震剖面上,表現為地震同相軸輕微錯斷、不連續,同相軸輕微撓曲、分叉或合并,同相軸出現空白帶等形式,斷層識別難度大;
(2)低序級斷層是局部構造應力場的產物,斷層的斷距、延伸長度和規模都比較小,通常淺層斷距小于10m、中深層小于25m,斷開層位較少,伸展長度小;
(3)平面延伸較短,橫向延伸長度多半不超過500m,可以輸導油氣。
圖1展示了高(藍線)、低(紅線)序級斷層的地震響應特征。低序級斷層在地震剖面上表現的微小錯動、同相軸扭曲或者振幅變弱等特征,常易與地層巖性變化引起的同相軸變化相混淆。一般來說,常規方法中的高、低序級斷層識別方法不通用,利用DNN模型可以區分由斷層或巖性改變引發的變化特征。對于深度學習而言,選擇合適的網絡結構能同時提取高、低序級斷層特征,這是深度學習在斷層識別方面的優勢之一。

圖1 高、低序級斷層地震響應特征
UNet結構由下采樣的收縮路經和上采樣的擴展路徑組成(圖2)。收縮路徑是典型的重復結構卷積網絡架構,由兩個3×3×3尺寸的卷積層、一個激活函數和一個步長為2、尺寸為2×2×2的最大池化層構成。每次下采樣操作都將特征圖通道數增加2倍,同時將圖像尺寸縮小為原來的1/2。上采樣擴展路徑中的每一步都首先進行一次反卷積操作,將特征圖通道數減半,然后拼接對應收縮路徑裁剪得到的特征圖,再采用2個2×2×2尺寸的卷積層進行特征提取,并重復使用這一結構。網絡的最后一層是一個尺寸1×1×1的卷積層,通過這一層操作可以將64通道的特征向量轉換為所需要的分類結果的數量。卷積層后的ReLU激活函數應用在UNet的每個階段的計算中。

圖2 UNet網絡結構
VNet網絡結構如圖3所示,分為編碼部分和解碼部分。VNet在UNet基礎上添加了ResBlock殘差模塊,并采用ResNet的短鏈接方式,使用的激活函數是PReLU。上采樣和下采樣的每一階段包含1~3個卷積層,增加了信號的感受野,能夠更好地保留和提取信號的細節信息。同時,VNet采取在壓縮路徑疊加特征圖的方法補充損失信息。通過將每個階段下采樣的特征圖與對應層次的上采樣相連接,以收集在下采樣過程中丟失的信息。與UNet不同,VNet在下采樣過程中使用卷積層替換池化函數,因而占用的網絡結構內存更小。另外,VNet結構在每個階段的卷積次數不一樣,其在第一個階段短路部分只進行一次卷積操作,然后在第二個階段、第三個階段依次遞增,這樣有利于充分挖掘目標信息。每一階段的特征通道數都會增加一倍,使VNet在下采樣過程中減小輸入信號的大小并增加信號的感受野,這樣特別有利于小斷層信息的提取,并在后續網絡計算中呈現想要提取的特征。與UNet相比,VNet可以在提取大尺度斷層的同時,保留和提取小尺度斷層信息。

圖3 VNet網絡結構圖
非飽和激活函數ReLU和PReLU的應用能夠解決梯度消失問題,同時加快函數收斂速度。
使用Wu等[28]討論的平衡交叉熵損失函數
(1)
(2)
式中:N為地震數據樣點數;i代表地震數據中第i個樣點;pi為斷層預測概率;yi為第i個斷層標簽;β表示非斷層數據與總數據的比率,則1-β表示總數據中斷層數據的比率。
增加β可以使模型在訓練過程中更側重于對較少標簽樣本的學習,適合正、負樣本不均衡的情況。在數據訓練集中,非斷層點(標簽為0)遠大于斷層點(標簽為1)的數量,因而應用L能夠增加模型對斷層點的學習能力,以便更好地識別斷層。
模型訓練采用的數據集共有240個三維合成地震記錄以及與之對應的標簽集,每個數據的大小為128×128×128。其中,200個作為訓練集,20個作為驗證集,其余20個作為測試集。圖4展示了訓練數據集中的主測線(Inline)剖面、聯絡線(Xline)剖面、時間切片以及對應的斷層標簽。在訓練之前,首先對樣本標簽數據體進行預處理。考慮到不同地震剖面的振幅值之間可能存在很大差異,因而對所有訓練集數據剖面振幅進行歸一化處理,每幅圖像用平均值減去標準差。通過模型遍歷訓練數據集,發現數據集中同時具有高序級斷層和低序級斷層的特征,所以用這些數據集進行模型訓練后可以預測高、低序級斷層。

圖4 訓練數據集中的地震數據與對應的斷層標簽
在測試集中選取一條地震剖面進行斷層識別驗證。斷層驗證結果如圖5~圖7所示。由圖5可見,Xline測線1~40之間、60ms以上淺層發育兩條低序級斷層,地震剖面上表現為微小錯動、同相軸扭曲、振幅變弱等,斷層特征不明顯。UNet和VNet網絡模型預測結果基本一致,均可以從地震剖面中識別斷層,與斷層標簽也比較吻合,但在一些細節方面,VNet好于UNet。如圖5c紫色和綠色橢圓框中,VNet識別出兩條與斷層標簽數據一致的低序級斷層,而UNet結果沒有分開;在紅色橢圓框中,VNet識別的斷層為一條,與斷層標簽數據一致,而UNet結果中斷層斷為兩條,這條斷層在小于1600ms的淺層為低序級斷層。又如圖7c紅色橢圓框中,VNet結果識別出的斷層連在一起,與斷層標簽一致,而UNet識別的結果中斷層斷為兩條,與標簽不符。因此,VNet模型可以更好地學習斷層特別是低序級斷層特征。

圖5 測試數據集中的主測線剖面(a)、斷層標簽(b)、VNet(c)和UNet(d)識別結果

圖6 測試數據集中的聯絡測線剖面(a)、斷層標簽(b)、VNet(c)和UNet(d)識別結果

圖7 測試數據集中的時間切片(a)、斷層標簽(b)及VNet(c)、UNet(d)識別結果
進一步選擇發育有低序級斷層及河道的訓練集和驗證集數據進行測試,驗證本文方法區分真正的低序級斷層和偽斷層(如巖性變化)的效果。圖8、圖9分別為訓練集和驗證集數據時間切片、譜分解切片、斷層標簽數據和用本文方法識別的結果。圖中紫色虛線指示河道,由圖8d、圖9d識別結果可以看出,本文方法能有效區分低序級斷層和巖性體邊界。說明即使原始地震數據中包含巖性體變化,應用本文方法仍然能夠較準確地將低序級斷層與非斷層因素區分開。

圖8 訓練集數據中發育低序級斷層、河道的識別結果

圖9 驗證集數據中發育低序級斷層、河道的識別結果
表1對比統計了VNet與UNet網絡模型的訓練參數。

表1 VNet和UNet網絡訓練參數統計
受伸展—走滑應力場的影響,研究區內發育眾多“花”狀構造,且斷層破碎、構造復雜,低序級斷層較為發育。為了提高鉆探成功率,需要理清低序級斷層分布及斷層組合情況,確定構造特征,為后續井位部署提供重要依據。
圖10a為研究區內Inline2400地震剖面,剖面上可見發育有復雜的“花”狀構造。圖10b~圖10d分別為采用相干體、邊緣檢測及螞蟻體屬性的斷層檢測結果,這些方法識別出的斷層剖面噪聲重,干擾信息較多,效果很不理想。圖10e、圖10f分別為應用UNet和VNet方法的識別結果,兩種深度學習方法得到的結果均明顯優于傳統斷層識別方法,仔細對比后發現,VNet識別結果看到的“花狀”構造中心斷層細節刻畫得更豐富。如圖10e、圖10f中的紅色橢圓區,通過分析地震數據認為在“花狀”構造中心發育有低序級斷層,斷距較小,斷層特征不明顯,UNet方法對該部位低序級斷層特征的識別不清楚,而VNet方法識別的低序級斷層相對清晰且更符合地質規律。圖10g為地震剖面與VNet斷層識別結果疊合顯示,可以看出,VNet識別出的斷層符合地質情況。

圖10 實際地震數據及不同方法識別斷層結果對比(Inline2400)
圖11分別為實際地震數據、相干體、邊緣檢測、螞蟻體、UNet和VNet斷層識別結果在1500ms處的時間切片。同樣可以看出,UNet和VNet斷層識別效果明顯優于相干體、邊緣檢測、螞蟻體屬性。仔細對比UNet(圖11e)、VNet(圖11f)切片,特別是圖中紅色橢圓區域,可以看出兩者對大斷層的識別相對一致,但VNet針對小斷層(低序級斷層)的識別結果好于UNet。

圖11 實際地震數據及不同方法識別斷層結果對比(切片時間1500ms)
(1)受斷裂系統復雜性影響和地震資料品質的限制,復雜斷塊地區的低序級斷層識別難度較大,地震解釋多解性強,傳統相干體、邊緣檢測技術對低序級斷層的檢測效果不好;螞蟻體檢測斷層結果存在較多干擾信息,需要仔細甄別對待。
(2)本文根據低序級斷層的地震地質特征,將VNet深度學習網絡結構應用到斷層檢測特別是低序級斷層識別中。通過選擇合適的損失函數、迭代次數,優選合適模型權重參數進行模型訓練,并應用到模型數據和油田實際地震數據中。與傳統斷層檢測方法及UNet方法識別結果對比,本文方法提取的斷層信息更豐富,對低序級斷層的刻畫更清楚;同時,能有效剔除偽斷層(如巖性變化)的影響。表明本文方法在識別低序級斷層方面更有效。