







關鍵詞: 地震儲層預測,深度學習,地震反演,地震烴類檢測,有監督學習,無監督學習
0 引言
傳統地震儲層預測技術是通過反演從地震資料中獲取縱波速度、橫波速度、波阻抗及彈性模量、泊松比等參數,然后根據測井數據回歸分析,建立物性參數與彈性參數的巖石物理模型或經驗公式,從而實現儲層物性參數的定量評價。
隨著油氣勘探程度的不斷提高,基于線性假設和經驗公式的傳統地震儲層預測方法已無法滿足儲層精細定量評價的要求[1],主要問題有:①大多數情況下,儲層孔隙結構復雜,非均質性較強,難以滿足儲層為各向同性孔隙充填的假設條件,這導致預測結果的可靠性降低[2];②物性參數與彈性參數之間存在復雜的非線性關系,難以建立精準的經驗公式,并且參數的選擇受主觀因素的影響較大[3],降低了定量評價的精度;③每一種經驗公式都有其適用范圍,增加了巖石物理分析工作量。
充分挖掘地震彈性參數與儲層物性參數之間的非線性關系對提高儲層定量評價精度至關重要。深度學習技術具有強大的特征提取和高維數據處理能力,可以在大量的數據中有效挖掘更深層的特征[4];對復雜非線性關系的學習能力強,可以更準確地逼近地震數據與目標之間復雜的非線性關系[5]。與傳統的神經網絡算法相比,深度學習網絡(Deep Neural Net?work,DNN)在反演精度、分辨率和抗噪能力等方面具有更顯著的優勢[6],因此它在地震反演和儲層預測方面均有著巨大的應用潛力[7?8]。為此,本文深入討論深度學習技術在地震儲層預測領域的研究進展,分析它在實際應用中面臨的挑戰,并提出未來的發展方向。
1 深度學習技術及其特點
1. 1 方法原理
深度學習網絡由輸入層、隱藏層和輸出層組成。與傳統機器學習方法相比,深度學習技術最大的特點是網絡結構深度的增加,通常包含3 個以上的隱藏層,經過隱藏層的逐層特征提取和轉換,可將樣本特征從原空間變換為新的高維空間,從而建立由輸入到輸出高維的映射關系。因此,深度學習具有強大的特征提取能力,能夠解決復雜的非線性問題。
深度學習技術和傳統機器學習相同,均具有三種學習方式:監督學習(Supervised Learning)、無監督學習(Unsupervised Learning)和半監督學習(Semi?Su?pervised Learning)。
深度學習技術的應用包括了分類和回歸,二者都屬于監督學習,不同點在于:①輸出不同。分類的輸出是離散型變量,為定性輸出;而回歸的輸出是連續型變量,為定量輸出。②目的不同。分類的目的是尋找決策面,對集中的數據進行分類;而回歸的目的是尋找最優擬合,通過回歸算法得到一個最優擬合線,可以最好地接近數據集中的各個點。③評價結果的標準不同。分類的結果只有對與錯之分,回歸的結果則以是否更接近真實值作為標準,而不是簡單的判斷對與錯。④使用場景不同。在地球物理領域,分類通常用于識別、分類地下儲層類型、巖性、地質體等,從而提高資料解釋的工作效率;而回歸通常用于預測連續性的地下屬性,如速度、密度等物性參數,可以根據已知的屬性數據,通過深度學習訓練,構建地球物理數據與屬性之間的映射模型,從而預測未知位置的屬性值。因此,回歸是預測地下物性的重要工具。
1. 2 技術特點
區別于傳統的模型驅動方法,深度學習技術是一種數據驅動的方法,即通過大量數據的訓練,有效融合地球物理數據與地質信息,求解數據與目標之間復雜的非線性映射模型。在完成地震儲層預測任務中,深度學習具有3 個方面優勢:①數據驅動,無需明確測井數據與地震數據之間的物理關系;②非線性,克服了傳統地震反演中不合理的線性假設,可以更精準地建立地震數據與物性參數之間的聯系;③在測井數據充足的情況下,可以通過測井數據和地震數據的訓練,建立物性參數與地震數據之間的聯系,從而直接由地震數據反演物性參數,并且可以同時反演多種物性參數;④數據驅動的方法雖然在訓練階段需要花費較多的時間,但在實際預測階段所需的時間非常少,因此,模型一旦建立好,就可以大大減少地震儲層預測的計算時間,提高工作效率。
2 深度學習技術在地震儲層預測中的應用
在地震儲層預測中,深度學習技術的應用主要包括3 個方面:烴類定性檢測、非線性地震反演和儲層參數預測。其中,烴類定性檢測屬于分類,非線性地震反演和儲層參數預測屬于回歸。
2. 1 烴類定性檢測
基于疊后地震資料的“亮點”技術和基于疊前地震資料的AVO 屬性分析技術等都是烴類檢測常用的手段。但部分非烴類巖性表現出與油氣相似的振幅特征,部分含烴地層未表現為明顯的強振幅異常,而是弱振幅響應。如致密砂巖氣藏具有低孔、低滲、非均質的特點,導致氣藏與圍巖的地震響應差異較小[9?11]。因此,利用地震資料精準識別油氣儲層仍然面臨巨大的挑戰。
深度學習在烴類檢測中取得了良好的應用效果[9, 12?15]。林年添等[12]提出了一種在小樣本條件下基于卷積神經網絡(Convolution Neural Network,CNN)的儲層預測方法,有效識別了超致密氣藏,并與測井數據具有較高的吻合度。Gao 等[14]針對標簽數據不足的問題,提出了一種基于CNN 和遷移學習的氣藏識別方法。Júnior 等[15]提出了一種基于卷積長短期記憶模型和粒子群優化算法的天然氣富集區檢測方法,在最佳條件下準確率達99. 42%。Xue 等[9]針對致密砂巖氣藏弱地震響應的特點,提出了基于量子神經網絡(Quantum Gate Set Neural Network,QGSNN)的地震多屬性油氣檢測方法。由圖1 可見,氣藏(圓圈處)表現為弱地震響應特征(圖1a),利用QGSNN 算法的預測結果(圖1d)與反向傳播神經網絡(Back Propagation Neural Network,BPNN) 算法(圖1c)相比準確性更高,能夠更精準定位常規方法(圖1b)無法識別的弱地震響應氣藏。
疊前AVO 分析需要大量的預處理工作,如角度數據生成、噪聲衰減、AVO 屬性提取和分析等,非常耗時,而利用深度學習技術可以有效提高效率。Lim等[16]開發了一套基于CNN 架構的自動AVO 分析算法,可以直接應用于CMP 道集數據,無需角道集數據轉換,準確識別了Ⅲ類AVO 異常。
縱波地震數據的檢測結果存在多解性。對于多分量地震數據,可以利用縱波與橫波的差異進行烴類檢測以減少多解性[11]。Zhang 等[10]提出了一種基于深度學習的多分量地震致密砂巖氣藏識別方法,相比于僅使用縱波數據,其預測結果與鉆井吻合度更高。
監督式深度學習技術依賴于標簽數據的數量和質量,當缺乏標簽數據時,難以獲得精準的烴類檢測結果。無監督聚類技術可以從高維地震屬性空間自動識別具有相似特征的聚類,為烴類檢測提供模式,從而提高烴類檢測的準確性和可靠性[11]。例如,Zhang 等[11]提出了一種基于無監督學習自組織映射(Self Organizing Maps,SOM)算法的多分量地震數據氣藏識別方法,并成功用于致密砂巖氣藏弱地震信號的識別。地震相分析是地震儲層定性預測的重要方法之一,無監督學習在地震相分析中得到了廣泛的應用。張?等[17]提出了一種基于SOM 和粒子群優化(Particle Swarm Optimization,PSO) 的K 均值聚類地震相分析方法,既減小了計算量,又具有全局尋優能力,有效避免了陷入局部極小值,取得了較好的效果。Wang 等[18]引入譜聚類技術實現了無監督的地震相分析,將地震數據視為空間中的點與邊所構成的圖,通過對圖進行最優化切割,以實現地震數據聚類。結果表明該方法無需任何假設,就可適應多種形態的地震數據分析,同時計算結果的準確性和運算效率都能夠滿足應用需求。因此,無監督學習可以從未標記的數據中發現隱藏的模式和特征,在復雜地質條件下提高了效率和模型的預測能力。
2. 2 非線性地震反演
地震反演是一個非線性問題。基于模型的傳統地震反演方法是把非線性問題近似為線性問題,通過多次迭代求取最優解,這容易陷入局部最優解。深度學習可以實現非線性反演。
2. 2. 1 基于監督式學習的地震反演
在基于監督式學習的地震反演中, CNN 應用最為廣泛。CNN 是一種前饋網絡(圖2),卷積層提取地震數據的有效特征,非線性激活函數用于支撐CNN的復雜性和非線性,在疊后波阻抗反演[7, 19?20]和疊前彈性參數反演[21]等方面均取得了良好的效果。但是,在實際應用中,傳統的CNN 可能存在難以收斂、訓練速度慢的問題,因此出現了一些基于CNN 的變體網絡結構,比如殘差卷積神經網絡(Residual ConvolutionNeural Network,ResCNN)。與CNN 相比,ResCNN增加了跳躍式連接,可以更好地解決深層次網絡訓練時出現的梯度消失問題,提高了模型的穩定性和泛化能力。
除CNN 之外,循環神經網絡(Recurrent NeuralNetwork ,RNN)也是反演中常用的網絡結構, RNN模型包括長短時記憶(Long Short?Term Memory,LSTM)[22] 和門控循環單元(Gate Recurrent Unit,GRU)[23]等。RNN 與CNN 的區別在于其網絡不但與輸入、輸出存在聯系,而且信息可以在回路中循環,是一種可以處理時間序列數據的深度學習模型。因此,與基于CNN 的地震反演方法相比,基于RNN 的地震反演方法具有以下優勢:①可以處理時序數據。傳統地震反演方法通常將地震數據作為靜態的多維向量,但實際上地震數據是一種動態的時序數據。針對時序信息,RNN 可以更好地進行建模和預測。② 具有長期記憶功能。RNN 存在記憶狀態,能夠較好地處理長時間跨度的時序信息,并且能夠利用這些信息獲得更準確的反演結果。而CNN 通常只考慮局部信息,無法處理全局的時序關系。③訓練效果更穩定。CNN 中存在參數共享和梯度消失等,訓練過程可能會出現收斂速度慢、容易陷入局部最優解等問題。而RNN 具有門控機制,用于解決梯度消失問題,訓練效果更加穩定。④更容易擴展到多種輸入數據,有效融合地震多屬性信息,反演結果的精度和穩定性更高。
監督式深度學習需要大量標簽數據集以保證網絡的泛化能力,這在實際應用中難以滿足。訓練樣本的不足會導致模型過擬合,是制約深度學習應用的瓶頸。因此,學者們開展了三個方面的研究:①正演模擬。以巖石物理和地質統計為基礎,以已有的測井和地質資料為約束,構建多樣化的地質模型,合成相應的地震記錄,從而擴展標簽數據[7]。②遷移學習。雖然合成記錄可以擴充訓練數據,彌補標簽數據不足的缺陷,但訓練獲得的預測模型不能直接應用于實際地震數據,而使用遷移學習策略,利用少量的測井和地震數據對模型進行更新和優化,可以提高模型的魯棒性[19]。③數據增強技術。以現有標簽數據為約束,采用合理的算法進行數據擴展,生成符合原始樣本空間的訓練數據,為模型訓練提供充足的訓練樣本。常用的數據增強技術包括灰度系統理論[24]、基于特征提取的方法[25]和虛擬樣本生成技術[1]等。其中,虛擬樣本生成技術是按照一定的規律挖掘現有數據中的隱藏信息,在數據空間添加新的虛擬樣本,從而擴展樣本數據,提高預測模型的準確性,在地震反演中取得了較好的效果[1]。
2. 2. 2 基于無監督或半監督學習的地震反演
為了彌補標簽數據不足帶來的過擬合缺陷,學者們提出了基于無監督或半監督學習的地震反演方法,利用未標記的數據或分別利用標記數據與未標記數據同時訓練,從而在標簽數據有限的情況下提高反演精度和魯棒性。常用的算法包括自編碼器(Autoen?coder,AE)、生成對抗網絡(Generative AdversarialNetwork,GAN)等。
AE 網絡架構由編碼器和解碼器組成,編碼器可以自適應地對輸入數據降維,并提取輸入數據中的重要特征;解碼器用于將編碼器生成的特征向量重構為原始數據的表達形式,通過最小化輸入數據與重構數據之間的誤差進行學習和訓練。因此,AE 網絡無需特定的輸出層,可處理未標記的數據集,并且數據降維可有效地減少模型參數的數量,減少訓練所需的數據量,從而提高模型的訓練速度和泛化能力。
除單一網絡架構外,結合CNN 與AE 的各自優勢,可有效提高無監督或半監督地震反演的精度。Yang 等[8]利用在CNN 中引入自編碼器的方法,建立了全卷積神經網絡引導的速度建模(Fully Convolu?tional Neural Network Velocity Model Building,FCNVMB)方法,進行特征提取和降維,提高了速度反演的精度。Liu 等[26]結合殘差網絡與卷積自編碼器(Residual Neural Network Convolutional Autoen?coder,ResNet?CAE)實現了疊前地震無監督速度反演。該方法首先使用卷積自編碼器對地震數據進行特征提取,并將其轉換為低維特征空間,然后使用殘差網絡對特征空間進行處理,從而實現地震速度反演(圖3)。與FCNVMB 方法相比,該方法具有更高的反演精度(圖4)。
GAN 由生成器和判別器組成。其中,生成器用于生成與真實數據相似的合成數據;判別器用于區分真實數據與合成數據。在訓練過程中只需使用未標記的真實數據作為訓練數據,比較真實數據與合成數據之間的差異進行網絡優化,就可以有效避免標簽不足而導致的樣本不均衡問題。Araya ? Polo 等[27]將GAN 應用于地球物理反演,建立了基于GAN 的地球物理反演技術流程。后來,基于GAN 算法的一些變體也用于地震反演,如循環生成對抗網絡(Cycle?GAN) [28]、基于Wasserstein 距離的Wcycle ? GAN(Wasserstein CycleGAN) [29]以及雙重Wcycle? GAN(Dual ? Wcycle ? GAN) [30] 等。其中,Dual ? Wcycle ?GAN 網絡包含了2 個生成網絡和2 個判別網絡( 圖5),分別進行地震正演和反演,從而形成由地震數據到目標參數的閉環,并且在網絡中引入條件輸入模塊(Dual?WGAN?C),使少量的有標簽數據與大量無標簽數據共同訓練,通過生成網絡與判別網絡的相互博弈,構建地震反演預測模型。測試結果(圖6)表明,Dual?Wcycle?GAN 網絡能夠準確地預測地下介質的縱波阻抗信息,同時對于含噪地震數據的反演具有較高的魯棒性。另一方面,由于GAN 具有生成特性,也是一種有效的數據增強技術[31],可以用于合成地震記錄[32],從而擴展現有數據集,提高模型的泛化能力。
2. 2. 3 物理引導與數據驅動相結合的地震反演
大多數基于深度學習的地震反演方法完全由數據驅動。深度學習網絡中沒有加入地球物理約束,其本質相當于一個黑匣子,無法了解和干預其學習過程,也不確定映射關系是否符合地球物理學的理論基礎,導致預測結果不可控,缺乏物理可解釋性[23,33]。Raissi 等[34]提出了基于物理信息的神經網絡結構(Physics?Informed Neural Networks,PINN),結合訓練數據和物理方程約束,解決涉及非線性偏微分方程的正、反問題。隨后,地球物理學家們在PINN 的框架下提出了物理引導與數據驅動相結合的地震反演模型。Vashisth 等[35]提出了一種基于PINN 的弱監督模型架構,直接由地震道集數據估計孔隙度。在深度學習網絡中加入巖石物理模型約束網絡訓練,不僅可以提高反演結果的可解釋性,還可以實現無監督或半監督學習,克服標簽數據不足帶來的過擬合。因此,基于物理引導的深度學習地震反演方法成為了近年來的熱點。
構建基于物理引導的地震反演深度學習網絡包含兩個方面[23]:①建立包含地球物理理論約束的網絡架構,如圖7 所示。②建立具有地球物理約束的損失函數。其中,網絡架構類似AE 和GAN 的思路,它們的區別在于AE 中的編碼器和GAN 中的生成網絡都是神經網絡模型,需要通過訓練去構建;而物理引導網絡中是由基于地球物理理論的地震正演取代編碼器或生成器[36],將預測結果進行正演以獲得合成地震記錄,并在損失函數中將合成地震數據與輸入的真實地震數據進行比較,然后通過最小化二者之間的差值以實現網絡的更新和優化,從而獲得更準確的預測結果。
Biswas 等[33]利用物理引導的思路實現了地震資料疊后(圖8)和疊前(圖9)無監督反演。網絡架構分為兩個部分:第一部分由CNN 組成,實現由輸入的地震數據預測彈性參數,并在模型中加入低頻模型作為約束;第二部分為基于褶積模型的地震正演,首先由CNN 網絡的輸出計算反射系數,然后將反射系數與地震子波卷積計算得到合成地震記錄,用于與實際地震數據比較,從而更新CNN 的模型參數。網絡的輸入是地震數據、低頻模型和地震子波,可以在沒有標簽數據的情況下實現地震反演。同時,在物理引導網絡的輸入中加入少量的標簽數據,實現半監督學習,可進一步提高預測精度[23]。Zhang 等[23]結合物理引導與Cycle?GAN 構建了一個用于波阻抗反演的半監督深度學習網絡架構(SeisInv ? GycleGan)。Cycle ?GAN 由2 個生成器和2 個判別器組成,利用褶積模型地震正演代替GAN 中用于由波阻抗數據生成地震數據的生成網絡,并將損失函數與地球物理理論相結合以約束網絡訓練。采用5 種不同的反演方法對Marmousi 模型進行試驗和定量評價,結果表明,Seis?Inv?GycleGan 的預測結果在精度方面和符合地球物理規律的程度上都優于其他方法。
2. 3 儲層物性參數定量評價
目前,深度學習技術已用于儲層物性參數的預測,并取得了良好的效果[37]。Feng 等[38]基于CNN 實現了儲層孔隙度反演。Zhong 等[39]構建了一個基于Cycle-GAN 的時移地震反演工作流程,并應用于碳封存CO2 遷移的動態監測。李明軒等[40]提出了一種基于數據分布域變換和貝葉斯神經網絡的滲透率預測方法,利用貝葉斯神經網絡的數據分布特性,在滲透率預測的同時進行了不確定性估計。利用深度學習技術可以有效融合地震多屬性數據,充分挖掘地震屬性中包含的隱藏信息。Hampson 等[41]通過屬性優選和多屬性變換,優選與反演目標相關性最佳的地震屬性組合,建立地震多屬性數據與目標數據之間的非線性關系,實現了儲層參數的有效預測,提高了預測精度。
上述方法都是基于單任務深度學習完成一種目標預測。如果需要預測的目標類型較多,就會導致多種任務的重復訓練,并且忽略了目標之間豐富的關聯信息。此時,需要引入多任務學習算法同步反演多個儲層參數[42?44]。Song 等[6]提出一種基于多任務學習的半監督反演算法,在深度學習網絡架構中引入巖石物理正演,利用反演結果生成合成地震數據,通過對比合成地震數據與真實地震數據之間的差異實現網絡更新,應用該反演方法利用疊前地震數據同步反演孔隙度、泥質含量和流體飽和度等物性參數,無需進行彈性參數反演以及物性參數換算,避免了經驗公式不準確帶來的預測誤差。在深度學習網絡中引入巖石物理模型作為約束,一方面可以減少對標簽數據的依賴,避免標簽數據不足導致的過擬合問題;另一方面可以為深度學習網絡賦予物理意義,提高可解釋性。
2. 4 不確定性分析
深度學習的不確定性分析對于確保模型預測結果的可靠性至關重要。然而,基本的深度學習訓練過程通常僅能估計一組模型參數,這意味著對于給定的每個輸入觀測數據只有一個固定的預測值,而量化輸出的不確定性需要得到預測值的方差。為了量化深度學習預測結果的不確定性,國內外學者做了大量的研究[45?48],其基本思想是:在模型訓練中加入概率分布,使訓練得到的模型參數不是確定的值,而是服從概率分布;通常基于貝葉斯近似的方法,通過學習參數后驗概率分布,量化預測參數的不確定性。目前最受歡迎的貝葉斯近似方法主要包括:拉普拉斯近似、變分推斷法[45]、蒙特卡洛dropout 算法[46]等。
在儲層預測領域,應用最多的是蒙特卡洛dropout算法,其利用dropout 的正則化技術逼近貝葉斯推理,分析模型參數的后驗不確定性。比如,Aleardi 等[21]將蒙特卡洛算法引入CNN 地震反演模型,獲得從疊前地震數據中預測巖石物理參數的不確定性近似值,驗證了蒙特卡洛算法用于量化深度學習地震反演模型不確定性的可行性。但通過實驗對比認為,蒙特卡洛dropout 算法無法獲得巖石物理性質小尺度的變化,明顯低估了對巖石物理預測的不確定性,預測精度較低[37]。生成對抗網絡也可以用于不確定性分析。Feng 等[47]通過改變潛在的輸入向量,利用生成對抗網絡獲得預測數據集的分布,從而進行不確定性分析。與蒙特卡洛算法相比,生成對抗網絡可以納入巖石物理模型約束,將馬爾可夫鏈―蒙特卡洛算法引入生成對抗網絡進行不確定性分析,進一步提高了確定性分析的精度[28]。Zou 等[48]提出了一種基于隨機森林的多地震屬性預測孔隙度分布的不確定性量化方法,同時利用量化的不確定性優化和校正預測模型,提高了孔隙度預測的精度。
3 實際應用中面臨的挑戰
盡管深度學習技術在定性和定量儲層預測中都取得了較好的效果,但仍面臨諸多挑戰,主要體現在數據可用性和深度學習技術的局限性兩個方面。
3. 1 數據可用性
在實際應用中,深度學習的模型非常依賴數據,面臨主要問題為:
(1)缺乏足夠的標簽數據。雖然地震數據量很大,但可用的標簽數據卻非常有限。一方面,目前標簽數據的獲取仍然以手工為主,非常耗時且成本昂貴,而且能夠公開訪問的帶有標簽的地震數據集非常少;另一方面,對于儲層定量預測而言,訓練標簽為測井數據,成本高昂。尤其海上工區,通常僅有幾口井或者沒有鉆井資料,因此測井數據無法滿足深度學習模型訓練對數據量的需求。
(2)樣本數據不均衡。針對儲層定性預測,非儲層的樣本數量可能遠大于儲層的樣本數量,這導致模型在預測中偏向占多數的類別,而對于少數類別的預測性能較差。
(3)數據質量的影響。地震數據在采集和處理過程中可能受到各種因素的影響,如噪聲、干擾、缺失和不完整性等,導致深度學習獲得不準確或誤導性的模型。因此,在使用深度學習技術進行地震儲層預測時,需要對數據進行嚴格的質量控制,包括噪聲壓制、異常值檢測、數據插值和校正等,以確保數據的準確性和可靠性。
(4)數據的不確定性。主要體現在地震數據解釋結果的不確定性。解釋結果通常是主觀的,可能存在誤差或錯誤。利用錯誤的地震解釋結果進行模型訓練,不可避免地導致模型的不確定性。另外,地震數據是時間域數據,測井數據為深度域數據,時深關系的不準確會導致數據的拉伸或壓縮,影響數據的準確性[49]。
針對數據的可用性問題,許多學者提出了解決方案,主要包括合成地震記錄、數據增強技術和深度學習算法優化等。遷移學習[16]、半監督算法[2]以及引入物理約束的深度學習方法[33]等都在一定程度上緩解了數據壓力,提高了模型的泛化能力。為了解決時深關系不準確會帶來的數據不確定性問題,Song 等[49]提出了一種基于動態時間規整的閉環CNN 算法,有效提高了反演精度和空間連續性。雖然在解決數據可用性方面已取得了一定的進展或成效,但該問題仍然是目前深度學習技術全面應用于地震儲層預測領域所面臨的最大挑戰。
3. 2 深度學習技術的局限性
(1)高計算成本。與淺層機器學習算法相比,深度學習需要更大量的計算資源和更長的計算時間,尤其針對三維地震數據,還需要更多存儲資源。如果計算機配置有限,在訓練過程中經常會出現系統崩潰的情況。
為了降低計算量,通常采用一階優化算法,但一階優化算法的訓練效率較低,容易陷入局部極小值而無法尋找全局最優解。而且,當深度學習網絡反向傳播時,信號經過多層傳播后可能會產生梯度消失或梯度爆炸的問題,從而導致訓練不穩定。采用更先進的算法可以在一定程度上提高優化能力,但同時也會帶來更大的計算量。在實際應用中,需要綜合考慮目標的復雜性、數據規模和計算資源,以平衡優化算法和計算量。
(2)地震數據的復雜性和高維性。地震多屬性數據的復雜性和高維性給深度學習模型訓練帶來了挑戰。雖然深度學習強大的特征學習能力使其在處理高維數據中具有明顯的優勢,但高維數據往往是稀疏的。對于地震數據而言,每個維度對應不同的地震屬性或特征,由于地質結構的復雜性,很多特征可能缺失或冗余,影響模型的訓練和預測能力。
針對地震數據的復雜性和高維性,通常采取屬性優選與融合、稀疏表征[18]等技術以減少特征的維度并提高模型的泛化能力。常用的屬性優選方法包括逐步回歸法[41]、遺傳算法、主成分分析等。另一方面,選擇適當的網絡架構、損失函數和優化算法,可以提取地震數據中的有用特征,減少冗余和噪聲的影響。
(3)缺乏物理可解釋性。深度學習模型通常以“黑匣子”的形式呈現,在訓練過程中無法進行人工干預,缺乏對結果的物理解釋[33]。地質學家無法了解結果是如何預測的,也無法得知預測結果是否符合地球物理規律、能否與地質解釋相結合等,這會造成地質學家對深度學習結果的不信任。
(4)不確定性評價。一是在定性預測模型的評價標準方面,目前沒有明確的標準評估預測模型的準確性和通用性;二是在不確定性的量化方面,需要更為精細的量化算法以提高不確定性分析的精度。
4 結論與展望
與傳統方法相比,深度學習技術應用于地震儲層預測的優勢在于:可以通過大數據的訓練,無限逼近地震數據與儲層物性參數之間的非線性關系,從而提高預測精度,且模型訓練成功后,可大幅提高工作效率。但在實際應用中,仍面臨數據可用性不高、計算成本高、物理可解釋性差等挑戰。未來的研究應致力于解決當前深度學習技術在地震儲層預測中面臨的挑戰,以發揮更重要的作用。
(1) 數據增強技術。綜合考慮數據多樣性和一致性的平衡、生成數據的質量以及計算成本和工作效率等方面,改進數據生成算法,推動數據增強技術的發展和應用。在數據增強技術中引入物理引導,使數據更符合地球物理特征。
(2) 多源數據融合和跨尺度建模。將地震數據與其他地質數據(如測井數據、地質等)進行融合,利用多源數據的互補提高儲層預測的精度。同時,應考慮多尺度建模,從局部到全局,跨尺度進行儲層預測。
(3) 深度學習和知識圖譜相結合。構建地球物理知識圖譜,融合、共享地質、地球物理和測井等多源數據、知識,將深度學習模型和知識圖譜相結合,擴充訓練數據,增強原始數據的語義信息以及模型的可解釋性。
(4) 數據驅動與物理驅動的融合。將數據驅動的深度學習方法與傳統物理驅動的方法相結合,充分利用各自的優勢,緩解數據壓力,提高模型的泛化能力,增強預測結果的物理解釋性。
(5) 深度學習的可視化。在基于深度學習的地震儲層預測中實現可視化,有助于地質學家有效掌握模型的結構和計算過程,更好地指導儲層預測結果的可解釋性和不確定性評價,提高決策制定的準確性和效率。
(6) 模型優化和自適應學習。改進深度學習模型的架構和訓練算法,探索更有效的模型優化算法、自適應學習策略和損失函數的設計,提高模型的泛化能力和魯棒性,節省計算成本。
(7) 深度學習與其他機器學習技術相結合。將深度學習與其他機器學習相結合,比如支持向量機、隨機森林、主動學習和反饋強化學習等,充分利用不同機器學習技術的優勢,取長補短,提高模型的性能、魯棒性和泛化能力。
綜上所述,在地震儲層預測領域,深度學習技術的應用得到迅速發展,未來可通過更多的跨學科合作,通過不斷地研究和創新,為油氣資源勘探與開發提供更準確、可靠的技術支持。