張文征 唐 杰* 劉英昌 孟 濤 陳學國
(①中國石油大學(華東)地球科學與技術學院,山東青島266850;②中國石化勝利油田勘探開發研究院,山東東營257015)
實際地震數據由于采集儀器或者環境等因素的影響,往往存在非平穩隨機噪聲[1],在地震數據中以脈沖形式出現,具有較強的能量,主要包括猝發脈沖、異常擾動、聲波干擾等[2],很難用人工方法完全剔除野值和串狀干擾[3]。如果中、深層地震資料中存在強能量干擾,則疊前時間偏移剖面會出現不同程度的“畫弧”現象[4]。現代地震資料處理的目標是既能衰減噪聲、提高地震資料的信噪比,又能保留和增強有效不連續地震反射信息及儲層流體信息[5]。常規濾波方法常常放大了噪聲的影響,同時噪聲的存在也限制了分辨率的提升[6],并“平滑”了地震數據中的不連續信息。通過自動識別地震記錄中的強能量干擾,確定噪聲出現的空間位置,根據定義的閾值和衰減系數用適當的方式壓制非平穩隨機噪聲[7]。在動校正后或同相軸相對平直的地震剖面上,中值濾波器具有壓制強能量干擾的能力[8-9],但很難選取合適的閾值算子兼顧保護有效信號和壓制噪聲[10]。由于異常噪聲既不連續也不相關,采用局部中值簡單地代替噪聲位置處的數據,容易壓制有效信號,尤其在同相軸彎曲和間斷處[11]。為此,Boashash等[12]提出了一種瞬時頻率估計算法——時頻峰值濾波算法,基于時頻分析理論壓制非平穩隨機噪聲,將含噪信號調制為解析信號的瞬時頻率信號,然后取解析信號時頻分布的峰值估計有效信號,經時頻峰值濾波后信號得到增強,噪聲被壓制。林紅波等[13]提出了基于絕對級差統計量(ROAD)的徑向時頻峰值濾波非平穩隨機噪聲壓制方法,結合局部時頻峰值濾波和徑向時頻峰值濾波壓制地震非平穩隨機噪聲。
近年來機器學習算法發展迅速,深度學習算法在數據去噪領域的應用也越來越廣泛。Burger等[14]推出了具有三層網絡的多層感知機模型(MLP),雖然網絡結構不深,但是處理效果較好。Schmidt等[15]、Chen等[16]分別提出聯合收縮方法(CSF)、反應擴散模型(TNRD),這兩種方法的信噪比提高和邊緣保護效果超過了塊匹配方法(BM3D)。Mao等[17]利用機器學習算法實現了地震數據處理、屬性提取、斷層預測等方面的云地震數據分析平臺。Zhang 等[18]受迭代收縮閾值算法(ISTA)的啟發,提出了一種新的結構化深度網絡(Iterative Shrinkage-Thresholding Algorithm Network,ISTA-net),能快速、準確地實現數據的去噪和壓縮感知重建。
本文利用深度學習算法中的監督數據驅動算法——迭代 啟 發 網 絡(Iterative scheme inspired network,IIN)壓制非平穩隨機噪聲[19],該網絡結構簡單、緊湊。IIN 由交替方向乘子算法(Alternating Direction of Method of Multipliers,ADMM)的迭代過程推導而來,利用L1范數優化變分模型。在訓練階段,通過增加一個新的輔助變量,將目標函數的極值轉化為增廣拉格朗日格式,使用L-BFGS算法判別、訓練所有網絡參數,最終得到最優去噪模型參數。在實驗階段,首先利用模型數據和實際數據建立訓練數據庫,使用訓練階段得到的去噪模型去噪。實驗結果表明,與現有的壓制非平穩隨機噪聲方法相比,文中方法具有明顯的優勢。
噪聲消除的目的是從采集到的含噪數據y中恢復無噪數據。傳統壓縮感知(Compressive Sensing,CS)方法通過求解以下優化問題恢復無噪數據,其目標函數為[20]

式中:x為無噪數據的估計值;Φ 為變化矩陣,將x變換到不同域;Ψ 為非線性變換函數;λ 為正則化參數。
ISTA-net網絡算法結合CS算法,網絡由固定的層數組成,每層中一次迭代采用傳統ISTA 算法,該網絡結合了ISTA 和CS的優勢[21]。該網絡通過迭代兩個更新步驟

估計去噪 數 據[22]。式 中:k 為 迭 代 次 數;s(k)為 步長,根據之前的步長參數由學習確定;T 為軟閾值算子的閾值;F(x)為參數可學習的非線性變換函數。
非平穩隨機噪聲主要表現為脈沖噪聲,以不規則脈沖或噪聲“尖峰”的形式隨機出現在地震數據中,持續時間短,具有譜密度較寬和振幅相對較高的特點[23]。由于L2范數對局部異常值的檢測不穩定,在壓制非平穩隨機噪聲時會限制算法的處理效果。因此本文采用的IIN 算法在迭代收縮—閾值啟發網絡算法的基礎上,采用L1范數優化噪聲壓制方程,增強對局部強能量噪聲的敏感度[24],結合ADMM 網絡(ADMM-net)[25],通過優化問題

得到去噪數據。式中l∈[1,2,…,L]為濾波器序號,L 為單層濾波器的總數。濾波器D 的參數由網絡進行訓練。
引入變量t=x-y,z=Dx,則式(3)的增廣拉格朗日函數為[26]

式中:ε、ρ為權重系數;α、ω 為拉格朗日乘數矩陣。根據ADMM 算法,引入變量p=ω/ε,βl=αl/ρl,則式(4)分解為6個問題

式中:n為層數;S(·)為非線性收縮函數;I為各元素為1的矩陣;Hnl為第n 層中第l 個濾波器矩陣;τ、η為可學習的權重參數,控制學習速率,在網絡訓練中逐層修正。
在IIN 網絡算法中,每層有6個計算節點(對應式(5)),具體步驟如下。
(1)利用式(5a)重構輸入的地震數據。若該層是第一層(n=1)時,式(5a)變為

(2)對重構數據x(n)進行濾波處理。
(3)根據式(5c)對濾波數據進行非線性變換,其中S[·]為分段函數,其形式為

由于分段線性函數擬合性程度高,可以根據數據的特點,學習更加合適的非線性變換函數。其中

(5)對重構數據按步驟(3)進行非線性變換,如果n=1,即為第1層時,令p(n-1)=0。
(6)根據式(5f)更新乘數p(n)。
圖1為第k層正向傳播流程。
在網絡訓練過程中,通過計算估計數據與輸入數據之間的誤差作為損失函數

式中Θ 表示上述流程中各個參數的集合。在反向傳播過程中計算損失函數E(Θ)對參數集Θ 的梯度,利用L-BFGS算法,通過最小化式(8)的取值,優化去噪數據(y,Θ)的參數集Θ。通過不斷循環反向傳播過程,使E(Θ)的值不再下降、保持穩定為止,以保證在去噪的同時不壓制有效信號。
圖2為第k層反向傳播流程。通過反向傳播計算得到去噪網絡參數模型,利用該模型對輸入地震數據進行正向傳播便可得到去噪后的地震數據。

圖1 第k層正向傳播流程

圖2 第k層反向傳播流程
為了驗證上述去噪算法的可行性和有效性,分別對模型數據和實際地震數據進行去噪實驗。通過比較不同層數的網絡處理效果設置網絡總層數,過多的層容易導致過擬合,過少的層數不能有效去除噪聲。綜合去噪效果和計算時間設置單層濾波器總數目。根據經驗設置NC值,關系到分段線性函數的擬合程度。合成地震數據添加了非平穩隨機噪聲,生成含噪數據作為輸入數據,無噪數據作為輸出數據;單炮疊前地震數據作為實際數據,存在大量的非平穩隨機噪聲,采用空變中值濾波和時變中值濾波去噪得到去噪后數據,再選擇去噪效果理想的數據作為數據庫數據。通過水平翻轉和90°旋轉將訓練數據集擴充,以增加數據的多樣性。然后對上述數據訓練得到去噪模型。圖3 為訓練庫部分數據。
圖4為損失函數曲線與峰值信噪比(PSNR)曲線。由圖可見:①在第6次迭代之前,損失函數值呈明顯下降趨勢,當迭代次數大于6后,損失函數值收斂于小值,說明去噪誤差達到最小值,并且其變化趨于平穩,證明訓練模型去噪結果穩定(圖4a)。②前幾次迭代生成的去噪模型的去噪能力不強,經過幾次迭代之后,去噪能力趨于穩定,尤其在迭代次數大于7 之后,去噪數據的PSNR 較高且穩定(圖4b)。由于采用簡單、緊湊的網絡結構,因此曲線收斂速度較快,表明文中方法用相對較小的數據集和較少的訓練時間得到了穩定的去噪模型。
根據模型中有效信號的能量在合成數據(圖5a)加入非平穩隨機噪聲得到含噪數據(圖5b),再利用訓練好的網絡模型去噪得到去噪結果(圖5c)。可見,經過去噪后噪聲被壓制,去除的噪聲(圖5d)中基本不存在有效信號,提高了信噪比。為了對比對疊后模型的去噪效果,分別利用本文方法與傳統中值濾波方法對含噪模型(圖6a)去噪,結果表明:本文方法的去噪結果(圖6b)沒有殘留噪聲,去除的噪聲(圖6c)中不存在有效信號;中值濾波方法的閾值設置影響了去噪結果(圖6d),部分有效信號被壓制,如果閾值設置太大,則會殘留噪聲,很難選取合適的閾值有效地壓制噪聲。

圖3 訓練庫部分數據

圖4 損失函數曲線(a)與峰值信噪比(PSNR)曲線(b)

圖5 數據模型的去噪效果

圖6 對疊后模型的去噪效果
圖7為圖6第10道數據去噪前、后對比。由圖可見:由于本文方法噪聲壓制方程的保真項采用L1范數,可更敏感地檢測地震數據中的非平穩隨機噪聲并進行壓制(圖7a);中值濾波去噪結果中有效信號也被壓制,去噪效果不理想(圖7b)。

圖7 圖6第10道數據去噪前、后對比
分別采用時頻峰值濾波方法和本文方法對實際地震數據去噪并分析去噪結果。圖8為F 區實際地震數據去噪結果。由圖可見:86道實際地震記錄中有幾道含有較強的非平穩隨機噪聲,干擾有效信號并影響弱有效信號的拾取(圖8a);時頻峰值濾波對圖8a的去噪結果中殘留噪聲(圖8b);經本文方法對圖8a去噪后有效壓制了噪聲,沒有破壞有效信號且很好地保護了弱有效信號(圖8d)。
單點高密度地震資料信號頻帶寬、波場信息豐富,反映了地下真實的反射信息,但同時也存在大量的噪聲,因此出現信噪比較低、有效信號與噪聲混雜的問題,不易發揮高密度資料的潛在優勢。為了檢驗本文方法對單點高密度地震數據的去噪效果,在訓練庫中增加相應的單點高密度數據,并選取G 區的單點高密度單炮道集進行去噪實驗。圖9 為G區單點高密度地震數據去噪結果。由圖可見:經本文方法對單點高密度地震數據(圖9a)去噪后,在壓制非平穩隨機噪聲的同時,保護了有效信號(圖9d箭頭處);時頻峰值濾波方法對圖9a的去噪結果中殘留噪聲(圖9b箭頭處)。圖10 為圖9 的局部放大。由圖可見:時頻峰值濾波處理結果中殘留噪聲(圖10b);本文方法去噪結果的同相軸清晰、連續,有效壓制了噪聲(圖10c)。

圖8 F區實際地震數據去噪結果

圖9 G 區單點高密度地震數據去噪結果
理論模型試算和實際地震數據去噪結果表明,本文方法有效減小了信號畸變,較好地壓制了各種非平穩隨機干擾,且對實際數據具有較強適應性。

圖10 圖9的局部放大
針對地震數據中的非平穩隨機噪聲,本文提出了采用基于迭代啟發網絡算法的去噪方法,采用深度學習算法,利用L1范數對目標函數進行優化,可更敏感地檢測并壓制地震數據中的非平穩隨機噪聲,同時較好地保護有效信號。理論模型及實際資料的去噪結果表明:
(1)利用迭代啟發網絡(IIN)算法,通過構建包含不同形態有效信號同相軸的數據,并結合實際地震數據建立訓練數據庫,由訓練得到的去噪模型根據有效信號的特征,在去噪的同時可保留同相軸的形狀特征;采用的迭代網絡簡單、緊湊,加快了網絡的收斂速度,用相對較小的數據集和較少的訓練時間快速訓練去噪模型,去噪效果較好。
(2)本文方法具有較強的適應性,有效壓制了常規地震數據中的非平穩隨機噪聲。對于單點高密度地震數據,較傳統的時頻峰值濾波算法,可有效減小信號畸變,較好地壓制各種非平穩隨機干擾。