邵婕,王一博*,梁興,薛清峰,梁恩茂,史樹有
1 中國科學院地質與地球物理研究所, 北京 100029 2 中國科學院地球科學研究院,北京 100029 3 中國石油天然氣股份有限公司浙江油田分公司,杭州 311100 4 北京辰安科技股份有限公司,北京 100094
分布式光纖聲波傳感器(Distributed Fiber-optic Acoustic Sensing,DAS)是近年來新發展起來的,利用獨特的分布式光纖探測技術對沿光纖傳輸路徑上的空間分布和隨時間變化的振動信息進行測量或監測的一種振動數據觀測儀器,它基于光纖背向瑞利散射的原理,利用光纖作為傳感器對地震信號進行采集.相比常規地震檢波器,DAS具有低成本、高密度、高靈敏度、高效施工及可長期監測傳輸等優點,已在結構監測、滲漏探測、交通運輸、安全系統、油氣勘探及天然地震等領域引起了人們的廣泛關注(李彥鵬等,2020;張麗娜等,2020;隋微波等,2021;Xu et al.,2021;周小慧等,2021).然而,這種新的地震數據采集技術也為DAS數據的后續應用帶來了新的問題.以DAS在井中地震勘探中的應用為例,光纖電纜懸置在套管內,在這種情況下,光纖和地層的耦合效果差.套管內自由懸掛的電纜拍打和振鈴會導致采集的數據中存在著相干耦合噪聲,記錄的地震數據顯示出條紋或之字形的特征圖案.此外,受隨機噪聲的影響,導致最終采集的套管井中懸置光纜DAS地震數據的信噪比很低,嚴重影響了DAS數據的后續應用.因此,研究針對DAS地震數據的噪聲壓制技術,提高數據信噪比,對提高后續的數據處理效果十分重要.
地震數據的噪聲壓制方法有很多,傳統的去噪方法利用了有效信號和噪聲在時空域或變換域內的差異,實現了增強有效信號及壓制噪聲的目的.時空域去噪方法包括:多項式擬合(Liu et al.,2011;李向云,2013)、中值濾波(王偉等,2012)及各向異性擴散濾波(張爾華等,2010)等.時空域去噪方法的去噪效果通常較為有限,尤其當數據的信噪比較低時,去噪效果較差.變換域內的去噪方法包括:基于小波變換(Mousavi et al.,2016)、S變換(李雪英和侯相輝,2011)、曲波變換(彭才等,2008)及seislet變換(Liu et al.,2015;張雅晨等,2019)等不同變換的去噪方法.這類方法是借助于各類數學變換方法將地震信號變換到變換域,然后利用有效信號和噪聲在變換域內的差異,實現了二者的分離.另外,信號稀疏表示理論(Candèsand Demanet,2005)的發展促使了基于稀疏表示的地震噪聲壓制方法得到廣泛應用(劉璐等,2021).它假設信號在某種變換的作用下是稀疏的,噪聲是非稀疏的,從而有效地實現信噪分離.對于稀疏表示中的數學變換,除了采用傳統的傅里葉變換、小波變換及曲波變換等,也可以通過字典學習方法(Zhu et al.,2015;Pilikos and Faul,2017;Shao et al.,2019),直接從輸入數據中學習數據本身的稀疏表達方式,從而適應地震數據的非穩態特征,提高去噪效果.Chen等(2019)研究了基于稀疏表示理論的DAS耦合噪聲壓制方法,根據有效信號和噪聲在形態結構上的差異,分別采用小波變換和離散余弦變換表示有效信號和噪聲,實現二者的分離.
傳統的去噪方法雖然在一定程度上可以壓制噪聲,但大多數傳統方法的參數選取都依賴于先驗知識,這不僅影響著最終的去噪效果,當工區內的數據量很大時,也降低了地震數據的處理效率.近年來,人工智能方法在地震數據處理和解釋中的應用逐漸廣泛,如基于深度學習的地震數據初至拾取、插值、去噪、斷層識別及儲層預測等.相比于傳統的去噪方法,基于深度學習的去噪方法通過各種不同的網絡結構,對大量的數據進行訓練,可以自動地深入挖掘出數據所包含的特征,從而有效地表示地震數據中的有效信號,壓制噪聲(Zhao et al.,2020).Liu等(2020)提出了基于三維卷積神經網絡(3-D-DnCNN)的噪聲壓制方法,可以同時壓制三維疊后地震數據中的隨機噪聲和弧狀成像噪聲.董新桐等(2021)提出了基于正演模型驅動的卷積神經網絡去噪方法(FMA-CNN),通過正演模擬構建了高真實性的無噪聲地震數據集,利用該數據集以及實際DAS隨機噪聲數據集引導網絡訓練,從而有效地實現DAS地震數據的隨機噪聲壓制.上述方法在網絡訓練的過程中,需要提供大量的無噪聲數據作為標簽數據,然后將其與對應的含噪聲數據進行成組標記,人工標記工作量巨大.對于實際地震數據而言,無噪聲數據通常很難直接獲取.對此,可以將傳統去噪方法處理后的結果作為標簽數據,但這會導致標簽數據不準確,從而影響了訓練網絡的去噪效果(Li et al.,2021;陳文超等,2021;Liu et al.,2022).另外,也可以采用正演模擬的方式產生無噪聲數據,但這會導致模擬的數據難以表征復雜實際數據的特征,從而影響了訓練網絡的泛化能力.
本文將孿生網絡方法應用于人工震源分布式光纖聲波傳感數據中的隨機噪聲壓制.基于孿生網絡的基本思想,該方法采用了U-Net網絡建立深度學習框架,包括輸入層、編碼器、解碼器和輸出層四部分.參與訓練的輸入數據只需要含噪聲的原始數據,不再需要利用無噪聲數據對原始的含噪聲數據進行標記.訓練后的網絡可直接應用于含噪聲數據的去噪處理,為實際地震數據去噪處理帶來了便利.最終,采用合成數據和實際資料驗證了本文所研究方法的有效性.
實際采集的地震數據中通常包含了部分噪聲,假設y為含噪聲的地震數據,則它可以表示為
y=x+n,
(1)
其中,x為無噪聲的有效信號,n為噪聲.傳統的監督學習去噪網絡需要含噪聲數據y和無噪聲數據x作為標簽數據,然后將成對的輸入數據(y,x)輸入網絡f進行訓練,獲得將含噪聲數據y映射為無噪聲有效信號x的最佳網絡參數θ,從而實現去噪目的.監督學習網絡訓練的目標函數為
(2)
在實際應用中,無噪聲數據通常很難獲得,尤其是對于分布式光纖地震數據而言,高信噪比數據的數據量往往很少.通過正演模擬方式獲得的地震有效信號難以全面地表征實際有效信號的特征,從而影響最終訓練網絡的泛化能力.此外,大量的正演模擬也給實際應用帶來了極大的不便.
如果能只使用含噪聲數據進行網絡訓練,則會有效地克服傳統監督學習去噪網絡在實際地震數據去噪應用中的瓶頸.為此,假設噪聲的均值為0,則給定自監督網絡訓練的目標函數如下(Xie et al.,2020):
-f(yJc;θ)J‖2/|J|]1/2,
(3)
其中,E表示對數據取均值,m表示輸入數據y的空間維度,J可作為一個mask算子,通過它可以獲得數據的某一個子集(如圖1所示),|J1|+…+|Jk|=m,JC表示J在m中的補集,f(·)J表示f(·)在J上的取值,yJc表示y在JC上的取值.

從公式(3)的目標函數可以看出,該網絡在訓練時需要含噪聲數據y和由數據y經mask算子作用后的yJc(如圖1所示),無需再使用無噪聲數據.因此,它屬于自監督網絡.為此,基于孿生網絡的思想,采用U-Net網絡建立如圖1所示的深度學習去噪網絡.該網絡由輸入層、編碼器、解碼器和輸出層4個部分組成.原始的輸入數據首先經過兩個卷積層,每一個卷積層包含了4個濾波器,步長為1.編碼器由4組下采樣層和卷積層構成.編碼器中所有的下采樣層都具有反假頻特征(Zhang,2019),以避免下采樣過程中的假頻影響.每個下采樣層后都有兩個卷積層,各組卷積層中的濾波器數量逐漸加倍,即分別為8、16、32、64.解碼器由4組上采樣層、拼接層和卷積層構成.在解碼器中,每一組都包含一個上采樣層和拼接層及兩個卷積層,各組卷積層中的濾波器數量逐漸減少,即分別為32、16、8、4.最終的輸出層是由濾波器和線性激活函數構成的卷積層.建立的網絡中所有卷積層的卷積核大小均為3×5.

圖1 去噪網絡結構示意圖Fig.1 Structure of the denoising network
為了驗證本文提出的基于孿生網絡的DAS數據去噪方法的有效性,首先采用合成數據進行測試.通過正演模擬獲得了原始無噪聲的人工震源井中分布式光纖數據,每炮數據共有50道,每道數據的時間采樣點數為2048,數據中包含了P波和S波,且S波的能量明顯強于P波.在原始無噪聲數據中加入信噪比值分布在-20~10 dB范圍內的隨機噪聲,最終獲得用于網絡訓練的含噪聲數據共4288炮.圖2展示了訓練集中的部分地震數據,不同炮數據間的地震波波形、振幅、相位、同相軸的斜率及信噪比等特征各不相同.選取其中80%的數據(共3424炮)作為訓練集,用于進行去噪網絡訓練,獲得實現最佳去噪效果的各網絡參數值.為了分析和驗證訓練網絡的去噪效果,選取其中20%的數據(共864炮)作為驗證集.在合成數據的網絡訓練時,設置批大小(batch size)為32,時期次數(epoch)為5000,圖3為合成數據進行去噪網絡訓練時損失函數值隨時期次數的變化曲線.

圖3 合成數據去噪網絡訓練的收斂曲線Fig.3 Convergence curve of denoising network training for synthetic data
在訓練獲得去噪網絡的最優參數后,選取如圖4所示的數據測試訓練網絡的去噪效果.該數據的特征與參與網絡訓練的數據特征相似,即數據中包含了P波(黑色箭頭所示)和S波(藍色箭頭所示),且S波的能量明顯強于P波.不同之處在于地震波波形、振幅、相位及同相軸的斜率特征.在原始數據中分別加入信噪比為9.03 dB、0 dB和-6.99 dB的隨機噪聲,然后將訓練的網絡參數直接應用于不同信噪比的含噪數據,獲得的去噪結果及去除的噪聲分別如圖5、6、7所示.

圖4 無噪聲的井中分布式光纖合成數據Fig.4 Synthetic downhole DAS data without noise
當含噪聲數據的信噪比較高時(SNR=9.03 dB),仍可以識別出含噪數據中的弱能量P波,如圖5a所示.在這種情況下,訓練的網絡可以完全地壓制原始數據中的噪聲,去噪的結果(如圖5b所示)與真實數據幾乎相同,去噪后數據的信噪比為20.37 dB.但去除的噪聲中殘留了部分S波能量,如圖5c所示.這主要是由于訓練網絡無法有效地恢復地震有效信號的振幅導致的.從網絡訓練的目標函數可以看出,該網絡訓練的主要目標在于去除噪聲對有效信號的影響,訓練的網絡無法可靠地估計有效信號的真實振幅值.當信噪比值為中等(SNR=0 dB)時,加入噪聲后的弱能量P波完全淹沒于噪聲中,難以有效地識別出來,強能量的S波初至仍可識別,但后續的弱能量S波也幾乎淹沒于噪聲中,如圖6a所示.在這種情況下,噪聲仍可以被有效地壓制,弱能量的P波和后續S波都得到了較好的恢復,去噪后數據的信噪比為12.73 dB,如圖6b所示,去除的噪聲如圖6c所示.當信噪比較低(SNR=-6.99 dB)時,加入噪聲后的弱能量P波和后續的弱能量S波都已完全淹沒于強噪聲中,只有強能量的S波初至仍可識別.在這種情況下,噪聲仍得到了有效壓制,弱能量的P波和后續S波得到了部分恢復,如圖7所示,去噪后數據的信噪比為6.64 dB.
為了進一步定量地分析本文提出方法的去噪效果,我們對圖4中的數據加入了信噪比值分布在-20~40 dB范圍內的隨機噪聲,對加入噪聲后的各數據分別進行處理,并按照公式(4)計算了每一個信噪比情況下所有道去噪后數據和真實無噪聲數據間歸一化的均方誤差(MSE),結果如圖8所示,圖中的誤差棒由公式(5)給出,是不同道去噪后數據和真實無噪聲數據之間均方誤差的標準差(STD).
(4)
(5)

(6)
從圖8可以看出,隨著SNR的增加,由公式(4)計算的MSE值不斷減小.因此,隨著數據中噪聲的不斷減少,去噪結果和真實數據之間的差異不斷減小,去噪效果不斷變好.當信噪比達到某一程度時,二者的差異趨于達到穩定值.另外,隨著SNR的增加,計算結果的標準差整體也呈現出減小趨勢,但部分數值會有起伏變化,如7 dB處的誤差棒較周圍其他值明顯變長.這可能是由于去噪方法無法有效地恢復地震有效信號的振幅導致的.
選用某地區的人工震源井中分布式光纖數據對本文所提出方法進行進一步測試,實際數據采集的觀測系統示意圖如圖9所示,光纖布設在套管外.該數據共80炮,每炮數據包含712道,每道數據的時間采樣點數為2048.由于實際數據的數據量較少,因此,我們將上述合成數據的訓練結果作為預訓練模型,在此基礎上,繼續進行實際資料的網絡訓練.這就要求合成數據應該具有與實際數據相類似的特征,否則無法使用.如果實際數據量足夠多,則無需選用合成數據的訓練結果作為預訓練模型.在訓練過程中,選取65炮數據作為訓練集,剩余的15炮數據作為驗證集,設置批大小為32,時期次數為50.圖10為實際資料進行網絡訓練時損失函數值隨時期次數的變化曲線,可以看到,由于選用合成數據的訓練結果作為預訓練模型,實際數據的訓練網絡能夠很快地達到收斂.從實際資料中分別選出高信噪比、中等信噪比和低信噪比三種不同情況下的去噪結果進行分析,得到結果分別如圖11、12、13所示.從去噪結果中可以看出,訓練的網絡都能較好地壓制剖面中的噪聲,去噪后的同相軸變得更加連續.從去噪后的殘差剖面中可以看出,高信噪比數據的殘差剖面中包含了部分有效信號的能量,這同樣是由于訓練網絡無法有效地恢復地震有效信號的振幅導致的.

圖8 不同信噪比時合成DAS數據的去噪效果Fig.8 The denoising result of synthetic DAS data with different SNRs

圖9 井中分布式光纖數據采集觀測系統示意圖Fig.9 Diagram of borehole DAS seismic data acquisition geometry

圖10 實際資料進行去噪訓練的收斂曲線Fig.10 Convergence curve of denoising training for field data

圖11 高信噪比實際資料去噪(a) 含噪聲數據; (b) 去噪結果; (c) 去除的噪聲.Fig.11 Denoised result of field data with high SNR(a) Noisy data; (b) Denoised data; (c) The removed noise.

圖12 中等信噪比實際資料去噪(a) 含噪聲數據; (b) 去噪結果; (c) 去除的噪聲.Fig.12 Denoised result of field data with medium SNR(a) Noisy data; (b) Denoised data; (c) The removed noise.

圖13 低信噪比實際資料去噪(a) 含噪聲數據; (b) 去噪結果; (c) 去除的噪聲.Fig.13 Denoised result of field data with low SNR(a) Noisy data; (b) Denoised data; (c) The removed noise.
本文將孿生網絡應用于人工震源分布式光纖傳感數據的去噪處理.合成數據和實際資料的處理結果表明,本文方法可以有效地壓制人工震源分布式光纖地震數據中的隨機噪聲.與傳統的監督學習去噪方法不同,本文方法屬于自監督學習方法,在網絡訓練過程中,不需要使用去噪后的數據對原始含噪聲數據進行人工標記,這非常有利于實際應用,可以顯著地提高實際地震數據去噪處理效率.本文方法的不足與限制在于它無法有效地恢復地震有效信號的振幅,導致去除的噪聲剖面中會殘留部分有效信號的能量.因此,后續仍需進一步研究并改進本文方法,以提高其對有效信號振幅的恢復和保護作用.
致謝感謝審稿專家對文章提出的寶貴意見,感謝編輯對文章的修改完善.