張文浩, 尹 玲
(上海工程技術大學 電子電氣工程學院, 上海 201620)
為了最大程度上減輕地震帶來的災害,各國政府越來越關注地震預警相關系統的研究與建設工作,許多國家都相繼建設GPS觀測網并投入使用,為地震預警工作提供了大量的觀測資料[1]。地震預警技術作為目前國際上公認的能夠減輕地震災害的有效手段之一,可有效減少地震帶來的人員傷亡及財產損失[2]。因此研究準確地震檢測算法對抗震減災、地震定位等研究有重要意義。
自長時窗平均/短時窗平均(STA/LTA)被提出以后,在此基礎上衍生了很多改進方法,譚玉陽等[3]針對微震事件,根據噪聲振幅、偏振等差異提出SLPEA算法,根據信噪比的不同構建不同檢測函數來對地震波形進行提取;劉曉明等[4]引入權重因子K構建特征函數,使用全局最大的確定p波初至時刻;張小紅等[5]使用S變換對近震臺站的高頻GPS信號進行p波拾取,與強震儀數據相對比得到較吻合的結果。隨著深度學習技術的發展,越來越多的研究人員將深度學習用于地震檢測中,Ross等[6]利用卷積神經網絡來檢測地震相位,可在低信噪比的情況下進行拾取;Perol等[7]搭建神經網絡,利用單一波形對地震進行分類,輸出0為噪聲,1-6對應6個區域的地震;李建等[8]搭建多任務卷積神經網絡,輸入為臺站三分量數據,實現對震相的檢測和到時的估計;劉佳楠等[9]使用全卷積神經網絡區分初至波和背景噪聲,在高噪聲的環境下取得較好結果;Dokht等[10]使用深度卷積網絡提取地震信號和噪聲信號的一般性特征,使用不同頻域的地震波作為輸入,完成對地震事件的檢測。
目前基于深度學習的到震檢測研究較少,最常用的方法仍是利用能量特征差異進行檢測工作。該方法主要用于高信噪比的數據,對于信噪比較低、能量較弱的GPS數據易出現漏報。本文提出一種融合區域特征的CNN-BiLSTM分類模型,降低到震檢測過程中的漏報率,并與融合區域特征的預測模型及單獨的CNN、BiLSTM模型對比來驗證本文方法的有效性。
在訓練神經網絡時,數據預處理工作至關重要,預處理的效果將直接影響模型的訓練效果,影響網絡是否收斂[11]。因此本文在數據預處理時對其進行數據清洗、歸一化操作,并探究小波降噪對實驗的影響。
本文使用的高頻GPS時間序列數據來自新西蘭GEONET地震信息網,收集2008~2018年間新西蘭北島地區最小4級到最大8.8級共214個歷史地震事件中多個監測臺站記錄的高頻GPS數據,數據頻率為1 Hz。每個監測臺站有X、Y、Z3個方向的觀測數據,以3個臺站3個方向上的高頻GPS時間序列為一個樣本,最后得到訓練集6 124條樣本,測試集679條樣本。
首先對高頻GPS數據進行處理,根據解算質量對臺站數據進行篩選,只有少量的數據出現缺失值,為保證數據的完整性及預測結果的準確性,補全缺失值,常用的缺失值處理方法有平均值填充、特殊值填充、數據補差。本文使用平均值補差方法,用周圍數據均值進行填充。
在深度學習訓練過程中需要讓數據在尺度上具有一致性,歸一化可提高模型優化算法的收斂速度。本文使用Min-Max歸一化對每個分量進行計算,歸一化公式如式(1)所示:
(1)
其中,Ai為數據每個分量的值;Amax為每條數據分量中的最大值;Amin每條數據分量中的最小值。
由于高頻GPS觀測數據會受到多路效應及接收機噪聲干擾,噪聲基底較大,可能會對序列分析造成一定干擾,需要進行降噪處理。使用小波閾值降噪對高頻GPS數據進行處理,使用信噪比(Signal Noise Ratio, SNR)、偏差(BIAS)、均方根誤差(Root Mean Square Error, RMSE)作為評價指標探究不同小波基、分解層數對降噪效果的影響。SNR為信噪比,該指標反應降噪后的數據中真實信號及噪聲信號的比重,SNR的值越高說明信號中的噪聲越少,計算公式(2);BIAS表示未降噪信號與降噪后信號的偏離程度,理想情況下為0,計算公式(3);RMSE用來表示原始信號與降噪后信號兩個時間序列的離散程度,RMSE的值越小說明降噪后信號的離散程度越小,降噪效果越好,公式(4)所示:
SNR=10*log10(psignal/pnoise)
(2)
(3)
(4)

小波閾值降噪的關鍵是對小波基、分解層數及閾值進行選擇,使用Symlet小波基處理高頻GPS時間序列,嘗試使用不同的小波基(sym2-sym7)并固定其他變量來比較評價指標的優劣,根據實驗經驗將小波分解層數設置為3,閾值函數使用平滑閾值函數,得到的評價指標參數見表1。由表1可知,使用sym6作為小波基進行降噪,得到的SNR最高、RMSE最小、BIAS的結果也較為理想,說明使用sym6作為小波基對序列進行降噪能最大程度上減少時間序列中的噪聲并保持序列的相對穩定。

表1 不同小波基對應的評價指標
在確定小波基后,需要確定分解層數,嘗試1~4層分解進行去噪,得到的各項指標見表2。由表2可知,使用1層分解的效果最好,得到了的較低RMSE及較高的SNR,BIAS的偏離程度只比分解成2層略差。因此小波基選用sym6,分解層數為1層時有較好的降噪效果。

表2 不同分解層數對應的評價指標
長短期記憶(Long short-term memory, LSTM)神經網絡是一種特殊的循環神經網絡,不同于單只包含單一結構的神經網絡,LSTM`使用4種不同的門結構,主要為了解決在長序列訓練時出現的梯度消失和梯度爆炸問題,LSTM單元結構如圖1所示。

圖1 LSTM單元結構
LSTM通過輸入門、遺忘門、輸出門結構讓時間序列中的信息有選擇性的通過。遺忘門要決定從上一個狀態中舍棄哪些信息,輸入為前時刻的輸出ht-1和當前的輸入xt輸入到σ函數,σ函數公式(5):
(5)
遺忘門輸出ft的計算公式如公式(6)所示:
ft=σ(Wf*[ht-1,xt]+bf)
(6)
其中,Wf為遺忘門的權重,bf為偏置項。
輸入門決定讓多少信息進入到細胞狀態中,可以利用當前時刻的輸入xt和上一時刻的輸出ht-1通過σ函數決定更新的信息ii,公式(7):
(7)
其中,Wi為輸入門權重,bi為偏置項。
用xt和ht-1通過tanh層得到臨時細胞狀態C't,公式(8):
(8)
其中,Wc為細胞單元權重,bc為偏置項。

(9)
輸出門決定了從細胞狀態中輸出哪些信息到下一神經元,將當前時刻的輸入xt和上一時刻的輸出ht-1通過σ函數來確定輸出信息Ot,公式(10):
Ot=σ(Wo*[ht-1,xt]+bo)
(10)
其中,Wo為輸出門權重,bo為偏置項。
將輸入門的結果經過tanh函數,最后將兩者相乘得到LSTM單元的輸出ht,公式(11):
ht=Ot*tanh(Ct)
(11)
LSTM模型解決了循環神經網絡中存在的循環依賴問題,但是該網絡只使用了單向的過去信息,而沒有使用未來的信息。為了更好地學習GPS時間序列的變化趨勢及局部特征,本文使用雙向長短時記憶網絡(Bi-Directional Long Short Term Memory,Bi-LSTM),同時學習時間序列的過去及未來相關的信息。首先使用卷積神經網絡(Convolutional Neural Network,CNN)提取時間序列中的短時小尺度特征信息,再送入Bi-LSTM網絡提取長時序信號的關聯信息。卷積網絡使用深度為1的2D卷積,shape為(1,64,(3,9)),卷積核個數為64,卷積核大小為3,為了防止過擬合的發生加入dropout層,在網絡的隨機區域進行稀疏性限制,最后利用全連接和sigmoid實現噪聲-事件的二分類,融合區域特征的CNN-BiLSTM分類模型框架如圖2所示。

圖2 融合區域特征的CNN-BiLSTM分類模型框架
CNN-BiLSTM的地震檢測算法過程示意圖如圖3所示。整個流程可分為數據預處理部分及神經網絡處理部分。數據預處理部分將原始波形中的地震片段進行分割組成數據集,再對數據使用小波閾值方法進行降噪及數據的歸一化操作;神經網絡由輸入層、CNN層、Bi-LSTM層、及輸出層組成。輸入為長度38 s的時間序列片段,其中含30 s的到震前序列及8 s的震后序列,特征維度為3個臺站的三分量數據;使用卷積提取維度間短期的相關特征;雙向循環神經網絡疊加了正向和反向的LSTM層,并將輸入的正向數據輸入正向LSTM層,計算從1到t時刻值,輸入的反向數據輸入反向LSTM層,計算從t到1時刻的值,并把正向LSTM及反向LSTM層相應時刻的隱藏層狀態連接;再將雙向LSTM輸出的向量進行全連接,經過sigmoid運算后輸出分類結果。

圖3 融合區域特征的CNN-LSTM分類模型計算過程示意圖
使用準確率、精確率、召回率作為評價指標對訓練模型進行評估,精確率越高說明模型對地震事件的誤檢率越低,召回率越高說明模型的漏檢率越低,準確率、精確率、召回率公式分別如式(12)~式(14)所示:
(12)
(13)
(14)
其中,Tp為正樣本被正確預測的樣本數量;Fp為負樣本錯誤預測為正樣本的數量;TN為負樣本正確預測為負樣本的數量;FN為正樣本錯誤預測為負樣本的數量。
使用新西蘭地區高頻GPS數據對模型進行訓練,并探究數據降噪、學習率、網絡層數及dropout值等參數對結果的影響,分別使用經過降噪及未經過降噪的數據訓練網絡,未經降噪處理時得到的模型準確率為92.3,%,降噪后準確率提升為95.22%。對dropout參數進行調優,依次調整dropout值為0.2、0.3、0.4、0.5進行訓練,實驗結果顯示當dropout的值取0.3時準確率較高;使用多個不同的學習率對模型進行訓練,不同學習率下損失函數的變化如圖4所示,當學習率為0.000 3時收斂速度較慢,當選擇學習率0.000 8時可以較快收斂且損失函數值較低,當學習率為0.001 5時,雖然能夠較快收斂,但是不夠穩定存在一定的震蕩現象。

圖4 不同學習率下的loss曲線
不同的卷積網絡層數進行試驗,試驗結果見表4,采用一層的卷積神經網絡得到的準確率、召回率及精確率較低,使用兩層的卷積神經網絡比3層卷積的檢驗結果較高,且較深的網絡會增加模型訓練所需的時間,綜合考慮模型的精度和訓練所需要的時間,本文最終選取兩層的卷積神經網絡結構。

表4 不同卷積層數的檢測結果
訓練時使用ADAM作為優化器,使用交叉熵作為損失函數來優化參數,經過對學習率、網絡層數、dropout等參數進行調優后,模型在訓練集上的準確率達到了97.03%,此時學習率、網絡層數、batch size、dropout的值分別為0.000 8、2、64、0.3。
為驗證模型的實際檢驗能力,本文選取訓練的最優模型對新西蘭北島地區臺站記錄的地震波形數據及無震噪聲數據進行檢測。該模型訓練了200個epoch后,在訓練集上精確率為97.03%、召回率為96.48%、準確率為97.51%。使用該模型對由316個地震波形和363個噪聲波形組成的測試集進行測試,得到測試集上的準確率為91.45%、召回率為90.5%、精確率為91.08%。
單獨使用CNN分類器、Bi-LSTM分類器及融合區域特征的預測方法對316個地震波形和363個無震噪聲波形組成的測試集做對比實驗,不同模型的檢出結果對比見表5。由表5可知,本文提出的分類模型與預測模型相比提高了5.69%的召回率,降低了漏檢率,同時其他指標也比預測模型及單獨的Bi-LSTM及CNN模型有所提高。

表5 不同模型的檢出結果對比
本文提出一種融合區域特征的CNN-BiLSTM分類模型來降低地震檢測的漏報率。首先,在預處理過程中使用小波閾值方法對高頻GPS數據去噪;其次,訓練并調優CNN-BiLSTM模型進行地震檢測,通過與融合區域特征的預測模型、單Bi-LSTM模型及單CNN模型進行對比實驗。實驗結果表明,本文提出的分類模型相比融合區域特征的預測模型對召回率有較大提高,能有效降低漏報率,并且檢測的準確率等指標要比單獨的CNN、BiLSTM模型要高,提升了模型的可靠性。