陳善鵬,尹玲,張文浩
(上海工程技術大學電子電氣工程學院,上海 201620)
地震災害給人類帶來重大人員傷亡及經濟損失,人類無法阻止地震發生,但及時進行強弱震預判,采取適當的安全措施,可以減少生命財產損失。
相關資料顯示,5級以上地震能造成一定的破壞,6級以上7級以下的強震能摧毀建筑物。因此,及早判定地震是否為影響較大的強震是開展震后快速救援、減少損失的關鍵。文獻[1]基于南加州地震發生不規則性特征,預判未來5年5.0級及以上的地震事件;文獻[2]提出了一個長期預測模型,該模型基于對過去震級大于等于5.0地震的外推,用于預測未來的地震事件;文獻[3]利用自適應神經模糊推理系統(Adaptive Neuro-Fuzzy Inference System,ANFIS)模型,對伊朗5.5級以上地震預報進行研究。上述方法對于較大地震的判定均是中長期范圍的探索,而震后幾秒內快速判定強弱震非常重要。強弱地震的預判可以指導工作人員采取更為有效的方法進行地震預警。
地震的發生是一種隨機或高度非線性現象,利用神經網絡具備較強的非線性特征學習能力,本文提出三元組卷積神經網絡(Triplet Convolutional Neural Network,Triplet-CNN)與強震儀時間序列數據相結合的方法,將歷年地震事件的強震儀數據輸入到設計好的Triplet-CNN結構中,以對應的震級作為標簽,訓練基于Triplet-CNN的震級分類模型。當新的地震橫波到來之前,根據地震的強震儀數據,利用訓練好的Triplet-CNN震級分類模型,快速、準確地對研究區域的地震震級進行分類,判定地震是否為強震,為減小地震災害爭取寶貴的時間。
x
、x
、x
時,網絡的距離層將會輸出兩個L
距離中間值。判斷層根據L
距離中間值進行類別判斷,最終將類別結果通過輸出層進行輸出。如果將網絡層的網絡表示為Net
(x
),則判別層表示如下:
x
、x
、x
稱之為三元組,以(x
,x
,x
)表示,其構成方式為:首先隨機選取一個樣本作為Anchor(記為x
),然后隨機從中抽取與Anchor屬于同類的Positive(記為x
)樣本,以及異類的Negative(記為x
)樣本。三元組也可表示為(x
,x
,x
),對每個樣本構造參數共享網絡CNN,以獲得3個樣本的特征表達式:f
(x
)、f
(x
)、f
(x
)。訓練網絡的目的是減少同一類別之間的距離,并增加不同類別之間的距離。通過訓練讓x
與x
特征表達間的距離盡可能小,而x
與x
的特征表達間的距離盡可能大,其原理可由公式(2)表示如下:
Fig.1 Basic framework of Triplet network圖1 Triplet network基本框架

α
為閾值,可在正負樣本間空間距離為零的情況下仍讓模型進行特征學習,從而使得模型訓練得到更好效果。基于Triplet-CNN網絡的震級分類模型包括數據處理與分組、網絡模型訓練和震級預判,模型框架如圖2所示。①數據處理與分組:負責獲取需要研究的強震數據,對數據進行預處理轉換成需要的格式,依據已有的標簽對數據進行分組;②網絡模型訓練:將三元組數據輸入到設計好的Triplet-CNN網絡,基于triplet loss損失函數對模型進行訓練得到最佳震級分類模型;③根據提供的強震數據,利用訓練好的最佳Triplet-CNN震級分類模型對當下震級進行分類,從而實現震級預判。

Fig.2 Triplet-CNN magnitudeclassification model framework圖2 Triplet-CNN震級分類模型框架
Triplet-CNN震級分類模型實質上是個多分類問題,對于某一震級范圍的樣本設置為錨例Anchor,屬于該震級范圍的其他樣本為正例Positive,不屬于該震級范圍的其他樣本為負例Negative。
神經網絡所要學習的目標是:使得Anchor到Positive的距離要比Anchor到Negative的距離短。通過學習使得類別內部的樣本距離小于不同類別樣本的距離。根據式(2)將triplet loss損失函數定義為:

利用Triplet-CNN結構結合歷年地震事件中記錄的強震儀數據進行訓練,得到能夠預判強弱地震的震級分類模型。對多個震級范圍進行預測,其實質是一個多分類問題。Triplet-CNN以“端到端”的形式進行模型訓練,利用優化算法不斷改進訓練模型的超參數,通過Triplet-CNN的卷積層和池化層將原始數據抽象成能學習的數據特征,最終完成特征到目標的映射。
本文三元組網絡的網絡層為CNN,CNN的網絡結構主要包括輸入層、卷積層、池化層、全連接層以及輸出層。
如圖3所示,圖中卷積層C
包含32個卷積核,其大小為5×1,卷積核會分別對輸入數據進行卷積來提取數據特征。池化層S
大小為3×1,池化層對卷積獲取的特征降采樣進一步提取特征。卷積層C
包括64個卷積核,大小為3×1,池化層S
大小為2×1,卷積層C
包括128個卷積核,大小為3×1,池化層C
的尺寸為2×1,卷積層C
包括256個卷積核,大小為3×1。全連接層F
尺寸為128,全連接層F
大小為6。為提高Triplet-CNN震級分類模型的準確度,需要通過調整Triplet-CNN網絡的超參數,其主要包括尺寸(batch size)、學習率(learning rate)、丟棄值(dropout)、迭代次數(epoch)。其中,batch size指模型訓練1次所使用的樣本數量;learning rate參數大小會影響損失梯度下降的程度,從而對神經網絡權值進行調整。當learning rate值過大時可能會找不到準確的極值點,learning rate值過小又會使收斂時間太長;dropout會壓縮權重起到防止過擬合的作用;epoch指模型在訓練過程中全部樣本訓練的輪數,一個epoch代表全部的樣本數據先后實現1次前向傳播運算和1次反向傳播運算的過程。
本文選用日本國家地球科學和災害預防研究所建立的兩個強震觀測網KiK-net(kiban-kyoshin net)和K-NET(kyoshin network)在日本宮城縣監測的強震儀數據,該強震儀數據是一維的加速度值時間序列。選取宮城縣附近約200km范圍內從2000-01-01至2008-12-31歷史地震中觀測臺站所記錄的強震數據。其中2000-01-01至2007-12-31的強震儀數據作為訓練集,用于訓練Triplet-CNN震級分類模型,2008-01-01至2008-12-31的強震儀數據作為測試集,對當下發生的震級進行震級分類,判斷是否為強地震。本文獲取其間日本宮城縣附近震級由最小2.8級到最大7.2級共271個地震事件中距離震中比較近的多個觀測臺站所記錄的強震動加速度數據。每個強震觀測臺站都記錄了EW(東西分向)、NS(南北分向)、UD(豎直分向)3個方向的強震儀數據,以單個臺站記錄單方向的強震儀數據為一個樣本數據,統計得到模型的訓練集有3 270個樣本,測試集有831個樣本。
2.2.1 基于EMD的數據降噪
針對日本強震數據提出基于經驗模態分解(Empirical Mode Decomposition,EMD)的強震數據降噪方法。
EMD方法可根據數據信號自身特點自適應地將復雜的時程分解為多個不同時間尺度的子模態函數(Intrinsic Mode Function,IMF),或稱作內蘊模式函數,每個IMF函數都包含了原信號的局部特征,具有多分辨的特點。設強震數據信號為x
(t
),用EMD將x
(t
)分解為不同尺度的IMF分量,即:
imf
(t
)為第k
個IMF分量,r
(t
)為分解殘余項。EMD分解的各IMF分量會按照頻率的高低依次排列,通過分析將高頻部分除去,并對剩下的IMF分量做重構處理,從而得到降噪后的數據信號。EMD分解需滿足條件:①IMF分量內的極值點數目和過零點數目相等或不超過1個;②通過極大值和極小值得到的包絡線均值為零。

Fig.3 CNN network structure圖3 CNN網絡結構
2.2.2 數據標準化
在深度學習算法中,目標函數基礎是假定所有特征均是零均值并且有相同的階方差。若1個特征的方差比其他特征大多個數量級,則它將在算法中占據主導地位,導致模型不能從其他特征中學習。因此,數據標準化成為數據預處理的關鍵步驟,標準化數據可以提高模型精度。
通過原始數據減去平均值后除以方差進行數據歸一化處理,使其符合平均值為0和標準差為1的正態分布。換算公式如下:

X
為原始數據,μ
為原始數據的均值,σ
為原始數據的方差,Z
為標準化之后的數據。2.2.3 One-hot編碼
總是,高中物理在整個高中階段是十分重要的,但是其中涉及到的知識比較抽閑且難以理解,需要學生不斷通過進行問題的解決來鞏固知識并且在知識鞏固的過程中提升自身的解題能力.
本文設計的Triplet-CNN震級分類模型實質上是一個多分類問題,因此需要對各震級標簽進行One-hot編碼。分別對2.0~2.9級地震、3.0~3.9級地震、4.0~4.9級地震、5.0~5.9級地震、6.0~6.9級地震、7.0~7.9級地震制作標簽,即0、1、2、3、4、5。對應標簽的One-hot編碼為:[1,0,0,0,0,0]、[0,1,0,0,0,0]、[0,0,1,0,0,0]、[0,0,0,1,0,0]、[0,0,0,0,1,0]、[0,0,0,0,0,1]。
T
指將正類樣本正確預測為正類樣本的數量,F
指將正類樣本錯誤預測為反類樣本的數量,F
指將反類樣本錯誤預測為正類樣本的數量,T
指將反類樣本正確預測為反類樣本的數量。T
和T
均是正確預測的情況,而F
和F
均是錯誤預測的情況。本文中,每個單位震級相當于1個類別,對于每一個震級,正類指的就是該震級,而非該震級的其他震級則為負類。
Table 1 Confusion matrix表1 混淆矩陣
本文設計的震級分類模型為一個多分類問題,將通過準確率、精確率、召回率、F
值4個評價指標分別對訓練模型進行度量。準確率指預測為正確的樣本量與所有樣本量的比例,精確率指預測為正確的正類樣本量與全部被預測為正類的樣本量的比例,召回率指預測為正類的樣本量與全部實際為正類樣本量的比例,F
值為精確率和召回率的調和均值,其具有精確率和召回率的綜合評價作用。二分類評價指標公式分別如下:
A
為準確率。
P
為精確率。
R
為召回率。
F
值,然后計算平均值得到整個模型的評價指標,計算公式如下:
M
為宏平均準確率,A
為第i
個類別的準確率,n
為總類別數。
M
為宏平均精確率,P
為第i
個類別的精確率,n
為總類別數。
M
為宏平均召回率,R
為第i
個類別的召回率,n
為總類別數。
M
為宏平均F
值,F
為第i
個類別的F
值,n
為總類別數。基于Triplet-CNN的震級分類模型中的網絡層采用CNN結構,將損失函數softmax替換成triplet loss函數。實驗所用的數據集不變,本節同樣分別采用經EMD降噪后的數據集和未經EMD降噪的數據集對Triplet-CNN震級分類模型進行訓練。通過對比實驗,將前者的分類評價標準與后者的分類評價標準進行比較,分析兩種數據集訓練得到的最佳模型效果。兩種數據集訓練得到的準確率變化情況如圖4所示(彩圖掃OSID碼可見,下同)。

Fig.4 Change of training accuracy of Triplet-CNN magnitudeclass ification model圖4 Triplet-CNN震級分類模型訓練準確率變化
根據圖4可知,兩種分類模型訓練集和驗證集的準確率走勢相近且趨于穩定,表明模型擬合準確。但從整體準確率看,經EMD降噪處理的分類模型準確率相對較高,進一步說明EMD降噪處理對模型分類效果有很大提升。
為從整體上客觀分析EMD降噪對兩種模型分類效果的影響,通過交叉驗證取平均值方法得出兩個模型的準確率、精確率、召回率、F1值的宏平均值,其對比結果如表2所示。由表2可知,相比無降噪的模型,經EMD降噪后的訓練集學習到的模型在4個評價指標上均占有優勢,且有較大提高。
綜上表明,EMD對強震數據進行降噪對模型訓練有很大影響,下面引入機器學習中的兩個分類算法,即隨機森林和SVM,利用EMD降噪后的數據集訓練基于隨機森林的震級分類模型、基于SVM的震級分類模型,并與兩個基于深度學習的震級分類模型進行比較。這4個分類模型分別在訓練集、測試集上得到的實驗結果如表3-表4所示。

Table2 Training results of EMD noiser eduction under Triplet-CNN magnitude classification model表2 Triplet-CNN震級分類模型下有無EMD降噪的訓練結果(%)

Table 3 Experimental results of different classifiers on training set表3 訓練集上不同分類器的實驗結果 (%)

Table4 Experimental results of different classifiers on thetest set表4 測試集上不同分類器的實驗結果 (%)
由表3可知,在訓練集上,Triplet-CNN震級分類模型的準確率、精確率、召回率、F值均比CNN震級分類模型、隨機森林分類模型和SVM分類模型高;由表4可知,在測試集上Triplet-CNN的震級分類模型仍然表現出最優的評價結果,表明在對日本宮城地區強弱震級分類研究中,基于Triplet-CNN的震級分類模型相比CNN震級分類模型和傳統的基于機器學習分類模型具有更好的震級分類效果。利用Triplet-CNN震級分類模型對地震的震級范圍做出及時預判,能夠快速判定地震是否為強震。
強震給人類帶來災難性傷害,對強震進行及早預判可以指導工作人員采取更為有效的方法進行防災救災。本文以日本宮城縣地區為例,獲取宮城縣周邊地區歷年地震發生時檢測的強震數據,結合Triplet-CNN結構訓練震級分類模型,從數據中學習震級的相似性度量,將學習到的度量去比較和匹配地震類別,從而快速判定震級。為提高模型的分類精確度和防止過擬合,對數據集進行交叉驗證和標準化處理。引入EMD強震數據降噪處理,在基礎模型上不斷對超參數進行優化,從而訓練得到準確率最高的Triplet-CNN震級分類模型。利用訓練好的Triplet-CNN震級分類模型對強震儀數據進行分類判斷,從而實現特定震級范圍的自動分類。
盡管本文對震級分類的研究有良好的分類效果,但目前只是針對宮城縣地區預判地震強弱。隨著全球強震觀測臺站的廣泛布局,本文提出的方法可以在其他地區進行測試及研究。