孫 霖王躋權石利飛侯建民趙 莎劉 杰董 霖鄭增威*
(1.浙大城市學院 計算機與計算科學學院,浙江 杭州 310015;2.浙江大學 計算機科學與技術學院,浙江 杭州 310017;3.中國地震臺網中心,北京 100045;4.每日互動股份有限公司 浙江 杭州 310012)
近些年來,我國地震頻發,從2019 年到2021年,地震臺網中心報道5.0 級以上地震85 次。 較大的地震會造成大量財產損失和人員傷亡,尤其在人口密集的城市區域[1-2]。 為了減少地震造成的人員傷亡,日本、墨西哥等國家相繼建立了地震早期預警(Earthquake Early Warning,EEW)系統。 地震早期預警依托震源地附近的地震臺網,在震后數秒內快速估算地震的相關參數(如震級,震中,地震發生時間等),在破壞性的S 波和面波到達前發布警報,給人們帶來幾秒甚至幾十秒的預警時間[3-4],及時采取相關措施,例如,提前找尋安全區域避險、工廠機器提前停止運轉以避免機器在地震中損壞、附近的高鐵提前停止運行以避免脫軌[5-8]。
地震預警系統需要部署高密度的地震臺網才能及時地監測地震,發布預警消息[9]。 我國疆域遼闊,建立全國性的地震預警系統需要投入巨額資金建設地震臺網[10-12]。 研究人員嘗試利用MEMS 加速度傳感器來提供地震早期預警信息服務[13],來解決地震早期預警系統高昂的建設成本問題。 美國地質調查局(USGS)DYFI 項目采集了震區用戶感知的地震強度和位置信息[14-15]。 DYFI 項目利用這些信息評估地震參數,建立了社區地震網絡(Community Seismic Network,CSN)[16]。 CSN 網絡利用內置或者外聯MEMS 的聯網計算機,監測地面震動,并通過云服務計算地震事件。 在監測到地震發生后,該系統可以通過幾秒鐘內地面震動情況估計出地面峰值加速度分布圖。 地震監測網( Quake-Catcher Network,QCN)[16]將內置或者外聯MEMS 的聯網計算機改造成地震監測站,用這些設備填補地震監測站的空缺,建立了實行分布式計算的地震網絡,能夠對大中型地震提供早期預警。
隨著智能手機的廣泛普及,得益于其廣泛的地理分布和傳感計算能力,研究者們開展了基于智能手機的地震早期預警(Smartphone based Earthquake Early Warning,SEEW)研究[17-18]。 孔慶凱等人[19-20]開展了MyShake 項目的研究,設計了一種手機端-服務器端架構的EEW 系統。 在MyShake 系統中,當手機因為震動而觸發后,MyShake 會使用人工神經網絡(ANN),根據觸發后10 s 的數據判斷該震動是否是地震引起的。 然后中央服務器會統計系統部署區域內手機觸發的比例,若該比例達到閾值,就最終確認發生了地震。 通過兩階段判斷,降低系統虛警率。 此外,MyShake 還會要求手機在觸發后計算一些必要的參數上傳到服務器,如PGA、手機位置、手機觸發時間。 中央服務器會根據這些信息計算震中和震級。
Earthquake Network(EN)項目[21]也采用手機端-服務器端架構,并利用統計模型計算和監測地震事件。 在EN 的系統中,手機使用基于標準控制圖(Standard Control Chart Technique)的觸發算法來監測地面震動。 當手機因震動觸發后,會直接將其觸發時間和觸發所在的位置發送至中央服務器。 中央服務器中的地震監測器會根據系統部署區域內可用手機數量、手機平時觸發頻率以及30 s 時間窗口內觸發手機的數量來綜合判斷當前是否發生了地震。
大多數現有的SEEW 系統使用手機端-服務器架構。 當手機出現震動時,它會計算震動的開始時間并確定當前的振動是否是由地震引起的。 當判斷為地震引起時,它發送觸發信息(時間和所在的位置)到SEEW 服務器。 這類系統的缺點是:手機處于高度復雜的環境中,用戶日常生活中的震動都可能導致發送觸發信息。 因此,無論地震發生還是不發生,SEEW 服務器都可能會接收到來自手機的觸發信息。 通常情況下,地震發生是小概率事件,所以在SEEW 服務器上對觸發信息進行合理性分析,進而確定是否有地震發生,是十分必要的。
在地震判別上,SEEW 服務器需要根據手機觸發信息辨別是否發生地震。 通常設置一個規則來區分兩種不同的觸發信息,來確定地震是否發生。MyShake 和EN 項目都表明,當地震發生時,在短時間內SEEW 服務器收到的觸發信息多于平時。 My-Shake 項目采用60%手機在20 s 內觸發來判定地震的策略[19]。 EN 項目則經過構建統計模型來判斷是否地震發生,模型中包含手機數量、觸發比例等多種因素[21]。
然而,由于智能手機所處環境復雜,容易受到人們活動、行走、交通工具等因素的干擾,地震預警的準確性一直困擾著預警系統的研究者。 當地震發生時,地震能量以一定的速度由震源向外傳播,手機離地震源距離不同,收到地震信號的時間也不同。 宏觀上,觸發時間與震源距離之間存在正相關性。 沒有地震時,雖然手機會因為用戶活動觸發,但是觸發時間和震源距離缺乏正相關性。 基于此,本文提出了一種基于觸發比例統計推斷的地震早期預警方法(Trigger Ratio Statistical Inference based SEEW,TRSI),旨在利用地震觸發手機震動在時間和空間上的一致性,大幅降低人們日常行為導致手機震動的虛警信息,提高地震預警系統的準確性。 在MyShake和EN 項目中,主要采用單一閾值方式降低地震虛假報警,閾值的選擇缺乏模型和數據支撐,無法在現實中推廣應用。 本文方法則利用大規模日常觸發數據,基于地震觸發的時間和空間關系,在服務器上建立統計推斷模型。 與MyShake 和EN 項目等方法相比,在魯棒性和預警性能上更優。
SEEW 系統框架圖如圖1 所示。 設定一個SEEW系統和地震觀察點Q。 設T(Q,D)是以Q為中心,直徑為D的區域。 SEEW 利用區域T(Q,D)內的智能手機監視地震是否在地震觀察點Q附近發生,其中D表示地震的影響范圍。 設該部署區域T(Q,D)在時刻t內活躍手機的個數為M(T(Q,D),t)。 SEEW 系統每10 min 統計一次活躍手機的分布情況。

圖1 SEEW 系統示意圖
為了提高地震預警性能,在手機觸發預警消息時,我們首先建立手機端地震信號觸發模型。 當手機振動時,該模型對該振動是否由地震引起做初步判斷。 如果判斷為地震信號觸發,才將觸發時間和手機所在位置發送至SEEW 服務器,從而減少用戶活動對地震預警的干擾。
設時刻t采集的三軸加速度分別為ax(t),ay(t)和az(t),at=[ax(t),ay(t),az(t)]。 地震判別模型的輸入為A=(a1,a2,…,aT),其維度為3×T。將加速度序列A輸入到長短期記憶網絡(Long-Short Term Memory,LSTM)模型中,如圖2 所示。 在LSTM 網絡中,為了更準確地捕捉地震觸發信號,我們引入了注意力機制。 注意力機制根據信號重要性進行局部加權,動態地提取信號中與地震觸發事件相關的重要信息。 設LSTM 網絡的隱含層輸出H=(h1,h2,…,hT),注意力權重attt定義為:

圖2 基于注意力機制的LSTM 模型

式中:W∈RT×dh,softmax 是歸一化指數函數。 然后,將H輸入到由全連接網絡構成的二分類器中,并用交叉熵損失函數訓練模型。
設在區域T(Q,D)上,時間間隔內,SEEW 服務器收到的觸發信息的時間和位置分別為τ1<τ2<…<τK和P1 設地震P波傳播速度為Vp。 若地震在Q處發生,第k個觸發手機可以準確獲得地震到達該手機的時間和位置信息,則地震發生的時間可以表示為: 根據式(4),可以計算得到在區域T(Q,D)上,在時間間隔=(t-ε,t)內的觸發手機集合{k|t-ε≤tk≤t}。 在理想情況下,如果手機預警是由震源Q觸發的,那么不同手機估算得到地震時刻tk應該誤差很小。 實際上,由于地質環境和網絡延遲的差異,不同位置手機估算出的tk存在差異。設滿足時間間隔條件的智能手機個數為: 式中:N[T(Q,D),]表示區域T(Q,D)中,時間間隔=(t-ε,t)內觸發點的個數。 在系統實現中ε設置為10 s。 設T(Q,D)區域在時刻t活躍手機的個數為M(T(Q,D),t)。 我們定義區域T(Q,D)內觸發手機占該區域內活躍手機的比例為: 當手機觸發預警,會向SEEW 服務器發送觸發信息。 如果手機所受震動是由地震引起的,我們稱這個觸發信息為真觸發信息,否則稱之為假觸發信息。 當SEEW 服務器根據收到的觸發信息綜合判斷發生了地震,則其會向公眾發布警告。 若此時真的發生了地震,我們稱該警報為真警報,否則稱之為假警報。 通常在沒有發生地震時,N[T(Q,D),Itε]一般維持在較低的水平。Q附近發生地震后的小段時間內N[T(Q,D),Itε]會突然增大。 這導致發生地震時R[T(Q,D),t,ε]會比沒有發生地震時大。 所以我們根據下列公式判斷地點Q附近是否發生地震: 當式(7)條件滿足時,SEEW 系統將認為Q附近發生了地震。 否則認為Q附近沒有發生地震。誤警率定義為條件概率: 漏檢率定義為條件概率: 閾值h1作為參數,在誤警率和漏檢率之間權衡選擇。 當h1增大,誤警率會降低,但同時漏檢率會增大。 當h1減小,誤警率會增大,但同時漏檢率會降低。 高誤警率會造成不必要的恐慌,所以優先將誤警率控制在很低的水平。 在本文中,我們設計了一種基于R[T(Q,D),t,ε]概率分布的地震判別模型。 通常情況下,R[T(Q,D),t,ε]的概率分布無法直接計算得到,但可以通過地震沒有發生時SEEW服務器收集的大量數據計算得到R[T(Q,D),t,ε]的經驗分布。 假設SEEW 服務器平均間隔時間Y會觸發一個假警報信息。 在地震沒有發生時,將h1設置為滿足誤警次數足夠小的分位數: 那么,閾值h1可以保證SEEW 服務器平均間隔時間Y才會觸發一個假警報信息。 在固定地震點Q基礎上,進一步將區域T均勻劃分成I×J個子區域,來判別區域T內的任意位置地震是否發生。 方法如下:我們在每個子區域中心處設定一個地震觀察點{Qi,j|1≤i≤I,1≤j≤J}。 我們定義: 表示所有子區域中最大地震感應量。 在沒有發生地震時,子區域集合j≤J}內的數值一般都比較小,所以Btε也比較小。當地震在部署區域T的地震觀察點Qi,j附近發生時,R[T(Qi,j,D),t,ε]會快速增大,那么Btε也會快速增大。 所以,根據以下公式判斷是否發生地震: 則SEEW 系統誤警概率為: SEEW 系統漏檢概率為: 類似h1的計算方法,我們可以通過構造Mtε的經驗分布來得到閾值h2,保證SEEW服務器平均間隔時間Y才會收到一個假觸發信息: 最后,我們將本文提出的服務器端SEEW 地震判別算法總結如表1 所示。 表1 SEEW 地震判別算法 為了驗證所提出方法在SEEW 系統上的有效性,我們采用了MyShake 和EN 項目的實驗方法,即通過構建仿真平臺來模擬SEEW 服務器可能會收集到的大量觸發信息。 仿真數據用以定量評估在不同地區不同人口密度條件下,SEEW 系統的地震監測性能。 下面介紹仿真平臺,仿真平臺包括地震仿真平臺和日常仿真平臺,用于生成地震發生時和無地震時的數據,并發送給SEEW 系統。 我們使用的仿真平臺結合了MyShake 和EN 項目仿真平臺的優勢,由四部分構成,如圖3 所示。 和MyShake 項目一樣,我們也使用人口采樣來確定仿真SEEW 網絡中智能手機的空間分布。 地震中,活躍手機可能因為某些原因不被觸發,我們根據EN 項目定義的觸發比例?決定哪些手機觸發。 觸發比例?表示當前區域內活躍手機中因地震而觸發的手機比例。由于強烈的地震會導致更多比例的手機觸發,所以觸發比例?可以用來描述地震能量的大小。 圖3 地震仿真平臺及服務器地震監測示意圖 在地震仿真中,我們假設P 波和S 波的傳播速度分別是6.1 km/s 和3.55 km/s。 根據地震的時間和地點,可以計算地震波到達每部手機的時間。 不同手機的時間不完全一致,而且地震波到達手機也不一定立即預警地震。 因此,為了表達這種隨機性,通過在手機觀測到的觸發時間中添加白噪聲,來模擬地震波到達手機的實際時間。 和MyShake 項目一樣,噪聲采樣自方差為2 s 的半正態分布。 SEEW 系統的手機處于嘈雜的環境中,在沒有地震發生時,手機也可能會被意外事件觸發,例如用戶突然拿起電話。 在這種情況下,手機也會向SEEW 服務器發送地震觸發信息。 在SEEW 服務器端,也有一定概率誤判地震發生,發布虛假地震預警信息。 為了準確測量SEEW 服務器的誤報頻率,我們同時搭建了一個非地震日常仿真平臺,來獲取SEEW 服務器在地震沒有發生時可能接收到的預警數據。 圖4是非地震日常仿真平臺示意圖,由三個部分組成。 和MyShake 模擬平臺類似,我們也使用人口采樣的方式,根據感興趣區域的人口密度分布圖,隨機采樣手機分布。 由于用戶的手機處于復雜的環境中,可能會因周圍的非地震振動而隨時觸發。 我們在這個非地震模擬平臺中模擬了這種現象,使這些手機在平均時間間隔內隨機觸發。 最終,我們把日常手機觸發的數據收集起來,形成一個數據集。 圖4 日常仿真平臺及地震監測示意圖 非地震日常仿真平臺可以根據我們感興趣的區域快速、大規模地模擬多年數據,在部署前對SEEW系統性能進行粗略評估,并相應地調整其內部參數。如果在該地區部署SEEW 系統來收集此類數據,則需要耗費很長時間。 在實驗中,對模型的評價指標主要包含兩方面:一是在無地震前提下,模型誤警的可能性;二是發生地震的前提下,模型檢測到地震的可能性。 由于模型誤警會造成不必要的恐慌,且影響人們對地震早期預警系統的信心,所以我們優先控制模型的誤警率。 與EN 項目的設定類似,我們設置模型平均兩次誤警的時間間隔為一年,即公式(10)和(15)中參數Y設置為一年(365×24×60×60 s)。 基于此參數,我們測試TRSI 方法在地震發生時檢測地震的性能。 為了與EN 項目方法進行比較,我們通過地震仿真平臺模擬了美國圣地亞哥的部署環境,因為該地區也部署了EN 項目。 我們采用人口采樣的方法,基于人口數據確定模擬SEEW 網絡的空間分布,其中人口數據來自2015 年世界網格化人口第四版(GPWv4)[22]。 在相對空間分布方面,GPWv4 與全國人口普查和人口登記相一致。 比例分配網格算法使用國家和地區以下約1 250 萬個行政單位,將人口值分配到30弧秒(約1 km)的網格單位,全球人口密度分布如圖5所示,圖中顏色越深的區域,人口越密集。 隨機采樣感興趣區域的人口比例,作為SEEW 系統用戶。 采樣比例為0.05%時,產生了183個SEEW 系統用戶。 在圣地亞哥地圖網格(如圖6 所示)上,根據該單元的人口密度采樣,并模擬這些用戶的位置信息。 圖5 全球人口密度分布圖 圖6 通過人口密度采樣得到SEEW 系統的用戶分布圖 表2 列出TRSI 模型中的參數設定值。 地震監測系統目標設置為:無地震發生時,TRSI 模型的平均誤警時間間隔達到1 年。 為了到達這個目標,日常仿真平臺生成的100 年觸發數據被輸入到TRSI 模型中,并且每隔1 s 更新一次Btε的值。 我們通過統計來構造Btε的經驗分布。 然后將h2設置為該經驗分布的上1/Y分位數,其中Y=365×24×60×60。 這樣在無地震前提下,不等式Mtε>h2成立的時間間隔會達到平均一年一次。 表2 SEEW 系統參數設置 手機地震信號觸發模型序列時間長度為5 s,手機加速度計的采集頻率為100 Hz,輸入數據采樣時刻的數量為T=500。 LSTM 網絡隱含層神經元個數為30,mini-batch 大小為512,優化器為Adam,學習率為2e-4。 我們采用F1、精確度(Precision)和召回率(Recall)指標來評價手機地震信號觸發的準確率。 3.3.1 手機端地震信號觸發性能 在中國地震局工程力學研究所,通過振動臺模擬地震,并將手機放置在振動臺上來采集數據。 實驗使用的48 部手機固定和自由地擺放在振動臺上,然后將46 條地震記錄(震級5.0~8.0)依次輸入到振動臺中模擬地震,持續時間為10 s,共采集4 416條記錄。 日常手機振動數據,則通過隨機信號產生。 將數據劃分為訓練集合和測試集合(比例為4 ∶1),我們還測試了SVM、CNN 模型在數據集上的性能,測試結果如表3 所示。 結果表明基于注意力機制的LSTM 模型(LSTM+Att)取得了最佳性能。 表3 手機端地震判別模型性能比較 3.3.2 SEEW 服務器地震判別性能 在本節中,我們測試了TRSI 模型,并將其與地震網(EN)項目提出的Detector 模型進行了比較。在構建TRSI 時,與EN 項目設置相同,平均誤警時間間隔設置為一年一次。 我們使用地震仿真平臺生成的觸發數據測試TRSI 模型和EN Detector 模型的地震監測性能。 地震仿真平臺模擬的183 部手機按人口密度分布在200 km×200 km 的系統部署區域內。 地震仿真平臺的觸發比例?參數為地震發生時系統部署區域內系統用戶手機中觸發手機的比例。 EN 項目在測試實驗中使用觸發比例?來描述地震的強度。借鑒EN 項目測試方案,我們在不同觸發比例?(地震強度)下模擬100 次地震。 然后測試TRSI 模型和EN 項目的Detector 模型在100 次地震中成功預警的比例,以及預警發布的平均時延。 圖7 比較了各系統在不同觸發率下的成功預警率。 隨著觸發比例的增加,TRSI 模型和Detector 模型成功預警的比例都快速增加。 這說明當地震震動劇烈,地震會被更多比例的手機監測到,系統成功預警的比例增加。 TRSI 模型取得了比Detector 模型更高的成功預警比例,其中,當觸發比例?屬于[0.2,0.4]區間時,TRSI 模型的成功預警比例比Detector 模型平均高35.6個百分點;當觸發比例?為0.3 時,TRSI+手機地震信號觸發模型的成功預警比例達98.2%。 圖7 地震監測器在不同觸發率下的成功預警率 圖8 比較了各系統在不同觸發率下的平均報警延遲。 隨著觸發比例的增加,TRSI 模型和Detector 模型平均預警延遲都會降低。 這說明當地震震動劇烈時,系統預警所需的延遲會降低。 圖8 曲線表明,TRSI 模型預警延遲低于Detector 模型平均1.9 s,說明TRSI 模型可以對地震做出更快地預警反應。 圖8 地震監測器在不同觸發率下的平均報警延遲 同時,圖7 和圖8 中的實線顯示了TRSI 模型在手機端增加地震信號觸發判別后的SEEW 地震預警性能,我們可以看到系統在成功預警率和平均預警延遲上性能都有一些提升。 本文深入研究了基于智能手機MEMS 的地震早期預警技術,基于地震向外傳播的特性,由手機觸發時間反向估計地震發生時間,設計提出了一種基于觸發比例統計推斷的地震早期預警方法。 本方法基于大規模日常觸發數據,建立了統計推斷模型,參數的計算模型和方法可以推廣到實際應用系統中。實驗表明,本方法可以有效過濾掉大部分日常觸發事件。 通過與EN 項目Detector 模型比較,在平均誤警間隔為一年的低誤警率要求下,所提出的TRSI 模型在成功預警比例和檢測延遲等方面性能更優。 同時,基于注意力機制的改進LSTM 手機地震信號觸發模型,與CNN、SVM 等基準模型相比,性能最佳。



1.4 基于統計的SEEW 地震判別模型




1.5 基于任意位置的改進SEEW 地震判別模型





1.6 算法總結

2 數據集
2.1 地震仿真平臺

2.2 日常仿真平臺

3 實驗
3.1 人口分布采樣


3.2 仿真參數設定

3.3 實驗結果



4 結束語