張勇,趙學志,肖爽
?
基于通信大數據的地震影響初步判斷*
張勇,趙學志,肖爽
(上海市地震局,上海 200062)
破壞地震發生之后,在最短的時間內,判斷地震可能造成的有感范圍、極震區范圍,對地震應急工作的開展是至關重要的。歷次地震中,多次發生地震影響范圍的判斷失誤,甚至破裂方向出現巨大偏差,大大影響震后應急工作的開展。主要介紹通過通信大數據判斷大致的地震破裂方向、有感范圍和極震區范圍的方法,為震后應急提供比較準確的救援支持。
破裂方向;有感范圍;極震區;通信大數據
破壞地震發生之后,前期的數小時內,外界得不到災區任何信息,我們稱之為黑箱期。黑箱期內,我們需要快速判斷破裂方向、有感范圍和極震區,提供給應急救援隊伍,使其快速進入地震破壞最嚴重的區域開展地震應急救援工作。
在歷次地震中,黑箱期內多次使用活斷層判斷影響場方向,但是因為活斷層未完全探明或者隱伏斷層的存在,這樣的判斷方法出現了很大的偏差,如魯甸地震方向判斷為北東向,實際為北西向;景谷地震方向判斷為北東向,實際為北西向。因影響場判斷的錯誤,災害評估也因此出現了巨大的偏差,應急救援隊伍甚至前進的方向都出現了錯誤,導致這幾次地震救援效率大大降低,也使人民的生命和財產損失更加巨大。因此,如何在黑箱期內,迅速判斷地震的破裂方向、有感范圍和極震區是地震發生后的重中之重[1]。我們之前使用傳統的根據破裂帶判斷影響場的方法容易出現巨大錯誤,因此我們急需尋找一種更加可靠的方法,迅速判斷地震影響情況,開啟應急指揮技術系統[2],迅速開展應急救援,大大降低地震災害帶來的損失。
多次地震后,使用活斷層的方法偏差太大。經過研究,我們發現地震發生后,移動基站的退服情況、電網的中斷、手機入網中斷、手機數據通信的分布與地震影響場分布情況存在很大的關系。
這些判斷影響場的方法準確性比較高,但是數據的獲得難度太大,移動基站數據、電網數據、手機斷網數據牽涉到隱私、涉密、價格等問題,電網公司和運營商都不允許將數據提供給我們地震系統[3]。因此,我們經過多次調研,發現可以通過第三方公司獲得手機數據通信大數據,該方法可靠度高,而且也能以便宜的價格獲得到該類數據。
數據主要來源于第三方移動推送服務商。現在不管是安卓還是IOS系統,它們的APP軟件都嵌入了各種消息SDK,推送服務商可以以一定時間間隔動態采集經過用戶授權的設備、位置、搜索內容等相關信息。使用消息SDK平臺的用戶規模巨大,裝機的SDK用戶數達到百億,覆蓋數十億終端,日常用戶近十億,在線用戶數也超過了數億。數據收集到之后,我們還需要對這些基礎數據進行臟數據去除、去重、格式轉換等數據清洗,再通過數據挖掘針對海量數據使用分布式計算方法進行業務邏輯處理,挖掘得到結果集。
因數據量非常大,我們采用Geohash編碼[5]進行空間檢索,將二維的經緯度轉換成字符串,每一個字符串代表了某一矩形區域,也就是說,這個矩形區域內所有的經緯度坐標都共享相同的Geohash字符串。因此,相當于將整個上海平面均分為若干矩形方格,5位的編碼可分割為10 km2的矩形塊,即上海可以分成近1 000個Geohash塊;而6位編碼能精細到約0.34 km2,即上海可以分成近20 000個Geohash塊。
當地震發生后,網絡設施、電力設施、人員速度及位移等都可能受到相應的影響,這些也能在數據層上有一定的表現。此時,我們就可以通過Geohash數據塊中的數據進行分析,構建模型,我們主要可以通過7個指標進行判斷。地震影響判斷指標關系如圖1所示。

圖1 地震影響判斷指標關系圖
地震影響判斷指標為以下幾個:①活躍基站數。統計某個時間切片、某個Geohash塊中設備連接的活躍基站數量驟減,或者遠低于之前平均水平,說明該范圍發生大規模基站退服。②活躍WiFi熱點數量。某個時間切片、某個Geohash塊中,移動設備上報的WiFi熱點數量驟減,或者遠低于之前平均水平,說明該范圍發生大規模無線熱點斷電。③無線網絡聯網設備數量。聯網的移動設備定時上報連接狀態,某個時間切片、某個Geohash塊中,通過無線網絡聯網的設備數量驟減時,說明該范圍內發生大規模無線網絡斷網。④匯總在線設備數量。某個時間切片、某個Geohash塊中匯總在線設備數量發生驟減,或者遠低于之前平均水平,說明該范圍發生大規模數據阻塞。⑤平均移動速度。通過獲得移動設備的位置數據,再對比前后兩個時間間隔的位移,可以計算每個設備的平均移動速度。某個時間切片、某個Geohash塊中整體平均移動速度驟增,或遠高于之前平均水平時,說明該范圍內發生大規模人群遷徙。⑥瞬時移動速度。某個時間切片、某個Geohash塊中整體瞬時移動速度驟增,說明該范圍內發生大規模人群快速移動。⑦異常震動設備數量。可通過移動設備加速度傳感器檢測第三軸方向加速度,某個時間切片、某個Geohash塊中異常震動設備數量驟增,或遠高于之前平均水平時,說明該范圍內發生大規模異常震動。
將上海市劃分為成百上千個Geohash塊后,對各個數據塊中的數據進行收集、整理,最后再判斷各項數據指標,就可以判斷地震影響場的方向,大致判斷地震的影響范圍。
從圖2可以看到,將上海分割成個Geohash塊后,判斷其數據指標。深灰色塊代表活躍基站數、活躍WiFi熱點數量、無線網絡聯網設備數量、匯總在線設備數量驟減,說明地震對這幾個區域造成了破壞,地震烈度可能達到八度。淡灰色塊代表平均移動速度、瞬時移動速度、異常震動設備數量驟增,說明這幾個區域大范圍人員有震感,地震烈度為四至七度。再將深灰色塊和淡灰色塊的范圍分別連接起來,可以大致畫出兩個橢圓,小橢圓為極震區范圍,大橢圓為有感范圍。這個就是簡單判斷的影響場范圍,而橢圓的方向就是本次地震的破裂方向。如果地震強度較大,造成的破壞也巨大,就可能出現三層橢圓的情況。外面兩層橢圓和之前的情況相同,但是最內層我們無法收集到數據,說明手機通信中斷,地震烈度可能達到九度或者更高。

圖2 上海被分割成Geohash塊示意圖
本文主要介紹了通過通信大數據來簡單判斷地震影響場方向、范圍的方法。通過將上海分割成若干個Geohash塊后,再對各個塊中得到的通信數據進行收集、整理、判斷之后,根據連接的基站數、終端位移等條件判斷并顯示,簡單、準確地給出地震的三個影響程度,判斷地震影響場的方向。地震影響范圍和影響場范圍確定之后,地震應急救援人員就能第一時間趕到地震破壞最嚴重的地方開展救援工作,大大提高應急救援工作效率和準確率,加強地震工作能力,最大限度地減輕地震災害給人們帶來的損失。
[1]程顯洲.基于AHP與差異權重聚類的地震災害快速評估模型研究[D].蘭州:中國地震局蘭州地震研究所,2013.
[2]姜立新,帥向華,張建福,等.地震應急指揮管理信息系統的探討[J].地震,2003,23(2):115-120.
[3]馬犇,張潔,何琳,等.市級地震應急指揮技術系統建設規范研究[J].電腦編程技巧與維護,2014(18):4-5.
[4]張勇,王小明,程顯洲.上海地震災害情景構建數據庫建設[J].地震地磁觀測與研究,2018,39(1):154-158.
[5]金安,程承旗,宋樹華,等.基于Geohash的面數據區域查詢[J].地理與地理信息科學,2013,29(5):31-35.
2095-6835(2018)20-0043-02
P315.9
A
10.15913/j.cnki.kjycx.2018.20.043
上海市科學技術委員會科研計劃項目(編號:18DZ1200500);上海市地震局科技專項(編號:2018專 4);大中城市地震災害情景構建重點專項(編號:2016QJGJ02)資助
張勇(1986—),男,上海人,本科,工程師,主要從事地震應急工作。
〔編輯:嚴麗琴〕