李兆隆++吳艷梅++李敏++李永強
摘要:通過建立云南省IP地址定位與狀態變化數據基礎數據庫,使用互聯網信報控制協議,研發基于互聯網信報控制協議的災情信息收集系統,實現對云南省IP地址主機設備震前、震后的在線狀態比對,短時間內生成震區災情判斷數據,為震害評估及應急決策提供依據。經過2017年云南2次地震檢驗,該系統收集數據及分析結果滿足地震應急相關工作需求。
關鍵詞:地震應急;災情獲取;IP地址
中圖分類號:P315941文獻標識碼:A文章編號:1000-0666(2017)02-0311-06
0引言
云南省地震局地震應急技術系統開發、應用部署于“十五”期間,從開始使用至2017年3月,經歷了多次的數據、模型本地化與系統的技術優化、軟件升級(曹彥波等,2015)?,F已發展成包含地震應急評估系統、應急信息發布服務、綜合數據查詢服務3個主要功能模塊為主體的、共計40余個服務接口的綜合應急技術系統。雖然有多年的優化與升級來保證應急資料、評估信息的全自動化產出、推送,但是,隨著互聯網技術的高速發展與網絡基礎設施的不斷完善,各類先進的技術迅速得到普及與應用,互聯網大潮下的信息產出與需求,早已超出了現有地震應急技術系統的接受與服務能力:(1)初評估階段的地震影響場是由靜態模型計算后得到,缺乏必要的實時數據支撐,且其形狀規則不能準確地反應地震破壞情況與影響范圍;(2)地震災害發生后,缺乏便捷、準確的地震現場數據獲取手段,無法在后方指揮部最需要災情信息的時間段內獲取到有價值的災情信息,極大地制約著后方指揮部的應急決策能力(程陳,史文博,2013)。因此,建立一套主動、便捷、高效、低成本的、能與現有軟件系統融合的災情獲取系統成為地震應急技術系統發展的必要(王喜雙等,2014)。
針對以上地震應急技術系統的問題,根據云南省地震局現有技術系統的運行、管理特點,本文借助互聯網大數據思維,利用因特網信報控制協議,編寫基于互聯網信報控制協議的災情信息收集軟件系統,對特定地域內的各類互聯網聯網設備(TCP/IP)的在線狀態進行采集與分析,積累長期的背景數據,找到其在線狀態、傳輸時間與地震影響狀況間的對應關系,在震后有針對性的對震區數據進行快速、加密收集,同時與常態數據進行對比分析,從而在震后極短時間內完成災情數據的收集及相關災情的判別。
包括IP地址列表、IP地址定位、IP地址行政區劃歸屬、IP地址分時段在線狀態(比例)、IP地址分時段平均延遲、IP地址常態掃描數據記錄等數據,建立云南省IP地址定位與狀態變化基礎數據庫,數據庫詳細內容見表2。
通過前期對數據需求的調研及監測部門監測要素常態值運算方法的研究,設定了一系列的數據項目采集存儲要求,同時對各類數據的存儲方法、存儲類型加以規定(張方浩等,2016)。主要包括以下幾個方面:(1)IP地址列表及定位數據;(2)IP地址掃描數據結果數據;(3)IP地址常態背景數據;(4)IP地址軟件計算用狀態變化數據。
2基于互聯網信報控制協議的災情信息收集系統的研發與應用[BT)]
以云南省IP地址及云南省基礎地理數據為基礎,建立云南省IP地址定位與狀態變化數據基礎數據庫,使用互聯網信報控制協議完成全省IP地址的常態與異常數據收集,并對數據進行分析整理,根據相關模型產出震區IP地址在線狀態變化圖等結果資料。軟件系統業務流程如圖2所示。
21系統功能
[KG(0.15mm]按照云南省地震局現有應急指揮技術系統特點,基于IP的災區災情信息收集系統全部部署于阿里云服務器,共分IP地址后臺掃描端、主控分析端兩大部分,相關軟硬件環境需求見表3。掃描端以云計算節點方式長期獨立運行并生產數據,與主控分析端通過MSMQ(微軟消息隊列)方式進行數據傳輸與作業交接;所有的數據讀取、分發、存儲工作由主控分析端完成,并負責響應由軟件系統定期發起或由用戶隨機發起的各類數據核算、查看、分析作業(錢文靜,鄧仲華,2009)。
軟件系統功能總體包含系統參數設置、IP地址掃描、IP地址常態值核算、數據產出(已完成方法研究,軟件功能未實現)4個方面。功能模塊根據應用時間、服務對象不同,對上述4方面功能進行了進一步的分割或結合,以保證系統運行期各模塊之間互聯、互通便捷且不相互影響(陶彩霞等,2013),具體功能設計見表4。
22運行狀態
截至2017年3月,IP地址后臺掃描軟件系統已完成設計部署,試運行24 d,未發現重大設計失誤或數據偏差,運行界面見圖3。試運行期間,設定IP地址掃描速率為750次/s,重訪周期約為30~45 min;期間共收集數據7億余條,完成一次常態值核算,核算常態值36億余條。
經校驗,常態值的分布情況與預想值較為接近。圖4為較典型的IP地址在線狀態分布圖,由連續3周的觀測數據匯總得到,統計時為得到較為典型的曲線,已將休息日數據剔除。圖中IP地址為疑似某小型企業固定IP地址在線狀態分布,其在線時間段與法定工作時段有明顯的正相關關系,法定工作時間其在線率接近100%,而其他時間則幾乎為0%,0點的數據突跳為測試用異常數據。
由此類常態值可分析、分辨出IP地址對應的用戶個體(群體),此類分析結果可直接作用于震后人員傷亡、遷移評估,對震后的災情估算有較大價值,尤其對人員傷亡情況判斷有重要意義。此類數據的分析、分辨模型仍需較長時間進行研究,以便獲得更為準確的判別結果。
23預期成果及地震應用
[KG(0.25mm]在地震災害(緊急事件)發生后的一定時間段內,使用上述方法及軟件系統,對震區IP地址逐一進行短周期重訪操作,將這些目標主機因電力中斷、線纜破壞、人為關機等原因而引起的通信中斷(曹刻等,2008),因民眾倉促避難無暇上網而引發的網絡通暢,因災民集中使用網絡而引發的網絡阻塞等網絡狀態進行收集,并逐一根據位置信息在地圖上進行分時段標繪,即得到圖5。
[KG(0.15mm]從此類圖件中可快速準確地判讀出地震災害極重災區(高烈度區)、通信中斷、阻塞、生命線工程破壞等內容(帥向華等,2014)。如圖5a為模擬全省IP地址震后狀態分布圖,其中紅色區域為通信中斷地區,由此可認定該區的地面線路基本中斷,造成原因可能為地面通信線路故障;黃色區域為高延遲區域,此區域可能為震感強烈區域,導致該區居民集中使用網絡資源進行報災、發送微博微信等引發區域網絡阻塞。圖5b為震后城市IP地址狀態分布圖,可明顯判讀出一呈條帶狀分布的通信中斷區域,此區域的通信中斷極有可能是由為該區域提供電力的輸電線路損壞而引起。[KG)]2017年2~3月,軟件系統覆蓋區共發生2次
40級以上地震,分別為2月8日云南魯甸49級、3月12日云南魯甸45級地震。這2次地震發生后,軟件系統均根據EQIM數據自動創建并開始進行緊急事件掃描,2月8日地震事件持續掃描為5 h,掃描半徑50 km;3月12日地震事件持續掃描時間為6 h,掃描半徑60 km。
這2次地震事件均未收集到有效的網絡狀態突變數據。由圖6可知,常在線設備的延遲數據并未因地震事件發生較大波動,震后延遲波動范圍與常態值基本保持一致,并未發生預計中的突跳,其原因在于兩次地震震區均為地震常發區,且震級偏小,當地居民對此類不會造成較大損失或生命線工程毀壞的地震并不會采取較為激烈的應急動作。
鑒于上述2次地震案例,該軟件系統在應對云南省內較小地震的過程中尚存在一定不足,其原因主要為:(1)軟件系統設計的應對目標地震為震級較大、具有較大破壞力的地震,設計采用的數據收集方式、精度不能很好地應用于較小地震;(2)軟件系統數據分析方式、方法不能較為準確地體現數據的微小波動。后期將對上述兩個問題進行詳細研究并提出解決方案與更優的數據分析方法。[JP]
24其他說明事項
本軟件系統使用的主機在線狀態探測方法是互聯網點對點聯通狀態測試的最常用方法,其回報內容有限且不涉及隱私,非有意進行特定特殊參數設置并進行大量并發操作不具有危害性。軟件系統試運行階段所有運行參數(探測及重訪周期等)設置均在合理、合法范圍內,公網出入流量較小且穩定,不具備有害行為特征,不會被認定為有害軟件或黑客軟件(馮登國等,2014)。
3結論
本文所介紹的基于IP的災區災情信息收集系統是云南省地震局在地震應急大數據應用方面進行的重要探索,主要以快速、準確、主動獲取震區災情為目的,是基于成熟的互聯網技術與低廉的硬件服務實現的,是具有較強地域通用性(由數據層控制適用地域范圍)的災區一手災情數據獲取軟件系統。經一般小型地震檢驗,系統功能可以滿足地震應急中對震區災情判斷的需求。后續需進一步對IP地址進行提純與高精度定位數據更新,并加強異常數據篩選與熱力圖向地震影響范圍轉化機制等方面的研究,以保證該系統可以更好地服務于地震應急工作。
參考文獻:
曹刻,王鋒,李永強,等2008云南寧洱64級地震災區范圍的快速判斷[J].災害學,23(2):76-79
曹彥波,李兆隆,李永強,等2015云南地震應急快速評估模型本地化集成研究[J].地震研究,38(1):148-154
程陳,史文博2013大數據挖掘分析在地震科研中的應用[J].信息系統工程,(12):27-28
馮登國,張敏,李昊2014大數據安全與隱私保護[J].計算機學報,37(1):246-258
錢文靜,鄧仲華2009云計算與信息資源共享管理[J].圖書與情報,(4):47-52
帥向華,胡素平,鄭向向2014基于互聯網信息快速估計汶川地震有感范圍[J].地震地質,36(4):1094-1105
陶彩霞,謝曉軍,陳康,等2013基于云計算的移動互聯網大數據用戶行為分析引擎設計[J].電信科學,29(3):27-31
王喜雙,趙邦六,董世泰,等2014油氣工業地震勘探大數據面臨的挑戰及對策[J].中國石油勘探,19(4):43-47
張方浩,和仕芳,呂佳麗,等2016基于互聯網的地震災情信息分類編碼與初步應用研究[J].地震研究,39(4):664-672