常 俊喬 波趙 曦1)中國西安710068陜西省地震局2)中國陜西721008寶雞綜合地震臺
?
地震前兆數據連續性及穩定性量化評價
常 俊1)喬 波2)趙 曦1)
1)中國西安710068陜西省地震局2)中國陜西721008寶雞綜合地震臺
摘要鑒于因地震前兆儀器采樣率提升而帶來的數據量大、規模增加的狀況,在前期實現陜西省地震前兆觀測臺站每日數據定時匯集的基礎上,對匯集數據的連續性及穩定性進行量化分析。通過程序設計,實現對觀測數據異常狀態的自動檢測,給出干擾數據剔除后各檢測分量的穩定性評價結果,以數據庫表格式保存。以期為數據共享服務提供基礎依據,為地震臺動態化管理提供信息支撐,為其他地震觀測數據的相關研究提供技術支持。
關鍵詞前兆數據;連續性;穩定性;量化評價
經過“九五”系統改造及“十五”項目建設,地震前兆觀測數據形成一套規范的存儲與管理系統。各類地震前兆儀器產出的觀測數據,經由地震臺站統一匯集至省地震局前兆數據庫,并對外提供數據共享服務。數據從產出至入庫,需由地震臺站或前兆臺網人工預處理,查看有無數據缺失,是否存在突跳臺階等異常,并相應進行補缺、去干擾等處理。隨著地震前兆臺網的建設與發展,觀測儀器采樣率多提升為分采樣或秒采樣,采樣率的提升帶來觀測數據量的飛速增長,人工預處理數據在時效性、準確率及精細度上的局限逐步顯現,難以滿足數據使用與管理需求。而且,觀測數據從產出到服務,尚無一套可用的質量評價準則或方法,難以實現對觀測數據或臺站儀器產出質量的把控。
為了及時發現地震前兆觀測數據的潛在問題,提高數據管理自動化水平,研究建立地震前兆數據連續性及穩定性量化評價系統,實現對數據每日質量分析,對數據連續性及穩定性作量化計算,存儲于地震前兆數據庫,與陜西省地震數據共享服務系統相關聯,為研究人員提供全面、深入的地震數據信息。
在實際觀測過程中,觀測設備不可避免地受到一些無法預知的外界因素影響,如環境干擾、惡劣天氣、意外停電等,導致觀測數據出現缺失、突跳、臺階等異常。目前,地震行業內對此類異常的檢測方法研究較少,現行應用方法包括日變幅法、均方差法(王建國等,2007)、時間序列閾值法(成萬里等,2014)等,這些方法解決了部分問題,但不具備綜合性及體系化。因此,在對各類計算方法進行對比分析后,設計一種結合差分、方差及平滑時間窗等手段的綜合計算方法,實現對觀測數據完整率統計及異常狀態的檢測。
1.1 連續性檢測與統計
在地震前兆觀測數據中,數據缺失是一個較為普遍的現象。從數據庫記錄看,數據缺失表現為兩種狀態:①該類數據當天記錄為空,即在數據庫中缺少對應臺站、對應測項分量的數據條目,可能是由于儀器故障或停電等導致數據向省地震局上傳延遲;②缺失數據以“NULL”值填充,從“NULL”在表記錄中出現的位置及次數,可判斷當天觀測值缺失的時間點及個數。
在上述特征基礎上,設計程序對每天運行的臺站、測項分量對應的數據庫表進行掃描(王春等,2014),查找有無上述兩種狀況的存在。對于第1種狀態:①記錄該臺站、測項分量的當日數據完整率為零;②為避免因數據延遲回傳而完整率記錄始終為零,當數據庫中出現對應數據條目時,觸發程序對其之前完整率為零的數據重新啟動檢測計算。對于第2種狀態,統計“NULL”的位置及個數,記錄數據缺失時間,計算數據完整率。
1.2 突跳檢測原理
引起突跳的原因有多種,如雷擊、暴雨、信號干擾等。在地震前兆數據中,突跳發生量在一定范圍內屬于干擾,應去除,超過一定數量則可能為地震前兆異常,應予以標記,提醒預報人員注意。突跳數據表現為數據點與前后數據的變化趨勢有明顯差異,不符合數據常規變化規律。基于該特性,考慮以差分檢測為基礎,實現對突跳數據的檢測。
一階前向差分算法是對于非平穩時間序列進行處理的一種方法,用當前觀測值減去前一時刻觀測值,通過該差值可靈敏反映兩相鄰采樣數據點間的突變(盛驟等,2008),用于地震前兆觀測,可有效檢測突跳數據的存在。在實際運算過程中,通過一階前向差分產生新的差分序列,進行一定數學運算,從而實現突跳數據檢測。此外,針對不同采樣率數據,實際檢測運算略有不同。具體步驟如下。
(1)采樣率為分值、秒值、時值的數據。由于每日觀測數據值較多,只需對當日數據進行提取與處理。對當日觀測數據進行一階前向差分算法,形成差分序列。設置x (n)為觀測值序列,y (n)為x (n)的差分序列。則

計算差分序列均值,設置該均值為A (y),則

其中,N為當日觀測數據的個數,通常,分采樣率為1 440,秒采樣率為86 400,時采樣率為24。
計算差分序列方差

計算差分序列最大變化絕對值,將差分序列與差分均值逐一作差,找出絕對值最大的記錄,記為Δymax,則

上述運算完成后,進行突跳判斷。將差分序列分別與突跳公式比較,如果滿足以下兩個條件之一,則判斷該觀測點為突跳。
條件一

條件二

其中,λ稱為突變系數,取值范圍為0—1,1對應差分序列最大變化值與差分均值之差,即Δymax- 2δ(y),最小值0對應二倍方差,即2δ(y)。
(2)采樣率為日值的數據。當采樣率為日值時,由于每天只有一個觀測數據,無法像其他采樣率僅對當日觀測數據進行差分運算以檢測突跳。因此,將當天與前兩周的數據進行差分運算,通過與其他采樣率類似方法檢測當天觀測數據是否存在突跳。
圖1所示分別為漢中地震臺水管儀及鳳翔地電場觀測數據及差分序列曲線。由圖1可見,通過該算法可準確檢測人工難以觀測到的突跳數據異常(原始曲線中圓圈標示位置)。

圖1 突跳檢測結果(a)漢中臺水管儀觀測數據;(b)鳳翔地電場觀測數據Fig.1 Jump detection results
1.3 臺階檢測原理
在地震前兆觀測中,由于儀器不穩定或周邊環境變化等因素,造成觀測數據在某一點超出日常統計的數據變化范圍,且該變化在一定時間范圍內持續,該異常稱為臺階。臺階與突跳的不同之處在于,突跳表現為單點突變,而臺階則表現為數據突變后具有保持性與延續性。
在傳統的信號處理領域,臺階數據可利用信號的相關算法,通過構建臺階信號原始模型,利用觀測數據與模型之間的匹配相關度來進行檢測判定。但對于地震前兆數據而言,由于其變化的多樣性,導致出現多種類型的臺階信號,如正向躍變或負向躍變等,利用傳統檢測方法需要構建多種臺階模型,從計算的復雜度和準確率而言不夠理想。考慮上述狀況,結合臺階信號的表現特征,采用滑動窗比值法進行地震前兆數據臺階檢測(張興國等,2010)。檢測原理為:取臺階點前后某持續時間段,假設為穩定時段的數據點做均值處理,將前后兩段數據均值與原始觀測數據的峰峰值乘以一定系數后進行比較,判斷是否存在臺階異常。在計算臺階異常時,需首先去除突跳異常,同時,與突跳計算相類似,不同采樣率的數據在實際運算中略有不同。具體步驟如下。
(1)采樣率為分值、秒值、時值的數據。由于每日觀測數據值較多,只需對當日數據進行提取與處理:①計算當日觀測數據的峰峰值差值:Δxmax= xmax- xmin;②設置兩個時間窗N1、N2(每個時間窗長度默認分采樣為20,秒采樣為120,時采樣為4),對原始觀測數據從左向右逐一滑動,分別計算窗內均值E1、E2;③對計算出的均值作差:ΔE =E2-E1,與Δxmax比較,如果差值的絕對值|ΔE | > λΔxmax(λ為臺階突變系數,取值范圍為0—1),則判斷該點出現臺階異常。記錄該點在數據序列中的位置,并記錄臺階高度,即該點與前一點的差值。值得注意的是,在時間窗滑動過程中,當處于數據起始與尾端時,N1、N2的長度為遞增或遞減變化。以分采樣為例,最初N1為1,N2為20,然后N1逐漸增加,直至N1、N2均為20;至數據結尾處,N1為20,N2從20逐漸遞減,直到N1為20,N2為1。
(2)采樣率為日值的數據。對于日采樣數據,由于后期觀測值未知,因此標題1.2中檢測出的突跳數據是真正的突跳還是臺階數據的起始點,需要根據后續觀測數據再次判斷。在實際計算中,若當天觀測值x (n)符合突跳判定條件,則將x (n)暫時記為突跳點寫入數據庫,在第2天觀測數據x (n+1)出現后,計算3天觀測值的差分Δ xn+1= x (n+1) - x (n)及Δxn= x (n) - x (n-1),判斷Δxn+1是否滿足標題1.2所述突跳條件,且Δxn+1與Δxn符號相反。若符合,則認定x (n)為突跳數據,并在后期臺階檢測中予以去除;若不符合,則將x (n)暫時修正為臺階點的起始數據,并以x(n)為起始點,觀測其后一周與前一周數據均值差,是否滿足臺階異常判定標準。
圖2所示為西安子午臺2015年6月3日垂直擺觀測曲線,圖中臺階發生的起始位置點通過滑動窗計算法可準確實現檢測。

圖2 臺階檢測結果Fig.2 Step detection results
前兆觀測數據的穩定狀況,可以在一定程度上反映該觀測點周邊環境、儀器狀態及干擾等,也可為臺站的動態管理及數據可靠性提供輔助參考。目前,數據穩定仍依賴數據處理人員通過波形觀察及經驗判斷,缺乏客觀量化評價指標。因此,需要結合地震數據特點,通過合適算法實現數據穩定性的量化評價。
在概率論和數理統計中,方差運算(Variance)被用來度量隨機變量和數學期望(即均值)之間的偏離程度。方差越小,數據越穩定;方差越大,數據波動性越大、越不穩定(盛驟等,2008)。基于該原理,方差被廣泛應用于質量監控、風險運算、氣象分析等領域,實踐證明,應用效果較好。在地震前兆觀測方面,前兆儀器產出的數據應在一定范圍內波動,因此,用方差法計算觀測值與均值的離散度,作為數據穩定的評價指標,理論上具有一定可行性(張昱等,2010)。
在實際應用中,由于前兆觀測分為重力、形變、流體、電磁等觀測手段,不同手段因自身測項性質而具有不同的數據形態與變化趨勢(張聰聰等,2014)。以形變觀測為例,受固體潮影響,數據會出現類似正弦曲線的變化趨勢。在這種情況下,數據會遵循其應有的變化規律而產生與均值偏差較大的波動,如在正弦曲線的波峰波谷點處,這種波動是一種正常的穩定狀況,而依據方差計算原理,會得到較大的方差結果,從而產生對數據穩定情況的誤判斷。
因此,需要一種算法,消除由于數據正常趨勢變化而產生的觀測值與均值偏離所帶來的影響,得出數據本身真正波動的評價結果。參考標題1.1提到的一階前向差分算法的含義,除能夠有效檢測突跳點外,進行差分算法還能夠消除地震前兆觀測數據由于地球物理特性而帶來的長期趨勢變化,真正反映觀測數據波動情況。鑒于上述原因,考慮將差分運算與方差算法相結合,實現對觀測數據穩定性的量化評價。具體計算步驟為:①提取當日觀測數據(日值提取兩周內觀測數據),去除突跳點,并對臺階異常進行去臺階處理;②對觀測數據進行一階前向差分運算,形成差分序列;③計算差分序列的方差值,并以此結果作為當日觀測數據的穩定性評價標準。
以2015年5月漢中地震臺地磁數據水平分量分析為例,按照以上步驟進行量化評價,計算步驟與結果見圖3。從圖3中差分序列方差圖可見,除6日、13日、18日量化評價結果超過1,其他時間均在0—1范圍內,由此可見,漢中臺5月地磁水平分量觀測數據整體較為平穩,質量良好。

圖3 漢中臺地磁記錄水平分量數據質量分析結果(a)原始觀測數據;(b)差分序列;(c)差分序列方差Fig.3 Data quality analysis of the horizontal component of the magnetic change at Hanzhong Seismic Station
3.1 數據庫及數據服務現狀
依據地震前兆工作流程,地震前兆觀測數據每天從各臺站統一匯集至省地震局臺網中心數據庫。為保障數據安全,在省地震局信息服務部門另外搭建一套數據庫系統,用于數據服務系統底層數據支持。新建數據庫為Oracle 10g RAC,包含多個表空間,其中一個表空間與地震臺網前兆數據庫結構內容同步,另有一個表空間用于存儲數據服務系統需要的基礎信息表以及對原始觀測數據計算加工的結果存儲表。
現行數據服務系統由陜西省地震局技術人員研發,基于GIS界面,提供地震前兆、測震等類別的數據服務。對于地震前兆觀測,提供前兆臺站相關信息、圖片的查詢與下載,前兆數據的查詢、曲線展示、數據下載等服務。
3.2 數據表設計
為實現地震前兆數據每日異常檢查與穩定性評價,在提供數據服務基礎信息表的表空間中,新增3類表格,分別用于地震前兆數據概覽、數據異常記錄、數據完整率及穩定性評價結果記錄。
(1)數據概覽表(表1)。設計程序對前兆數據庫表進行掃描,統計觀測數據的起止時間、建設時期、運行狀態等信息,數據每日更新。通過該表,呈現地震前兆觀測數據概況,并以此表為基礎,通過運行狀態列,獲取每天需檢索并進行異常及穩定性判斷的數據內容。

表1 前兆數據概覽Table 1 Precursor data overview
(2)前兆異常記錄表。檢索數據概覽表中運行狀態列為“運行”的所有數據條目,按照上文所述方法進行連續性、突跳、臺階檢測,存在某類異常,則更新此表(表2)。

表2 數據異常記錄Table 2 Abnormal data record
(3)數據質量分析結果表。檢索運行數據條目,計算每日數據完整率、穩定性方差,對于存在突跳或臺階的觀測項,記錄突跳臺階的發生位置。此類數據表遵循前兆“十五”數據庫總體建設結構(周克昌等,2010),每一類測項為一張表,數據每天更新(表3)。

表3 數據質量分析結果Table 3 Data quality analysis results
3.3 評價結果服務方式
數據服務系統在原有服務內容上,新增質量分析內容,通過調取數據庫中關于觀測數據質量分析結果的表,對各臺站、測項每天的觀測質量情況予以報告,對穩定性變化以曲線形式展示(彭愿等,2012)。如:2015年6月乾陵地震臺觀測數據集質量分析曲線見圖4,圖中清晰可見該臺站地磁變化記錄總強度質量情況。

圖4 乾陵臺2015年6月地磁變化記錄總強度觀測數據及質量分析結果曲線Fig.4 Curve of observation data and quality analysis result of total intensity component of geomagnetic record at Qianling Seismic Station in June, 2015
地震前兆觀測數據由于觀測類型多、數據量大,變化趨勢多樣,難以有統一的檢測判定方法。本文的研究拋開了地震前兆數據的地球物理特性,從數據自身出發,提出對各類觀測手段均適用的異常檢測及穩定性評價方法。經實際測試,能夠有效得出數據連續性及穩定性的量化評價結果,并實現對突跳、臺階等異常的檢測,為研究人員提供基礎依據,為地震臺站數據產出質量管理提供支撐與參考。
本文提到的突跳、臺階檢測方法,涉及動態參數設定,該參數值取值大小直接影響檢測結果。應根據實際需求進行參數值選擇,較大參數值檢測變化幅度較為明顯的異常,較小參數值檢測變化細微的異常。建議在進行地震觀測數據質量評價與干擾去除時,選擇較大參數值,盡量保留數據原始形態,以供地震分析預報人員使用。
參考文獻
成萬里,余尚江,盧亞. 地震監測時間序列異常值檢測策略[J].數字技術與應用,2014,(9):40-41.
彭愿,吳阿丹,李勝樂.中國地震前兆臺網觀測曲線動態展示[J].大地測量與地球動力學,2012,32(B08):49-52.
盛驟,謝式千,潘承毅. 概率論與數理統計[M].北京:高等教育出版社,2008.
王春,周浩,劉長祺,等.基于Oracle 10G省級地震前兆數據庫數據完整率統計[J].地震地磁觀測與研究,2014,35(5):282-287.
王建國,崔曉峰,陳華然,等.前兆觀測數據監視及異常自動識別軟件系統[J].地震研究,2007,30(1):83-87.
張聰聰,王秀英.前兆觀測異常數據檢測方法研究[J].震災防御技術,2014,9(B10):615-621.
張興國,王子影,李盛樂,等. 地震前兆儀器實時數據動態與異常報警[J].地震地磁觀測與研究,2010,(6):45-50.
張昱,劉小鳳,邵輝成,等. 甘肅“十五”數字化水位觀測資料分析及地震前兆監測效能評估[J].地震研究,2010,33(4):281-287.
周克昌,蔣春花,紀壽文,等.地震前兆數據庫系統設計[J].地震,2010,(2):143-151.
Study on the quantitative evaluation of continuity and stability of earthquake precursor data
Chang Jun1),Qiao Bo2)and Zhao Xi1)
1) Earthquake Administration of Shaanxi Province,Xi’an 710068,China 2) Baoji Seismic Station,Shaanxi Province 721008,China
Abstract
In consideration of the situation that a massive increase in the amount of data caused by the improvement of the sampling rate of the precursor instrument, based on the daily data collection of all the precursor observation stations in Shaanxi Province, the study on the quality quantitative analysis algorithm is carried out from two aspects: continuity and stability. Through the designed program, the anomalies of the observation data are automatic detected and the complete rate is calculated. Finally, the stability evaluation results of each item of each station are given in the condition of removing interference data. All results are saved in the database in which tables are newly added and designed according the standard format of precursor database. In order to provide the basis for data sharing services, both information support for the dynamic management of the station and technical exploration for other related observation data are provided.
Key words:precursor data,continuity,stability,quantitative evaluation
doi:10. 3969/j. issn. 1003-3246. 2016. 01. 021
基金項目:陜西省地震局啟航與創新基金(201310)資助
作者簡介:常俊(1983—),女,工程師,從事前兆數據整理與數據庫建設維護等工作。E-mail:cjjy1983@163.com
本文收到日期:2015-07-09