劉春國,余 丹,陶志剛,樊俊屹
(中國地震臺網中心,北京 100045)
氡是目前國際上普遍認可的七大地震前兆之一。長期的觀測結果表明氡存在顯著的震前異常變化。2008年5月12日發生的汶川M8.0地震引起了中國大陸多個井泉的氡濃度出現脈沖式、臺階式的異常變化,氡的震后效應才開始引起人們的關注和研究[1-2]。
殿溝泉位于甘肅武都縣城西約3 km處的殿溝村,距汶川地震8.0級震中302 km。泉水出露于NEE向的斷層破碎帶上志留系的灰巖中,屬于裂隙巖溶上升泉。水溫年變化范圍為17~18 ℃,流量為0.7~1.4 L/s。自2001年3月27日開始該泉采用SD-3A測氡儀,開始了連續自動觀測氣氡濃度,其采樣率為1次/h。氡濃度年動態為夏高冬低型,汶川地震氣氡同震效應明顯,同時流量變化很大[3-4]。汶川地震后經常出現成簇高頻震蕩異常變化,經現場檢查與臺站調研,觀測系統運行正常,周邊觀測環境無明顯變化,儀器觀測的氣氡濃度異常變化真實可信。
汶川地震發震斷層為NE向龍門山斷裂帶,與殿溝泉構造上同屬于我國南北帶地質構造中段。汶川地震引發的數以萬計的余震空間展布尺度大,殿溝泉正好位于汶川地震余震分布的東北末端。殿溝泉氡出現的高頻震蕩異常出現的密集時段正好是汶川地震余震密集發生時段。
殿溝泉氡異常是否因汶川地震余震引起?泉點氣氡對不同區域的地震活動響應是否存在差異性?為此,我們擬采用數據挖掘方法開展殿溝泉氡異常與地震活動統計關系研究。
數據挖掘技術已廣泛應用在工業、農業、商業、醫學、金融、服務及氣象等多個領域,而在地震監測預報領域尚處于起步階段,主要研究集中在地震目錄及地震活動性等方面,而用于前兆異常研究尚未見報道,難點在于地震監測數據為高維時間序列,其預處理方法是數據挖掘的關鍵技術。
研究思路是:首先對氡觀測數據和地震目錄數據進行預處理。預處理內容包括數據的清洗、數據轉換與分箱處理、異常特征值的提取、地震目錄聚類與地震空間參數的獲取等。然后對異常特征值、地震震級、地震空間參數等集成、統計分析研究異常與地震活動分區的關系。
殿溝泉氣氡數據和地震目錄數據均來自于地震科學數據共享網站(https://data.earthquake.cn)。時間從2008年1月1日至2010年12月30日。殿溝泉氣氡為小時值時間序列數據,共計26 304個數據。本文采用中國大陸地震速報地震目錄,共計116 263條記錄(含汶川地震余震)。
氣氡觀測數據的預處理包括觀測數據清洗和異常特征值的提取。氣氡觀測數據的清洗主要包括錯誤數據剔除和缺數標志的統一。氣氡異常特征值用變量σ3表示,表征氣氡觀測數據是否異常,σ3為標志變量,取值1(異常)和0(無異常)。氣氡異常參數σ3提取方法如下:

圖9:王小溪,張弛.《喜讀
氣氡觀測時間序列與殘差序列曲線如圖1所示。

圖1 氣氡小時值觀測序列與殘差序列對比曲線Fig.1 Comparison between curves of radon observation series and residual series
地震目錄預處理包括地震目錄的篩選、震級的正規化和地震空間參數提取。
(1)地震目錄篩選
根據地震能量的衰減以及氣氡濃度對地震響應的經驗范圍,按3級以下地震影響范圍50 km以內,3.0~3.9級影響范圍100 km內,4.0~4.9級影響范圍300 km內,5.0~5.9級影響范圍600 km內,6.0~6.9級影響范圍1 000 km內,大于7級為全國范圍內,選取2008年1月1日至2010年12月30日期間可能與殿溝泉氣氡變化相關的地震目錄1 124條。
(2)震級與震源深度處理
按照表1,對選取的地震目錄按震級劃分為9個區段,分別投射到整數0、1、2、3、4、5、6、7、8,并把這個整數稱為類震級。類似地,對地震深度也進行了處理,劃分4個區段分別投射到整數1、2、3、4,把這個整數稱為類深度。

表1 類震級與地震震級、類深度與地震深度Table 1 Regular magnitud as well as earthquake magnitude and regular depth as well as earthquake depth
(3)地震空間參數提取
考慮到地震呈現條帶狀分布和沿地震斷裂帶分布的特點,地震空間分布參數沒有采取將整個地震分布區域劃分為若干區域并編號的方式來提取[5],而是采用K-平均聚類方法(K-Means),對1 224個地震目錄樣本數據的地震經度、緯度進行聚類。地震空間參數即為地震所在區域的聚類編號。
K-平均聚類算法:首先隨機地選擇k個對象,每個對象初始代表了一個簇的平均值或中心。對剩余的每個對象根據其與各個簇中心的距離,將被賦給最近的簇,然后重新計算每個簇的平均值。這個過程不斷重復,直至準則函數收斂[6]。K-平均聚類算法的準則函數定義為:
(1)
式中:x是空間中的點,表示給定的數據對象;xi是簇Ci的平均值。這個準則可以保證生成的簇盡可能的緊湊和獨立。
第一次聚類結果分出10個聚類區域。除聚類J1區和J7區之外,其他聚類區域地震個數較少,均小于5個,遠離研究泉點區域。J1區緊鄰研究泉點,包含的地震最多,又是本次研究的重點區域,對該區域進行第二次聚類,又分出J1-1、J1-2、J1-3三個聚類區域。兩次聚類分區結果如表2所列,可見聚類分區基本與構造分區吻合,反映了不同構造單元地震活動的叢集性特征。

表2 地震聚類分區結果一覽表Table 2 The clustering results of earthquakes in the study area
特別是地震數目較多的J7、J1-1、J1-2和J1-3區,這也是汶川地震及其余震分布密集區域,聚類分區結果與依據長度約60 km的余震稀疏段為標志劃分的基本段落一致[7]。J7與J1(J1-2)的分區界線在北川—江油一線,而這正好是龍門山斷裂中段與北段的分界線,也是第四紀活動強弱的分界線[8-9],J1-3與J1-1分界正好是龍門山與西秦嶺構造單元的分界。泉點緊鄰區域聚類分區地震分布如圖2所示。

圖2 泉點緊鄰區域分區地震分布圖Fig.2 Distribution of earthquakes in the surrounding areas of Diangou spring
經過預處理的氣氡觀測數據和地震目錄對比分析發現,σ3=1的時段均出現有地震,而出現地震,氣氡σ3=1并不一定等于1。以地震目錄為基準,將地震目錄與氣氡異常信息集成作為數據挖掘集。數據集包括類震級、類深度、地震空間參數(聚類區域編號)、氣氡異常指標σ3。
采用回歸、主成份分析法作初步分析發現,氣氡異常與周邊地震三要素的關系不是一種簡單的線性關系,也不能用一種顯式的關系式來表達。本文選用貝葉斯網絡模型(Bayesian Belief Networks,BBN)從統計概率的角度進行分析。
采用Clementinel2.0軟件進行統計分析。貝葉斯網絡模型共設置3個屬性變量(類震級、類深度、聚類區類別)作為輸入節點,1個標志變量(氣氡異常指標σ3)作為輸出節點。采用TAN貝葉斯網絡模型,參數學習方法采用最大似然法。
統計分析結果顯示,氣氡顯著異常與震級、地震發生的區域和震源深度均有關系,引起殿溝泉氣氡數據出現顯著性異常的重要因素是地震所在的特定構造區域,其次是地震震級和地震深度。
不同聚類區域的概率分布如表3所列。聚類區域J2、J3、J5、J6、J9及J10區發生的地震,殿溝泉氣氡均未出現顯著異常;聚類區域J4和J8區地震少,均有1次7級以上地震,對應這些大震各出現1次顯著異常。J1和J7區區域發生的地震,殿溝泉氣氡出現的異常次數最多(表3),其中以J7區最多,其次為J1-3、J1-2區。當地震震級小于5.5級時,氣氡異常與否的概率基本上相當的,而當震級大于5.5級以后,氣氡異常的概率明顯比無異常概率要大。

表3 不同聚類區域的概率分布表Table 3 Probability distribution table of different clustering zones
不同的聚類區域引起氡濃度異常的地震的能量是否存在明顯差異?我們又計算了考慮地震震級(M)和泉與震中距離(r)的地震能量密度(e)。其計算公式[10]為:
lg(e)=(0.48*M-lg(r)-1.4)/0.33
(2)
以發震時間為橫軸,分別繪制J7、J1-1、J1-2、J1-3地震能量密度散點圖(圖3),用顏色標識氡濃度異常與否。從圖3可以看出汶川地震余震一直延續到2010年12月,其中在大震后一年內尤為密集。引起氡異常的地震集中分布在大震及震后3個月內。為了能夠看到密集時段引起氡異常的地震情況,又以地震序號為橫軸,分別繪制了J7、J1-1、J1-2、J1-3區地震能量密度散點圖(圖4)。從圖4可以清晰地看到J7和J1-3區對應氡異常的地震能量密度較小,約10-6J/m3,而J2區明顯偏高,約為10-5J/m3。

圖3 J7、J1-1、J1-2、J1-3聚類區域發震時間與地震能量密度的散點圖Fig.3 Scatter plot of occurrence time and seismic energy density in clustering areas J7,J1-1,J1-2 and J1-3

圖4 J7、J1-1、J1-2、J1-3聚類區域發震序號與地震能量密度的散點圖Fig.4 Scatter plot of seismic occurrence number and seismic energy density in clustering areas J7,J1-1,J1-2 and J1-3
本文引入聚類、貝葉斯網絡模型等數據挖掘方法,對汶川地震后殿溝泉氡出現異常與周邊地震的發震時間、震級與構造位置的統計關系進行了研究。獲得了如下認識:
(1)2008—2010年殿溝泉氣氡的多次異常顯著變化是由泉點區周邊地區地震活動引起,主要是龍門山斷裂中段(汶川地震主震區)和北段(青川斷裂)汶川地震及其余震活動引起。當地震震級大于5.5級,氣氡出現異常的概率明顯增大。
(2)氡值異常受地震所在構造單元的影響較為顯著,其次是地震震級、地震深度。龍門山斷裂中段和北段地震活動更易引起殿溝泉氣氡的異常。
(3)氣氡的地震響應異常機理研究目前還處于探索階段。考慮到氡異常源在地下水中的遷移遵循水動力彌散機制[11-12],氣氡地震響應異常形成可能是一種水動力學機制[13-15],與地震瞬時流量變化有關。
本項研究結果有助于了解泉點氣氡對周邊地震響應的差異性特征,對未來殿溝泉氣氡異常的判斷與分析預測有參考意義。本項研究是數據挖掘方法應用于前兆異常分析研究的一次嘗試,其數據處理方法及流程具有借鑒意義。此外,利用聚類開展的地震分區結果令人滿意,為地震活動分區提供了一種新的思路。