李永振
(遼寧省地震局,遼寧沈陽 110034)
主成分分析法在遼寧地區(qū)地震預(yù)測中的應(yīng)用①
李永振
(遼寧省地震局,遼寧沈陽 110034)
采用多因子分析的主成分分析法,選擇與地震活動強(qiáng)度有關(guān)的地震頻次N(ML≥3.0)、b值、η值、Mf值、A(b)值和Ac值等6個(gè)參量進(jìn)行分析,實(shí)現(xiàn)對上述參量的有效約簡,得到反映地震強(qiáng)度特征的綜合指標(biāo)W。發(fā)現(xiàn)指標(biāo)W在遼寧海城7.3級、岫巖5.4級地震前出現(xiàn)明顯的異常變化,震后恢復(fù)。表明綜合指標(biāo)W可以較好的反映地震活動的異常特征。
遼寧;地震活動強(qiáng)度參數(shù);主成分分析法;相關(guān)性;貢獻(xiàn)率
Abstract:Using the primary components analysis method,six main parameters for indicating seismicity strenth such as frequency N(ML≥3.0),b value,ηvalue,A(b)value,Mfvalue,Ac-value are selected to analyse.The parameters are simplified effectively and a new synthetic index Wfor indicating seismicity strenth is obtained.It is found that the index Wappeared obvious anomalies before Haicheng MS7.3earthquake in 1975and Xiuyan MS5.4earthquake in Liaoning province,and returned after events.It is shown that the synthetic index Wcan reflect anomalous characterisitic of seiemicity well.
Key words:Liaoning province;Seismicity strenth parameter;Primary components analysis method;Relativity;Contribution rate
當(dāng)今世界各類數(shù)據(jù)量正在以指數(shù)增長。數(shù)據(jù)挖掘[1]就是在數(shù)據(jù)庫中對數(shù)據(jù)進(jìn)行一定的處理,從大量不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含的、事先未知的、但又是潛在有用的信息和知識的過程。在數(shù)據(jù)挖掘中數(shù)據(jù)清洗是一個(gè)重要環(huán)節(jié),包括去噪聲,填補(bǔ)丟失的域,刪除無效數(shù)據(jù),對時(shí)序數(shù)據(jù)的整理和歸并,以及數(shù)據(jù)屬性的約簡等。王煒等[2]就用主成分分析法對地震活動性參數(shù)進(jìn)行了約簡,同時(shí)用該方法在江蘇溧陽6.0級地震中進(jìn)行了應(yīng)用[3]。
主成分分析方法是將描述樣本特征的多個(gè)可能有一定相關(guān)性的指標(biāo)化為少數(shù)幾個(gè)綜合指標(biāo)的一種統(tǒng)計(jì)分析方法,能夠在最大限度地保留原有信息的基礎(chǔ)上對高維變量系統(tǒng)進(jìn)行最佳地綜合與簡化,并能夠客觀地確定各個(gè)指標(biāo)的權(quán)數(shù),避免了主觀隨意性。應(yīng)用主成分分析法可以找出由若干個(gè)指標(biāo)線性組合而成的綜合指標(biāo),即若干個(gè)主成分,同時(shí)彼此之間相互獨(dú)立。
目前在地震活動分析中存在許多預(yù)報(bào)指標(biāo),這類參數(shù)數(shù)量較多,同時(shí)它們之間還可能存在一定的相關(guān)性[4-5]。另外在實(shí)際預(yù)報(bào)中常常出現(xiàn)有些參數(shù)在一些中強(qiáng)以上地震前出現(xiàn)較明顯的異常,而另一些參數(shù)并不出現(xiàn)異常。這些都給實(shí)際預(yù)報(bào)帶來困難。為解決預(yù)報(bào)參數(shù)過多而造成預(yù)報(bào)意見的不一致。本文選用1970年以來遼寧地區(qū)2次5級以上地震前后震中附近地區(qū)的地震資料,選擇與地震活動強(qiáng)度有關(guān)的6個(gè)參量,即3級以上地震的頻次N、b值、η值、A(b)值、Mf值和Ac值進(jìn)行主成分分析,以期得到一個(gè)反映地震強(qiáng)度異常的綜合指標(biāo)。
主成分分析法旨在力保原始數(shù)據(jù)信息丟失最小的情況下,對高維變量空間進(jìn)行降維處理,經(jīng)過線性變換和舍棄部分信息,以少數(shù)的綜合變量取代原有的多維變量。
設(shè)原始變量為x1,x2,…,xp,進(jìn)行主成分分析后得到的主成分(綜合變量)為z1,z2,…,zm(m<p),它們是x1,x2,…,xp的線性組合(m<p)。新變量z1,z2,…,zm構(gòu)成的坐標(biāo)系是在原坐標(biāo)系經(jīng)平移和正交旋轉(zhuǎn)后得到的,稱其空間為m維主超平面。在主超平面上第一主成分z1對應(yīng)于數(shù)據(jù)變異(貢獻(xiàn)率e1)最大的方向,對于z1,z2,…,zm,依次有e2≥,…,≥em。因此,z1是攜帶原始數(shù)據(jù)信息最多的一維變量,而m維主超平面是保留原始數(shù)據(jù)信息最大的m維子空間。
主成分分析法的步驟如下:
(1)為了排除數(shù)量級和量綱不同帶來的影響,首先對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理:

式中,xij為第i個(gè)指標(biāo)第j個(gè)樣本的原始數(shù)據(jù);xi和σi分別為第i個(gè)指標(biāo)的樣本均值和標(biāo)準(zhǔn)差。

(3)根據(jù)特征方程│R-λI│=0,計(jì)算R的特征根λi,并使其從大到小排列:λ1≥λ2≥…≥λp,同時(shí)可得對應(yīng)的特征向量u1,u2,…,up,它們標(biāo)準(zhǔn)正交。u1,u2,…,up稱為主軸。這里I為單位矩陣。
(4)計(jì)算貢獻(xiàn)率

和累計(jì)貢獻(xiàn)率

(5)計(jì)算主成分

(6)一個(gè)m維主超平面究竟以多大的精度來近似代替原始變量系統(tǒng)才能確保盡可能多的原始數(shù)據(jù)信息?這可以通過求累計(jì)貢獻(xiàn)率Em來判斷。一般Em>85%的最小m(m<p),則可得主超平面的維數(shù)m,從而可對m個(gè)主成分進(jìn)行綜合分析。
(7)根據(jù)主成分分析得到的主成分Zi和相應(yīng)的權(quán)值(貢獻(xiàn)率)ei,計(jì)算本文定義的反映地震活動時(shí)、空、強(qiáng)異常特征的綜合指標(biāo)

由于m個(gè)主成分已基本保留了這些預(yù)報(bào)參數(shù)的信息,所以綜合指標(biāo)W包含了這些參數(shù)從不同側(cè)面反映地震活動時(shí)、空、強(qiáng)異常的基本特征。本文選擇了從不同側(cè)面反映地震活動時(shí)、空、強(qiáng)特征的一些參量:地震頻次N(ML≥3.0)、b值、η值、Mf值、A(b)值、Ac值6個(gè)參量進(jìn)行主成分分析。
1975年2月4日遼寧海城發(fā)生MS7.3地震。圖1為地震發(fā)生前后震中周圍300km范圍內(nèi)的一些地震活動性參數(shù)隨時(shí)間變化曲線。除地震頻次N(ML≥3.0)外,其它參數(shù)計(jì)算所選取的起始震級為ML2.0。參數(shù)計(jì)算累計(jì)時(shí)間為1年,滑動步長為1個(gè)月。從圖1可以看到,7.3級地震前這些參數(shù)各有所異,大多參數(shù)在這次地震前的異常變化并不顯著。
表1為通過主成分分析方法得到的上述參量在各主成分中的系數(shù)(特征向量)、特征值與貢獻(xiàn)率。當(dāng)取3個(gè)主成分時(shí)累計(jì)貢獻(xiàn)率已達(dá)到93%;當(dāng)取4個(gè)主成分時(shí)累計(jì)貢獻(xiàn)率已達(dá)到98%。這表明取前3個(gè)主成分已包含了樣本中的絕大部分信息量。由表1可知,主成分1中的A(b)、Mf值系數(shù)較大,是構(gòu)成主成分1的主要參數(shù);主成分2中的地震頻次b值、η值系數(shù)較大,是構(gòu)成主成分2的主要參數(shù);主成分3中的Ac值、N值(ML≥3.0)系數(shù)較大,是構(gòu)成主成分3的主要參數(shù)。
本文取前3個(gè)主成分根據(jù)式(5)計(jì)算地震綜合指標(biāo)W。圖2反映了海城7.3級地震前后震中附近地區(qū)地震活動時(shí)、空、強(qiáng)異常特征的綜合指標(biāo)W隨時(shí)間的變化。可以看到,在1975年海城7.3級地震前0.5年左右時(shí)間海城震中附近地區(qū)W值出現(xiàn)明顯抬升的形態(tài),異常幅度近1.0,震后異常逐漸恢復(fù)到正常范圍內(nèi)波動。

圖1 海震地震前各地震參數(shù)曲線Fig.1 Curves of different seismic activity parameters before Haicheng MS7.3earthquake in 1975.

表1 各參量在各主成分中的系數(shù)(特征向量)、特征與貢獻(xiàn)率

圖2 海城地震前后地震強(qiáng)度綜合指標(biāo)W值的變化Fig.2 Curve of earthquake intensity synthetic index W before and after Haicheng earthquake.
本文選取1970年以來東北地區(qū)(38°~55°N,117°~135°E)小震目錄,考慮到地震孕育過程中的可能影響范圍及東北地區(qū)地震活動實(shí)際情況,對岫巖5.4級地震選取200km左右圓域。除地震頻次N(ML≥3.0)外,其它參數(shù)的計(jì)算選取ML2.0地震,并剔除余震,資料計(jì)算時(shí)間窗為12月,滑動步長為1個(gè)月。
采用與海城7.3級地震震例相同的主成分分析方法,取累計(jì)貢獻(xiàn)率Em>85%的最小m(m<p)確定主成分個(gè)數(shù)m。在此基礎(chǔ)上對m個(gè)主成分使用式(5)進(jìn)行綜合分析,得到反映地震活動時(shí)、空、強(qiáng)異常特征的綜合指標(biāo)W,并計(jì)算其在中強(qiáng)以上地震前后隨時(shí)間變化曲線(圖3)。由圖3可知,W值大體在0以下波動,在中強(qiáng)震發(fā)生前1年左右的中期階段出現(xiàn)明顯的增高異常,異常高值通常超過1.0,這與文獻(xiàn)[6]研究一致。

圖3 岫巖地震前W值異常Fig.3 The Wvalue anomaly before Xuyan earthquake.
以上兩個(gè)震例初步表明,反映地震時(shí)、空、強(qiáng)異常特征的綜合指標(biāo)W在震中附近地區(qū)震前的異常變化明顯,可以較好地反映地震活動異常。
圖4為對與地震活動強(qiáng)度有關(guān)的6個(gè)參量進(jìn)行主成分分析時(shí)得到的3個(gè)公共因子得分隨時(shí)間變化曲線。可以看到圖4中綜合指標(biāo)W值的基本形態(tài)主要由主成分1確定,這是由于主成分1的方差貢獻(xiàn)率最大,達(dá)到58%。主成分1主要反映了異常相對較好的Mf值、A(b)值2個(gè)參數(shù)的信息。其它2個(gè)成分得分各有所異,且異常變化特征不甚顯著,但因?yàn)樗鼈兊呢暙I(xiàn)率較小,因此綜合指標(biāo)W值可以較好地反映出震前的異常變化。由此可以看出,因子分析可以通過研究各參量的相關(guān)矩陣內(nèi)部結(jié)構(gòu),得到各參量的因子載荷和因子貢獻(xiàn)率,將一些包含異常信息較大的參量和因子賦予較大的權(quán)值,從而使得綜合指標(biāo)W值的異常變化明顯。
目前在地震預(yù)測中由于地震活動性參數(shù)較多,指標(biāo)之間有一定的相關(guān)性,因而所得的統(tǒng)計(jì)數(shù)據(jù)反映的信息在一定程度上有重疊;而且無論在正常情況還是異常情況下各個(gè)參數(shù)的形態(tài)變化各不相同[7-8]。這不但給分析預(yù)測工作帶來不必要的麻煩,還可能存在主觀片面性,不能很好地抓住事物的主要矛盾。而主成分分析有可能改善這一問題。主成分分析法可在力保原始數(shù)據(jù)信息丟失最少情況下,對高維變量空間進(jìn)行降維處理,經(jīng)過線性變換和舍棄部分信息,以少數(shù)的綜合變量取代原有的多維變量。本文用主成分分析得到綜合反映地震活動綜合特征的W值,包含了以前描述地震活動強(qiáng)度各參數(shù)的絕大部分信息,在遼寧2次中強(qiáng)地震前出現(xiàn)明顯的異常變化,表明綜合指標(biāo)W可以較好地反映地震活動異常特征,在地震預(yù)報(bào)中具有良好的應(yīng)用前景。

圖4 主成分1、2、3分值曲線Fig.4 The value curves of the primary component 1,2and 3.
[1] 邵峰晶,于忠清.數(shù)據(jù)挖掘原理與算法[M].北京:中國水利水電出版社,2003:68-88.
[2] 王煒.主成分分析及地震活動參數(shù)的約簡[J].地震學(xué)報(bào),2005,27(5):524-531.
[3] 王煒.主成分分析法在地震預(yù)測中的應(yīng)用研究[J].中國地震,2005,21(3):410-416.
[4] 陸遠(yuǎn)忠,閻利軍,郭若眉.用于中短期地震預(yù)報(bào)的一些地震活動性參量相關(guān)性討論[J].地震,1999,19(1):11-18.
[5] 韓渭賓.地震活動性參數(shù)分類及其相關(guān)性初步研究[J].四川地震,2003,(3):1-5.
[6] 李永振.應(yīng)用RTL算法對岫巖MS5.4地震的回顧性預(yù)測[J].東北地震研究,2008,24(1):39-43.
[7] 王筱榮,李志海.新疆中強(qiáng)震預(yù)報(bào)的探討[J].西北地震學(xué)報(bào),2008,30(2):132-138.
[8] 李亞榮,何新社,陳軍.甘肅及鄰近地區(qū)中強(qiáng)地震前弱震空區(qū)的時(shí)空參數(shù)研究[J].西北地震學(xué)報(bào),2008,30(3):293-297.
[9] 李永振,曹鳳娟.主成分分析法在林甸MS5.1地震回顧性預(yù)測中的應(yīng)用[J].東北地震研究,2008,24(2):29-34.
Application of Primary Components Analysis Method to Earthquake Prediction in Liaoning Province
LI Yong-zhen
(Earthquake Administration of Liaoning Province,Liaoning Shenyang 110034,China)
P315.51
A
1000-0844(2011)01-0076-04
2009-10-23
李永振(1976-),男(漢族),遼寧沈陽人,工程師,主要從事從事強(qiáng)震監(jiān)測工作.