衛(wèi)定軍,羅國富,司學(xué)蕓,李國斌,李 英
(寧夏回族自治區(qū)地震局,寧夏銀川750001)
寧夏位于南北地震帶北段,地質(zhì)構(gòu)造復(fù)雜,境內(nèi)存在一系列規(guī)模較大的活動斷裂(楊明芝等,2007)。歷史上曾發(fā)生多次強烈地震,如1739年銀川—平羅8級地震和1920年海原8.5級地震。近年來,隨著地震監(jiān)測臺網(wǎng)的建設(shè),監(jiān)測資料日益豐富,各種地震前兆異常越來越多,這些異常與未來地震的關(guān)系如何,成為分析預(yù)報人員研究的重點。前兆異常與地震之間的關(guān)系具有較強的不確定性和不可重復(fù)性,一些異常出現(xiàn)后,并不一定發(fā)生較強地震。因此,地震前兆異常與未來地震之間具有較強的非線性關(guān)系,很難通過某種解析表達(dá)式進行表達(dá)。這就需要綜合考量各種地震前兆異常信息,運用統(tǒng)計學(xué)、物理學(xué)和系統(tǒng)學(xué)的方法進行地震前兆綜合預(yù)測,以此來判斷地震前兆異常與未來地震之間的關(guān)系(梅世蓉等,1993)。
近年來,一種具有高度自適應(yīng)能力的非線性動力系統(tǒng)——支持向量機被引入地震綜合預(yù)測研究中,該方法適用于小樣本事件,能夠很好地建立起輸入與輸出之間的非線性不確定復(fù)雜關(guān)系。王煒等(2005,2006a,b)首先使用該方法,對我國大陸強震活動的時間序列與全球的強震活動、太陽黑子活動之間的關(guān)系等進行了研究;蔣淳等(2006)使用該方法在地震綜合預(yù)測方面進行了有益的探索;李志雄等(2007a,b)應(yīng)用該方法對中國西南地區(qū)、華北地區(qū)年度地震活動強度進行了預(yù)測;武安緒等(2008)利用該方法和中國大陸中強地震前兆異常建立了中國大陸中強地震前兆綜合預(yù)測模型,該模型的內(nèi)符檢驗預(yù)測結(jié)果與實際震例的地震震級基本一致,取得了良好的應(yīng)用效果。本文在總結(jié)20世紀(jì)70年代以來寧夏及周邊地區(qū)發(fā)生的一系列中強地震震例資料的基礎(chǔ)上,運用支持向量機回歸算法,以寧夏及鄰區(qū)實際發(fā)生的震例為樣本,建立起適用于寧夏及鄰區(qū)的各類地震前兆異常與地震震級之間的非線性映射關(guān)系,形成地震前兆綜合預(yù)測模型,研究寧夏及鄰區(qū)地震前兆異常與地震震級之間的關(guān)系,以期在寧夏及周邊地區(qū)未來震情研判中發(fā)揮作用。
支持向量機(SupportVectorMachines,SVM)是由Vapnik于1995年在統(tǒng)計學(xué)理論的基礎(chǔ)上首次提出的一種新學(xué)習(xí)算法(Vladimir,2000),它建立在統(tǒng)計學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險最小原理的基礎(chǔ)上,根據(jù)有限的樣本信息在模型的復(fù)雜性(即對特定訓(xùn)練樣本的學(xué)習(xí)精度)和學(xué)習(xí)能力(即無錯誤地識別任意樣本的能力)之間尋求最佳折衷,以求獲得最好的推廣能力。支持向量機的基本思想是基于Mercer核展開定理,通過非線性映射φ把樣本空間映射到一個高維乃至于無窮維的特征空間(Hilbert空間),使得在特征空間中可以應(yīng)用線性學(xué)習(xí)機的方法解決樣本空間中的高度非線性等問題(Nello,John,2004)。
設(shè)樣本為(x1,y1),…,(xk,yk)∈Rn× R的k維向量,待擬合函數(shù)為f(x)=w·φ(x)+b。支持向量機通過在約束條件yi-(w·φ(xi)+b)≤ε+ξi下極小化函數(shù)

來確定回歸函數(shù)。式(1)中第1項是使回歸函數(shù)更為平坦,從而提高泛化能力,第2項則為減少誤差,常數(shù)C>0控制對超出誤差ε的樣本的懲罰程度。ξ和ξ*是松弛因子。ε是大于零的常數(shù),f(xi)與yi的差小于ε時不計入誤差,大于ε時誤差計為對于非線性擬合,首先通過非線性變換φ(x)將輸入空間映射成高維的特征空間,然后在高維的特征空間中進行線性逼近,從而取得在原空間非線性回歸的效果。此時待求擬合函數(shù)可表示為

其中:αi、為拉格朗日乘子,且(αi-)不為零,k(xi,xj)=φ(xi)·φ(xj)。支持向量機理論只考慮高維特征空間的點積運算k(xi,xj)=φ(xi)·φ(xj),而不直接使用函數(shù)φ,從而巧妙地解決了因φ未知w而無法表達(dá)的問題,稱k(xi,xj)為核函數(shù)。已經(jīng)證明,只要滿足Mercer條件的對稱函數(shù)即可作為核函數(shù),常用的核函數(shù)有
(1)多項式核函數(shù) k(xi,xj)=(xi·xj+c)d,c> 0,d=1,2,…;
(2)徑向基(RBF)核函數(shù) k(xi,xj)=exp
(3)Sigmoid 核函數(shù) k(xi,xj)=tanh[b(xi·xj)+c];
其中RBF核函數(shù)因其優(yōu)秀的局部逼近特性在SVM中應(yīng)用最為廣泛。利用現(xiàn)有的優(yōu)化軟件包可以很容易的實現(xiàn)上述算法。
20世紀(jì)70年代以來寧夏及鄰區(qū)發(fā)生20多次5級以上地震,積累了較豐富的中強地震資料,這些地震發(fā)生前均出現(xiàn)過一定數(shù)量的前兆異常,充分利用這些資料對今后的地震預(yù)測工作具有重要的參考價值。在地震預(yù)報三要素中,震級的預(yù)測是重要的預(yù)測量之一,地震前兆異常的持續(xù)時間和種類與未來地震震級存在一定關(guān)系。本文的基本思路為在總結(jié)寧夏及鄰區(qū)中強地震震例資料的基礎(chǔ)上,應(yīng)用支持向量機方法,探索寧夏及鄰區(qū)地震前兆異常的異常時段與中強地震震級之間的關(guān)系,形成多種地震前兆組合的綜合預(yù)測模型,為未來寧夏及鄰區(qū)震情判斷提供判據(jù)。
本文以中國震例(張肇誠等,1988,1990a,b,1999,2000;陳棋福等,2002,2003)和寧夏及鄰區(qū)中強以上地震預(yù)測指標(biāo)和震后趨勢判斷①寧夏回族自治區(qū)地震局.2007.寧夏及鄰區(qū)中強以上地震預(yù)測指標(biāo)和震后趨勢判斷.的研究成果為基礎(chǔ),對1970年以來寧夏及鄰區(qū)發(fā)生的中強地震進行了總結(jié),系統(tǒng)整理了這些地震前寧夏存在的地震前兆異常項目(表1)。由表1可以看出,多數(shù)地震都出現(xiàn)過測震學(xué)和前兆觀測異常,只有1970年12月3日寧夏西吉5.5級、1971年6月28日寧夏吳忠5.1級地震前僅存在測震學(xué)異常,其原因為該段時間寧夏境內(nèi)前兆觀測手段偏少。對于寧夏鄰區(qū)發(fā)生的中強地震,有部分地震前僅出現(xiàn)過前兆觀測異常,如1984年1月6日甘肅武威5.3級、1987年1月8日甘肅迭部5.9級和1995年7月22日甘肅永登5.8級地震。需要指出的是,1988年1月4日寧夏靈武5.5級地震和1988年1月10日寧夏靈武5.0級地震前后僅隔6天,在整理時將它們作為一次地震事件。1998年7月29日海原4.9級地震前,寧夏存在多項測震學(xué)及前兆觀測異常,也將其進行了統(tǒng)計(研究時段期間寧夏境內(nèi)僅發(fā)生過這一次4.9級地震)。

表1 1970年以來寧夏及鄰區(qū)中強地震及震前寧夏存在的異常項目Tab.1 The moderate and strong earthquakes occurred in Ningxia and its adjacent areas since 1970 and precursory anomalies of Ningxia before these earthquakes
本文主要研究寧夏地震前兆異常量與可能發(fā)生的地震震級之間的關(guān)系,而影響震級的因素有很多種。在表1中震例總結(jié)的基礎(chǔ)上,統(tǒng)計了在各次震例中出現(xiàn)次數(shù)相對較多的異常項目,并借鑒王煒等(1999)的研究,選擇了地震條帶、地震空區(qū)、應(yīng)變釋放、地震頻次、b值、地震學(xué)參數(shù)、短水準(zhǔn)、地傾斜、地電、水化學(xué)、水位、重力、地磁13個異常項目作為主要影響震級的因素量。需要說明的是,本文將η值、b值、Mf值、D值、GL值、Rm值等測震學(xué)參數(shù)統(tǒng)一歸類為地震學(xué)參數(shù),而將水氡、氣氡、CO2、He、Cl-、CH4等地下水化學(xué)參量統(tǒng)一歸類為水化學(xué)。
從表1整理的23個震例中篩選了21個,1984年1月6日甘肅武威5.4級和1987年1月8日甘肅迭部5.9級地震寧夏境內(nèi)僅各出現(xiàn)一項地震前兆異常,異常數(shù)量偏少,故而剔除這2次震例。對篩選的21個震例統(tǒng)計上述13項異常項目的持續(xù)時間,將其作為SVM的輸入?yún)?shù),實發(fā)震級作為輸出參數(shù),從而構(gòu)成SVM的樣本集。對于前兆觀測項目,一次地震前可能多個臺站出現(xiàn)異常,因此在統(tǒng)計異常持續(xù)時間時,當(dāng)某項前兆觀測異常有多臺出現(xiàn),取其加權(quán)和為輸入值,即某臺站某項前兆觀測異常的持續(xù)時間與相應(yīng)的權(quán)系數(shù)相乘,然后將所有臺項求和。權(quán)系數(shù)為某臺站某項前兆觀測異常的持續(xù)時間在所有該項前兆觀測異常的持續(xù)時間中所占的比例。采用同樣方法對地震學(xué)參數(shù)和水化學(xué)這兩個綜合的異常指標(biāo)進行處理。由于每個震例出現(xiàn)的異常項目并不相同,因此對于某一震例如果沒有對應(yīng)的異常項目,則該項目的異常持續(xù)時間統(tǒng)計為0。結(jié)果如表2所示,其中地震序號同表1中地震序號一致。

表2 寧夏及鄰區(qū)中強地震震例異常持續(xù)時間統(tǒng)計(單位:月)Tab.2 Duration statistics of anomalies before the moderate and strong earthquakes in Ningxia and its adjacent areas(Unit:Month)

圖 學(xué)習(xí)和測試樣本的回歸預(yù)測結(jié)果Fig.1 Predicted results of learning and test sample
在樣本集確定之后,地震前兆綜合預(yù)測模型的建立主要依賴于相應(yīng)的支持向量機核函數(shù)和常數(shù)C的選擇,它們對預(yù)測結(jié)果的影響很大,它們的合理確定直接影響模型的精度和推廣能力(趙洪波,馮夏庭,2003)。本文通過對各種核函數(shù)的測試,最終選定徑向基RBF函數(shù)為核函數(shù)。對于核函數(shù)參數(shù)σ和常數(shù)C的選取,考慮到人工搜索存在很大的盲目性,不能保證找到的參數(shù)是最優(yōu)參數(shù),本文采用遺傳算法進行參數(shù)尋優(yōu),最終確定了所用模型的參數(shù),分別為σ=0.6,C=2.1,ε=0.01。對于表2中篩選的21個震例樣本,選擇其中地震序號為 1~3、6、8、10、11、13、14、16、18、19、22、23共14個震例作為學(xué)習(xí)樣本,其余地震序號為4、9、12、15、17、20、21的7個震例作為外推預(yù)測樣本,通過得到的模型計算各個震例的預(yù)測值,結(jié)果見圖1。在選擇學(xué)習(xí)樣本時充分考慮了各個震例的輸入屬性及輸出震級的全面性,使得預(yù)測模型進行充分的學(xué)習(xí)。
由圖1可得,若以震級誤差±0.5為限,14個學(xué)習(xí)內(nèi)檢震例樣本的預(yù)測震級均在誤差范圍內(nèi),準(zhǔn)確率達(dá)到了100%;而7個外推預(yù)測震例震級樣本的預(yù)測震級也均在誤差范圍內(nèi),其中最大的預(yù)測震級誤差為0.4,最小的預(yù)測震級誤差為0.1,外推預(yù)測的準(zhǔn)確率也達(dá)到了100%。由此可見,該綜合預(yù)測模型具有較強的學(xué)習(xí)能力,且具有一定的外推泛化能力,可以在實際的地震預(yù)測中發(fā)揮一定作用。
支持向量機核函數(shù)參數(shù)σ和常數(shù)C的選擇是否合理,將直接影響模型的精度和推廣能力,本文在選取最優(yōu)參數(shù)時使用了遺傳算法,該方法能夠避免人工選擇的盲目性。為了檢驗遺傳算法的參數(shù)尋優(yōu)效果,本文使用與武安緒等(2008)相同的資料以及相同的學(xué)習(xí)樣本和檢驗樣本,選用遺傳算法找到的參數(shù)進行支持向量機回歸預(yù)測,獲得了與武安緒等(2008)研究成果相近的結(jié)果(圖2)。因此,使用遺傳算法進行參數(shù)尋優(yōu)在參數(shù)選擇時是可行的。

圖2 中國震例樣本的預(yù)測結(jié)果Fig.2 Predicted results of earthquake sample in China
本文旨在將支持向量機方法應(yīng)用于寧夏及鄰區(qū)的地震綜合預(yù)測研究中,通過建立基于多種地震前兆異常的地震綜合預(yù)測模型,初步研究了支持向量機方法在寧夏地震綜合預(yù)測中的應(yīng)用情況,研究結(jié)果表明利用支持向量機形成的地震綜合預(yù)測模型對寧夏及鄰區(qū)可能發(fā)生的地震震級具有一定的預(yù)測能力。例如,2011年利用該模型預(yù)測寧夏及鄰區(qū)未來可能發(fā)生5.3級左右的地震,2012年11月20日寧夏永寧發(fā)生了4.5級地震,震級差為0.8級。盡管與預(yù)測震級有一定的差距,但是仍然可以看出該模型具有一定的預(yù)測能力,而且該地震發(fā)生后,許多異常仍在持續(xù)發(fā)展,可能預(yù)示著未來有更大震級的地震發(fā)生。
據(jù)不完全統(tǒng)計,目前我國用于地震預(yù)測預(yù)報的測震學(xué)參數(shù)有幾十種,前兆觀測有水化、水位、地電、地磁、電磁波、形變、重力、應(yīng)力等多項指標(biāo)。如何從各種地震活動參數(shù)和前兆手段中選擇出適合于某一區(qū)域的預(yù)測指標(biāo)在實際地震預(yù)測研究中具有重要意義。本文通過震例總結(jié)和支持向量機地震綜合預(yù)測模型研究表明,地震條帶、地震空區(qū)、應(yīng)變釋放、地震頻次、b值、地震學(xué)參數(shù),短水準(zhǔn)、地傾斜、地電、水化學(xué)、水位、重力、地磁等測震學(xué)和前兆觀測異常指標(biāo)在寧夏地震綜合預(yù)測中具有一定的使用價值。
陳棋福,鄭大林,高榮勝.2003.中國震例(1997-1999)[M].北京:地震出版社,136-145.
陳棋福,鄭大林,劉桂萍,等.2002.中國震例(1995-1996)[M].北京:地震出版社,146-164.
蔣淳,魏雪麗,陸遠(yuǎn)忠,等.2006.支持向量機在地震綜合預(yù)測中的初步應(yīng)用[J].中國地震,22(3):303-310.
李志雄,袁錫文,丁軍,等.2007a.中國西南地區(qū)強震預(yù)測的支持向量機方法[J].地震研究,30(2):134-136.
李志雄,曾鋼平,丘學(xué)林,等.2007b.預(yù)測華北地區(qū)年度地震趨勢的支持向量機分類方法[J].華北地震科學(xué),25(3):11-14.
梅世蓉,馮德益,張國民,等.1993.中國地震預(yù)報概論[M].北京:地震出版社,328-427.
王煒,蔣春曦,張軍,等.1999.BP神經(jīng)網(wǎng)絡(luò)在地震綜合預(yù)報中的應(yīng)用[J].地震,19(2):118-126.
王煒,林命週,馬欽忠,等.2006a.支持向量機及其在地震預(yù)報中的應(yīng)用前景[J].西北地震學(xué)報,28(1):78-84.
王煒,劉悅,李國正,等.2005.中國大陸強震時間序列預(yù)測的支持向量機方法[J].地震,25(4):26-32.
王煒,劉悅,李國正,等.2006b.我國大陸強震預(yù)測的支持向量機方法[J].地震學(xué)報,28(1):29 -36.
武安緒,張永仙,張曉東,等.2008.地震前兆綜合預(yù)測支持向量機模型研究[J].地震,28(3):55-60.
楊明芝,馬禾青,廖玉華.2007.寧夏地震活動與研究[M].北京:地震出版社,1-9.
張肇誠,羅蘭格,李海華,等.1988.中國震例(1966-1975)[M].北京:地震出版社,77-97.
張肇誠,羅蘭格,李海華,等.1990a.中國震例(1976-1980)[M].北京:地震出版社,133-145.
張肇誠,羅蘭格,李海華,等.1990b.中國震例(1981-1985)[M].北京:地震出版社,61-76.
張肇誠,鄭大林,徐京華.1999.中國震例(1986-1988)[M].北京:地震出版社,213-224.
張肇誠,鄭大林,徐京華.2000.中國震例(1989-1991)[M].北京:地震出版社,87-93.
趙洪波,馮夏庭.2003.支持向量機函數(shù)擬合在邊坡穩(wěn)定性估計中得應(yīng)用[J].巖石力學(xué)與工程學(xué)報,22(2):241-245.
Nello Cristianini,John Shawe-Taylor.2004.支持向量機導(dǎo)論[M].李國正,王猛,曾華軍,譯.北京:電子工業(yè)出版社,1-162.
Vladimir N Vapnik.2000.統(tǒng)計學(xué)習(xí)理論的本質(zhì)[M].張學(xué)工,譯.北京:清華大學(xué)出版社,1-85.