摘要:文章旨在研究地震預測問題,討論了全球16個強震活動區的強震活動次數與其后一年我國強震發生與否的關系。首先,由模糊聚類和變量規格化的思想,結合前15年的數據求出全球16個區發生強震次數與中國后一年發生強震的相關系數矩陣,通過對前15年16個區發生強震次數加權求和,得到各地的影響值,取其中的最小值作為影響值的下限值,建立預測預測中國后一年是否發生強震模型;其次,從數據中篩選出云南地區每月最高震級組成固定時間間隔的地震序列,利用氣象學預測中的均生函數方法生成一列相應的時間序列,經周期性外延、殘差值逐步擬合得到對當地地震最大震級的預測模型。
關鍵詞:地震預測;相關系數;加權和;均生函數;時間序列
中圖分類號:P31文獻標識碼:A文章編號:1009-3044(2008)32-1252-05
The Model of Earthquake Prediction
GONG TANG Xiao-heng1, LIN Jian-ming2, SU Jing3, ZHOU Jie2
(1.School of Computer Science, Sichuan University,Chengdu 610065,China;2.College of Mathematics, Sichuan University,Chengdu 610065,China;3.School of Electrical Engineering and Information,Sichuan University,Chengdu 610065,China)
Abstract: This paper was mainly about the earthquake prediction on the basis of the relationship between the frequency of strong earthquakes in 16 seismically active zones all over the world and the probability of strong earthquakes which may happen in China the next year. Firstly, according to fuzzy clustering and variable normalizing, we obtained a relevant coefficient matrix about the relationship between the frequency of strong earthquakes in 16 seismically active zones all over the world and the probability of strong earthquakes which may happen in China the next year with data of the previous 15 years. Through weighted summation of the frequency of strong earthquakes in 16 seismically active zones all over the world during the previous 15 years, we obtained the “influencing value” of each zone and set the minimum value as the lower limit value, and then established the prediction model of strong earthquakes in China the next year. Secondly, we screened out the highest earthquake magnitudes each month in Yunnan to compose an earthquake sequence. Next we applied to mean generating function from Meteorological prediction to generate a time sequence. Thus we established the prediction model of the highest earthquake magnitudes in Yunnan by using cyclic extension and adjusted residual gradual fitting.
Key words: earthquake prediction; relevant coefficient; weighted summation; mean generating function; time sequence
1 問題的提出
1.1 基本情況
地震是地下巖層受應力作用錯動破裂造成的地面震動,是一種破壞性極強的自然災害,是自然災害之首惡。地震可以在很短的時間內使一座城市夷為平地,使無數的家庭支離破碎。為了有效的減小地震帶來的損失,對地震進行預測則很重要。
我們從以往已經發生過的地震記錄中尋求規律,以達到對未來時間地震發生情況的預測。全球強震帶主要集中分布在環太平洋地震帶和歐亞地震帶,而且身處其中的不同的地區間地震發生情況是互相關聯的。我國亦處在其中,因此我國的地震活動和全球的地震活動是密切相關的,尤其是和板塊邊界的強震活動更是如此。
1.2 相關信息
參考文獻[1]:國家地震數據科學共享中心的中國地震臺網數據目錄中給出的全球從1985年1月1日到2006年8月25日的地震數據。
1.3 需解決的問題
對地震預測建立數學模型,具體要求如下:
1) 對參考文獻[1]給出的數據,找出16個強震活動區的強震活動次數與其后一年我國強震發生與否的關系,用它預測2007年我國是否會有強震發生。
2) 利用參考文獻[1]給出的數據,及我國地震帶的分布,在我國地震活動較強的某個區域內(本文選擇云南作為研究對象),做進一步的短臨預測,預測在此區域內,2006年9月、10月發震的最高震級。
2 模型假設與符號說明
2.1 模型假設
1) 對震級的計算有不同的度量,給出的震級數據,假設已經統一成面波震級;
2) 假設問題中對全球16個強震活動區的劃分及我們對地區歸類分區準確無誤;
3) 假設國家地震數據科學共享中心所提供的地震數據真實準確;
4) 假設強震指大于或等于6.0級的地震;
5) 假設問題1數據處理中全球16個強震活動區前15年是從1986年開始記錄,而中國前15年是從1987年開始記錄;
6) 假設問題2中震級小于或等于2.0的地震不予考慮;
7) 假設處理問題2中云南地區每月最高震級時將其它數據作為余震處理;
8) 對附件2數據處理時:
a) 假設緯度以N為基準,即標為\"N\"的數據,去掉\"N\";標為\"S\"的數據,去掉\"S\",并添上負號\"-\"。例如:23.22N 23.22,23.22S -23.22;
b) 假設經度以E為基準,即標為\"E\"的數據,去掉\"E\";標為\"W\"的數據,去掉\"W\",并用360減去該數值。例如:101.3E 101.3,101.3W 257.7。
2.2 符號說明
表1為符號說明表。
3 問題分析
3.1 問題1
要找出16個強震活動區的強震活動次數與其后一年中國強震發生與否的關系,并要預測2007年中國是否會有強震發生,而地震活動之間的影響具有高度的非線性性,要求出一個具體的函數關系式有很大的難度,且又因為每個區強震次數對中國強震發生的影響各不相同,故考慮:
1) 求出全球16個區和中國前15年強震次數的規格化系數;
2) 求出全球16個區強震發生次數對中國強震影響的權值,也即對相關系數歸一化后得到的相關度;
3) 利用權值算出16個區強震活動次數的加權和;
4) 取一個下限值作為對中國強震發生與否的度量值;
5) 檢驗運用下限值預測的準確性;
6) 預測中國2007是否發生強震。
3.2 問題2
地震的數據有很強的不穩定性,利用連續函數的方法預測準確性不高,用周期分析是地震預測的主要方法之一,歸納起來可分為2類:一類是對已發生的地震序列進行定性分析,以經驗劃分周期進行外推預測;另一類就是從地震序列本身出發,利用各種數學方法擬合并進行預測。針對上述問題,本項研究借鑒氣象學中用于中長期預測的數學方法,依據地震預測特點,結合一、二兩類方法,先經驗性的劃分周期,然后通過調節周期值減小誤差。
4 模型的建立與求解
4.1 問題1
4.1.1 劃分全球16個強震活動區
根據圖1和參考文獻[1]給出的數據劃分全球16個強地震帶。統計數據如表2。
4.1.2 規格化系數
假設全球16個強震活動區前15年是從1986年開始記錄,而中國前15年是從1987年開始記錄。
中國的x參數定義為:
用數學符號描述為:
4.1.3 相關度
利用自定義的Matlab文件qiuc.m,再調用自定義函數xishu求出C=[0.6739 0.4657 0.6107 0.7533 0.7222 0.8095 0.8013 0.6625 0.6803 0.6430 0.7608 0.6065 0.5938 0.7735 0.6698]
作為第i區發生強震次數與中國后一年發生強震的權值。
4.1.4 加權和
取前15年的數據做研究,用第i區第j年發生強震的次數乘以第i區的相關系數:
前15年16個區的加權強地震次數和記為對應年的地震次數:10.8604 8.8636 10.7887 6.5039 10.5366 8.4613 8.9314 10.52459.8064 13.2414 12.4107 8.5926 8.0791 6.6808 9.5909
4.1.5 下限值
前15年加權和的最小值
用min函數求16區強震次數影響中國后一年次數的下限值-6.5039。
4.1.6 檢驗
假設得出下限值在誤差3%的范圍內有效。
若接下來16區的加權強地震次數和小于該下限值,則預測中國后一年不發生地震。
再以接下來5年的數據做檢測,若用接下來5年的數據得到的16區在j年能影響中國發生強震的強震次數,在誤差允許范圍內比下限值小,則認為后一年中國不發生強震,反之則會發生。
得接下5年的強震加權平均值為:8.5641;6.6224;5.9168;6.3156;8.3036。
在誤差允許的范圍內,會有一年發生錯誤,在接下來的5年內中國實際上每年都有強震發生,故預測的準確率為80%。
4.1.7 預測
由2006年的數據,調用yuce.m可得2006年16區強震的加權平均值為7.3518,大于下限值6.5039。
故可以80%的準確率預報中國在2007年會發生強震。
4.2 問題2
4.2.1 模型建立
利用均生函數的數學方法建模,進行周期性外延對時間序列作出多步外推。擬合時考慮了短臨預測的準確性,將以往的地震預測的雙評分標準csc準則的λ值取為0,直接通過給定方差的閾值調節適當的周期。
1) 用均生函數構造時間序列
設時間序列x(t)={x(1),x(2),…,x(N)},式中:N為擬合樣本量。
其均生函數定義為:
式中:n,L滿足nL≤[N/L]的最大整數,M為不超過[N/2]的最大整數。
均值生成函數是由時間序列按一定的時間間隔計算均值而派生出來的。
取不同的周期(L=1,2,…,M),用均值生成函數循環外推構造延拓序列,即為在一定周期下構造的新序列:
2) 擬合周期的選取
用不同周期的均生函數所構造的序列不同,如何選取合適的周期,使擬合的效果達到最佳是一個關鍵的問題。本文將長期預測的雙評分準則轉為單評分準測,以提高短臨預測的精確度。
a) 雙評分準則CSC(Couple Score Criterion):
雙評分準則CSC是從數量預報評分和趨勢預報評分2個方面來權衡變量的篩選或階數的確定,采用隱式表達,即CSC=S1+S2 ,其中:S1表示數量評分,稱之為精評分;S2表示趨勢評分,即粗評分。雙評分準則旨在使精評分和粗評分之和達到最小。該準則有3種不同的表達式,本文采用第一種,即CSC1準則:
其中:N為樣本量;Qk為平均殘差平方和;Nk為趨勢評分。
如果預報考慮升平降3種趨勢,則趨勢評分定義為:
式中:
U是判定不同趨勢的標準,可根據預報問題憑專業只是確定。λ為調整系數,表示數量預報和趨勢預報的權重。λ=1.0時,二項權重相等;λ>1.0時,趨勢預報占的比重較大,這一點對地震的中長期預報而言是非常重要的。在進行擬合時,取不同的時期,可構造不同的序列,根據雙評分準則,計算其CSC1值。取CSC1值最小的周期作為一級擬合的周期。
b) 單評分準則:
利用地震發生的周期性,為提高短臨預測,不使用中長期的雙評分準則CSC,將雙評分準則的CSC表達式中的λ取為0。同時將累計的范圍設定在L-N之間。取累計殘差的平均值
將其作為為單評分標準,以符合短臨預測的要求。
4.2.1 模型求解與誤差分析
1) 最優周期的選擇
若一時間序列x(t)={x(1),x(2),…,x(N)}存在長度為L的周期,那么由此周期構成的新序列是由x(1),x(2),…,x(L),x(L+1),x(L+2),… x(2L),…加上隨機項構成的。顯然,序列中x(L)與x(L+1),x(L+2),…數據相近,x(2)與x(L+2),… x(2L),…相近。依此類推,不同周期相同序號上的數據之間的方差稱為組內方差,同一周期內數據之間的方差稱為組間方差。這里我們只考慮組內方差,將組內方差的范圍設定在L-N之間。我們將方差的設定為: =2.3
通過調節周期L值使方差的值達到設定的閾值
2) 擬合與數據求解
擬合度定義=1-相對誤差值
選取云南地區每月的最大震級作為觀測數據,取未擬合的6個月的數據作為檢驗數據發現最低擬合度達到:65%,最高達到95%,平均殘差值Q =2.2543,最優周期為L=40,如表3所示。
我們預測結果是:第9月的最大震級是:3.7;10月份的最大震級是:3.4。
5 模型的討論與推廣
5.1 模型的討論
該模型通過改進中長期的方法達到比較理想的效果,但是模型求解的精確度依賴于對周期的選取。本文中使用殘差調節周期值有一定合理性,而且相對容易操作,比較適合短臨預測。本模型在也可以改進最優周期的選取方法用于中長期預測。
5.2 模型的推廣
預測問題是一個普遍性問題,尤其作為氣象學經典預測的均生函數預測模型,更能得到更廣泛的應用,可以應用于各種類似的預測問題中。根據前面的模型所建立的地震預測系統和歷史地震數據,可以較好地預測某一年是否會有地震發生以及某區域某月的最高震級。還可以應用于氣候預報、自然災害預測等領域。
6 結束語
地震監測預測是防震減災的基礎,直接關系到防震減災事業的成效。地震監測預測的根本突破,取決于地震監測預測科技水平的不斷提高。因此,強化管理,依靠科技進步,不斷提高地震監測預測科技水平,是推進防震減災事業發展的重要途徑和根本保證。
云南省是我國地震災害最嚴重的省份之一。由于地處印度洋板塊和歐亞板塊碰撞帶東側,新構造運動和現代構造活動十分強烈,歷史上曾發生多次強烈地震,現今中強地震活動頻繁。由于地震本身的復雜性和目前對地震的科學認識水平,以及觀測方法、研究深度的局限性,地震監測預測水平與政府和社會需求之間的差距仍然很大。因此,進一步完善地震監測預測工作管理體制、規劃地震監測預測的科學布局技術要求,是防震減災工作的重要任務之一。
參考文獻:
[1] 國家地震科學數據共享中心[EB/OL].http://data.earthquake.cn/index.jsp.
[2] 吳紹春,吳耿鋒,王煒,等.尋找地震相關地區的時間序列相似性匹配算法[J].軟件學報,2006(17):185-192.
[3] 姜啟源,刑文訓,謝金星,等.大學數學試驗[M].北京:清華大學出版社,2005.
[4] 馬文靜,張曉清,張曉東,等.基于均生函數的數學預測模型在地震中期預報中的應用[J].西北地震學報,2000(22):62-67.
[5] 科普專題[EB/OL].http://www.eqyn.com/index.asp.