楊希
摘要:本文根據吉林省的相關地質災害數據(近10年),對該地區的地質災害風險評價問題進行了分析,采用的是統計方法,在此基礎上,對區內容易發生地質災害的地段進行了劃分。
關鍵詞:風險評價;地質災害;系統聚類;閾回歸;權重
1、加權聚類劃分方法劃分災害易發區
1. 1加權聚類分析模型的建立
設有一個容量一共為n的樣本數據,其中的每一個樣品都需要測得它的p項指標,從而就可以得出其原始數據陣為:
其中,xij (i=1,....n.j=1...,n)代表的是第i個樣品中,第j個指標的實際觀測數據。那么,為了能夠精確的計算出Xi樣品點和Xj樣品點之間所具有的相似程度值,同時也為了能夠更好、更精確的反映出每一項指標對于這種相似程度的影響不同,我們還選用了馬氏距離公式,這種公式是帶有加權系數的,即:
在具體實施的時候,需要先把n個樣品自然的分成一類,然后再逐次的縮小,這個時候,離差平方和也就會不斷的增加,然后,再選擇使T的增幅最小的2個類別進行合并,一直到我們需要的所有樣品都最后歸為1類才停止。
1. 2權重如何確定
1)對于所有的指標來說,要與研究的目標來進行緊密的相關分析,并要以具體的相關系數值來作為其權重所具有的初始值,即
2)對第一項指標進行適當的調整為,如果這個時候,分類的精確度就出現了下降,則進行反方向的調整,反之,就繼續進行同方向上的調整,一直到能夠達到允許的精度為止;
2、對災害的影響因素進行閾回歸分析
在這個過程中,首先要判斷出各個不同的因素對于災害的具體影響形式,然后再運用所建立起來的閡回歸模型,對不同的影響要素在不同規模的數值之下所造成的災害特點進行分析,最后再選擇一個最為適當的方法,最大程度上來避免多重共線性、異方差和序列相關的出現,這樣就可以在殘差的分析基礎上來最終確定出模型的具體結構和參數。
2.1確定出引起災害的最主要要素
在選擇因變量的時候,以災害點的密度作為主要考慮因素。首先要計算出zhd和fg之間所具有的相關系數,然后再計算出zhd和ln(fg+l)之間的實際相關系數值,除此之外,zhd和1/fg+1、zhd和fg的平方之間的相關系數值也需要計算出來。通過這些相關系數值之間的比較就可以很容易的看出:zhd和fg之間實際上是屬于線性相關的。
2.2基于數值規模的閾回歸模型的建立
為了能夠反映出各種不同的因素在不同的數值規模下,對于災害的不同影響程度,通常要以虛擬變量的形式來引人相關的閾值。而災害點的密度再進行取值的時候,可以劃分成4個區間,因此這時候就需要引進3個不同的虛擬變量,以Dj(j=1,2,3)來表示;其中的D1、D2和D3分別代表不同的災害點密度下所具有的狀態。于是就可以建立包含了所有可能的解釋變量的模型:
2. 3模型估計
一般我們要避免在各個解釋變量之間可能出現多重共線性的問題,通常采用的方法是逐步回歸分析,這種方法同時也可以很好的選擇出對于災害密度具有最為顯著影響的幾個因素。由于在模型當中使用了很多的截面數據,因此對于各種不同類型的區域來說,它們在地質條件上存在的差異性往往就可以造成災害的波動狀態,這個時候就可以采用加權最小二乘法(WLM)估計模型來消除這種異方差的現象,結果見表1。
根據我們以上的分析,最后就可以確定出最終的估計模型結構,具體來說是一個閾回歸ARCH的形式,而殘差的檢驗結果也表明了其狀態已經轉變成了正態白噪聲,.
而模型的參數估計結果也可以參見表2中的數據。
在表2當中,回歸模型的R2為0. 992,調整后的R2可以達到0. 999,AIL統計量與SC統計量則分別是2. 324和2. 376,因此擬合的效果是非常好的,另外,DW的統計量也達到了2. 065,已經十分接近2,因此也不存在序列相關的現象。
結束語
綜上所述,采用閾回歸模型可以對發生不同災害程度之下的各個相關影響因素做出更好的區分,同時我們也對相鄰單元的具體災害發展的態勢進行了擬合,可以發現擬合的精度也能夠達到99. 99。因此,選擇一個合理的統計方法十分重要,這對于地質災害在風險評價方面的效果會非常顯著。
參考文獻
[1]馬寅牛,張業成,張春山,等.地質災害風險評價的理論與方法[J].地質力學學報,2004 , 10(1) :7-18.
[2] 張春山,張業成,馬寅牛,等.區域地質災害風險評價要素權值計算方法及應用—以黃河上游地區地質災害風險評價為例[J].水文地質工程地質,2006, 33(6):84-88.
[3] 尚敏,陳劍平,王征亮,等.向家河大橋庫岸地質災害危險性分區的可拓學評價[J].巖上力學,2007, 28(11): 2445-2450.endprint