杜國梁 ,楊志華 ,袁 穎 ,任三紹 ,任 濤
(1.河北地質大學城市地質與工程學院,河北 石家莊 050031;2.河北省高校生態環境地質應用技術研發中心,河北 石家莊 050031;3.中國地質科學院地質力學研究所,北京 100081;4.中國地質科學院水文地質環境地質研究所,河北 石家莊 050061)
川藏交通廊道位于青藏高原中東部地區,包括從成都通往拉薩的G317、G318和在建川藏鐵路沿線區域(圖1),是世界上構造活動最強烈和地貌演化最迅速的地區之一。伴隨著青藏高原的隆升,內、外動力地質作用強烈交織與轉化,塑造了復雜特殊的地質環境條件和強烈的河谷動力學過程,導致區內滑坡災害極其發育[1-3]。頻繁發生的滑坡災害不僅造成重大的人員傷亡和財產損失,而且嚴重影響著川藏鐵路的建設與安全運營,制約著區域經濟的發展[4-5]。然而,受高寒、高海拔、交通條件差的制約,研究區滑坡調查受到一定限制。整合已有調查數據、分析研究區滑坡分布規律、預測區內滑坡空間分布特征具有十分重要的意義。

圖1 研究區地質背景圖Fig.1 Geological background map of the study area
滑坡易發性評價是在現有滑坡調查、編目的基礎上,分析評價斜坡體在所處的地層巖性、地形地貌、地質構造、氣象水文等因素組合下發生失穩、破壞的可能性[6]。滑坡易發性評價常用的方法有確定性和非確定性方法,其中確定性方法主要為基于斜坡穩定性的定量計算,非確定性方法主要包括層次分析法、模糊綜合評判、信息量法、概率比、邏輯回歸、神經網絡、支持向量機等數學分析方法,這些方法在區域滑坡易發性評價中都取得了良好的應用效果[7-13]。其中,信息量法由于其物理意義明確、操作簡單、實用性強,在地質災害評價領域得到了廣泛應用。但是,信息量法屬于“暗箱”操作,它只反映評價因子不同類別在組合情況下對災害發生的影響,并沒有考慮各評價因子之間的相關性,以及各因子對災害發生影響的差異[14]。邏輯回歸模型作為應用最為廣泛的回歸模型之一,可以很好地擬合各評價因素的非線性特征,且各因子不需要符合正態分布。充分發揮邏輯回歸和信息量2種評價模型的優勢,建立邏輯回歸-信息量組合模型,對于提高預測精度具有十分重要的意義[15]。
本文在資料收集整理、遙感解譯和野外地質調查的基礎上,選取巖性、坡度、坡向、坡形、地形起伏度、地形粗糙度、斷裂密度、河流距離等8個影響因子,采用邏輯回歸-信息量評價模型,評價川藏交通廊道的滑坡易發性,并分析、檢驗評價結果。本研究可為區內公路、鐵路、水電工程的規劃建設和防災減災提供參考。
川藏交通廊道地勢西高東低、地形起伏度大,從海拔500多米的四川盆地躍升到4 000多米的青藏高原,橫跨橫斷山脈、念青唐古拉山、岡底斯山、喜馬拉雅山等山脈,穿越岷江、大渡河、雅礱江、金沙江、瀾滄江、怒江、雅魯藏布江等多條大江大河。受第四紀以來青藏高原快速隆升的影響,研究區大江、大河在高原地區河谷深切,常形成高山峽谷地貌。
川藏交通廊道從東向西穿越揚子地塊、川滇塊體、甘青塊體、西藏塊體和喜馬拉雅塊體,地層巖性復雜,從第四系至震旦系均有分布,巖性以砂巖、板巖、泥巖、灰巖、白云巖、頁巖、片巖、千枚巖、花崗巖、閃長巖、片麻巖、玄武巖及第四系松散沉積物為主。
伴隨歐亞板塊碰撞、擠壓,青藏高原快速隆升,在區內形成了龍門山斷裂帶、鮮水河斷裂帶、金沙江斷裂帶、瀾滄江斷裂帶、怒江斷裂帶、嘉黎—察隅斷裂帶、雅魯藏布江斷裂帶等多條區域性大型活動斷裂帶。活動斷裂在歷史上曾多次發生強震,如1933年發生Ms 7.5疊溪地震,1950年發生Ms 8.6察隅地震、1973年發生Ms 7.9爐霍地震、2008年發生Ms 8.0汶川地震等,這些大地震均誘發了大量的地震滑坡災害。
信息量模型最早由Shannon提出,殷坤龍等[16]首次將其應用到地質災害評估領域。信息量模型中,第i個影響因子分級指標對滑坡發生事件提供的信息量(Ii)表示為:

式中:Si—分布在第i個影響因子分級中已發生滑坡的個數;
Ai—第i個影響因子分級所占的面積;
S—評估區滑坡總個數;
A—評估區總面積。
邏輯回歸(logistic回歸)是一種廣義的線性回歸分析模型。在邏輯回歸模型中,P為滑坡發生的概率,通過Logit變換,對滑坡發生的概率P和不發生的概率1-P的比取自然對數,即ln(P/1-P),建立線性回歸方程:

式中:x1,x2,···,xn—滑坡影響因子;
β0—常數項;
β1,β2,···,βn—回歸系數。
充分發揮邏輯回歸模型和信息量模型的優勢,建立邏輯回歸-信息量組合模型,建立的主要步驟為[17]:①用式(1)計算影響因子分級指標提供的信息量;②用式(4)對信息量值進行歸一化;③以歸一化信息量值為自變量,滑坡發生為1,不發生為0,作為因變量,用式(5)進行回歸計算,得到各影響因子的回歸系數;④將式(5)中計算得到的z值帶入式(2),計算得到滑坡易發性指數值P。

式中:xi—第i個影響因子分級指標提供的信息量歸一化值;
Ii—第i個影響因子分級指標提供的信息量;
I(i)min—第i個影響因子分級指標所屬影響因子分級指標類中提供的信息量最小值;
I(i)max—第i個影響因子分級指標所屬影響因子分級指標類中提供的信息量最大值。
本研究使用的數據包括:(1)歷史滑坡數據:主要來自1∶5萬和1∶10萬縣市地質災害詳細調查資料,以及野外實際的補充調查資料;(2)數值高程模型(DEM):來源于地理空間數據云,ASTER GDEM V2版,空間分辨率為30 m×30 m。坡度、坡向、地形起伏、坡形和地表粗糙度提取于DEM;(3)巖性和斷裂數據:來源于1∶50萬地質圖;(4)主要河流和行政區劃數據:來源于研究區1∶100萬地理底圖。
(1)巖性
巖性是滑坡災害的物質基礎,影響斜坡受侵蝕的難易程度和滑坡發育類型。將地層巖性按軟硬程度劃分為:Ⅰ堅硬的層狀和塊狀巖的砂巖、板巖、灰巖、白云巖、玄武巖、花崗巖等;Ⅱ較堅硬-堅硬的層狀的礫巖、板巖、砂巖、泥巖;Ⅲ軟硬相間的砂泥巖、泥巖夾灰巖、白云巖夾泥巖、千枚巖等;Ⅳ軟弱-較堅硬的片巖、頁巖、千枚巖、泥礫巖及火成巖;Ⅴ軟質的散體結構5個等級(圖2)。由表1可知,研究區軟硬相間的砂泥巖、泥巖夾灰巖、白云巖夾泥巖、千枚巖等巖組的信息量值最大,最有利于滑坡的發生。

圖2 研究區巖性分布圖Fig.2 Lithology map of the study area
(2)坡度
坡度與滑坡發生的關系十分密切,是滑坡形成的主控因素之一。坡度影響斜坡內的應力分布、斜坡上松散固體物質的厚度、植被覆蓋度、地表水徑流,從而影響斜坡的穩定性。將坡度劃分為:0~10°、10°~20°、20°~30°、30°~40°、40°~50°、>50°共6個等級(圖3);研究區在30°~40°范圍內,最有利于滑坡的發生,其次為20°~30°,在<10°的范圍最不利于滑坡的發生(表1)。

圖3 研究區坡度分級圖Fig.3 Slope gradient map of the study area

表1 信息量統計表Table 1 Information value of landslide contributing factors
(3)坡向
不同坡向太陽輻射強度不同,影響斜坡的植被覆蓋、水分蒸發和風化程度,進而影響斜坡的穩定性。將坡向劃分為:-1°(平面)、337.5°~22.5°(北)、22.5°~67.5°(東北)、67.5°~112.5°(東)、112.5°~157.5°(東南)、157.5°~202.5°(南)、202.5°~247.5°(西 南)、247.5°~292.5°(西)、292.5°~337.5°(西北)9個等級(圖4);從表1可以看出,研究區面向南、東南方向的斜坡滑坡容易發生,面向北的斜坡最不利于滑坡的發生,平面無信息量值,無滑坡發生。

圖4 研究區坡向分布圖Fig.4 Slope aspect map of the study area
(4)地形起伏度
地形起伏度是一定范圍內最高點和最低點海拔的差值,可以反映地表的起伏變化,與滑坡分布存在一定的相關性。本文將地形起伏度劃分為:<50 m、50~100 m、100~150 m、150~200 m、200~250 m、>250 m共6個等級(圖5)。由表1可以看出,地形起伏度在150~200 m時,滑坡發生的可能性最大,100~150 m次之,<50 m最不利于滑坡的發生。

圖5 研究區地形起伏度分布圖Fig.5 Topographic relief map of the study area
(5)坡形
坡形可以影響坡體內地下水的分布,凹形坡在斜坡表面更易集水,在地震載荷作用下凸形坡的地震放大效應等,這些都影響坡體的穩定狀態。將坡型劃分為:凹形坡、平直坡和凸形坡(圖6)。從表1可以看出,在研究區滑坡發生的可能性:凸形坡>凹形坡>平直坡。

圖6 研究區斜坡坡形分布圖Fig.6 Slope shape map of the study area
(6)地表粗糙度
地表粗糙度是反映地表起伏變化和侵蝕程度的指標,從一定程度上反映了構造運動伏度,對地質災害的發生具有重要的意義。很多學者將地表粗糙度作為滑坡影響因素用于滑坡易發性評價[18]。本文將地表粗糙度劃分為<1.1、1.1~1.2、1.2~1.3、1.3~1.4、1.4~1.5、>1.5共6個等級(圖7)。由表1可以得到,研究區地表粗糙度在1.4~1.5信息量最大,最有利于滑坡的發生,1.3~1.4次之,1.1~1.2滑坡發生的可能性最小。

圖7 研究區地表粗糙度分布圖Fig.7 Surface roughness map of the study area
(7)斷裂密度
斷裂密度體現了一個區域遭受構造作用改造的強度和構造的復雜程度,也反映了區域地表的破碎程度,與滑坡發育存在一定的相關性[14]。本文將斷裂密度劃分為:0~5 m/km2、5~10 m/km2、10~15 m/km2、15~20 m/km2、20~25 m/km2、>25 m/km2共6個等級(圖8)。由表1可以看出,隨著斷裂密度的增大,研究區滑坡發生的可能性增大。

圖8 研究區斷裂密度分布圖Fig.8 Fault density map of the study area
(8)河流距離
河流對斜坡體坡腳的沖刷和淘蝕加速了斜坡體的變形破壞,從而導致滑坡的發生。河流距離與滑坡分布具有很好的相關性。本文將河流距離劃分為:0~200 m、200~400 m、400~600 m、600~800 m、800~1 000 m、>1 000 m共6個等級(圖9)。由信息量統計表(表1)可以看出,隨著與河流距離的增加,滑坡發生的可能性基本呈減小的趨勢。

圖9 研究區河流距離分布圖Fig.9 Map showing distance to rivers of the study area
進行Logistic回歸時,各自變量需要保證相互獨立,若因子相關性高,會出現多重共線性。采用容忍度(Tolerance,TOL)和方差膨脹因子(Variance Inflation Factor,VIF)對自變量進行多重共線性診斷:

其中,R2是以xi為因變量時對其他自變量回歸的復測定系數。TOL為VIF的倒數,當TOL大于0.1且VIF小于10時,說明自變量不存在多重共線性。
采用SPSS進行多重共線性檢驗,檢驗結果見表2,結果顯示所選8個因子的TOL均大于0.1且VIF均小于10,表明各因子相互獨立,不存在多重共線性。

表2 評價因子共線性診斷Table 2 Multi-collinearity analysis of contributing factors
在邏輯回歸-信息量模型中,滑坡發生的因變量值為1,不發生的因變量值為0。隨機生成結合遙感解譯判別、修正,生成與滑坡點數相同的非滑坡點4 820處。基于GIS提取各點的各影響因素的歸一化信息量值,并在SPSS中進行回歸分析,得到各因子的回歸系數(表3)。

表3 模型相關參數Table 3 Relevant parameters of the model
將各因子回歸系數帶入式(5),得到:

式中:Il—巖性;
Is—坡度;
Ia—坡向;
It—地形起伏度;
Iq—坡形;
Ir—地表粗糙度;
If—斷裂密度;
Iri—河流距離。
在GIS中,將z值代入式(2)得到滑坡易發性指數值P。根據易發性指數將研究區劃分為高易發(0.8~1)、中易發(0.6~0.8)、低易發(0.6~0.4)和極低易發(<0.4)4個易發區(圖10)。

圖10 川藏交通廊道滑坡易發性評價圖Fig.10 Landslide susceptibility map of the study area
(1)顯著性檢驗
回歸分析需要檢驗自變量對因變量影響的顯著性。采用Wald統計量對應的Sig.值判斷因子的顯著性,若因子的Sig.值小于0.05表明影響因素對滑坡的發生有顯著的影響[17]。由表3可知巖性、坡度、坡向、地形起伏度、坡形、地表粗糙度、斷裂密度、河流距離等8個因子的顯著性Sig.均小于0.05,通過檢驗。
(2)精度驗證
ROC曲線(receiver operating characteristic curve)即感受性曲線,曲線下方面積(AUC)可以評價模型預測結果的準確度。一般認為:AUC值小于等于0.5時,模型預測失敗,AUC值為0.5~0.7時,預測準確性較低,AUC值為0.7~0.9時,預測準確性較高,AUC值在0.9以上,說明預測準確性極高。采用ROC曲線對邏輯回歸-信息量模型評價結果的準確性進行檢驗,得到ROC曲線下的面積為0.81(圖11),說明模型評價結果在研究區具有較高的準確性,能夠很好地預測研究區滑坡的發生。

圖11 邏輯回歸-信息量模型的ROC曲線Fig.11 ROC curve of the model
從易發性評價結果可以看出(表4和圖10),研究區滑坡高易發區面積83 464.69 km2,占研究區總面積的13.00%,主要分布在坡度陡峭、地形起伏度大的大渡河、雅礱江、金沙江、瀾滄江、怒江、雅魯藏布江、易貢藏布江等的大型河流深切河谷的兩岸,以及龍門山斷裂帶、金沙江斷裂帶、瀾滄江斷裂帶、怒江斷裂帶、邊壩—洛隆斷裂帶等活動斷裂控制區,區內地表切割強烈,巖體破碎;中易發區面積204 267.96 km2,占研究區總面積的31.79%,主要分布在坡度較為陡峭、地形起伏度中等的大江、大河及深切河谷支流兩岸;低易發區面積166 022.27 km2,占研究區總面積的25.84%,主要分布在坡度相對較緩,斷裂密度較小的大型河流支流的兩岸;極低易發區面積188 728.76 km2,占研究區總面積的29.37%,主要分布在坡度平緩、地形起伏小、斷裂不發育的地區。通過統計不同易發區的滑坡、非滑坡數量和密度,可以看出隨著易發程度的增強,滑坡點密度不斷增大,而非滑坡點的密度不斷減小,說明易發分區是合理的(表4)。

表4 不同易發區滑坡統計結果Table 4 Relevant parameters of the model
研究區在工程規劃和建設時,應盡量避開滑坡高易發區,必須穿越高易發區時,應對該區段斜坡進行詳細勘查,對滑坡隱患點采取相應的工程治理措施。在高、中易發區,需盡量避免工程建設和運營時對地質環境的擾動,以免誘發滑坡災害,同時,應加強滑坡隱患的排查工作。在低易發區,仍需對潛在發生的地質災害進行風險防范,并做好應急保障工作。
(1)結合邏輯回歸和信息量模型的優勢,采用邏輯回歸-信息量方法對研究區滑坡進行易發性評價。共收集整理川藏交通廊道滑坡4 820處,同時,通過隨機生成結合遙感解譯調整,生成同等數量的非滑坡點用于易發性評價。
(2)選取巖性、坡度、坡向、坡形、地形起伏度、地形粗糙度、斷裂密度和河流距離8個因素作為評價因子,通過因子共線性和顯著性檢驗,得到所選8個因子不存在多重共線性,且均對滑坡發生影響顯著。通過ROC曲線對模型預測結果進行檢驗,評價結果的準確率達81%,表明評價結果能夠很好地預測研究區滑坡的發生。
(3)研究區高易發區主要分布龍門山斷裂帶、怒江斷裂帶、金沙江斷裂帶、瀾滄江斷裂帶、邊壩—洛隆斷裂等活動斷裂帶控制區,以及大渡河、雅礱江、金沙江、瀾滄江、怒江、雅魯藏布江、易貢藏布江等大型河流深切河谷的兩岸。中易發區主要集中在岸坡較陡、地形起伏度中等的大型河流支流的兩岸。在工程規劃、建設和運營階段,需加強上述區域滑坡隱患的排查和防治工作。