許霄霄,牛瑞卿
面向對象的三峽庫區新生型滑坡空間預測研究
許霄霄,牛瑞卿
(中國地質大學地球物理與空間信息學院,武漢430074)
三峽水庫運行期間,庫水位的變動不僅可能誘發老滑坡復活,還會產生新的滑坡(新生型滑坡)。以庫首區秭歸段岸坡為研究區,采用了面向對象的C5.0決策樹分類的預測方法,選取了庫水、坡度、工程巖組、斜坡結構和影像紋理等作為評價因子,在遙感解譯和野外調查的基礎上,利用遙感、地理信息系統和空間數據挖掘技術,建立了新生型滑坡空間預測模型,生成了新生型滑坡易發性區劃圖。驗證顯示:預測結果與實際較為一致,該方法可為新生型滑坡的防治提供科學依據。
三峽庫區;新生型滑坡;面向對象;C5.0決策樹;空間預測
三峽水庫蓄水后,庫水位迅速抬升近百米,打破了數萬年以來大自然塑造的地質環境平衡。水庫運行期間,庫水位的浸泡與變動及周邊庫岸地下水位的抬升,必然產生眾多的水庫新生型滑坡[1]。與已經發生的滑坡(老滑坡)相比,水庫新生型滑坡的特點是具有突發性、穩定性狀態未知、產出位置不確定、受庫水影響嚴重,因此難以識別和預測。對于新生型滑坡,現場調查確認是目前較為成熟可靠的方法[2],但受時間、資金、現場條件等限制,不可能大量實施。一些學者[3-7]利用GIS(Geographic Information System)和RS(Remote Sensing)技術可以快捷實時地調查和監測滑坡,分析滑坡孕災環境和影響因素,并進行區域風險分區及預測,但沒有涉及水庫新生型滑坡的預測研究。另外,由于受影像空間分辨率的制約,傳統的遙感變化監測和信息提取只能依靠影像的光譜信息,導致分類結果破碎、椒鹽效應明顯,且是在像素層次上通過目視判讀的計算機分類,人為主觀性較大、信息提取的精度和效率也不能兼顧。Beliz Aksoy[8]在滑坡識別和分類中提出了面向對象的分析方法,以對象作為分類的基本單元,提取紋理、光譜、形狀信息,再將這些信息作為知識加入到分類器中,這樣可以提高分類精度。但滑坡數據具有多樣化、選擇誘發滑坡的關鍵因子也是非常困難的,其采用的模糊隸屬度分類亦不能充分挖掘多樣復雜的滑坡信息,因此需要尋求一種數據挖掘[9]的算法。Shiuan Wan提出了決策樹的數據挖掘算法來分析泥石流災害問題[10],精簡了誘發滑坡的因子,提高了預測的效率和精度。
鑒于此,本文提出了面向對象的C5.0決策樹分類的空間預測方法,以三峽庫區秭歸段為研究區,建立了C5.0決策樹預測模型,分析了新生型滑坡與各因子間的定量關系,繪制了新生型滑坡易發性區劃圖,為庫區新生型滑坡預測及防治提供決策支持。
決策樹學習是數據挖掘中典型的分類算法,主要作用是揭示數據中的結構化信息,所建立的樹型結構直觀、易于理解,而且便于處理非線性數據,能提取數據中隱藏的知識規則。C5.0決策樹算法分類的依據是信息增益(Information Gain),根據信息增益最大的字段對樣本數據進行分類[11]。
通常可以用如下的方法計算C5.0決策樹算法中的信息增益:設訓練集樣本總數為S,共分為m類樣本Ci(i=1,2,…,m),類Ci中的樣本數為Si,則樣本集合S的信息熵定義為

式中pi是任意樣本屬于Ci的概率,可用pi=Si/|S|來估計。設屬性X具有v個值{x1,x2,…,xv},則S被分成v個子集{s1,s2,…,sv}。令Sj為在樣本集S中屬性X的取值為xj的子集,j=1,2,…,v。在分類的過程中,如果X被選為決策屬性,則根據屬性X可以將樣本集劃分到不同的分枝中。如果用Sij表示子集Sj中屬于Ci類的元組數量,則屬性X為分類所需的期望熵(條件熵)是

式中屬性X的每個取值對分類Ci的信息熵I(S1j,…,Smj)可由下式給出:

式中pij=Sij/|Sj|表示子集Sj中屬于類Ci的概率。由此,可以得到屬性X作為決策分類的屬性的度量值(稱為信息增益):

信息增益函數在可能產生多分枝的測試中更傾向于得到大的函數值,但是分枝多并不說明該測試對未知樣本有更好的預測效果,為解決該問題出現了信息增益率函數。某個屬性X的信息增益率函數表示為

3.1 研究區概況
三峽庫區位于長江上游段,研究區位于三峽庫區首段秭歸縣境內,地理范圍為110°30′~110°57′E,30°50′~31°04′N,面積約213 km2,長江大致呈NWW-SEE向穿越研究區,主干流長度約42 km,是庫區人類工程活動強烈、滑坡災害突出地段。該區地處中國地形第二階梯向第三階梯的過渡地帶,是川東褶皺與鄂西山地會合部位,為中、低山侵蝕峽谷地貌[12]。地層發育較完整,除缺失泥盆系下統、石炭系的上統、下統和白堊系的大部分及第三系外,自前震旦系至第四系皆有出露,總體上地層具有自東向西漸新展布的規律[13]。在香溪以東峽谷區以三疊系的地層連續出露,以碳酸鹽巖為主;香溪以西地區主要是中三疊至侏羅系(T2-J)地層,以碎屑巖為主,主要巖性為砂巖、粉砂巖和頁巖。褶皺是區內的主要構造形式,主要發育黃陵背斜和秭歸向斜。區內地層巖性多樣、構造復雜,不僅提供了地質災害發育的物質條件,還控制空間孕災環境的差異,部分地層(如巴東組)被稱為易滑地層,且大部分屬于第四系堆積層滑坡。研究區是庫區地質災害最嚴重、災害防治重點區域之一,曾在1985年發生著名的新灘滑坡以及2003年發生了千將坪特大型滑坡,慶幸的是這2處滑坡均已成功預報,滑坡體上人員在滑坡發生前安全撤離。近年來不斷有滑坡險情出現,如白水河滑坡、臥沙溪滑坡等。研究區地質構造見圖1。

圖1 研究區地質構造圖[13]Fig.1 Geological structure of the researched area[13]
3.2 數據準備
研究區收集到覆蓋該區的Landsat TM近期數據6景和高分辨率SPOT全色波段的遙感影像,主要用于提取紋理特征因子和遙感解譯選取樣本;其他數據還有1∶200 000地質圖、1∶10 000地形圖、高精度DEM(數字高程模型),主要用于提取相關的地形地質因子;除此之外,還有典型新生型滑坡野外現場調查資料等。
針對三峽庫區新生型滑坡空間預測問題,首先在收集數據資料基礎上選擇合理的評價因子,利用RS和GIS軟件對因子信息進行提取;然后針對預測模型對地形地質因子進行分級,將所有的因子信息集中到ArcGIS軟件中對多種數據進行疊加和綜合;接著在遙感解譯和野外調查的基礎上選取訓練樣本數據集,建立C5.0決策樹預測模型,對模型進行精度評價與分析,繪制新生型滑坡易發性分區圖;最后結合野外調查資料對預測模型及預測精度進行驗證。
4.1 多尺度分割
面向對象的信息提取技術是一種基于目標的信息提取方法,這種方法可以充分利用遙感影像的光譜、紋理、形狀、相關性等空間信息。它主要包括2個關鍵技術:多尺度分割和面向對象的影像分類。多尺度圖像分割采用異質性準則的區域合并策略,目的是實現分割后圖像對象的權重最小異質性。在分割前需要確定異質性閾值的2種因子(圖2):光譜因子與形狀因子,其中形狀又分為緊湊度和平滑度。分割程序始于單一的圖像對象(即種子),在設定的同質閾值條件下,通過反復的循環合并來增大對象。處理過程是種子對象尋找最合適的鄰域作為合并的對象。如果鄰近像元符合異質性最小的特征則合并,不滿足條件則設立新的種子對象并尋找符合條件像元。一個循環中,每個對象只處理一次,直到圖像中沒有新的對象合并為止。這種基于對象的分割技術具有效率高、分類結果連續性好的優點。

圖2 多尺度分割概念圖(據Definiens Developer 7 Reference Book修改)Fig.2 The concept ofmultiresolution segmentation(revised from Definiens Developer 7 Reference Book)
4.2 評價因子的提取
新生型滑坡空間預測需要考慮多種影響因子,根據三峽庫區新生型滑坡的具體特點,選取了Landsat TM4,TM3和TM2波段的紋理特征因子(熵、能量、相關性、對比度)以及相關地形地質因子(庫水、坡度、斜坡結構、工程巖組)共8個因子作為評價因子。這里選取TM4,TM3和TM2波段的紋理特征因子可反映研究區的植被覆蓋情況和滑坡形態特征,通過影像校正、地理裁剪等預處理,利用面向對象的遙感軟件eCognition提取影像的光譜和紋理信息。經過多次實驗和反復驗證,最終確定的分割尺度為20,形狀異質性參數為0.3,則顏色異質性參數為0.7,其中表征形狀的光滑度參數設為0.5,則緊湊度參數也為0.5。而地質因子主要利用地形圖、高精度數字高程模型(DEM)和地質圖通過ArcGIS軟件來提取,并對提取出的因子進行了分級處理。評價因子的分級見表1。
4.3 構建C5.0決策樹模型
樣本選取對滑坡預測評價影響很大,它直接影響到評價因子的表達。新生型滑坡樣本是結合三峽水庫蓄水前遙感影像、DEM數字高程模型與地質圖及部分野外調查驗證資料綜合解譯來選取的。區內的新生型災害主要有塌岸、庫岸、不穩定斜坡和滑坡,其中新生型滑坡包括土質滑坡和巖質滑坡兩大類。對于土質滑坡的解譯主要依據是否存在第四系堆積物、具備優勢滑動面、適宜的地形條件和庫水位的浸泡與周期性升降等標志;對于巖質滑坡解譯主要依據易滑巖層、岸坡形態、斜坡結構類型和庫水位的浸泡等標志。通過樣本數據采集,基于C5.0決策樹算法構建分類預測模型,對樣本的分類情況進行精度評價。

表1 地質評價因子分級Table 1 Classification of the geological evaluation factors
4.4 預測模型精度評價
本文利用數據挖掘軟件Clementine構建C5.0模型,模型中參數均采用軟件的默認設置。經面向對象的多尺度分割后,研究區共被分割成1 158個對象,選取了260個作為樣本,占研究區總對象數的22%。樣本中包括新生型滑坡樣本60個屬性賦值為1、非滑坡樣本200個屬性賦值為0。在構建C5.0決策樹模型時對樣本又進行分區,分為70%的訓練樣本和30%測試樣本,C5.0決策樹模型對樣本進行分類預測的結果如表2、表3。
從表2、表3可以看出模型對于訓練樣本總的正確率達92.66%,測試樣本總的正確率為80.72%,總體來說分類精度良好。Kappa系數是對分類精度的另一種度量,主要反映用戶和智能分類是否具有一致性。表中訓練樣本的Kappa系數大于0.8表明兩者分類精度一致性非常好,而測試樣本的Kappa系數0.46表明兩者的分類精度一致性很好。

表2 C5.0決策樹模型對訓練樣本的分類預測結果Table 2 Prediction results by C5.0 decision treemodel for training sam ples

表3 C5.0決策樹模型對測試樣本的分類預測結果Table 3 Prediction results by C5.0 decision treem odel for testing sam p les
利用建立的模型對研究區1 158個對象進行分類,分類結果有2種形式:一種是離散型的只有0和1的值,0表示不易發生滑坡設為穩定區,而1表示發生滑坡可能性較大設為危險區;另一種形式是[0,1]的連續型預測值,數值越大,反映各因素對滑坡發生的綜合影響越大,滑坡的發生就越容易。為了便于區分滑坡發生的容易程度,將預測值重新分類,分區依據的是預測連續值的統計直方圖,按直方圖的自然裂點將研究區劃分為4級:不易發區、低易發區、中易發區、高易發區。C5.0決策樹模型對研究區總對象的分類預測的結果如表4。

表4 C5.0決策樹模型對研究區的分類預測結果Table 4 Prediction results by C5.0 decision treem odel for the researched area
根據C5.0決策樹模型生成的易發性區劃圖(圖3),結合研究區的實際情況和新生型滑坡的具體特點,分析得出危險區的分布特點及其影響較大的原因如下:

圖3 研究區基于C5.0決策樹的新生型滑坡易發性評價圖Fig.3 The susceptibility evaluation of neogenic landslides by C5.0 decision treemodel for the researched area
(1)主要分布于庫水強影響區和波動區。長江干流及支流兩岸,童莊河和香溪河2大支流兩岸為高易發區和中易發區的集中區,說明新生型滑坡受庫水浸泡和升降影響非常嚴重。對于土質滑坡,庫水位的浸泡會降低土體抗剪強度,升降會使坡體內地下水滲流形成動水壓力;而對于巖質滑坡,岸坡前緣涉水段受到庫水位的浮托而產生一個不利于岸坡穩定的浮托力,庫水對巖體內軟弱結構面或潛在滑面的軟化會導致其強度降低,這些都不利于庫岸邊坡的穩定性。
(2)主要分布于軟巖巖組。這是因為處于侏羅系、三疊系中統巴東組和志留系的易滑地層,特別是三疊系巴東組地層是調查中庫區滑坡發育最多的地層。侏羅系地層巖性主要包括砂質泥巖、砂巖、泥質頁巖及煤層;三疊系地層主要為灰巖、白云巖、泥灰巖、砂頁巖互層等;志留系地層巖性主要為砂巖、粉砂巖、頁巖等。
(3)主要分布于順向坡和斜向坡的坡體結構。斜坡結構類型是根據岸坡坡向、下伏地層傾向以及長江流向的關系劃分的,一般而言,巖質滑坡易發生于順向坡之中的順向飄傾坡、斜向坡,地層傾向和坡向交角較小易滑,而逆向坡不易于巖質滑坡的發生。其中,順向伏傾坡一般不具備滑坡發生的剪出條件而不利于滑坡的形成。
(4)主要分布在緩傾坡,坡度在15°~30°。這個坡度范圍的岸坡前緣地形較緩而后緣地形較陡,如果坡體兩側還具有沖溝或具有走向與坡向相近的斷層條件,這時坡體就相當于一個六面體,不利于坡體的穩定性。
在易發性分區圖中的塌岸實形是三峽水庫172 m蓄水后野外調查的資料,共有21個塌岸,其中分布在高易發區的塌岸有8個、在中易發區的塌岸有10個、低易發區塌岸有1個、不易發區塌岸有3個。分布在高易發區的塌岸是一些大型的塌岸,中易發區的則為一些小型的塌岸。拍攝的野外調查塌岸圖片與易發性分區圖的對照如圖4所示。圖中顯示了5個大型的塌岸,其中代號1,2,3的塌岸均為秭歸縣郭家壩鎮蔡家坡塌岸,4號塌岸為秭歸縣郭家壩鎮周家灣塌岸,5號塌岸為秭歸縣郭家壩鎮譚家坡塌岸。蔡家坡塌岸和周家灣塌岸是典型的受水庫蓄水后新生的大型塌岸,地層巖性為侏羅系上沙溪廟組的粉砂巖與長石石英砂巖,塌岸長度約1.5 km,涉水深度近30 m,危害房屋40余間,對耕地、柑桔和村級公路也造成較大危害。預測的結果將其劃分在了高易發區,驗證了預測結果的可靠性。

圖4 易發性評價與野外驗證圖Fig.4 The susceptibility evaluation and field validation
針對三峽庫區新生型滑坡的特殊性,本文提出了面向對象的C5.0決策樹分類的空間預測流程,將多尺度分割技術、智能決策樹分類法、GIS空間分析功能與模型預測有機地結合在一起。
以三峽庫區秭歸段長江干流為研究區開展了新生型滑坡的空間預測,利用易獲得的遙感影像、地形圖與地質圖等資料綜合解譯和現場調查,選取分類樣本、建立C5.0決策樹模型,對研究區進行了新生型滑坡的易發性評價。研究得出:庫水波動區和強影響區、軟巖巖組、15°~30°緩傾坡及順向坡和斜向坡坡體結構對新生型滑坡的影響和控制較大。經野外調查驗證得出易發性評價結果與實際較為一致,表明本文提出的方法適合于庫區新生型滑坡的空間預測。
[1] 羅先啟,劉德富,吳 劍,等.雨水及庫水作用下滑坡模型試驗研究[J].巖石力學與工程學報,2005,24(14):2476-2483.(LUO Xian-qi,LIU De-fu,WU Jian,etal.Model Test Study on Landslide under Rainfall and Reservoir Water Fluctuation[J].Chinese Journal of Rock Mechanics and Engineering,2005,24(14):2476-2483.(in Chinese))
[2] 程圣國,方坤河,羅先啟,等.三峽庫區新生型滑坡滑帶土抗剪強度確定概率方法[J].巖石力學與工程學報,2007,26(4):840-845.(CHENG Sheng-guo,FANG Kun-he,LUO Xian-qi,et al.Probability Method to Determine Shear Strength of Slide Zone Clay for Neogenic Landslide in Three Gorges Reservoir Area[J].Chinese Journal of Rock Mechanics and Engineering,2007,26(4):840-845.(in Chinese))
[3] 胡德勇,李 京,陳云浩,等.GIS支持下滑坡災害空間預測方法研究[J].遙感學報,2007,11(6):852-859.(HU De-yong,LI Jing,CHEN Yun-hao,et al.GIS-based Landslide Spatial Prediction Methods,A Case Study in Cameron Highland,Malaysia[J].Journalof Remote Sensing,2007,11(6):852-859.(in Chinese))
[4] BISWAJEET P.Remote Sensing and GIS-based Landslide Hazard Analysis and Cross-Validation Using Multivariate Logistic Regression Model on Three Test Areas in Malaysia[J].Advances in Space Research,2010,45(10):1244-1256.
[5] BAISB,WANG J,LU G N,et al.GIS-based Landslide Susceptibility Mapping in the Three Gorges Area-Comparisons of Mapping Results Obtained by Two Methods:Analytical Hierarchy Process and Logistic Regression[C]∥Landslides and Engineered Slopes:From the Past to the Future:Proceedings of the 10th International Symposium on Landslides and Engineered Slopes,Xi’an,China,30 June-4 July,2008:1067-1070.
[6] OZDEMIR H,TUROGLU H.Landslide Susceptibility Assessment Using GISand RS in the Havran River Basin(Balikesir-TURKEY)[C]∥International Association for MathematicalGeology(IAMG).The12th International Mathematical Geological Congress,Beijing,August,26-31,2007:185-189.
[7] PRADHAN B.Remote Sensing and GIS-based Landslide Hazard Analysis and Cross-Validation Using Multivariate Logistic Regression Model on Three Test Areas in Malaysia[J].Advances in Space Research,2010,45(10):1244-1256.
[8] AKSOY B,ERCANOGLU M.Landslide Identification and Classification by Object-based Image Analysis and Fuzzy Logic:An Example from the Azdavay Region(Kastamonu,Turkey)[J].Computers and Geosciences,2012,38(1):87-98.
[9] 李德仁,王樹良,李德毅.空間數據挖掘理論與應用[M].北京:科學出版社,2006.(LIDe-ren,WANG Shu-liang,LIDe-yi.The Theory and Application of Spatial Data Mining[M].Beijing:Science Press,2006.(inChinese))
[10]ABDALLAH C.Spatial Distribution of Block Falls Using Volumetric GIS-Decision-Tree Models[J].International Journal of Applied Earth Observation and Geoinformation,2010,12(5):393-403.
[11]柯新利,邊馥苓.基于C5.0決策樹算法的元胞自動機土地利用變化模擬模型[J].長江流域資源與環境,2010,19(4):403-408.(KE Xin-li,BIAN Fu-lin.Land-use Change CA Model Based on C5.0 Decision Tree[J].Resources and Environment in the Yangtze Valley,2010,19(4):403-408.(in Chinese))
[12]地質礦產部編寫組.長江三峽工程庫岸穩定性研究[M].北京:地質出版社,1988:1-69.(Compilation Group of Geology and Minerals Ministry.Research on Stability of Reservoir Bank of the Three Gorges Project[M].Beijing:Geological Publishing House,1988:1-69.(in Chinese))
[13]湖北省地質礦產局.1∶20萬巴東幅(H~49~Ⅸ)區域地質調查報告[R].武漢:湖北省地質礦產局,1984:1-156.(Bureau of Geology and Mineral Resources of Hubei Province.Report on Areal Geology Survey of 1:200,000 Badong Map[R].Wuhan:Bureau of Geology and Mineral Resources of Hubei Province,1984:1-156.(in Chinese) )
(編輯:曾小漢)
長江科學院承擔的“重慶港主城港區果園作業區二期擴建工程加筋邊坡離心模型試驗研究”通過驗收
2012年11月15—16日,中交第二航務工程勘察設計院有限公司在武漢主持召開了“重慶港主城港區果園作業區二期擴建工程加筋邊坡離心模型試驗研究”課題評審會。來自重慶市交通委員會、重慶港務物流集團有限公司、重慶果園港埠有限公司、重慶雙源建設監理咨詢有限公司、中國科學院武漢巖土力學研究所、中國水利水電科學研究院、武漢大學、重慶交通大學等單位的專家和領導出席了會議。長江科學院汪在芹副院長、程展林副總工以及長江科學院水利部巖土力學與工程重點實驗室相關學科的技術人員參加了會議。
與會專家聽取了課題承擔單位長江科學院水利部巖土重點實驗室的項目研究執行情況和成果匯報,審閱了研究報告和相關成果資料,進行了現場質詢和討論。通過評審,專家們一致認為:本課題基于重慶港主城港區果園作業區二期擴建工程高陡加筋邊坡的工程問題,采用離心模型試驗與數值分析相結合的技術路線,揭示了該工程邊坡變形規律,完成了合同規定的研究內容,符合已通過的《工作大綱》的要求,一致同意通過驗收。同時,與會專家還認為本研究課題結論明確,研究成果可靠,對于指導該工程的邊坡設計具有重要的指導意義。
(摘自:長江水利科技網)
Object-Oriented Spatial Prediction for Neogenic Landside in the Three Gorges Reservoir Area
XU Xiao-xiao,NIU Rui-qing
(Institute of Geophysics and Geomatics,China University of Geosciences,Wuhan 430074,China)
During the operation of the Three Gorges Reservoir,the reservoirwater level fluctuation could induce old landslide revivification and trigger new landslides(neogenic landslides).The aim of this study is to provide basis for the prevention and treatment of these neogenic landslides.A predictionmethod with object-oriented C5.0 decision treemodelwas presented.Evaluation factorswere selected,including reservoir water fluctuation,slope gradient,engineering rock group,slope structure and image texture.On the basis of RS interpretation,field investigation,and with RS,GISand spatial datamining technology,the spatial predictionmodel for neogenic landslide was built,and the susceptibilitymap was obtained.The bank slope of Zigui segment in the reservoir area was taken as a case study.Verification shows that the prediction results are consistentwith the actual situation.
Three Gorges Reservoir area;neogenic landslide;object-oriented;C5.0 decision tree;spatial prediction
P642.22
A
1001-5485(2012)12-0024-06
10.3969/j.issn.1001-5485.2012.12.006 2012,29(12):24-29
2011-11-22
國家高技術研究發展計劃(863)(2009AA122004);國家自然科學基金項目(4067225);國土資源部三峽庫區三期地質災害防治重大科學研究項目(SXKY3-3-2)
許霄霄(1988-),女,山東泰安人,碩士研究生,主要從事遙感地質研究,(電話)13098821696(電子信箱)gisphh@126.com。