楊 帆 許 強 范宣梅 葉 微
(①地質災害防治與地質環境保護國家重點實驗室(成都理工大學) 成都 610059)(②四川大學商學院 成都 610065)
滑坡的預測預警是國內外學者研究的熱點問題。自20世紀60年代日本學者齋藤(Satio, 1965)提出滑坡位移經驗公式預報法以來,眾多學者對斜坡變形破壞及滑坡預報方法進行不斷的探索(張倬元等, 1994)。目前,滑坡預報手段通常有兩種方法:一是基于降雨閾值方法進行預報,通常在特定地區范圍較為適用(伍宇明等, 2014; Palladino et al., 2017); 二是基于現場實測數據進行預報(包括位移變形、孔隙水壓、含水率及微震監測等方法)(Busslinger, 2009; Li et al., 2012)。由于后者監測數據具有實時動態的特點,在一定程度上具有更高的預報精度。針對滑坡位移預報方法多種多樣總體可分為確定性模型、統計預報模型和非線性預報模型3類(蘇愛軍等, 1990; 廖野瀾等, 1996; 黃潤秋等, 1997; 蘭恒星等, 2000; 李秀珍等, 2003; 汪洋等, 2004; 尹光志等, 2007; 許強等, 2008; 杜鵑等, 2009; Li et al., 2012; 董秀軍等, 2015; 苗發盛等, 2016; 郭子正等, 2018; Li et al., 2018; 楊背背等, 2018; Zhu et al., 2018)。
隨著現代科學技術的不斷發展,滑坡位移監測及預測預報手段越來越豐富,監測精度得到顯著提升?;骂A測預報研究已從之前的單因素預報方法,逐漸轉變為基于實時監測數據,結合定性、定量及現代數值預報技術等多種手段的綜合動態預報,并開發自動化預警系統,實現主動防災減災的新階段(許強等, 2004, 2014; 蘇白燕等, 2018)。選用適合的方法對位移-時間曲線的監測數據進行分析,將其應用于滑坡監測預警系統作為預警判據,對防災減災具有十分重要的意義。
隨著模式識別與智能計算的發展,一些數據挖掘的方法(如神經網絡模型、灰色模型、時間序列分析模型、小波分析模型、極限學習機模型、支持向量機、混沌序列模型等)被應用到滑坡位移預測研究中(劉曉等, 2005; 杜鵑等, 2009; 徐峰等, 2011; 張俊等, 2015; 周超等, 2015; 闕金聲等, 2016; 鄧冬梅等, 2017; 郭子正等, 2018; Li et al., 2018; Zhu et al., 2018)。劉曉等(2005)用BP神經網絡方法提取位移趨勢項,結合時間序列ARMA進行滾動預測; 杜娟等(2009)結合BP神經網絡分別對滑坡趨勢項和周期項位移進行預測,根據時間序列提取趨勢項并預測,以BP神經網絡方法對周期項位移進行預測。徐峰等(2011)結合灰色模型和自回歸AR模型的滑坡位移預測方法,采用灰色模型和自回歸AR模型進行預測研究; 張俊等(2015)采用多項式及PSO-SVR對趨勢項和周期項位移進行預測; Li et al.(2018)用小波函數聯合ELM、OS-ELM建立滑坡位移預測模型。均取得較好的結果。鄧冬梅等(2017)在張俊等(2015)成果基礎上,加入集合經驗模態分解(EEMD)的粒子群優化-支持向量機回歸方法進行位移預測研究; 在前人研究成果基礎上,郭子正等(2018)基于小波分析的三角函數模型進行周期項位移預測研究; 楊背背等(2018)運用基于時間序列與長短時基于網絡(LSTM)進行位移預測研究。
上述方法中,杜娟等(2009)存在研究樣本年份過短、單個多項式對趨勢項位移進行擬合精度不高、灰色系統對于非線性序列研究誤差較大等問題(徐峰等, 2011); 人工神經網絡缺乏完備的理論基礎,存在模型結構難確定、精度難保證及泛化能力不高等缺點(張俊等, 2015)。支持向量機是Corinna Cortes和Vapnik于1995年首次提出的一種基于統計學習模型的監督式機器分類技術(Vapnik, 1995),有堅實的數學理論基礎,可以較好地解決小樣本、非線性和局部最小等問題(楊帆等, 2017)。在模型訓練過程中特征子集的選取以及參數的設定對分類結果有顯著的影響(Zhao et al., 2011)。常用支持向量機參數優化算法有遺傳算法(GA)、蟻群算法(ACO)、粒子群算法(PSO)及模擬退火算法等(Shelokar et al., 2004; 楊成祥等, 2005; Huang et al., 2006; Niknam et al., 2010; Zhao et al., 2011; 劉愛軍等, 2013; 吳華鋒等, 2013; 陳健飛等, 2016)。但上述傳統算法的性能很大程度上依賴其選用的參數,同時,在解決多峰值問題的尋優過程中,結果容易陷入局部最優問題,從而直接影響預測結果的準確性(陳健飛等, 2016)。人工蜂群算法具有較好的全局搜索能力,魯棒性強,可較好地解決上述問題,避免陷入局部最優。
針對上述問題,本文提出了一種基于時間序列與人工蜂群算法支持向量回歸機(ABC-SVR)的滑坡位移預測模型。以三峽庫區白水河滑坡為例,用時間序列加法模型結合平滑法中的移動平均法,將監測點位移數據分解為兩項:滑坡位移趨勢項和滑坡位移周期項。用多項式最小二乘法對位移趨勢項數據進行分段擬合,由人工蜂群支持向量機基于位移周期項數據進行訓練及預測。同時選取長江庫水位、本月累積降雨、前一月累積雨量、前兩月累積雨量、前一月庫水位變化量、前兩月庫水位變化量與監測點年累計位移量7項因子結合灰色系統關聯分析法研究各因素與周期項位移間的關聯性。將趨勢項、周期項位移預測值疊加得到總位移預測值并同實際監測位移進行對比。通過與BP神經網絡和PSO-SVR模型預測結果的對比,該模型表現出較好的預測結果。
地殼表層是個復雜的開放系統,滑坡在其發展演化的過程中會受到多種因素的影響與控制,其位移時間序列理論可概括為3部分(楊叔子, 1991):包括受地形、地質構造等內部地質因素影響的趨勢項; 受降雨、地下水及庫水位變動等外部作用影響的周期項; 以及一個隨機項。 由于在現有技術條件下,難以對隨機項因素進行準確評估,因此,在本文的滑坡位移預測研究中暫不考慮隨機項因素,時間加法序列模型可以簡化為:
X(t)=φ(t)+η(t)
(1)
式中,X(t)為時間序列函數,φ(t)為位移趨勢項,η(t)為位移周期項。
1.1.1 趨勢項位移提取
滑坡位移趨勢項代表了滑坡位移長期發展的趨勢。采用移動平均法提取趨勢項位移,可削弱或消除時間序列中季節和不規則周期變動的影響。計算式如下:
(2)

1.1.2 周期項位移提取
由時間序列加法模型公式(式1)可知,用滑坡總位移減去滑坡位移趨勢項即可得到滑坡位移的周期項。
支持向量機,是1995年由Corinna Cortes和Vapnik首次提出的一種基于統計學習VC維(Vapnik-Chervonenkisdimension)和結構風險最小化理論的監督學習分類技術。該模型采用核映射思想,在解決小樣本、非線性、高維數的問題時表現出很好的優勢(Vapnik et al., 1995),能較好的克服神經網絡等方法的固有缺陷,在處理非線性問題時具有一定的優越性(楊曉偉等, 2013; 楊帆等, 2017)。
支持向量機(SVM)可用于解決線性可分問題,而對于線性不可分問題,利用核函數將低維數據映射到高維空間,從而低維空間上線性不可分問題便轉化為高維空間上的線性可分問題,求解后將其映射到低維空間。假設數據集為S,原始空間集Rn,從低維到高維映射關系為:φ:x→φ(x),具體運算步驟為:
(1)尋找一個核函數K(s,t)使得
K(xi,xj)=(φ(xi),φ(xj)),
(3)
(2)構造并求解凸二次規劃問題:
(4)

(3)計算b
(5)
(4)構造非線性函數
(6)
本文核函數選用徑向基核函數(RBF):
K(xi,xj)=exp(-|xi-xj|2/2γ2)
(7)
人工蜂群算法(Artificial Bee Colony)是一種受蜂群行為啟發的代數優化算法,由Karaboga等人在2005年提出(楊淑瑩等, 2015)。該算法具有較強的發現最優解、信息正反饋、收斂速度快、魯棒性強及易于和其他方法結合等優點,能較大程度上避免陷入局部最優的問題。算法步驟如下:
1.3.1 蜜源初始化
初始化種群參數,隨機生成SN個可行解(與雇傭蜂數量相同),計算適應度(Fitness)。隨機產生可行解公式:
(8)
式中,xi(i=1, 2,…,SN)為D維向量,D是待優化參數的數目。j∈(1, 2,…,D)。
1.3.2 蜜源更新公式
引領蜂與跟隨蜂依據下列公式記錄截止目前的最優值,且在當前蜜源鄰域內搜索最優值:
vi, j=xi, j+φi, j(xi, j-xk, j)
(9)
式中,j∈(1, 2,…,D),k∈(1, 2,…,SN),k隨機生成且k≠i,φi, k∈[-1, 1]的隨機數。
1.3.3 選擇雇傭蜂概率公式
(10)
式中,fit(xi)為第i個Fitness解所對應的富源度。
1.3.4 偵查蜂的產生
若有蜜源連續未被更新的次數大于limit時,則對該蜜源進行重新初始化。算法流程圖(圖 1):

圖 1 程序流程圖Fig. 1 Flow chart of the procedure
在我國三峽庫區,由于季節性降水的分配不均及水庫水位的顯著波動等因素,水庫沿岸滑坡災害頻發,據統計,截至2014年長江三峽庫區崩滑地質災害點多達5000余處(許強等, 2014),對長江沿岸居民生命財產安全造成嚴重威脅。因此對持續變形的滑坡進行位移預測被認為是減少或避免滑坡災害造成損失的重要且經濟的方法(殷躍平, 2003; 許強等, 2004; 許強,2012; Zhu et al.,2018; Ma et al.,2018)。
白水河滑坡位于三峽庫區寬河谷段,長江主干道南岸(凸岸),距三峽大壩約56km,屬秭歸縣沙鎮溪鎮樂豐村。秭歸縣地處亞熱帶季風氣候區,降雨連續集中且雨季多暴雨。地勢南高北低,為侏羅系下統香溪群砂巖組成的順向岸坡,巖層產狀15°∠36°,滑坡前緣高程約70m,后緣高程約410m,東西兩側為近南北向山脊,北側為白水河單面山體。該滑坡南北向約600m,東西向約700m,滑坡總體坡度約30°,滑坡總面積0.42km2,滑坡體積126×105 ̄ ̄m3(圖 2)。

圖 2 白水河滑坡平面示意圖Fig. 2 Plane sketch map of Baishuihe Landslide
白水河滑坡歷史上就曾發生過滑動,多年來,隨著庫水位的不斷波動及汛期強降雨,該滑坡變形特征較為強烈。2003年6月隨著三峽水庫蓄水至135m后,該滑坡出現明顯的位移增長趨勢,特別是2007年6月后,受強降雨和庫水位等聯合作用,滑坡變形驟然增加(圖 3)。ZG93和ZG118監測點從2003年6月開始監測。2005年5月和10月又陸續加設了XD1、XD2和XD3、XD4監測點。
本文選用ZG93及ZG118監測點數據進行研究并建立模型。因為相比于其他監測點,ZG93和ZG118持續監測時間長,且均位于白水河滑坡體中部區域,可以較好的記錄和反映滑坡位移運動的整體趨勢。

圖 3 2003~2013年白水河滑坡月降雨量及長江水位與累計位移關系圖Fig. 3 Displacements, rainfall and reservoir level during the period 2003~2013
滑坡變形的產生受內部地質因素和外部誘發因素共同影響,本文以三峽庫區白水河滑坡為研究對象,選用ZG93和ZG118位移監測點自2003年6月至2013年3月間的監測數據進行分析,將總位移分解為趨勢項和周期項位移,分別用多項式最小二乘法、人工蜂群支持向量機模型進行擬合訓練及預測分析。
移動平均可以削弱或消除原時間序列中季節和不規則周期性的變動,從而分離出趨勢項。移動平均法中取周期長度M=12個月,根據移動平均法公式(式(2))提取出滑坡位移趨勢項,利用多項式最小二乘法對其進行分段擬合。
由于趨勢項提取值曲線呈現明顯的分段特征,故本文將其分為3個階段(2004年6月~2007年5月, 2007年6月~2008年7月, 2008年8月~2011年6月)進行研究。ZG93和ZG118滑坡監測點趨勢項位移的提取值和預測值(圖 4)。

圖 4 趨勢項位移的提取及預測(ZG93、ZG118)Fig. 4 Extraction and forecasting the displacement of trend term(ZG93、ZG118)
利用Matlab2010年對趨勢項位移提取值進行多項式最小二乘法擬合(圖 4),擬合方程及精度結果如下:
監測點ZG93:
監測點ZG118:
3.2.1 周期項位移提取
根據時間序列加法模型公式(式1),周期項位移等于總位移量減去趨勢項位移。因此,監測點ZG93與ZG118的周期項位移提取值如圖 5所示。

圖 5 監測點周期項位移提取值Fig. 5 Periodic displacement value of monitoring points
3.2.2 周期項位移預測
降雨和庫水位的變化是滑坡位移的兩個重要的誘發因素(杜鵑等, 2009; 楊背背等, 2018)。通過選取合適的影響因子,研究分析各誘發因素與滑坡位移之間的響應關系,可以更好地對滑坡位移進行研究和準確評價。本文在比對了前人研究資料的基礎上(杜鵑等, 2009; 張俊等, 2015),選取長江庫水位、本月累積降雨、前一月累積雨量、前兩月累積雨量、前一月庫水位變化量、前兩月庫水位變化量與監測點年累計位移7項因素,結合灰色系統關聯度分析法研究各因子同滑坡監測點周期項位移間的關聯度,取分辨系數為0.5,從而得到監測點周期性位移與各影響因子間的關聯度rk如表 1所示。其中,長江庫水位、前兩月降雨、前一月降雨、本月累積降雨同監測點ZG93周期項位移監測數據之間的關聯度分別為0.8525、0.8203、0.7984、0.7912,并且后3項數值比較接近; 與監測點ZG118表現出的現象近似。反映出監測點“階躍式”累計位移同長江庫區水位有密切的關系; 同時,降雨因素在滑坡位移中稍有滯后性。

表 1 滑坡位移周期項與各因子的相關性Table 1 Correlation between periodic terms of landslide displacement and various factors
用可優化選參的人工蜂群算法(ABC)與支持向量回歸機(SVR)結合,構建ABC-SVR滑坡位移預測模型,ABC算法可尋求最優的懲罰因子C及核函數參數g,可提高模型的預測精度(許國根, 2012; 楊景明等, 2014; 卓金武, 2014; 高雷阜等, 2016)。以白水河滑坡2004年6月~2011年6月間的滑坡周期項位移數據為訓練樣本,釆用ABC-SVR模型對2011年7月~2013年6月間的周期性位移進行預測。詳細過程如下:
(1)樣本數據預處理。以離差標準化(Min-Max Normalization)對原始數據做線性變換,使結果映射到[0,1]之間。
(2)模型參數初始化。規定蜂群規模為NP=20,蜜源數量為NP/2,最大搜索次數limit,最大迭代次數maxcycle,核函數使用RBF核函數,支持向量回歸機待優化參數的取值區間。
(3)訓練ABC-SVR模型,用ABC算法搜尋SVR懲罰因子C及核函數參數g的最優值,用得到的最優參數值帶入支持向量回歸機中進行學習訓練和預測。并且用ABC-SVR模型與文獻中的BP神經網絡模型、PSO-SVR模型的預測結果進行對比,對比結果見表 2。

表 2 不同模型預測精度對比Table 2 Comparisons of prediction accuracy of different models
預測結果顯示,監測點ZG93的均方根誤差MSE及平均絕對百分誤差MAPE分別為0.0311, 0.0768,相關系數(Correlation coefficient)為0.96,監測點ZG118的均方根誤差MSE及平均絕對百分誤差MAPE分別為0.0418, 0.0828,相關系數(Correlation coefficient)為0.95,預測精度較高。
從上表可知,PSO-SVR在時間上優于ABC-SVR,但預測效果低于ABC-SVR。BP神經網絡預測模型運行時間較長,預測結果不如其他兩個模型。綜上所述,ABC-SVR預測模型預測效果最優,說明其具有較好的尋優性能及預測效果。
根據時間序列加法模型公式(式(1))可知,監測點趨勢項與周期項位移預測值的數量和即為監測點滑坡累計總位移的預測值。將滑坡累計位移預測值與實測值進行對比(圖 6)。結果顯示,預測結果與實測值變化趨勢較為一致,預測結果較好。ZG93和ZG118累計位移預測擬合優度值R2分別為0.97、0.96,平均絕對百分誤差MAPE分別為0.083和0.078,說明基于時間序列人工蜂群支持向量機模型具有較好的預測精度,可以用于滑坡位移的預測研究。

圖 6 監測點累積位移的預測Fig. 6 Prediction of cumulative displacement of monitoring points
(1)本文提出了一種基于時間序列分析的結合人工蜂群算法優化支持向量機(ABC-SVR)的滑坡位移預測模型。用移動平均法從滑坡累計位移監測數據中提取滑坡趨勢項位移,用多項式最小二乘法對趨勢項位移進行分段擬合和預測。該模型的提出解決了灰色系統誤差較大問題,避免了神經網絡存在的模型結構難確定、精度難保證及泛化能力不高的缺點,為非線性滑坡預測模型在尋優過程中易陷入局部最優的情況提供了新的思路。
(2)根據灰色系統關聯分析法,分析7項影響因子與滑坡周期性位移數據的關聯度。結果顯示,長江庫水位、前兩個月累積降雨和前1個月累積降雨為相關性rk最大的3項,分別達到(ZG93監測點)0.8525、0.8203、0.7987,表明庫水位變動在滑坡位移中的重要性,并且降雨因素對滑坡位移影響具有一定的滯后性。
(3)將人工蜂群算法優化支持向量機(ABC-SVR)模型所得結果同BP神經網絡及PSO-SVR方法的結果進行對比,ABC-SVR模型展現出較好的位移預測結果。表明基于時間序列的人工蜂群支持向量機位移預測模型可以較好地對滑坡位移進行預測研究,有較好的實用性及應用前景。