連浩, 周愛紅,2*, 樂婧瑜
(1.河北地質大學城市地質工程學院, 石家莊 050031; 2.河北省地下人工環境智慧開發與管控技術創新中心, 石家莊 050031)
大量研究表明,邊坡失穩會導致崩塌、滑坡等常見的地質災害,對社會經濟、人民財產和工程建設等安全造成巨大的威脅,因此能夠準確預測邊坡穩定性狀態具有重要的意義[1-3]。影響邊坡穩定性的因素復雜多樣,如何建立合理的評價模型來反映多個影響因素與邊坡穩定狀態之間的聯系,對邊坡穩定性研究至關重要。
目前應用于邊坡穩定性的預測模型眾多,如王鵬飛[4]建立灰色系統理論和RBF(radial basis function)神經網絡組合模型對邊坡變形進行預測,能夠更好地抵抗預測數據序列中的波動性,保持邊坡穩定性預測的良好精度;方慶紅等[5]建立了強度折減法和BP(back propagation)神經網絡模型,用于確定坡態控制參數優化與穩定性之間的非線性關系;孫吉書等[6]通過建立相關向量機模型對邊坡安全系數進行了預測;楊勇等[7]建立基于隨機權重法改進的粒子群算法優化極限學習機模型,可以有效提高ELM(extreme learning machines)模型的穩定性;劉君浩等[8]選用隨機森林和神經網絡方法對巖質邊坡進行了變形預測;張化進等[9]采用5種自動機器學習對邊坡穩定性狀態進行預測, 并與傳統機器學習方法對比分析; 傅楊攀等[10]將CSMR(Chinese system for SMR)分類體系和卷積神經網絡相結合,對廣東某巖質邊坡進行穩定性預測分析;張泰麗等[11]建立了Box-Jenkins模型預測邊坡穩定系數時間序列數據,得到循環荷載作用下的邊坡穩定系數的變化規律。
上述模型在邊坡穩定性預測中都取得了不錯的實際效果, 但是仍存在收斂速度較慢、計算結果不穩定、泛化性能差、易陷入局部最優和預測精度較低等問題。鑒于此,現結合ISSA具有求解精度高、穩定性強、收斂速度快等特點,SVM適用于解決小樣本數據及非線性問題的特性,建立ISSA-SVM邊坡穩定性預測模型對邊坡穩定性狀態進行預測,為邊坡防治工程提供重要參考。
在自然、人工條件下影響下,邊坡均有可能從穩定狀態轉為失穩狀態,其穩定性受到眾多因素影響,大致可分為以下幾類:①物理力學性質:包含邊坡的黏聚力、內摩擦角、孔隙壓力比、重度等;②邊坡的幾何特征:包含邊坡高、邊坡角、邊坡幾何現狀;③降雨作用;④地震作用;⑤人類工程活動:包含開挖、爆破等一系列工程措施。
對于上述所提到的5類影響邊坡穩定性的因素,中外學者有著不同的評價標準,通過對于前人選取指標的歸納總結,大部分專家學者采用巖土體重度(γ)、黏聚力(C)、內摩擦角(Φ)、邊坡高(H)、邊坡角(β)、孔隙壓力比(ru)6項因素作為邊坡穩定性判別的輸入數據[12-15]。
根據1.1節得到的結論,為使模型測試數據更具有普適性,選取文獻[16-19]中所涉及的中外邊坡工程實例作為數據庫,所選邊坡應涉及不同高度、坡度、類型,并繪制小提琴圖(圖1)。通過圖1可以看到,本文所選的6項影響因素的最大最小值、平均值、主要分布范圍,由巖土體重度、黏聚力、內摩擦角的分布可知本文所選取的邊坡包含巖質邊坡及土質邊坡,由邊坡高度分布可知本文所選取的邊坡包含超高邊坡、高邊坡、中邊坡、低邊坡,由邊坡坡度分布可知本文所選取的邊坡包含緩坡、中等坡、陡坡。

圖1 影響因素小提琴圖Fig.1 Violin diagram of influencing factors
以文獻[16-19]中選取邊坡工程實例,作為訓練樣本數據集,同時為了避免不同文獻中出現相同的樣本數據造成模型訓練過擬合,對上述訓練樣本數據剔除重復數據,最終選用193組數據作為訓練樣本數據(部分數據見表1),以文獻[20]中選取的39個邊坡工程實例作為測試樣本數據集(部分數據見表2),以重度、黏聚力、內摩擦角、邊坡角、邊坡高、孔隙壓力比作為評價邊坡穩定性的影響因素,取邊坡穩定狀態為評價結果,其中穩定邊坡、不穩定邊坡,分別用1、0表示。

表1 訓練樣本Table 1 Training samples

表2 測試樣本Table 2 Test samples
在機器學習中,若樣本數據間存在較強的相關性關系,則會導致模型出現過擬合問題[21]。為提高模型的預測精度,防止模型出現過擬合問題,文章利用皮爾遜系數進行數據相關性分析,得到6個影響因素之間的兩兩關系,具體如表3所示。一般認為相關性系數越接近于1相關性關系越強,其中0.7~1為強相關,0.4~0.7為中度相關,小于0.4為弱相關,表3中影響因素大于0.5的因素有2個,為重度與邊坡角、重度與邊坡高,其余因素之間的相關性均小于0.5,表明參數之間的相關程度均為非強相關,可以采用巖土體重度、黏聚力、內摩擦角、邊坡角、邊坡高度、孔隙壓力比6項因素作為邊坡穩定性輸入參數。

表4 預測結果對比表Table 4 Comparison table of forecast results
麻雀搜索算法是一種基于麻雀種群中的覓食和反捕食行為提出的種群智能優化算法[22]。麻雀種群可分為發現者和跟隨者、警戒者。發現者、跟隨者和警戒者的位置更新公式為

(1)
式(1)中:t為當前迭代次數;itermax為最大迭代次數;Xi,j為第i個麻雀在第j維中的位置信息;α∈(0,1]為一個隨機數;Q為服從正態分布的隨機數;L為元素值為1的d維列向量;R2和ST分別為預警值和安全值,R2∈[0,1],ST∈[0.5,1]。

(2)
式(2)中:Xp為當前發現者所占最優位置;Xworst為當前全局最差位置;A為元素隨機賦值1或-1的1×d矩陣,且A+=AT(AAT)-1。

(3)
式(3)中:Xbest為當前全局最優位置;β為步長控制參數;K∈[-1,1]為隨機數;fi為當前麻雀個體的適應度值;fg、fw分別為全局最佳和最差適應度值;ε為最小常數。
麻雀搜索算法容易出現性能差、收斂速度慢、陷入局部最優的問題。基于以上原因,選用ISSA算法對上述不足進行改進[23]。其改進方面主要包含:對初始化麻雀種群采用立方混沌映射[24],并使用透鏡成像反向學習方法增加更優解的選取概率[25];將雞群優化算法中隨機跟隨策略引入跟隨者位置更新公式[26];采用柯西高斯變異策略解決局部最優停止問題[27]。
SVM是一種基于VC維理論(Vapnik Chervonenkis dimension,VC)和結構風險最小原理建立的機器學習方法[28-29]。在低維空間難以處理的數據集,SVM可通過非線性變換將輸入空間變換到一個高維空間中,在這個空間中構造最優分類面,該平面不僅可以正確分開兩類訓練樣本,還可以使其分類間隔達到最大,提高預測精度。具體求解過程如下。
設給定的樣本{(xi,yi),i=1,2,…,n},xi為樣本數據中的各項評價指標,yi為相對應的評價結果。假設xi為第一類,則yi=1;xi屬于第二類,則yi=-1,將超平面記為wTx+b=0,為使所有樣本正確分類且具有分類間隔,需滿足約束條件為
yi(wTx+b)≥1
(4)
式(4)中:w為權重向量,定義了特征空間中的一個超平面,將不同類別的樣本分開;b為決策邊界的偏置項,調整了決策邊界的位置。

(5)
引入Lagrange函數,將最小值求解問題轉化為相應的對偶問題,即

(9)
式(6)中:αi、αj為拉格朗日乘子;xm、xn為第m、n個樣本的特征向量;ym、yn為第m、n個樣本的類別標簽。

(7)

得到最優分類函數,即

(8)
對表1中的訓練樣本進行歸一化后,以6項影響因素作為輸入、以邊坡穩定狀態作為輸出建立SVM模型。并通過ISSA算法對SVM的懲罰函數C和核函數g進行優化取值。ISSA算法的初始參數為:初始麻雀數量pop=30,最大迭代次數100,預警值ST=0.6,發現者比例PD=0.7,警戒者比例SD=0.2;其參數的ISSA尋優過程如圖2所示,經過多次迭代尋優后,最終確定SVM模型參數最優值C=100,g=100.009。
由圖2可知,使用ISSA智能算法對SVM邊坡穩定性預測模型參數進行迭代尋優時,算法初始收斂速度較快,表明引入精英混沌反向學習策略后,極大地提升了算法的收斂速度,且迭代曲線呈階梯式下降,表明引入雞群算法和柯西-高斯變異策略后,較好地避免陷入局部最優問題,并在7次迭代之后,適應度值趨于收斂。

圖2 ISSA算法參數尋優Fig.2 ISSA algorithm parameter optimization
將訓練樣本代入該模型進行回歸仿真訓練,得到圖3所示的混淆矩陣圖。由圖3可知訓練樣本中的穩定邊坡共有110個,其中109個預測正確,1個預測錯誤,模型判別正確率為99.09%,不穩定邊坡共有83個,全部預測正確,模型判別正確率為100%,ISSA-SVM模型的總體判別正確率為99.49%,邊坡穩定性預測模型具有較高的預測精度。

圖3 混淆矩陣圖Fig.3 Confusion matrix diagram
通過上述建立的ISSA-SVM預測模型對測試樣本中的邊坡穩定狀態進行預測,模型測試集的預測結果如下表4所示,ISSA-SVM模型在僅19號樣本發生了誤判,模型判別正確率為97.44%,SSA-SVM模型在12、13、19號樣本發生了誤判,模型判別正確率為92.30%,表明經過改進優化的麻雀搜索算法具有更高的預測精度。同時在進行100次迭代時,ISSA-SVM模型總用時16.19 s,SSA-SVM模型總用時44.39 s,表明ISSA算法大幅提高了運算速率。
為了評估模型的預測性能,引入ROC(receiver-operating characteristiccurve,ROC)曲線作為衡量標準。ROC曲線是基于真正率和假正率評估預測模型性能的一種方法,具有直觀易懂、較好的魯棒性等優點,因此在機器學習中采用ROC曲線可以更加直觀地評估預測模型的性能,其精度通過曲線下面積(area under roc curve, AUC)表征,AUC值越接近于1認為模型越好[31-32]。圖4為ISSA-SVM、SSA-SVM模型的ROC曲線圖,其中ISSA-SVM模型的AUC為0.987,SSA-SVM模型的AUC為0.932,表明相比較SSA算法,ISSA算法優化后的SVM模型具有更好地預測精度、更好的魯棒性以及更不易出現過擬合問題的優點,可以用于邊坡穩定性預測。

圖4 ROC曲線圖Fig.4 ROC plot
測試集19號樣本被誤判為不穩定邊坡,其可能原因是:通過對比訓練集和測試集數據,發現183號訓練集樣本與19號測試集樣本6項影響因素的值均一致,其對應的邊坡穩定狀態應該一致,但來源于文獻[18]的訓練集183號樣本的邊坡穩定狀態為不穩定,而來源于文獻[20]測試集19號樣本的邊坡穩定狀態為穩定,表明可能其中一篇文獻數據有誤。而ISSA-SVM模型在使用183號樣本進行訓練后將測試集19號樣本預測為與183號樣本一致的穩定性狀態,符合模型預測邏輯,這從另一角度反映出ISSA-SVM模型具有較好的訓練能力,能有效挖掘已知樣本的內部規律。
在機器學習中探究影響因素對輸出結果的敏感程度,可以為邊坡穩定性判斷提供更加可靠的參考依據,因此本文研究采取灰色關聯度分析法(GRA)進行敏感性分析,具體結果如圖5所示。

圖5 影響因素關聯度圖Fig.5 Influencer correlation chart
由圖5可知,通過灰色關聯度分析法,確定各影響因素敏感性分析結果如下:內摩擦角(0.957)>黏聚力(0.953)>邊坡高(0.928)>巖土體重度(0.874)>邊坡角(0.851)>孔隙壓力比(0.835)。依據灰色關聯度理論一般認為關聯度大于0.8,影響因素與邊坡穩定性狀態之間關聯程度較高,因此本文所選取的6項指標可以用于邊坡穩定性預測模型,并且內摩擦角和黏聚力是對邊坡穩定性最敏感的兩個因子。
根據相關研究理論,通常認為邊坡角對于邊坡穩定性影響的重要程度大于巖土體重度,與本文研究通過GRA法得到的各影響因素敏感性排序有所區別,因前文提到邊坡高和巖土體重度間有較高的相關關系,為探究是否因兩者間相關關系過高導致巖土體重度的敏感性大于邊坡角的敏感性,本文研究采用分布回歸法進行中介效應檢驗,如表5所示。通過表5可知,模型1中巖土體重度與邊坡穩定性狀態存在顯著影響關系, 模型2中巖土體重度與邊坡高存在顯著影響關系,且在模型3巖土體重度與邊坡穩定性狀態無顯著性關系。因此說明邊坡高在模型中的中介作用成立,并且為完全中介。因此認為灰色關聯度分析法中巖土體重度對于邊坡穩定性影響的敏感性大于邊坡角是受到了邊坡高的影響。

表5 中介效應檢驗表Table 5 Mediation effect check table
(1)ISSA算法具有求解精度高、穩定性強、收斂速度快等特點,可以高效準確地尋找SVM模型所需最優參數。利用ISSA-SVM邊坡穩定性預測模型,對測試集數據進行預測,模型判別正確率為97.44%,表明該模型能夠準確地預測邊坡穩定狀態。同時利用ROC曲線對測試樣本進行檢驗,其中ISSA-SVM模型的AUC=0.987,表明ISSA-SVM模型具有較好的泛化能力,可以用于預測邊坡穩定性。
(2)影響邊坡穩定性的因素復雜多樣,本文通過灰色關聯度法對選取的6個因素進行敏感性分析,各因子敏感性大小依次為:內摩擦角、黏聚力、邊坡高、巖土體重度、邊坡角、孔隙壓力比。其中內摩擦角、黏聚力兩個因素的關聯度值最高,與邊坡穩定性狀態有較強的影響關系,在邊坡防治中可以采取針對性的監測措施,從而進行邊坡失穩預警。
(3)本文建立的ISSA-SVM邊坡穩定性預測模型取得了較好的預測效果,但受限于所收集數據僅為邊坡物理力學性質、邊坡的幾何特征這兩類因素,缺少了對外力作用(降雨、地震等)、人類工程活動作用對邊坡穩定性的影響,因此在邊坡防治工程中,除了借鑒本文所提供的研究方法外,還應注重其他影響因素的作用。