陳兆龍
(湖南興禹建設有限公司,湖南 常德 415000)
水利工程建設過程中常常無法避免對山體的切削,坡體的穩定性直接決定了工程建設的可行性、難易程度以及施工管理的復雜性。工程邊坡的穩定性評價是勘查、設計和施工管理中的重中之重。為此,國內外對邊坡穩定性評價進行了大量的研究,Zhou J[1]等利用二次二階矩法(SOSM)分析了含軟弱結構面的邊坡穩定性,穆志江[2]基于有限差分的FLAC3D軟件實現了三維情況下的水利工程高陡邊坡開挖穩定性的模擬,評價了該工程邊坡的穩定性。然而這些方法所基于的數學、力學原理均較為復雜,需要大量的建模、參數擬定和數值計算,因此雖然給出了較為可信的定量評價結果,但對水利工程邊坡的穩定性評價效率并不高。在工程建設的初始階段,定性評價往往要比定量評價更為適用。
近年來,隨著計算機技術的發展,對于水利工程邊坡穩定性的定性評價系統以及工程風險評估系統的開發成為了研究的熱點[3]。隨著現代計算機和人工智能技術的飛速發展,大量人工智能技術被運用到了邊坡穩定性評價當中,如Qi C[4]等提出并比較了六種基于元啟發式和ML算法的邊坡穩定性預測的綜合人工智能(AI)方法,證明了集成的AI方法具有很大的預測斜率穩定性的潛力。Hoang N D[5]等利用先進的機器學習方法,包括極限學習機(ELM)、徑向基函數神經網絡(RBFNN)和最小二乘支持向量機(LSSVM),對邊坡穩定性預測進行了對比研究。蘇國韶[6]等基于高斯過程機器學習對邊坡穩定性進行了定性評價,康飛[7]等提出了基于計算機試驗結合機器學習理論建立邊坡系統(體系)可靠度分析智能響應面法的一般框架。
對于工程建設者而言,Logistic回歸算法可以很好地用于邊坡穩定性分析,通過設計與水利工程邊坡穩定性評價配套的計算模型,可利用該算法快速地得出穩定性評價的結論。
在水利工程項目可行性研究階段,邊坡穩定性評價問題可以簡化為“欠穩定”與“穩定”兩種情況的判定,若將其分別利用“0”和“1”表示,這就成為了典型的離散變量預測問題。
該離散變量預測問題因變量簡明,但由于影響水利工程邊坡穩定性的因素較多,如坡高、坡角、地質年代與地層巖性、巖層厚度、軟弱結構面的數量與厚度、水文地質條件等,使得該離散變量預測問題的自變量紛繁復雜,因此提煉影響邊坡穩定性的主要因素至關重要。本文取坡高、坡角、地層巖性、巖體結構、軟弱地層、風化程度、地下水和年降水量等作為控制水利工程邊坡穩定性的主要因素,將這些因素作為模型的自變量,研究其對邊坡穩定性的影響。
1.2.1 評價模型的建立
經過水利工程邊坡穩定性評價模型因變量與自變量的選取,可將其用數學語言表達如下:
設因變量符號為y(i)(1≤i≤m),其中i代表第i個所研究的邊坡,m為所研究邊坡的總數量。由以上分析可知y(i)滿足y(i)∈{0,1},當邊坡被判定為“欠穩定”時,y(i)=0,當邊坡被判定為“穩定”時,y(i)=1。
下面建立自變量與因變量之間的關系,先令中間變量為z,表達式見式(1):

式中,θj為常系數,該式表示各自變量的值與其權重的乘積之和,表征各因素對邊坡穩定性的影響程度。
向量化表示以便于運算,式(1)可化為式(2):

由于y(i)∈{0,1},對“0”與“1”的判斷可用概率表示,所以應選取合適的自變量與因變量之間的函數關系hθ(x)描述因變量的取值概率,見式(3)、式(4):


式中,P(y=1|x)表示y=1(穩定)的概率,P(y=0|x)表示y=0(欠穩定)的概率,0<hθ(x)<1。上述兩式表示,當z取正值且較大時,P(y=1|x)=1,P(y=0|x)=0,當取負值且足夠小時,P(y=1|x)=0,P(y=0|x)=1。由此可通過選取適當的概率閾值判斷邊坡是否穩定。
1.2.2 模型的求解
在Logistic回歸中,最終要求解的未知量是θ,此處采用最速梯度下降法進行求解。在求解過程中需要判定解是否收斂,可選取一個目標函數,命名為Cost函數,Cost函數在Logistic回歸中用于判定算法的收斂性,當Cost函數達到最小值時判定算法求解已收斂,即此時的θ即為區分邊坡穩定性的最優解。
機器學習中,通常該問題的Cost函數表達式見式(5):

對式(5)解釋如下:由于需要得到J(θ)的最小值,因此當已知樣本的y(i)=1時,意味著需要將式中的hθ(x(i))更替為一較大值,使得J(θ)減小;當y(i)=0時,意味著需要將hθ(x(i))更替為一較小值,使得J(θ)減小。由此通過一個邊坡穩定性的判斷,可以得到一組更佳的θ值,θ迭代方式通過最速梯度下降法獲得,見式(6):

式中,α為學習速率,為一常數,式(6)即θ原值減去學習速率與式(5)對θ的導數之積,Cost函數沿此路徑下降最快。實際計算時本文采用Matlab的fminunc函數實現α的自動選取。
由此經過一系列已知邊坡穩定性情況對上述模型的反復訓練,便可得到使得Cost函數收斂的最佳θ取值,將該值代入式(2)中得出判斷邊坡穩定與否的邊界。
在按上述思路求解該水利工程邊坡穩定性評價模型的過程中,定義模型自變量為坡高、坡角、地層巖性、巖體結構、軟弱地層、風化程度、地下水和年降水量。其中坡高、坡角和年降水量已為量化指標,可不進行處理,但需將其他自變量進行量化以便代入數學模型運用Logistic回歸算法進行求解。參考劉美芳[8]所建立的復雜邊坡管理系統,規定量化指標見表1~表5。

表1 巖性量化指標

表2 巖體結構量化指標

表3 軟弱地層量化指標

表4 地下水量化指標

表5 風化程度量化指標
石磨嶺庫區邊坡經初步地質調查,得到的地質資料見表6[9],現對該邊坡的穩定性作出初步的定性判斷。

表6 石磨嶺庫區邊坡地質資料
首先利用表1~表5對該水利工程邊坡的地質資料進行量化操作,所得量化指標見表7。

表7 地質情況量化表
利用Logistic回歸建立分類模型的首要步驟是收集訓練集相關數據。由于所研究的對象是水利工程邊坡,研究的內容是水利工程邊坡的穩定性評價,可根據統計學大樣本定義,借鑒該案例的評價指標,經野外地質調查,另選取30個水利工程邊坡形成訓練集。水利工程邊坡訓練集相關數據見表8,相關指標均以量化的形式呈現。

表8 水利工程邊坡訓練集數據
由表8可知,正樣本(“穩定性”=1)的個數為13,負樣本(“穩定性”=0)的個數為17,正負樣本選取較為均勻,可以進行下一步的Logistic回歸分析。
2.2.1 Logistic回歸的實現
由表8可知,單個樣本中自變量的取值差異較大,如年降水量比巖性評分等指標高出2個數量級,這種情況將會造成Logistic回歸的收斂速度過慢甚至無法得到最優解。因此,考慮將每個自變量均進行特征縮放,特征縮放的過程見式(7):

式中,μj為第j個自變量的均值,sj為第j個自變量的標準差,由此限制所有樣本的自變量均滿足。
為防止過擬合的現象發生,設定正則因子為λ(λ>0,λ∈R),正則化后的Cost函數及θ值迭代表達式分別見式(8)、式(9):

式中,與λ的乘積項為正則化項,通過選取合適的正則因子λ可以有效地防止過擬合。
取λ=10,經上式迭代400次,編制程序進行計算,可得θ值:

此時對應的Jmin(θ)=0.263545,θ為局部最優解,由于Cost函數是凸函數,所以該局部最優解便是全局最優解。
建立水利工程邊坡穩定性定性預測與評價模型,見式(10)、式(11):

式(10)為預測模型,式(11)為評價模型,將待評價邊坡的自變量代入兩式計算,當hθ(x)≥0.5時,認定y(i)=1,即坡體是穩定的;當hθ(x)<0.5時,認定y(i)=0,即坡體欠穩定。
2.2.2 邊坡穩定性評價
在對工程案例進行評價之前,為考證模型的正確性,將30個訓練集邊坡案例代入由式(11)所建立的模型中,重新對各個已知穩定性的邊坡進行穩定性判斷。經檢驗,得到與真實結果相同結論的準確率為96.67%,模型準確性較高。
對案例邊坡進行穩定性評價,將已量化的已知自變量代入上述模型中,得到hθ(x)=0.263442<0.5,因此y=0,即該邊坡可能發生失穩,與實例結論一致。
水利工程邊坡穩定性的研究是水利工程建設可行性研究的重要環節之一,在可行性研究階段對坡體穩定性進行簡單可信的定性評價有利于節省勘查成本和研究成本。基于這一需求,結合目前熱門的Logitsic回歸思想,建立了水利工程邊坡穩定性評價模型,該模型能夠定性給出坡體的穩定性情況。模型考慮了地層巖性、坡高、坡角等8個主要因素對坡體穩定性的影響,充分體現坡體的特征,使得運用該模型評價的結果更加準確可靠。經30個樣本的訓練后,利用該模型對石磨嶺庫區水利工程實際邊坡穩定性作出了定性預測,論證了該模型的可靠性和實用性。