張研, 付閔潔, 王鵬鵬, 梁劍明, 郭道靜
(1.桂林理工大學,廣西巖土力學與工程重點實驗室, 桂林 541004; 2.廣東省海洋地質調查院, 廣州 510080)
邊坡穩定性分析是邊坡災害防治的核心內容之一,是判斷邊坡是否需要加固及加固措施選擇的重要依據。目前,極限平衡法和數值模擬法是評估邊坡是否穩定的常用分析方法。前者作為經典穩定性分析方法只能假設滑動面,且沒有考慮巖體的應力-應變關系,無法精準評判巖體力學真實變化情況。相較極限平衡法,數值模擬法雖可較準確的分析巖體變形、應力分布等,但其仍有安全系數概念模糊等問題[1-5]。邊坡作為動態開放系統,影響其穩定性的影響因素較多,多數影響因子隨機多變,與邊坡穩定性之間存在著復雜的非線性映射關系,故傳統分析方法有其相對局限性。為了更好地治理和防護邊坡,指導邊坡工程的設計和施工,邊坡穩定性分析方法的研究成為現場工程師和科研工作者關注的焦點[6-9]。
近年來機器學習快速發展,為邊坡穩定性分析提供了新思路。劉春等[10]借助灰色系統理論,并建立數學模型,探討邊坡巖體穩定性對于不同影響因素的敏感度,該理論系統考慮了工程中邊坡的實際問題,在邊坡穩定性預測問題上取得良好的成效;楊雅萍等[11]采用交叉變異優化的蝙蝠算法預測邊坡穩定性,該理論系統通過對所選 110 組影響邊坡穩定性的因素作為樣本進行模型建立、訓練與預測,選用經典邊坡算例驗證,與其預測結果接近;賀可強等[12]通過收集選取38個邊坡數據,明確6處變量,采用反向傳播算法的前饋神經網絡,建立邊坡穩定性預測算法模型,在測試數據中泛化能力較好;胡軍等[13]在人工神經網絡預測邊坡穩定性的基礎上,協調粒子群算法優化BP(back propogation)神經網絡模型,建立了基于協調粒子群(coordinated particle swarm optimization,CPSO)-BP邊坡穩定性的模型,該模型較BP神經網絡更好實現對邊坡穩定性的預測精度。盡管諸多學者針對邊坡穩定性問題進行了較多基于機器學習的探討與研究,但神經網絡存在收斂速度慢,預測精度偏低,需調整參數過多等問題。支持向量機參數較少,其訓練時長隨訓練樣本增加而延長,且核函數必須滿足 Mercer 的條件。
為有效避免上述問題對預測結果的影響,相關向量機(relevant vector machine, RVM)的機器學習方法[14-15]被提出,該方法在處理非線性數據和預測回歸問題上展示了其強大優越性。相關向量機[16-17]是基于支持向量機的理論基礎發展而來,有多種數據處理技術的機器學習方法,其更具稀疏性,可概率輸出,且核函數選取靈活。單一RVM模型在計算效率和尋找參數方面并非最優,為提高其效率和精確度,利用粒子群優化算法對RVM模型進行優化,更好的幫助RVM模型尋找最優參數,解決手動調節的困難,使整個模型的流程實現自動化。
考慮到邊坡為動態開放系統以及其穩定性預測的復雜性,以具體實例數據為依托,篩選出巖體重度、黏聚力、內摩擦角、邊坡角、邊坡高度、孔隙壓力共6個評價指標,通過大量現場實測信息與穩定性安全系數作為機器學習樣本。采用相關向量機對實測信息,穩定性安全系數進行學習,建立邊坡穩定性安全系數與其各影響因素間的非線性映射關系,并利用粒子群算法進行參數尋優,建立邊坡穩定性的粒子群優化算法的相關向量機預測分析模型,為邊坡安全系數的獲取提供一種新方法。
RVM[18-19]是基于貝葉斯原理的一種可學習數據特征的概率模型,在各個權值ω之上定義超參數α影響的獨立先驗概率。若訓練數據集為{xn,tn|n=1,2,…,N},其中xn和tn分別為輸入值和輸出值,令tn獨立分布,得tn的函數關系式為
tn=y(xn;ω)+ξn
(1)

(2)


(3)
式(3)中:yc代表核函數中心;σ代表高斯核寬度。
設tn為相互獨立分布,則似然函數為
p(t|ω,σ2)=(2πσ2)-

(4)
式(4)中:t=(t1,t2,…,tN)T;ω=[ω0,ω1,…,ωN]T;Φ為N×(N+1)階矩陣。
假設ωn服從均值為0、方差為αn-1的高斯條件概率分布,即

(5)
式(5)中:α為權值ω的先驗超參數,假定超參數α和噪聲參數σ2服從Gamma先驗概率分布,即

(6)
P(σ2)=Gamma(c,d)
(7)
Gamma(a,b)=Γ(a)-1baαa-1e-ba
(8)

(9)
為獲取更均勻的超參數,一般規定常參數a=b=c=d=0。
則ω概率分布為

1.2 儀器和試劑 邁瑞Mindray公司的五分類細胞分析儀;Dympus BX50型顯微鏡;廣州萬孚公司的惡性瘧原蟲抗原檢測試劑;染色液為RR8姬姆薩染液。
=(2π)-(N+1)/2|Σ|-1/2·

(10)
式(10)中: Σ=(σ-2ΦTΦ+A)-1,表示方差;μ=σ-2ΣΦTt,表示均值;A=diag(α0,α1,…,αN),為對角矩陣。
假設待測樣本為y*,則預測值t*分布為

(11)

(12)

粒子群優化算法(particle swarm optimization,PSO)[20-21]是一種基于群體智能方法的進化計算技術,是基于可行解范圍中的一群初始化隨機粒子,每個粒子都將會成為待解決問題的一個最優解,對一群隨機粒子的初始位置和初始速度不斷進行迭代計算以找出最優解。
PSO里面粒子代表待解決問題的答案,每個粒子的坐標xi=(xi,1,xi,2,…,xi,d,…,xi,D),飛行速度vi=(vi1,vi2,…,vid,…,viD);第i個粒子的歷史最優坐標Pi=(Pi1,Pi2,…,Pid,…,PiD);每個粒子經歷的最優坐標Pg=(Pg1,Pg2,…,Pgd,…,PgD),粒子群在飛行過程中不斷更新,表達式為

(13)

(14)


(15)
式(15)中:itermax為最大迭代次數;ωmax和ωmin為權重的初值和終值,一般情況下,ωmax取0.9,ωmin取0.4。
因此,權重ω的變化方式為
ω=aωd+bωk
(16)
隨之,粒子的位置將不斷地被更新進而不斷接近全局最優解。
本文中引用文獻[13]中的34組影響邊坡穩定性的數據,其具體數據如表1所示,將前30個樣本作為訓練學習數據集,后4個樣本為預測數據集,并與文獻[13]中運用CPSO-BP神經網絡模型和BP神經網絡模型得到的預測結果進行對比,來驗證和檢測該PSO-RVM模型的可靠性和準確性。

表1 邊坡穩定性數據樣本集
(1) 數據預處理。為了消除各個數據的數量級對RVM模型預測效果的影響,需將數據進行標準化處理,標準化處理公式為

(17)
(2)確定建模因子。利用文獻[13]中的邊坡穩定性相關數據(巖石重度 、黏聚力 、內摩擦角 、邊坡角 、邊坡高度、孔隙壓力比),并對數據進行了整理、分析、歸納,樣本數據中6個主要影響因素作為輸入值,輸出值為邊坡穩定性安全系數。
(3)模型初步建立。以標準化處理后的數據為基礎,選取前30組數據作為學習樣本,用于模型的映射訓練,找出輸入值和輸出值的非線性映射關系;剩余4組數據作為預測樣本,用于檢驗模型的預測效果。啟動PSO程序來生成粒子,這些粒子通過尋優可以找到最優核函數寬度,該寬度傳送到RVM程序中對預測樣本進行計算。此外,通過更新粒子群算法中的粒子來自動減少預測結果與實測結果之間的適應度和均方差,直到粒子群尋優出來的核函數寬度滿足RVM計算的精度要求。基于PSO-RVM的邊坡穩定性安全分析模型如圖1所示。

圖1 基于PSO-RVM的邊坡穩定性分析模型Fig.1 Slope stability analysis model based on PSO-RVM
(4)模型結果分析。基于最優參數建立滿足要求的預測模型,采用該模型對預測樣本進行預測。將4組預測樣本預測值與相應實測值進行對比分析(相對誤差、平均相對誤差和均方差),驗證模型的精確度和可靠性,計算簡圖如圖2所示。

圖2 基于PSO-RVM的計算流程圖Fig.2 Calculation flow chart based on PSO-RVM
選取上述數據樣本,將數據進行標準化處理,前30組學習樣本用于擬合訓練,后4組待預測樣本用于預測,建立了基于PSO-RVM邊坡穩定性分析預測模型,程序初始化,利用PSO對RVM模型進行參數尋優,可以得出加速度參數c1=2、c2=2,種群數量N=20,終止代數M=1 000, 粒子尋優過程中利用預測集的均方差作為終止條件,如圖3所示,邊坡穩定性安全系數預測結果與實驗值對比如表2所示,為了更加清楚地對各個模型預測出的結果進行對比,如圖4所示。

圖3 PSO-RVM模型迭代圖Fig.3 Iteration diagram of the PSO-RVM model

圖4 各個模型之間與實際值之間的預測結果比較Fig.4 Comparison of predicted results between models and actual values

表2 不同預測方法預測結果及實測值的比較
從圖4中可直觀看出:基于粒子群優化算法的相關向量機邊坡穩定性分析模型,其預測值與試驗值高度一致,吻合度較好。另外, PSO-RVM模型得到的相對誤差僅為2.058%、-5.830%、-1.183%
和-0.990%,且其最小的相對誤差僅為0.99%,從各個模型之間的整體性對比來看,PSO-RVM模型得到的邊坡穩定性安全系數得到的預測結果均優于利用BP神經網絡模型和CPSO-BP神經網絡模型得到的預測結果,證明了本文中所建立的基于粒子群優化算法的相關向量機模型對邊坡穩定性的分析預測是非常可觀的。
現通過平均相對誤差(average relative error,ARE)和均方差(mean square error,MSE)這兩個指標來更好地對比這兩種模型整體預測精度和離散情況,計算公式為

(18)

(19)
式中:y′i為實測值;yi是預測值;n為樣本個數。
計算結果如表3所示,可知: PSO-RVM模型對邊坡穩定性安全系數的預測結果的平均相對誤差只有2.515%,均方差為0.064;而利用BP神經網絡模型,其平均相對誤差為8.11%,均方差為0.103,雖然該文建立了PSO-RVM模型沒有利用 CPSO-BP 神經網絡得到的均方差接近,但通過整體的預測數據和對比來看本文所建立的模型優于BP神經網絡模型和CPSO-BP神經網絡模型。圖5、圖6更加清晰地對比了RVM模型和BP神經網絡模型的平均相對誤差ARE和均方差MSE。

圖5 各個模型之間的平均相對誤差Fig.5 Average relative errors between models

圖6 各個模型之間的均方差Fig.6 Mean square deviation of each model

表3 各個模型邊坡穩定性安全系數的平均相對誤差及均方差
由此看出,從平均相對誤差ARE,還是均方差MSE,PSO-RVM模型更優于BP神經網絡模型,雖然CPSO-BP神經網絡得到的均方差MSE較PSO-RVM模型較好,但整體上分析PSO-RVM 模型獲得的預測結果,其精度更好、更高。因此根據對比結果可得:本文提出的基于PSO-RVM的邊坡穩定性分析模型,相比于BP神經網絡模型和CPSO-BP神經網絡模型,整體預測精度更高,得到的樣本預測值穩定性更小,具有更高的可信度。
本文提出的基于粒子群優化算法的相關向量機邊坡穩定性分析模型以34組學習數據作為訓練集,4組預測數據作為驗證集,經程序運行后其結果表明,該PSO-RVM模型的預測精度高,穩定性好,并得出以下結論。
(1)邊坡穩定性安全系數受多種非線性關系因素影響,利用PSO-RVM模型得到的平均相對誤差和均方差僅為2.515%和0.064,在預測方面有較高穩定性,說明PSO-RVM預測模型能夠高效準確地對其邊坡穩定性安全系數進行預測,為邊坡穩定性分析找到了一種新方法、新途徑。
(2)利用PSO-RVM模型得到的邊坡穩定性分析模型能夠精確地實現對邊坡安全系數的預測。結果表明,PSO-RVM模型能夠準確地預測結果,且其誤差均在合理的范圍內,預測效果明顯優于BP神經網絡模型和CPSO-BP神經網絡模型,在處理多維復雜非線性問題時具有優越性。
(3)利用粒子群優化的相關向量機模型對邊坡穩定性安全系數進行預測,體現了該算法在邊坡工程領域中的實用性。對于邊坡穩定性安全系數預測而言,PSO-RVM模型比常見的神經網絡模型更為優越,無論從預測值對比還是從均方根誤差、平均相對誤差的對比,PSO-RVM模型都表現良好。