劉育林
LIU Yu-lin
河北地質大學 城市地質與工程學院,河北 石家莊 050031
Hebei GEO University, Shijiazhuang 050031, China
路基沉降是影響其工程質量及施工進度的關鍵因素。因此,選用精度較高的模型,預測以煤矸石為路基填充物的高速公路在逐層填筑過程中的沉降量,對于掌握沉降量的變化信息及安全生產尤為重要。
目前,機器學習被廣泛應用于預測路基沉降量領域中。例如,彭立順[1]等采用遺傳算法優化的BP神經網絡對高速公路路基沉降量進行預測;肖治宇[2]等將專家的模糊推理與神經網絡相結合建立ANFIS模型對軟土路基沉降量進行預測;張滿想[3]等采用GM(1,1)和Verhulst兩種灰色系統模型分別對高速公路路基沉降量進行預測;劉海明[4]等采用粒子群與Markov優化的PMIGM(1,1)模型對高速公路路基沉降量進行預測;張予東[5]等采用模擬退火算法優化支持向量回歸相模型對新型礦區沉降量進行預測;寧志杰[6]等采用灰色支持向量機殘差修正模型對地表沉降量進行預測。雖然上述方法在路基沉降量預測中取得一定成就,但是神經網絡存在收斂速度慢、容易陷入局部最優等問題;灰色預測沒有考慮系統的隨機性,中長期預測精度較差;SVR模型存在參數選擇較為敏感的問題。
麻雀搜索算法(SSA)作為一種新型算法,已經被國內學者應用于地質學、電力工業、機械工業等領域。例如,劉治成[7]采用PCA和SSA優化ELM模型對地震傷亡人數進行預測;劉棟[8]等采用SSA與極限學習機(ELM)相結合對風電功率進行預測;李怡[9]等采用CEEMDAN多尺度熵與SSA-SVM相結合的預測模型對軸承故障進行預測。并明確指出SSA優化算法有收斂速度快、不易陷入局部最優、受參數設置的影響較小等優勢。根據上述SSA優化算法的特征并結合湖南安邵高速公路煤矸石路基沉降已有數據的真實情況,本文使用SSA算法對SVR的內核參數進行優化,充分發揮SVR模型優異的泛化、非線性擬合能力以及處理小樣本數據的優勢,對逐層填筑的煤矸石路基沉降量進行預測。
麻雀搜索算法主要受麻雀覓食及反哺行為的啟發,具有尋優能力強及收斂速度快的特點。其規則如下:
假設由式(1)的n只麻雀組成一個種群(本文n=30)

其中,d表示待優化問題變量的維數,n表示麻雀麻雀的數量。上述麻雀的適應度值如式(2)所示:

其中,f表示適應度值,適應度值較高者在搜索食物中優先獲取。
將上述的麻雀覓食群體分為探索者和追隨者,二者的身份是在占種群數量比重不變的前提下動態變化的。由此可知,假如有一只麻雀尋找到更好的食物來源成為了探索者,必然有一只麻雀會變為追隨者。探索者負責為種群搜索食物豐富的區域,為追隨者提供覓食的路線于方向,其通常具備較高的能量儲備,因此其適應度值較高。當麻雀種群中有個體發現危險,就會警報,當警報值大于安全值,探索者會帶領追隨者到安全區域覓食。其位置迭代更新公式如下:

其中,t代表當前迭代數;j=1,2,3,…,d。itermax是常數,代表最大迭代次數(本文itermax=100);Xi,j代表第i個麻雀在第j維的位置信息;α∈(0,1]是一個隨機數。Q為隨機數,其服從于正態分布;L為1×d的矩陣,其所有元素皆1;R2(R2∈[0,1] )和ST(ST∈[0.5,1]) 分別為預警值和安全值。當R2≤ST時代表覓食區域安全,沒有捕食者,可以繼續覓食。當R2≥ST時,代表覓食區域出現了捕食者,此時種群中所有麻雀都需要遷移。
在尋找食物的過程中,追隨者總能找到覓食環境更好的探索者,然后從中獲取食物或者在其周圍覓食。還有一些追隨者為了更容易獲取食物,增加自己的捕食率,會不斷監控探索者進而去搶奪食物。如果贏了,其位置迭代公式如式(4);如果輸了,它所在的覓食位置越不好。所以為了獲取更好的覓食位置,有一些追隨者可能離開飛往其它地方。

其中,XP代表目前搜索者所占的最優位置;Xworst表示覓食區域最差位置;A是一個1×d的矩陣,其中每一個元素值都是隨機的1或-1,并且A+=AT(AAT)-1;式中當時,表明適應度值較低的第i個追隨者沒有獲得較好的覓食位置,且處于饑餓狀態,為獲得更多能量需要飛往其他區域。
當有危險時,麻雀種群的邊緣個體會移動到安全的位置,而麻雀種群中心的個體也會跟著移動,向其他個體靠近。危險預警機制更新公式如下:

其中,Xbest表示覓食區最優位置;β代表步長控制參數,服從均值為0,方差為1的正態分布隨機數。是一個隨機數,表示麻雀移動方向也是步長控制參數;fi代表當前麻雀個體的適應度值;fg、fw分別代表當前全局最佳和最差適應度值。當fi>fg時,表示此時麻雀處于種群邊緣,比較容易被捕食者攻擊,當fi=fg時,表示此時處于種群中間的麻雀感知到了危險,需要向其它麻雀靠近以減少被捕食的風險。
SVR作為SVM衍生出的分支,由Harris等[10]于1996年提出。SVM的輸出為離散值,通過引入不敏感參數ε,得到一類輸出為連續值新的模型,即支持向量機回歸模型(SVR)。其基本原理:先通過核函數將非線性數據映射到高維空間使數據變得線性可分,再采用結構風險最小化的原則來處理數據,即確定一個最優超平面,使所有樣本點中離超平面最遠點的距離最小化。對于小樣本的預測問題,采用SVR模型具有較好的效果,見圖1。

圖1 SVR示意圖Fig.1 Schematic Diagram of SVR
其具體推導過程如下:
首先給定m個訓練樣本D={(x1,y1),(x2,x2),……,(xm,xm)},y1∈R我們希望學習到一個回歸模式f(x)=wTx+b(其中w和b是待定的模型參數),使得其與各點的y值盡可能接近,假設所能容忍的最大偏差為ε,當|f(x)-y|>ε才計算損失。因此,可將SVR形式化為:

其中c為正則化常數,lε是圖中所示的ε-不敏感損失函數:

將松弛變量ξi和帶入式(6)可得:

將拉格朗日乘子μi代入上式可得:


上述過程需要滿足KKT條件,即:

最終得出SVR的解:

SSA-SVR是在麻雀搜索算法與支持向量機回歸的基礎上建立的,可以將其理解為優化的支持向量機回歸模型,其優化主要體現在優化懲罰參數(C)和核參數(g)。具體流程圖如下[11]:

圖2 SSA-SVR流程圖Fig.2 SSA-SVR Flow Chart
預測模型的準確性需要通過具體的評價指標進行表達。由于采用單一評價指標難以評價模型是否達到精度要求,因此本文通過平均絕對誤差(MAE)、均方誤差(MSE)、均方根誤差(RMSE)、平均絕對誤差比(MAPE)和相關系數r對其精度進行評價。指標計算公式如下:

式中,yi為樣本真實值,為模型預測值。其中r值越接近1,其余指標越接近0,表示其對應的模型精度越高。
路基沉降影響因子有巖、土體結構,周圍環境,地下水變化,荷載大小,路基填充材料,路基尺寸,初始條件,邊界條件等。而在實際路基監測中,目標監測點的位置、填充物以及應力條件是固定的,因此荷載是產生沉降的主要原因,即路基沉降量隨逐層加荷時間的變化而變化。所以在指標選取時,應該首要考慮時間和每次增加的荷載對沉降的影響。鑒于此,以文獻[12]中湖南安邵高速公路煤矸石路基沉降的38組實測數據作為模型的原始數據集,且每隔5組訓練集選取1組為測試集,剔除最后剩余2組數據。最終得到本文測試集(D)與訓練集如表1、表2:

表1 訓練集Table 1 Training Set

表2 測試集Table 2 Test Set
本文以表1中的3個影響因子作為SSA-SVR預測模型的輸入,以期望沉降量作為SSA-SVR預測模型的輸出,建立預測模型并分析其預測結果。在訓練過程中,使用SSA對SVR的參數迭代尋優,其初始參數如表3。

表3 初始參數表Table 3 Initial Parameters
基于上述參數在[0.001,1000]的區間內尋找c,g的最優值。為確保選取參數為最優,使用MATLAB對此預測模型多次運行,最終得到最優參數如圖3:

圖3 SSA-SVR 適應度曲線圖Fig.3 SSA-SVR Fitness Curve
由上圖可知:SSA的迭代次數少,收斂速度較快,經過算法尋優后的最優c,g值分別是75.70,10.67。將上述最優參數帶入到SVR中,建立SSASVR的湖南安邵高速公路煤矸石路基沉降預測模型。其訓練結果如下:
由上圖可知,訓練樣本的預測值和真實值整體趨勢相同,且誤差較小。由此可得預測模型的學習能力較強且預測精度較高。與此同時,通過對比訓練樣本的誤差,發現并沒有出現訓練樣本誤差遠小于測試樣本誤差的情況,說明此預測模型泛化能力較強,并沒有出現過擬合的現象。
由以上分析可知SSA-SVR預測模型對湖南安邵高速公路煤矸石路基沉降數據有較好的擬合效果,實際值與預測值之間的誤差較小,說明此混合模型具有較好的學習能力。為進一步分析模型的學習能力,本文將SSA-SVR預測模型與PSO-SVR、GA-SVR預測模型進行對比。
預測模型的準確性是判斷此預測模型性能的核心指標。為直觀的體現各模型的準確性,本文以表1,表2數據為例。經MATLAB運行上述各預測模型,得到最優參數下的預測結果。各預測模型的誤差評價指標結果見表4。

表4 模型誤差分析表Table 4 Model Error Analysis
由上表可得:SSA-SVR的平均絕對誤差(MAE)為0.370、均方誤差(MSE) 為0.229、均方根誤差(RMSE)為0.479、平均絕對誤差比(MAPE)為6.654%和相關系數r為0.997,以上的各項誤差指標整體優于PSO-SVR、GA-SVR預測模型。因此,使用SSA優化的SVR預測模型的準確性高于其它算法優化的混合模型。且SSA-SVR預測模型相較于PSOSVR、GA-SVR預測模型迭代次數少,收斂速度快。
根據上述SSA算法優化所得最優c值75.70、g值10.67,建立SVR預測模型。對測試集進行預測并與PSO-SVR、GA-SVR預測模型進行對比。各模型誤差見圖4。

圖4 SSA-SVR訓練誤差對比圖Fig.4 Comparison Diagram of SSA-SVR Training Error

圖5 測試集誤差對比圖Fig.5 Comparison of Test Set Errors
由上圖可得:SSA-SVR預測模型的實際值與預測值之間的誤差最小。表明,相較于PSO-SVR、GASVR預測模型,SSA-SVR預測模型可以更準確的預測煤矸石路基逐層填筑時的沉降量,具有更好的預測能力。
在高速公路路基沉降預測中,建立精確的預測模型對路基沉降的研究、工程的進展、公路災害的防治等方面具有重要的參考意義。本文建立了SSA-SVR預測模型,對高速公路煤矸石路基沉降進行預測,最終得出以下結論:
(1)SVR具有較強的泛化能力和非線性擬合能力,此方法對預測樣本量少的路基沉降具有一定優勢,但其性能受制于內核參數。針對參數優化問題,引入新型智能算法SSA,建立SSA-SVR混合預測模型可以很好的解決這一問題。
(2)使用SSA-SVR對湖南安邵高速公路煤矸石路基沉降進行預測,結果顯示其誤差評價指標均優于其它預測模型。說明本文所使用的SSA-SVR預測模型在降低收斂時間的同時可以更好的確保其預測精度。
(3)SSA-SVR預測模型的性能較好,可以在較小樣本量的基礎上建立影響因子與地基沉降量的非線性映射關系。為此類工程及其它領域提供了一種新思路,具有廣闊的應用前景。