張博航,薛新華
(四川大學水利水電學院,四川 成都 610065)
樁基是一種適用范圍廣同時承載能力較高的基礎。伴隨著城市化進程的快速發展,建筑物對樁基豎向承載能力提出了更高的要求。成樁方法不斷發展的同時樁身材料與樁身形狀也在不斷豐富以適應不同的工程需要。在地下水位較高與上部水平荷載較大的情況下,建筑物基礎需要具備一定的抗浮能力。為提高樁基礎抗拔承載能力,工程建設領域開始廣泛運用異截面樁。擴底灌注樁是一種樁體質量可靠的異形截面樁,擁有較好的抗拔承載能力[1]。傳統方法測試樁的抗拔承載能力存在一些不足(例如耗時很長且價格昂貴),在某些特殊情況下很難大規模開展靜荷載測試。因此,提出一種基于少量靜荷載測試準確獲取特定地區樁體極限抗拔承載力的方法是很有必要的。
伴隨著計算機技術與大數據處理技術的快速發展,機器學習作為擁有高泛化能力的數據處理方法應運而生。機器學習方法精度較高且計算速度快捷,近年來在工程建設領域取得了豐富的研究成果。例如,人工神經網絡(ANN)、支持向量機(SVM)、遺傳算法(GA)等方法被廣泛運用于預測樁基豎向極限承載能力與不同類型土壤中的樁體沉降。劉順[2]利用優化BP神經網絡建立了單樁豎向極限承載力的預測模型;李平[3]將神經網絡運用于高層建筑樁基承載力預測中,并建立了預測超長樁豎向極限承載能力的預測模型。但機器學習方法依然存在不足,如預測模型內部計算超參數難以選取、計算模型陷入局部極值、計算速度較慢以及出現過擬合問題等。為解決機器學習方法的不足,常用群體智能算法對計算模型進行優化,利用自適應變異與均衡慣性權重方法進行參數尋優[4]。目前針對擴底灌注樁極限抗拔承載能力的研究較少,同時尚未有準確計算樁體極限抗拔承載力的方法。本文利用PSO算法對RF算法進行參數優化(即PSO-RF算法),建立了多因素影響下擴底灌注樁極限抗拔承載能力的預測模型。預測結果與實際測量結果相比,數據之間的吻合度很高,模型的決定系數R2為0.974且100%的數據點誤差在20%以內。通過PSO-RF方法建立的預測模型對快速確定擴底灌注樁極限抗拔承載力以及提高工作效率有重要意義。
PSO算法[5]其思路是初始化一群隨機粒子,然后通過反復迭代計算找到全局最優解。算法主要步驟如下:
1)粒子群初始化。采用混沌映射方法確定d維空間上粒子群初始化后的速度區間及搜索空間、確定隨機粒子最初的速度與位置,均勻分布粒子種群初始位置。
2)確定粒子個體極值。計算每一個粒子的適應值fi,然后同個體極值Pi進行比較,若fi≥Pi,則用fi代替Pi。
3)確定粒子群全局極值。比較全局極值G與適應值fi,若fi≥G,則用fi代替G。
4)更新粒子的位置與速度。隨機粒子的速度和位置更新公式如式(1),式(2)所示。
(1)
(2)

為了避免粒子群在有限迭代次數下出現早熟收斂情況,本文采用動態自適應慣性權重平衡算法的全局搜索能力與局部搜索能力,從而找到全局最優解。動態自適應慣性權重的計算方法如式(3)所示:
(3)
其中,f為粒子當前的適應度值;w為慣性權重。
5)判斷PSO算法是否終結。若滿足條件則結束算法并輸出結果,否則返回步驟2)。
RF算法屬于機器學習中的集成學習方法,本質上是一種包含若干決策樹的強學習模型,主要運用于解決分類與回歸問題。該算法將隨機形成的決策樹組合形成一個分類預測能力更加高效的強分類器,根據少數服從多數的原則,結合所有決策樹的預測結果確定最終的預測結果。算法有效解決了決策樹決策流程單一的問題,并且不同決策樹訓練過程能夠高度并行,增強了模型的泛化能力與計算速度。算法具體步驟如下[6]:
1)從數據總集中采用隨機重復抽樣的方式抽取m個數據組成訓練集,剩余的數據為模型測試集。2)訓練集利用分類回歸算法訓練為若干并行的決策樹。3)重復步驟1)和2)直到決策樹數量T滿足算法要求。4)取決策樹預測值的平均值作為回歸問題最終的預測結果。算法具體流程如圖1所示。

研究表明,決策樹數量n、決策樹最大深度p對RF模型預測精度與計算速度的影響很大。參數合理取值可縮短模型計算時間、提高預測精度。傳統RF算法需要對超參數進行大量試錯計算,計算效率較低且容易出現過擬合情況,模型可靠性有待優化。而利用群體局部信息和全局信息進行指導搜索的PSO算法具備較優秀的參數選擇能力。基于此,本文提出了將PSO與RF混合的預測模型。PSO-RF算法建立預測模型主要包括三個階段,即數據預處理、超參數迭代優化、預測模型訓練及測試。首先算法會將原始數據進行歸一化處理以提高模型的精度與計算效率。隨機選取80%的數據用于模型訓練,剩余數據對模型進行測試。利用粒子群優化算法對超參數(決策樹個數n和決策樹最大深度p)進行優化調整。算法指定初始參數后進行迭代計算,確定每輪迭代后粒子的局部最優與全局最優值。當迭代次數最大且粒子適應度值不變時,得到最優的超參數。模型運算流程如圖2所示。

本文收集了已發表文獻中40組上海地區建筑工程項目的擴底灌注抗拔樁現場試驗數據作為建立PSO-RF預測模型的數據基礎[7]。為建立一個穩健的預測模型,輸入參數的選擇至關重要。本節利用統計分析軟件(Statistical Product and Service Solutions, SPSS)對數據庫中6個參數與樁體極限抗拔承載力之間的相關性進行了分析,結果如表1所示。表1中,V1—V7分別表示樁體擴大段上部土層的抗拔阻力、樁側土體摩阻力加權平均值、抗拔樁直桿段的長徑比、擴底部分直徑與直桿段直徑之比、擴底段樁身直徑、擴底段樁長和擴底抗拔樁極限抗拔強度,#表示兩參數間的相關性在0.01級別上顯著(單尾)。根據肯德爾相關性分析結果,樁體擴大段上部土層的抗拔阻力、擴底部分直徑與直桿段直徑之比和擴底段樁長等參數之間的相關性較高,分別為0.325,0.278和0.277。將相關程度不同的變量代入計算模型能夠提高模型的準確度。根據肯德爾相關性分析結果(見表1),本文將樁體擴大段上部土層的抗拔阻力(kPa)、樁側土體摩阻力加權平均值(kPa)、抗拔樁直桿段的長徑比、擴底部分直徑與直桿段直徑之比、擴底段樁身直徑(m)、擴底段樁長(m)6個參數作為模型的輸入變量,將擴底抗拔樁極限抗拔承載力(kN)作為輸出變量。

表1 肯德爾相關性分析結果
為了檢驗所提模型的準確性,決定系數(Coefficient of Determination,R2)、變異系數(Coefficient of Variation, COV)、平均絕對誤差(Mean Absolute Error, MAE)、均方根誤差(Root Mean Square Error, RMSE)、平均百分比誤差(Mean Absolute Percentage Error, MAPE)等統計指標來評價實測值和預測值之間的誤差。其中,標準差與平均值的比值稱為變異系數,均方根誤差是預測值和實際值的差值,平均絕對誤差是預測值和實際值之間的平均誤差,平均百分比誤差是評價模型優化程度的指標,以上四個評價指標數值越小,則說明模型的性能越好。決定系數表示模型試驗值與預測值的擬合情況,其數值越接近于1,則說明擬合情況越好,預測值越接近實際值。以上指標公式表達如式(4)—式(8):
(4)
(5)
(6)
(7)
(8)

為避免數據庫中數據的量綱不同對模型結果造成影響,本文在Matlab平臺中采用Mapminmax函數將數據歸一化處理至[0,1]。歸一化原理如式(9)所示。
(9)
其中,X為數據庫原始數據;Y為歸一化后結果。
本文提出了PSO-RF混合預測模型。首先利用RF算法提出了一種擴底灌注樁極限抗拔承載力預測模型,在構建決策樹時不進行裁剪,避免抑制決策樹生長。然后采用粒子群優化算法對模型進行優化,結合粒子群優化算法通用性強且易于實現的特點快速確定RF模型合適的超參數取值。
采用PSO算法確定RF模型的最優超參數。通過計算所得到的最優的決策樹個數n和決策樹最大深度p分別為196和5,在此基礎上建立的擴底灌注樁極限抗拔承載力預測模型的結果及其誤差統計情況如圖3所示。由圖3(a)可知,PSO-RF模型的R2,COV,MAPE,RMSE和MAE值分別為0.976,0.091,0.072,159.48和125.17。通過對比訓練集與測試集的統計指標,發現測試集的各項統計指標與訓練集的差異很小,說明模型并未出現欠擬合或者過擬合現象。從圖3(b)中可以看出,70.9%的數據點誤差在5%以內,80%的數據點誤差在10%以內,100%的數據點誤差在20%以內,這表明PSO-RF模型的預測性能較好。

為了驗證本文所提模型相較于其他預測模型的優越性,同時驗證PSO算法對RF算法的優化情況。本文將PSO-RF模型與基于RF和GMDH建立的模型進行對比,如圖4,表2所示。從圖4(b)和表2中可以看出,RF模型的預測結果與測量結果比較接近,決定系數為0.955,51%的數據點誤差在5%以內,72%的數據點誤差在10%以內,95%的數據點誤差在20%以內。而GMDH模型預測精度較差,決定系數僅為0.88,50%的數據點誤差在10%以內,80%的數據點誤差在20%以內。通過試錯法確定超參數取值的RF和GMDH模型均出現了程度不一的過擬合現象,即模型在訓練集上的預測精度高于測試集。過擬合現象導致模型精度與泛用性較差。綜合來看,RF模型優于GMDH模型,其R2,COV,MAPE,RMSE和MAE值分別提升了8.3%,40.2%,39.9%,50.5%和45.6%。將PSO-RF模型與RF模型進行對比,發現PSO-RF模型的R2,COV,MAPE,RMSE和MAE值相較于RF模型分別提升了2.3%,7.1%,13.2%,3.0%和4.5%,且PSO的參數尋優有效解決了RF算法中通過試錯法確定最優超參數準確度較低的問題,有效提高了模型的計算效率與準確性。計算結果表明PSO-RF混合模型有最優的預測精度與泛用性,同時證明了PSO-RF混合算法超參數迭代尋優的可行性。

表2 與其他模型的對比分析

為驗證本文所提方法在實際工程中的適用性,選取虹橋商務區核心區一期3號地塊南塊新建項目的擴底灌注樁抗拔靜荷載試驗進行分析比對,PSO-RF模型的預測結果與實際測試結果的誤差在5%以內,證明了該方法的工程適用性。具體結果如表3所示。

表3 虹橋商務區核心區一期3號地塊南塊擴底灌注樁抗拔靜荷載試驗與模型預測值比較
1)本文利用PSO優化RF算法,以40組擴底灌注樁極限抗拔承載力試驗數據作為模型訓練和測試的基礎,將樁體擴大段上部土層的抗拔阻力、樁側土體摩阻力加權平均值、抗拔樁直桿段的長徑比、擴底部分直徑與直桿段直徑之比、擴底段樁身直徑、擴底段樁長6個參數作為輸入變量,擴底灌注樁極限抗拔承載能力作為輸出變量,成功建立了擴底灌注樁極限抗拔承載力的預測模型。PSO-RF模型的R2,COV,MAPE,RMSE和MAE值分別為0.976,0.091,0.072,159.48和125.17。該模型能夠根據樁體幾何參數和工程現場土體性質準確預測出擴底灌注樁極限抗拔承載力,減少工作量的同時降低成本,為地下建筑工程的抗浮設計提供參考。
2)將PSO-RF混合模型與RF模型、GMDH模型進行對比,發現PSO-RF混合模型略優于RF模型且二者遠優于GMDH模型。PSO-RF模型的R2,COV,MAPE,RMSE和MAE值相較于RF模型分別提升了2.3%,7.1%,13.2%,3.0%和4.5%,表明PSO-RF混合算法有效優化了傳統RF算法的超參數選取過程,提高了預測模型的計算效率與精度。