徐勇斌 汪鋒 施倩紅



摘要:研究地鐵隧道施工引起的沉降一直是隧道研究中的熱點問題。但是由于地層復雜性和施工參數多變性,用經驗公式或者數值模擬預測隧道掘進引發的地面最大沉降難以兼顧易用性和準確性。近幾年隨著機器學習理論的深入研究、計算機軟硬件技術的快速發展,機器學習等新興算法正在被越來越多地運用于預測地面最大沉降。本文采用兩種機器學習算法(隨機森林和BP神經網絡),以隧道幾何參數、盾構機施工參數和地質參數作為輸入,對隧道施工過程中引發的地面最大沉降進行預測分析。結果顯示,兩種機器學習算法均能實現較高質量的預測,并且隨機森林模型的穩定性優于BP神經網絡模型。
關鍵詞:地鐵隧道?沉降預測?機器學習?隨機森林?BP神經網絡
中圖分類號:TP181;U456.3
Prediction?Methods?for?the?Maximum?Surface?Settlement?of?Subway?Tunnels?Based?on?Machine?Learning
XU?Yongbin1??WANG?Feng2*??SHI?Qianhong2
1.?Hangzhou?Construction?Engineering?Quality?and?Safety?Supervision?Station,?Hangzhou,?Zhejiang?Province,?310005?China;?2.PowerChina?Huadong?Engineering?Co.,?Ltd.,?Hangzhou,?Zhejiang?Province,?311122?China
Abstract:?It?has?always?been?a?hot?topic?to?study?the?settlement?caused?by?subway?tunnel?construction?in?tunnel?research.?However,?due?to?the?complexity?of?the?geological?strata?and?the?variability?of?construction?parameters,?it?is?difficult?to?balance?ease?of?use?and?accuracy?to?predict?the?maximum?ground?settlement?caused?by?tunneling?by?empirical?formulas?or?numerical?simulations.?In?recent?years,?with?in-depth?research?on?the?machine?learning?theory?and?the?rapid?development?of?computer?software?and?hardware?technology,?emerging?algorithms?such?as?machine?learning?are?increasingly?being?applied?to?predict?maximum?ground?subsidence.?This?article?uses?two?machine?learning?algorithms?(the?random?forest?and?the?BP?neural?network)?to?predict?and?analyze?the?maximum?ground?settlement?caused?by?tunnel?construction?by?taking?the?geometric?parameters?of?the?tunnel,?the?construction?parameters?of?the?shield?machine?and?geological?parameters?as?inputs.?The?results?show?that?the?two?machine?learning?algorithms?can?both?achieve?higher-quality?prediction,?and?that?the?stability?of?the?random?forest?model?is?better?than?that?of?the?BP?neural?network?model.
Key?Words:?Subway?tunnel;?Settlement?prediction;?Machine?learning;?Random?forest;?BP?neural?network
城市地鐵隧道緊鄰周邊建筑物、市政管線,并且施工時地面交通仍正常運行。當隧道施工造成過大的變形可能引起鄰近構筑物、管線的破壞,并且影響路面交通安全。因此準確沉降的預測和控制成為地鐵隧道研究中的重要問題。
早期,工程中主要采用經驗公式法對隧道施工引起的最大地表沉降進行預測分析[1-5]。然而,由于經驗性和簡化性的局限,這種方法的預測準確度很難達到要求。隨著數值模擬技術的不斷深入研究和計算機硬件性能的提升,采用有限元等數值計算方法來模擬盾構隧道在復雜地層環境中施工的動態過程,成為預測最大地表沉降的重要手段。諸多數值模擬研究已對土體本構模型參數、盾構施工參數、隧道設計參數以及地下水等影響因素進行了綜合分析和評估[6-7]。然而,數值模擬方法仍主要適用于特殊工點和重要工點的精細研究,難以廣泛應用于通用的工程問題。
近年來,機器學習算法如人工神經網絡(ANN)、支持向量機(SVM)和隨機森林(RF)等的興起和發展,已經引起了國內外許多研究人員的關注,并逐步將這些算法應用于預測盾構施工中的復雜非線性巖土問題。其中,人工神經網絡較早地被應用于預測和探究盾構施工引發的地表沉降量、沉降槽寬度和掘進參數等大小和內在關系[8-10]。這些方法通過訓練神經網絡模型,可以根據輸入的掘進參數和其他相關因素,預測地表沉降的量級和變化趨勢。同時,一些研究將神經網絡與優化算法如遺傳算法和粒子群算法等相結合,通過優化神經網絡的權重和偏置,進一步提高了預測模型的準確度[11,?12]。此外,基于決策樹結構的計算原理,隨機森林(RF)在預測結果中同時集成了多個決策樹的計算結果,是一種可以在短時間內處理大量數據并擁有較高的預測準確性的機器學習算法[13]。王祥等[14]基于隨機森林-支持向量基(RF-SVM)建立訓練模型,對隧道盾構引起的建筑物沉降進行了預測研究,獲得了準確性和可靠性較高的預測結果。陳仁朋等[15]通過粒子群算法確定神經網絡和隨機森林算法的最優超參數,并對比了兩種機器算法的預測準確度。林廣東等[16]基于隨機森林算法對隧道建成初期的累計沉降量進行了預測分析,結果表明其預測精度較神經網絡模型更高。張文濤等[17]利用隨機森林算法給出了盾構改良渣土的滲透系數預測模型,并將其應用于實際工程。
本文以杭州地鐵3號線一期工程百家園路站—花塢路站區間為例,基于土層沉降的多種影響因素選取預測模型訓練參數,然后分別采用隨機森林和BP神經網絡兩個模型對最大地表沉降進行預測,尋找最優模型。
1?工程概況
本工點為杭州地鐵3號線一期工程百家園路站—花塢路站區間,起止里程K18+920.707~K20+100.610,區間長度1?179.9?m,采用土壓平衡盾構法施工,盾構外徑6.2?m。圖1為隧道典型的地質縱斷面圖。隧道穿越范圍內上覆土層為雜填土、素填土、粉質黏土、淤泥質黏土、碎石混黏性土、泥質粉砂巖,隧道埋深范圍為19~28?m。各土層物理力學性質如表1所示。
為準確監測施工過程中的最大地表沉降,在右線隧道中軸線的正上方地面每隔6?m設置了沉降監測點。本研究選取了區間內101個監測點,并結合相關地質和施工參數,進行了機器學習預測分析。
2?機器學習模型
2.1隨機森林
隨機森林(Random?Forest)是一種集成算法,它由多棵決策樹組成并結合了決策樹和bagging算法的優點。圖2為隨機森林算法的基本框架。隨機森林通過在不同樣本上構建多個決策樹,可以并行地在不同主機上進行訓練,從而提高效率。最后,將所有決策樹的計算結果進行平均,這種方法避免了單個決策樹造成的過擬合問題。
2.2?BP神經網絡
人工神經網絡通過模擬動物神經網絡的行為特征,進行分布式并行信息處理,能夠有效地解決非線性問題。BP神經網絡(Back-propagation?Neural?Network)(如圖3所示)是一種常見的人工神經網絡。其主要特點是利用誤差的反向傳播來修正權值和閾值,直到預測值與實測值之間的誤差小于預先給定的標準。這種修正過程通過迭代進行,逐步提高神經網絡的預測準確性。
3?模型訓練與結果分析
3.1特征工程
通常認為影響地表沉降的因素可以分為三類:隧道幾何參數、盾構掘進參數和地質參數,如圖4所示。由于本文只研究單條線路,隧道直徑不發生變化,直徑不作為輸入參數。隧道的埋深會影響到盾構掘進過程中地層沉降的發展模式以及最終沉降的大小,故選取隧道埋深為幾何參數。同時,選擇6個盾構機掘進參數作為施工參數,包括注漿壓力、注漿量、土倉壓力、推進速度、總推力和刀盤扭矩。這些參數對地層的擾動程度有直接影響??偼屏?、刀盤扭矩和推進速度影響盾構機在掘進過程中對地層的擾動程度,土倉壓力則會影響掌子面的穩定性。而漿壓力和注漿量則影響盾尾空隙的沉降以及后期的沉降。這6個掘進參數不僅對地層沉降有直接影響,而且可以實時獲取,并且其精度可靠。此外,地質參數包含不同土層的厚度,與盾構隧道的相對位置以及巖土體本身的物理參數。當前研究中一般將土層的c,?φ值作為參數直接輸入[18],或者用數字表示土層的類別[19],這些方法雖然能夠一定程度上考慮不同的巖土層的特性,但是物理意義不明確。因此,本文通過定義一個修正因子(見圖5)綜合考慮土層深度、厚度、物理力學性質,得到加權過后的c,?φ,?kh,?kv作為新的輸入參數。具體計算公式如下:
基于本文選取的?101個地表沉降測點,按照上述方法獲取機器學習的樣本數據,部分數據見表2。
3.2最優模型
本文采用Python中scikit-learn第三方庫實現隨機森林和BP神經網絡算法。決策樹的數量能顯著影響隨機森林性能,本文中計算的決策樹數量為1~100。1~2層以內隱含層結構的BP神經網絡即能實現非線性映射,故只研究2層以內的BP神經網絡性能。對于單層的神經網絡,計算的神經元數量為1~100,共計100個組合。對于雙層的神經網絡,計算中第一、二層神經元數量都為1~100,總計10000個組合。激活函數采用ReLU(整流線型單元函數)。對于每一種模型結構,采用5折交叉驗證的方式,計算5組指標的均值作為最后評價指標。性能指標選用均方根誤差(Root?Mean?Squared?Error,RMSE),該值越小表示性能越好。
式(6)中:N為樣本數據的個數,yi和?di?分別代表機器學習預測的沉降量和實際量測的沉降量。將隨機森林和BP神經網絡的性能指標和超參數關系繪制在圖6、圖7、圖8中。從圖6可以看到,對比線性回歸RMSE=4.58,隨機森林僅在n=1時性能低于線性回歸,此時隨機森林退化為決策樹(回歸樹)模型。在n較小時(n<7),隨著n的增加,性能提升較快,在n=6時有一個局部最小值,總體而言隨著決策樹數量的增加,模型性能不斷提升,在n=40之后性能提升就不明顯。決策樹數量為52時,達到最優性能,此時RMSE=3.31?mm。
從圖7、8中看到,單層BP神經網絡隱含層神經元數量為40時,達到最優性能,RMSE=3.53?mm;雙層BP神經網絡隱含層神經元數量為(8,38)時,達到最優性能,RMSE=3.18?mm。對于BP神經網絡來說,神經元數量的輕微變化導致算法性能波動較大,并且部分時候甚至出現了性能不如線性回歸的情況。
3.3結果分析
圖9、圖10所示為最優隨機森林模型和BP神經網絡模型訓練和測試樣本的對比結果。從圖中可以看出,大部分數據點位于預測和測量等值線附近,這表明訓練數據和測試數據的預測值與測量值較為接近。其中,由于5~15?mm的沉降區間內數據相對較少,因此預測值與實測值存在較大的偏差??傮w而言,使用隨機森林模型和BP神經網絡都能夠相對準確地預測本文地鐵區間工程中盾構施工中引起的最大地表沉降量。
4?結論
本文基于隨機森林和BP神經網絡兩種機器學習算法,對百~花區間隧道地表最大沉降進行預測。從隧道幾何參數、施工參數、地質參數三方面選取11個影響因素,并構建了訓練與預測樣本數據,選取RMSE作為評價指標,建立了最佳的隨機森林和BP神經網絡預測模型,主要得出以下兩點結論。
(1)與線性回歸相比,隨機森林和BP神經網絡是預測盾構隧道施工地表最大沉降的更為有效的方式。通過調節隨機森林決策樹數量,BP神經網絡的隱含層神經元數量,可以使兩種機器學習模型都達到較高的準確率。
(2)對于本文采用的隧道地表最大沉降數據,隨機森林模型的穩定性優于BP神經網絡。總體而言隨著決策樹數量的增加,隨機森林模型性能不斷提升,當決策樹數量為52時,達到最優性能。而對于單層和雙層BP神經網絡來說,神經元數量的輕微變化導致算法性能波動較大,
參?考?文?獻