張生杰, 譚 勇
(同濟大學地下建筑與工程系, 上海 200092)
隨著我國城市建設的不斷進行,越來越多的城市開始進行大規模的地鐵建設。城市地鐵車站深基坑工程周邊往往建(構)筑物、道路、管線等分布密集,一旦基坑出現工程事故,必將危及周邊安全,甚至可能造成嚴重的財產損失和不良社會影響,因此,深基坑工程施工時的安全控制至關重要。對深基坑開挖過程中的變形做出可靠預測,是施工安全的重要保證。
圍護結構的水平位移是深基坑變形的重要形式,能直接反映出基坑整體變形狀態,水平位移過大還會導致基坑的坍塌。但圍護結構的水平位移受到地質條件、開挖方式等多種因素的綜合影響,實際變形機制遠比理論中的復雜,地質條件的復雜性也使得地層的物理力學參數和力學現象呈現出很強的隨機性和不確定性[1]。因此,要想準確地對基坑變形做出預測仍具有一定的難度。
傳統基坑研究領域多采用有限元的方法對基坑變形進行分析,但是,此類方法存在2個較為顯著的缺點:一是有限元模型中地層的力學參數大多進行歸一簡化,而實際土方開挖比模型中所模擬的分段分層開挖要更復雜,因此有限元模型并不能很準確地反映出真實的基坑開挖狀態;二是有限元模型所模擬得到的基坑變形結果大多是對應較長區間時間范圍內的數據,難以精確到每天的基坑變形,無法得到未來幾天的基坑變形數據,對工程中變形控制的實際意義較小。
近年來,隨著計算機計算能力的快速發展,神經網絡模型得到快速發展,在地下工程領域也開始得到廣泛應用。李彥杰等[2]基于遺傳算法優化的BP神經網絡建立基坑變形預測模型,對寧波市某基坑圍護結構的水平變形進行預測,證明此模型有較強的泛化能力;胡冬等[3]根據灰色系統理論,建立了基坑變形的GM(1,1)模型,模型預測結果與實測值吻合較好;渠孟飛等[4]利用支持向量機對基坑變形數據進行預測時指出,不斷加入最新監測數據可以取得更好的預測精度;王興科等[5]采用小波去噪分離基坑變形的趨勢項和誤差項序列,并采用支持向量機對趨勢項序列進行預測,采用混沌BP神經網絡對誤差項進行預測,將預測結果進行疊加得到變形預測值。然而,傳統的神經網絡模型或多或少都存在一定的局限性,比如BP神經網絡、灰色預測模型和支持向量機等都是靜態建模方法,對高度非線性和時間相關性的數據適用性較差[6],而基坑監測數據有著非線性的特征、良好的適應性和呈現時間序列的規律,所以需要使用一種考慮時間效應的算法模型。長短期記憶神經網絡(LSTM)對非線性數據和時間序列具有獨特的優勢,因此袁志明等[7]、許寧[8]以為其基礎對基坑變形進行預測,但是均沒有說明建立模型的具體方法,模型的訓練集和驗證數據也過少,無法充分證明模型的可靠性。
基于上述基坑變形預測方法研究中的不足,本文以長短期記憶神經網絡(LSTM)為回歸算法,使用Python語言和Tensorflow 2.0框架建立基坑變形預測模型,用前期的基坑實測變形數據為訓練樣本,從而實現在正常施工和不考慮意外突發情況的前提條件下,對未來一段時間基坑圍護結構水平變形的準確預測;同時,將LSTM模型得到的預測結果與BP神經網絡和灰色預測模型的結果進行對比,以更好地驗證LSTM模型的準確性,以期為工程中的變形控制提供參考。
LSTM最早由Hochreiter和Schmidhuber于1997年提出,并由Graves等[9]進行改進。該網絡模型最初是為了解決循環神經網絡(RNN)存在的梯度消失問題,因此LSTM也被當作是RNN的一種特例[10]。
LSTM的核心思想是通過記憶單元來存儲輸入的時序信息,記憶單元則使用“門”結構來篩選存儲至記憶單元的信息,“門”結構有以下3種: 輸入門、輸出門和遺忘門。圖1所示為一個LSTM細胞結構。

圖1 LSTM細胞結構
1個LSTM細胞t時刻的輸入為xt,t時刻的隱藏狀態為ht,即為短期記憶;t時刻的細胞狀態為Ct,即為長期記憶。ht和Ct2個參數會隨著時間向下傳遞信息,σ為sigmoid函數,tanh為tanh函數,3種門在這個信息傳遞過程中的作用分別為[11]:
1)遺忘門,顧名思義即為要遺忘一些信息。遺忘門負責接收t-1時刻的細胞狀態Ct-1傳來的信息,并選擇丟棄其中的一部分信息,所丟棄的通常是t時刻不再需要的信息,將保留下來的信息傳遞至當前t時刻的細胞狀態Ct。從數學上來說,遺忘門將t-1時刻的細胞狀態Ct-1乘上一個遺忘因子ft,遺忘因子是由t-1時刻的短期記憶ht-1和輸入xt通過sigmoid函數共同決定的。

3)輸出門,負責控制LSTM細胞的輸出值。首先,通過一個sigmoid函數來決定t時刻的輸入xt和t-1時刻的短期記憶ht-1中哪部分需要輸出,得到Ot; 然后,再把Ot通過tanh函數處理,得到當前時刻的隱藏狀態ht。
3種門結構都采用sigmoid函數作為激活函數,因此它們所接收到的信息都將映射到[0,1]。遺忘門處理上一時刻的長期記憶Ct-1,輸入門處理當前輸入xt和上一時刻的短期記憶ht-1,輸出門控制最終的輸出值,3種門結構的共同作用實現了LSTM細胞的長短期記憶時間效應。
在構建基于LSTM的基坑變形預測模型時,本文主要考慮了模型結構、網絡層數、單元個數、優化算法、誤差函數等因素。模型結構包括輸入層、隱藏層和輸出層,輸入層主要負責對輸入數據進行初步的處理,隱藏層則是模型結構中最主要的部分,具體來說隱藏層即是由LSTM細胞單元組成的網絡結構,輸出層負責輸出模型預測的變形結果[12]。
Tensorflow 2.0為谷歌公司開發的最新版本的開源庫,這是一種高度集成模塊化的深度學習框架[13]。本文以Python 3.6語言為基礎,配合Tensorflow 2.0框架,建立包含3層網絡的LSTM基坑變形預測模型: 第1層為輸入層,包含3個輸入單元和64個輸出單元;第2層包含64個輸入單元和128個輸出單元;第3層包含128個輸入單元和1個輸出單元。其中,第1層的3個輸入單元代表的含義是使用過去3天的監測數據,即時間步長為3,去預測未來1天的變形數據,即第3層中的1個輸出單元,中間的64個單元和128個單元代表的即為隱藏層中的LSTM細胞單元。
模型中其他重要的參數說明如下: 選擇方根誤差MSE為誤差函數,Adam算法為模型的優化算法,tanh函數為模型的激活函數。模型采用單步迭代的方法對變形進行預測,具體訓練步驟如下:
1)對監測數據進行預處理,將明顯監測錯誤等異常數據剔除,并進行差分擬合使數據集平滑;
2)將數據轉換成有監督的數據,并歸一化到[0,1];
3)將數據集劃分成訓練集和測試集,分別對2類數據進行維度轉換;
4)設置模型的迭代次數、驗證集比例、批尺寸等其他參數;
5)將數據導入封裝好的模型進行訓練,期間模型會根據誤差項對各項權重的梯度進行計算,并使用Adam優化算法更新權重,直到參數的選擇滿足精度要求;
6)對模型輸出的數據進行反歸一化,即為對應的變形預測值;
7)將模型保存為h5格式的文件,即為包含各項權重的模型文件,可用于同一基坑內其他測點的變形預測。
本文以江蘇省南通市某地鐵基坑監測數據為實例,該地鐵車站為12 m島式站臺地下2層框架結構,位于市區主干道下且臨近兩側分布密集建筑群,車站底板埋深16.75 m,凈長180 m,凈寬19.3 m。基坑標準段采用明挖順作法施工,圍護結構采用800 mm地下連續墻,豎向設1道混凝土支撐(0.8 m×1 m)和3道鋼支撐(φ609 mm,厚16 mm),標準段基坑開挖深度為16.95 m,端頭井基坑開挖深度為18.46 m,地下連續墻深均為39.2 m,基坑安全等級為一級,基坑環境保護等級為二級。
選取該地鐵基坑測斜監測點CX14從2018年12月7日到2019年6月20日共196期的監測數據,該段數據完整地包含了CX14測點附近基坑開挖前、開挖過程中、澆筑底板后的地下連續墻水平變形量,數據的監測頻率為1次/d,所用測斜儀型號為CA-CX-901F,測量精度為0.01 mm。因為在基坑的地下連續墻累計變形控制中,考慮的均為最大變形值,因此,本文中所涉及的地下連續墻水平變形值均為各測斜點縱向最大的水平變形值,該值出現的深度一般在基坑開挖面附近。
按照本文1.2節所描述的模型訓練步驟,使用這196期數據進行模型訓練,依據開挖工況,分為基坑開挖期、基坑澆筑底板后2種工況分別進行模型訓練,得到用于2種工況下的地下連續墻水平變形預測模型。
2.2.1 建立3種變形預測模型
為了對比研究LSTM基坑預測模型的準確性,本文還同時建立了分別以BP神經網絡和灰色理論為算法基礎的另外2種基坑變形預測模型。BP預測模型和灰色預測模型2種模型同樣采用CX14測斜點的196期數據作為原始數據集,文中涉及的基坑測斜點分布如圖2所示。
BP神經網絡是一種多層前饋神經網絡,包括輸入層、隱藏層和輸出層,具有泛化能力強的特點[14]。本文同樣基于Tensorflow 2.0框架,通過python 3.6語言建立基于經典BP神經網絡的預測模型,模型共包含3層: 輸入層、隱含層和輸出層。其中,輸入層輸入的數據樣本是3維列向量,隱含層的單元個數是64個,輸出層為1維列向量。模型一些重要的參數說明如下: 輸入層到隱含層的傳遞函數為sigmoid函數,隱含層到輸出層的傳遞函數為purelin函數,優化算法采用的是動量梯度下降法。經過多次訓練,得到效果相對更佳的BP預測模型。
灰色理論是通過建立灰色微分預測模型,對發展規律做出長期預測,該方法對樣本的數量要求較低,模型的計算速度快[15]。一般來說,灰色理論適用于等序時間間隔的序列, 而本實例中的監測數據頻率均為1次/d,所以是滿足等序要求的。本文根據陳健[16]所研究的改進灰色模型理論,使用優化后的背景值構造等方法,通過python3.6語言,結合numpy和pandas數據處理庫,建立灰色預測模型。
綜上,現得到LSTM預測模型、BP預測模型、灰色預測模型3種基坑變形預測模型,選擇同一地鐵基坑的CX04測斜點,用這3種模型分別進行該測點基坑開挖期的地下連續墻水平變形預測,以對比它們的預測準確性。

圖2 基坑測斜點分布
2.2.2 3種變形預測模型結果對比
CX04測斜點在基坑開挖之前共有40期監測數據,將這40期監測數據分別導入開挖期的LSTM預測模型、BP預測模型和灰色預測模型進行預測,得到了3種模型下CX04測點基坑開挖期44 d內的地下連續墻水平變形預測結果,如圖3和圖4所示。

圖3 CX04開挖期地下連續墻水平變形預測值對比

圖4 3種預測模型的絕對誤差
結合圖3和圖4可以看出,灰色預測模型有一定的預測效果,但是在開挖期內誤差波動較大,未呈現出誤差變小的趨勢,且部分點的誤差較大,整體表現出較強的隨機性;在開挖初期,BP預測模型較灰色預測模型預測效果更佳,誤差呈現出逐漸減小的趨勢,體現了BP神經網絡泛化能力強的特點,但是在開挖后期,誤差開始呈現出變大及不穩定的趨勢,預測效果變差;LSTM預測模型的誤差在整個開挖期內始終在-2.5~1.5 mm波動,整體誤差平穩,趨勢穩定,預測效果較好。
3種預測模型的絕對誤差見表1。結合表1可以看到,3種預測模型精度最高的是LSTM預測模型,相較于BP預測模型,平均誤差精度提高了19%,方差精度提高了43%;相較于灰色預測模型,平均誤差精度提高了34%,方差精度提高了46%。進一步分析,基坑監測數據有著非線性的特征、良好的適應性和呈現時間序列的規律,BP神經網絡、灰色理論都是靜態建模方法,對高度非線性和時間相關性的數據適用性較差,而LSTM特有的記憶單元,對處理非線性數據和時間相關序列具有獨特的優勢,考慮了基坑變形的時間效應。因此,相比于BP預測模型和灰色預測模型,LSTM預測模型的預測效果最好。

表1 3種預測模型的絕對誤差
2.3.1 CX04測點澆筑底板后變形預測驗證
通過2.2節,初步驗證了LSTM預測模型具有較好的準確性,為了進一步驗證LSTM預測模型的穩定性和可靠性,本節將繼續研究在CX04測點基坑澆筑底板后的地下連續墻水平變形預測效果。考慮到LSTM的預測精度相較于BP預測模型和灰色預測模型已經得到驗證,本節不再進行多種模型預測結果的對比。
在CX04測點附近基坑澆筑底板前,共有84期監測數據,在此數據基礎上,使用本文2.1節得到的基坑澆筑底板后的LSTM預測模型對地下連續墻水平變形進行預測,得到預測結果如圖5所示,預測值與監測值的絕對誤差如圖6所示。

(a) 示意圖

(b) 局部放大示意圖
結合圖5和圖6可以看出,LSTM預測模型在CX04測點附近基坑澆筑底板后的地下連續墻水平變形預測中,誤差完全控制在-0.75 mm以內,雖然因為模型的累計誤差效應,預測誤差呈現出逐漸增大的趨勢,但是基坑不可能長期保持該施工狀態,短時間內基坑就會封頂; 并且誤差增長的幅度極其緩慢,僅為-0.01 mm/d,這樣的誤差累計對實際基坑工程來說可以說是微不足道的。因此,對實際基坑工程來說,LSTM預測模型是絕對可靠的。
2.3.2 CX11測點變形預測驗證
為了充分說明LSTM預測模型的穩定性和可靠性,本文選擇同一基坑的CX11測點再次進行LSTM模型預測效果的驗證,同樣分為基坑開挖期和基坑澆筑底板后,研究CX11測點附近基坑的地下連續墻水平變形的預測情況。開挖期的預測結果如圖7和圖8所示。

圖6 CX04測點基坑澆筑底板后預測值與監測值的絕對誤差

圖7 CX11測點基坑開挖期地下連續墻水平變形值

圖8 CX11測點基坑開挖期預測值與監測值的絕對誤差
結合圖7和圖8可以看出,在CX11測點基坑開挖期內,LSTM預測模型的絕對誤差值始終控制在-1.5~2 mm,并且圍繞0線波動,與CX04測點的預測效果極為相似,證明了LSTM模型的預測效果具有穩定性與可靠性。
最后,驗證一下CX11測點附近基坑澆筑底板后的地下連續墻水平變形預測效果。CX11測點在基坑澆筑底板前,共有116期現場監測數據,基于這116期數據,使用基坑澆筑底板后的LSTM模型,對該測點的地下連續墻水平變形進行預測,預測結果如圖9和圖10所示。
結合圖9和圖10可以看到,CX11測點基坑地下連續墻水平變形的預測值與監測值的絕對誤差控制在-0.75 mm以內,這與CX04測點該工況下的預測效果極為一致,同樣出現了誤差逐漸增大的趨勢,但是誤差增長的趨勢同樣是完全可以控制的。結合上述CX11測點基坑開挖期的預測結果分析,足以充分證明LSTM預測模型具有極佳的穩定性,能夠對同一基坑內任意位置測點進行穩定可靠的地下連續墻水平變形預測。

圖9 CX11測點基坑澆筑底板后地下連續墻水平變形值

圖10 CX11測點基坑澆筑底板后預測值與監測值的絕對誤差
1)本文以某地鐵基坑工程為實例,基于現場實測監測數據,訓練得到基于LSTM算法的基坑變形預測模型,并使用該預測模型在正常施工以及不考慮意外事故的前提下,分別對基坑開挖期和澆筑底板后2種工況下的基坑地下連續墻水平變形進行預測,取得了較為準確的預測結果。
2)利用CX14測點完整施工周期內的監測數據,通過1.2節所描述的訓練方法得到LSTM預測模型,同時使用同樣的數據訓練得到BP預測模型和灰色預測模型,對CX04測點附近基坑開挖期的地下連續墻水平變形進行預測,并對預測誤差進行對比,得出LSTM預測模型相對另外2種預測模型預測精度更高的結論。
3)利用LSTM預測模型,對CX04測點附近基坑澆筑底板后,CX11測點附近基坑開挖期、澆筑底板后3種情況的基坑地下連續墻水平變形進行預測,得到了同樣精確的預測結果,證明了本文所構建的LSTM預測模型具有可靠性與穩定性的特點。
4)以上分析思路和結論適用于在不考慮突發事故情況并嚴格規范施工前提下的基坑變形預測。在實際工程中,部分情況下施工流程并不一定是規范標準的,也有出現地下連續墻滲漏等意外事故的概率,這些因素都會影響基坑變形預測。鑒于基坑工程中的不確定性,基于LSTM的基坑變形預測模型要提高適用性,還需要更多實踐的優化和改進。