(江西理工大學建筑與測繪工程學院 江西 贛州 341000)
針對地鐵深基坑工程事故頻發給社會造成人員傷亡和財政損失的現象[1],對深基坑開挖過程中的變形做出準確的預測和及時的預警是亟待解決的問題。
常見的深基坑變形預測的方法有回歸分析法,小波分析法,灰色模型,指數平滑法,時間序列法等。各種模型有著它的優勢和局限性,灰色模型能通過小樣本數據對變形系統對規律進行預測,但缺點在于對非線性數據樣本預測效果差;遞歸神經網絡在時間序列的應用廣泛,長短記憶時(LSTM)神經網絡是一種特殊的遞歸神經網絡,其在基于時間序列的非線性數據具有特殊的優勢,但對樣本數據量的要求比較高。Jordan在1986年提出了遞歸神經網絡框架,Elman在1990年提出了Elman遞歸神經網絡。正是這種網絡結構的循環設計,在每次向歷史傳播的過程中都會產生一個梯度,當傳播次數遞增時,梯度也會出現消失或爆炸等問題。1997年,Hochreiter和Schmidhuber為解決循環神經網絡(RNN)中梯度消失的問題,提出了長短時記憶單元(Long Short Term Memory,LSTM);2005年,Graves提出使用完全的后向傳播方式訓練LSTM模型,使得LSTM的實現過程更加可靠。2014年,Chung提出了簡化版本的LSTM,GRU(Gated Recurrent Unit)。GRU單元只有兩個門,重置門(reset gate)和更新門(update gate)。從2014年以來,LSTM神經網絡已經成為RNN的研究熱點,在很多行業都有廣泛的應用。2015年孫瑞奇將LSTM網絡模型應用在股票數據的預測上,結果表明該網絡模型適用于股票預測。2016年,左玲云,張晴晴將其應用在語音識別上,也取得了不錯的效果。
文中在python的語言環境建立了改進的LSTM預測模型,具體步驟如下:
1.在開始訓練之前,首先是對數據進行預處理,使其是沿時間序列的;
2.優先修正隨機數種子,以確保結果是可重復的;
3.導入數據,然后將數據轉化為浮點型,并且進行標準化處理,一般用Scikit-Learning庫的MinMaxScaler預處理類來規范數據集;
4.將數據模型分割為訓練模型和測試模型,對于時間序列數據,值的順序很重要。將訓練數據集分離成測試數據和預測數據,其中80%作為測試數據,剩下的20%用作預測數據;
5.定義一個函數來創建一個新的數據集,函數有兩個參數:DataSet(利用DataSet的NumPy數組)和look_back(上一時間段數據作為輸入變量預測下一個時間段的時間步驟數),一般默認為1;此默認設置將創建一個數據集,其中X是指定日期的相對高程,Y是下一次的相對高程;
6.重塑數據結構,利用Numpy可以將準備好的訓練數據和測試輸入數據轉換成預期的結構;
7.設計LSTM網絡,其中輸入層為1,隱含層為4,輸出層為1,同時將Sigmoid函數用于LSTM塊,取迭代次數為1000,批量為1。
BP神經網絡和SVM預測模型具有較強的泛化能力,非線性捕捉能力等特點。文中分別選用適用于變形監測的BP預測模型和SVM預測模型對185期沉降樣本數據進行訓練,訓練樣本為168期數據,預測數據為17期數據。并與改進的LSTM神經網絡模型預測結果進行對比。
三種預測模型的精度評定見表1:

表1 三種預測模型精度對比(單位:mm)
由表1可知,三種預測模型整體預測精度最好的是改進的LSTM預測模型,較BP預測模型其RMSE值精度提高了13.3%,MAE值精度提高了12.5%;較SVM預測模型其MAE值精度提高了23.3%,RMSE值精度提高了32.8%。改進的LSTM模型結合了LSTM預測模型對時間序列的非線性樣本數據預測的優勢性,對一定量的深基坑變形監測數據進行有效的預測。
文中提出改進的LSTM模型應用于地鐵深基坑變形監測中,文中將組合模型與BP模型和SVM模型對比,結果表明組合模型預測效果更好,RMSE值精度分別提高了13.3%和32.8%,具有一定的實際應用價值。