王隆安,魏長壽,張家威,王俊杰,李豪杰
(山東科技大學,山東 青島 266590)
地鐵車站深基坑開挖過程中最為重要的是其地下工程結構形變監測問題,通過實測數據進行形變分析、建模預測形變規律,是該類問題研究的重點。在已有的研究當中,有AR模型、灰色模型、BP神經網絡模型、遺傳算法等,都在形變擬合及預測問題上得到了眾多應用[1]。容靜等[2]使用改進灰色模型,合理剔除數據噪聲,做出了地鐵隧道形變預測方法;孟慶年等[3]使用AR模型求出模型參數,對工程形變作出預測;郭張軍等[4]利用LSTM模型對大壩形變進行預測,證明其具有工程實用性。
在眾多學者的研究中,多數是單一模型的工程擬合,其研究不能剔除多余噪聲,少有組合模型的形變預測,筆者發現ARIMA模型與時間序列特征相吻合,經過差分后的形變數據平穩性達標,但模型預測值略微偏大[5]。LSTM記憶神經網絡對歷史數據有長期依賴性,在時間序列的預測中具有很高的契合度,但模型容易出現過擬合。鑒于此,展開ARIMA模型聯合優化LSTM模型的研究,對數據進行差分處理、參數定階、殘差擬合、數據還原等步驟,再與眾多模型進行動態過程發展態勢的量化比較分析,其在眾多模型中得出最優解,合理擬合預測基坑形變,可以為相似工程提供一定參考。
ARIMA模型可劃分為三個部分,AR:自回歸;I:差分;MA:移動平均[6-7]。ARIMA模型對數據有平穩性和非白噪聲的要求[8],因此,需用差分法來實現序列的平穩性操作。通過白噪聲P值確定差分階數。
在自回歸模型AR中,
(1)
式中,yt為當前值;μ為常數項;p為階數;γi為自相關系數;εt為誤差項。
移動平均模型著重解決AR模型誤差項累加的精度問題[9],通過移動平均法剔除噪聲,消除隨機波動,在MA中,
(2)
式中,yt為當前值;μ為常數項;q為階數;εt為誤差項;θi為最優參數(需求解)。
經差分后,將AR與MA組合,即:
(3)
式(3)中各符號含義同式(1)、式(2)。
檢驗自相關系數ACF,用于隨機變量與自身的比較。偏自相關系數PACF的檢驗,可以嚴格x(t)、x(t-k)之間的相關性。選出ACF和PACF大概范圍后,進行熱力圖定階,其目的是選擇更簡單模型[10-11]。
LSTM 是通過設置了三個“門”來實現對單元狀態的控制[9]。其中遺忘門決定了有多少數據會被記憶;輸入門決定了有多少數據會被輸入到單元狀態中;而輸出門則決定了單元狀態有多少會被輸入到輸出值當中。單個單元內部結構圖如圖1所示。圖中用四個虛線框標出了四個結構,從左到右分別為:遺忘門、輸入門、當前單元狀態輸入部分的計算模塊、輸出門。

圖1 LSTM單元內部結構圖
LSTM 的訓練算法流程與傳統 RNN 的訓練算法一致[12]:首先,求出各個神經元的輸出值,再根據誤差反向傳播原理,得出各個神經元的誤差項,根據梯度下降原理對各個權重矩陣與參數進行更新。通過對樣本數據的學習,反復更新 LSTM 內部的權重矩陣及參數,直到網絡整體誤差達到標準,進而利用訓練好的模型對數據進行擬合預測。
首先,通過ARIMA建模后輸出預測值序列、殘差序列;然后,利用LSTM網絡對殘差序列建模,輸出新的殘差預測序列;最后,將新的殘差序列與ARIMA預測值序列組合,得到組合結果[13]。建模流程如圖2所示。

圖2 ARIMA-LSTM組合模型構建方法圖
其中,LSTM采用指數衰減學習率算法,增強模型的泛化性;采用早停止策略,弱化隨機噪聲的影響,防止過擬合。其方法在實例應用中給出。
某地鐵車站主體結構位于綠地內,場地條件較好,樁頂水平位移監測點使用徠卡TS15A1′R400全站儀觀測,按《工程測量規范》(GB50026-2007)二等水平位移技術要求進行。在眾多觀測點中選取位于主測斷面二上的測點ZQS06,從10.17~11.15共計23期數據進行擬合和預測。
整個實驗過程完全按照程序設計與應用流程表展開,如表1所示。

表1 程序設計與應用流程表
以測點ZQS06實驗過程為例,選取該測點10.17~11.15共23期數據,其測點位置及原始數據可視化如圖3、圖4所示。

圖3 ZQS06測點位置

圖4 原始數據可視化
可以看出數據類型為時間序列,有些時段出現數據冗余,數據中間時段波動較大,應進行數據預處理(差分、白噪聲檢驗),處理結果如表2所示。
P-value越接近0越平穩。由表2可知,進行d=2二階差分,P-vaule=4.212 821e-7,白噪聲為7.933 47e-5,二階差分即可使原始數據的平穩性達標。

表2 差分、白噪聲結果
對二階差分序列做出ACF圖和PACF圖,得到p、q范圍,結果如圖5所示。

圖5 自相關與偏自相關分析
ACF和PACF都呈現拖尾,在ACF圖中,在1階位置就開始基本落在置信區間內,且后方無過多噪聲點,確定出q為1;在PACF圖中,在1階或2階位置就開始基本落在置信區間內,且后方無過多噪聲點,確定出p為1或2,由此可得(p,q)=(1,1)或(2,1)。
當有多組備選參數可以選擇時,根據AIC值進行模型參數的選擇,通過衡量模型的復雜度來選擇更簡單的模型,做出熱力圖如圖6所示,完成最終定階。

圖6 熱力圖定階
在熱力圖中,圖塊數值為AIC值,橫縱坐標的選取原則為AIC值越小模型精度越高,選取盡量黑色的區域即為p、q最合適取值,結合偏自相關函數所確定的p、q值的范圍最終確定為:p=1,q=1。
數據經二階差分處理后其穩定性如圖7所示,差分值穩定在(-1.5,1.5)之間,均值趨于0附近,結合表2可知,差分值P-vaule=4.212 821e-7,白噪聲為7.933 47e-5,數據趨于平穩,無較大波動,已符合平穩序列要求。

圖7 二階差分穩定性分析
至此,確定為ARIMA(1,2,1)模型,將差分數據喂入模型,畫出殘差圖,如圖8所示,對模型精度進行評估。

圖8 模型殘差圖
殘差均值接近0且方差滿足正態分布,模型精度符合要求。將殘差序列喂入LSTM模型,LSTM模型采用均方誤差計算誤差,選擇“Adam”優化器,迭代次數選擇1 000次,網絡結構如圖9所示。

圖9 LSTM網絡結構
LSTM輸出預測殘差序列,聯合ARIMA的擬合值,得到最終序列,與LSTM模型、GM(1,1)模型、MLP多層感知器及原始數據做出動態過程發展態勢量化比較分析,如圖10所示。

圖10 ZQS06模型擬合對比分析
計算得出,ARIMA模型的RMSE誤差相比于LSTM模型降低了15%,因此,先用ARIMA模型預測殘差符合邏輯與實際。由圖10可知,單一LSTM模型擬合值整體偏低;GM(1,1)模型基本保持單調上升的趨勢,不適合非指數型序列的預測;MLP模型有些時段噪聲過大;ARIMA-LSTM組合模型始終隨著觀測數據的變化而變化,且二者的數值十分接近。相較于單一LSTM模型、GM(1,1)模型和MLP模型,優化ARIMA-LSTM組合模型可以挖掘相隔較長時間數據的關聯性,對此基坑形變規律的適應性更強。
本文挖掘ARIMA對于時間序列的優勢,結合深度學習優化LSTM記憶神經網絡對歷史數據記憶的優點,將兩者結合建立了優化ARIMA-LSTM組合模型,采用該模型應用于地鐵基坑形變預測,結果表明:MLP多成傳感器、GM(1,1)等模型單一預測精度較低,優化ARIMA-LSTM組合模型能充分利用兩種單一預測模型各自的優勢,在中長期的基坑形變規律擬合及預測中,該組合模型預測精度更高,繼而可以作為該工程的預測模型來進行后續的研究分析。