楊國林,孫學先,鎖旭宏,劉 濤,曹 辰
(1.蘭州交通大學測繪與地理信息學院,蘭州 730070;2.蘭州交通大學地理國情監測技術應用國家地方聯合工程研究中心,蘭州 730070;3.中交一航局第二工程有限公司,山東青島 266071;4.蘭州交通大學甘肅省地理國情監測工程實驗室,蘭州 730070)
各種不同類型的神經網絡方法對人工智能和機 器學習有新的促進,它們都在各自應用領域有著重要意義[1-3].其中在標準的循環神經網絡(recurrent neural network,RNN)中,神經元之間存在反饋和前饋連接,動態處理和計算能力比傳統的前饋神經網絡更加出色,在時序數據處理中表現出很強的適應性[4-5].在 RNN網絡基礎上發展來的長短期記憶(long short-term memory,LSTM)神經網絡有了新的改進[6],其主要優點體現在:RNN在樣本訓練過程中,由于訓練的時間積累過多,從而導致網絡層數的改變越發頻繁,就可能產生梯度爆炸,形成梯度消失問題[7-8],無法獲得長程信息.新的方法能在這些方面有針對性改進,LSTM當前已成功應用的領域包括文本生成、機器翻譯、語音識別、生成圖像描述和視頻標記等[9-11].當前針對橋梁形變預測方法主要包括灰色理論法,時間序列模型、回歸模型等預測模型法,主要能進行短期預測,LSTM方法可彌補這一不足,在構筑物變形監測數據處理方面,相較常規方法具有優勢.
在建設工程中橋梁沉降及傾斜變形監測十分重要,通過準確地預測橋梁工程建設中沉降和傾斜的變化過程,就能較早地找到橋梁形變的異常狀況從而進行必要的應對調整,防止災害出現造成工程損失[12-14].
通過利用橋梁實測數據對建立的RNN和LSTM網絡模型分別進行訓練及預測,在RNN網絡基礎上根據Martin等[15]改進的LSTM網絡能夠學習時間序列中的短期和長期相關信息,克服了RNN相關的問題,結果表明,LSTM網絡能夠對觀測數據進行高精度和穩定的擬合和預測,能夠有效地描述橋梁的變形規律.
RNN的模型結構圖中涉及到輸入、輸出和中間的隱藏層,在當前時間隱藏層中有連接輸入到下一時間隱藏層.對于給定序列 x=(x1,x2,…,xn),可以通過迭代式(1)和式(2)計算出一個隱藏層序列h=(h1,h2,…,hn)和一個輸出序列 o=(o1,o2,…,o2).結構如圖1所示.

圖1 RNN模型細胞結構Fig.1 Cell structure of RNN model

式中:W為給定序列的權重系數矩陣;U為隱藏序列的權重系數矩陣;V為輸出序列的權重系數矩陣;b為偏置向量;f為激活函數.
過程中普遍采用的(3)和(4)式的sigmoid激活函數和tan h激活函數.在特征信息相差比較大的情況通常使用激活函數tan h;在相差較小時使用函數sigmoid,同時對輸入數據進行規范化處理.

LSTM網絡中有時間記憶單元,LSTM網絡是將RNN隱藏層的細胞替換為LSTM細胞,即具有了長期記憶的特性,LSTM模型細胞結構如圖2所示.對于學習時間序列依賴于時期長短的問題與長序列建模問題,可以更好處理存在于RNN中的問題,改進效果明顯[16-17].

圖2 LSTM 模型細胞結構Fig.2 Cell structure of LSTM model
其中LSTM在t時刻輸入的序列值為xt,輸出值及控制單元狀態為ht-1和ct-1;LSTM的輸出為:輸出值ht及控制單元狀態ct.計算分別見式(5)~(7)[18]:

式中:Wf、Wi、Wo為權重矩陣;bf、bi、bo為偏置項[19].
具體開展研究的方法流程如圖3所示.

圖3 數據處理流程Fig.3 Flowchart of Data processing
首先開展深度學習預測算法的歸納分析,然后進行多數據驅動型LSTM算法研究,特別針對橋梁形變進行LSTM預測模型設計,具體通過數據的預處理、模型參數的計算、進行樣本的模型訓練和對模型進行評估,實現LSTM算法對橋梁形變的預測分析.
使用基于Sequential-Keras模型所構建的基于單元素分析的三層神經網絡框架,擬定輸入輸出單元,過程中單元誤差函數為標準差,激活函數為adam.現用一橋梁的長周期形變觀測數據對其進行訓練和預測,數據如表1所列.通過差分使數據穩定,并將數據轉換為有監督數據,對轉換后的數據進行拆分,分為訓練數據和測試數據并進行縮放.通過確定步長、迭代次數和神經元數量參數進行訓練和預測,并根據RMSE的值調整參數直至參數滿足精度要求.

表1 橋梁觀測數據Tab.1 Bridge measured data
研究方案中以前35期沉降觀測數據作為訓練樣本,后5期數據作為測試樣本,經過相應程序計算,該橋梁的沉降曲線如圖4所示,兩種方法分別開展沉降預測,成果分析如圖5所示,傾斜曲線如圖6所示.另外以前7期傾斜方面觀測的數據作為樣本,以后面3期傾斜觀測數據作為測試樣本,經過相應程序進行傾斜預測,其成果對比如圖7所示,結果對比及分析如表2~3所列.

表2 沉降觀測值與預測值比較Tab.2 Comparison of settlement measured and predicted values

圖5 沉降預測結果對比Fig.5 Comparison of settlement prediction results

圖7 曲線預測結果對比Fig.7 Comparison of tilt prediction results
分析圖4表明,橋梁的沉降在第1期至第6期時間段內經歷一個緩慢下沉過程,此時處于施工期,隨后在第6期至第17期時間段內快速下沉,之后下沉速率放緩并趨于穩定.分析圖6,受施工因素、地質條件和自然天氣等對橋梁的下沉及傾斜造成的綜合影響,表明橋梁的傾斜具有一定階段性.

圖4 沉降曲線Fig.4 Settlement curve of bridge

圖6 傾斜曲線Fig.6 Tilt deformation curve of bridge
分析圖5和圖7表明,采用訓練樣本對LSTM進行訓練的效果要好于RNN,RNN訓練誤差離散較大,LSTM在各個測試樣本誤差都較小.對于橋梁傾斜的預測,LSTM和RNN最終結果接近,在一定的時間序列處理中LSTM的提升不顯著.大量的重復訓練試驗表明通過增加迭代次數、隱藏層層數和神經元個數使RNN預測精度的提高效果不大,而在同種試驗條件下LSTM預測精度都較高,尤其是在長序列預測中.
統計所有過程數據并根據表2相關信息表明,RNN預測平均絕對誤差為0.47 mm,平均相對誤差為1.15%,標準差為0.507.LSTM方法得到的平均絕對誤差值是0.12 mm,平均相對誤差是0.31%,標準差為0.158.LSTM較RNN預測精度有整體提升,能較準確反映橋梁的沉降規律.從表3可以看到,RMSE值分別為0.120和0.113,二者在傾斜短時間序列預測中效果接近.RNN存在梯度消散問題,在特定實際情況下建模效果較差.在RNN基礎上改進的LSTM較好地解決了這個問題,考慮到當前信息對過往信息的影響,增加不同長短時期信息的學習,對時間序列遇到間隔與延遲的情況下更為可靠.

表3 傾斜觀測值與預測值比較Tab.3 Comparison of tilt measured and predicted values
工程施工監測更加自動智能的條件下,預測質量的提高對形變監測關系重大.利用橋梁的實測數據對RNN和LSTM網絡開展訓練和預測,由研究結果可知,在對橋梁的沉降與傾斜的監測中,兩者都能反映橋梁的沉降規律,在傾斜短時間序列預測中效果接近,同時LSTM能更好解決梯度消散問題,且LSTM網絡性能更穩定、更準確,效果明顯優于RNN網絡,對橋梁形變的預測和分析更具優勢.因此應用LSTM在橋梁變形預測中有較好的適用性,能為類似形變監測提供參考依據.