卓維松,闕云,王榮,黃瑞
(1.福建船政交通職業學院 土木工程學院,福建 福州 350007;2.福州大學 土木工程學院,福建 福州 350116;3.武夷學院 土木工程與建筑學院,福建 武夷山 354300)
土釘軸力是土釘抗拔和抗拉極限狀態設計的關鍵參數之一,對土釘軸力精確預測不僅關系到工程造價,并且與基坑支護工程的安全問題息息相關。目前,世界各國都有相應的土釘軸力計算模型,如美國的FHWA 法[1],日本規程用的經驗土壓力[2],中國的《建筑基坑支護技術規程》(JGJ 120-2012)、《基坑土釘支護技術規程》(CECS 96:97),簡化增量法[3]和極限上限分析法[4]等。
目前已有學者對現有的土釘預測模型進行評估。例如,Yuan 等[5-6]對FHWA、《建筑基坑支護技術規程》和《基坑土釘支護技術規程》所提出的土釘軸力模型分別進行了模型不確定性分析,研究表明其模型因子的平均值和變異系數分別為0.95 和0.382、0.62 和0.62 及0.974 和0.730。由此可見,現有土釘軸力計算模型精確度仍有待提高。
神經網絡方法由于具有高度的非線性映射能力,事先不需要假設輸出變量與輸入變量之間的關系,而是通過對大量數據組成的樣本本身進行深入學習驗證,就能找到輸入數據和輸出數據之間的某種線性或者非線性關系。楊小輝[7]基于Elman 神經網絡構建復合土釘墻安全預測模型,并用實測數據進行對比,證明Elman 神經網絡用于復合土釘墻的安全預測方面具有較好可行性。曹正[8]提出一種基于BP 神經網絡的基坑土釘支護結構優化設計方法,用于選擇工程量最小的土釘支護方案。Hao 等[9]用監測數據建立土釘墻位移神經網絡預測模型,并用正交試驗分析,找出影響邊坡位移影最大的敏感性因素。王兆鑫[10]采用BP算法與遺傳算法相結合的方法應用于土釘墻土釘支護的變形預測,經過預測模型與實測位移數據對比,發現神經網絡模型預測值與實測變形值最大誤差為8.82%,能滿足工程問題的實際需求。Maedehl 等[11]利用多層神經網絡對考慮土釘抗拔力、覆土荷載和灌漿壓力影響的土釘墻中土釘結合體系的最大位移進行了評估。
由此可見,神經網絡已被廣泛地應用于土釘墻相關參數的預測中,且具有較高的模型預測精度。然而,以上研究多適用于單一土體或者單一土釘墻神經網絡模型,因其數據有限導致模型適用性有限,并且其所建立模型所采用的數據量偏少,遠不足以支撐一個具有實用價值的神經網絡模型。
基于此開展文獻調研,收集大量工作狀態下土釘軸力最大值的實測數據,建立一個考慮土釘墻參數(坑壁傾角、后傾角)、土釘參數(間距、直徑、長度和角度)、土參數(黏聚力、摩擦角和重度)和超載情況等因素的土釘軸力神經網絡預測模型,然后對該模型的預測結果進行評估,以期提高土釘軸力的預測精度,為其理論計算和工程實踐提供支持。
BP 神經網絡(back-propagation neural networks)及反向傳播神經網絡,是采用誤差逆傳播算法進行誤差校正的多層前饋網絡。BP 神經網絡的學習過程是正向傳播過程和反向傳播階段,正向傳播過程是基本信息輸入輸入層,然后由隱藏層加權處理就會得到輸出值。反向傳播階段就是當輸出值與樣本值存在差異時,這是BP 神經網絡就會通過逐層修改權值和閾值,逐步減小輸出值與樣本值的誤差,直至得到滿足特定要求的結果為止。
BP 神經網絡對于處理工程中各種非線性的映射能力非常出眾,使其使用面很廣,其具有非常強大的自學習和自組織能力,神經網絡對建模的目標的經驗知識不需要太高的要求。在實際應用中較為方便,將影響土釘軸力多因素數據作為輸入,實際監測土釘軸力值作為輸出,神經網絡便會將輸入數據和輸出數據分成三類分別用于訓練網絡、驗證網絡、測試網絡,是最終生成的神經網絡模型滿足精度要求,可以應用于土釘軸力預測的實際工程,其應用范圍涉及非常廣。
圖1 為BP 神經網絡的結構,左邊為輸入層x,右邊為輸出層y,中間部分為隱藏層,隱藏層層數不唯一,隱藏層里面包括神經元,神經元數也不唯一。

圖1 神經網絡結構Fig.1 Neural network structure
圖2 為神經網絡使用的基本流程。通過編寫Matlab 神經網絡語言,使用結果回調用相應的工具箱,便于更加直觀理解所訓練驗證測試神經網絡模型的性能,圖3 為Matlab 實現神經網絡的流程。

圖2 算法流程圖Fig.2 Algorithm flow chart

圖3 神經網絡訓練及仿真流程圖Fig.3 Neural network training and simulation flow chart
基坑土釘墻土釘軸力是多種因素共同作用的結果,收集大量工作狀態下土釘軸力最大值的實測數據,建立詳細土釘軸力數據庫。考慮土釘墻參數(坑壁傾角、后傾角)、土釘參數(間距、直徑、長度和角度)、土參數(黏聚力、摩擦角和重度)和超載情況等因素,該神經網絡將這些因素作為輸入層,用來進行數據分析,輸出層是監測的土釘實測數據值。
2.2.1 層數和節點數
隱藏層的層數通常不唯一,計算方式也不固定,通常與設計人員的經驗和習慣確定,設計隱藏層數目太少,學習能力下降,會導致計算不充分,精度較差,容錯率變低。設計隱藏層數據太多,會導致計算過程過于漫長,學習時間太長,精度也不一定很高。經多次測算,本模型設置1 個隱藏層,一共2 層激活層,其中第一層有21 個神經元,第二層10 個神經元。輸入節點是14 個,輸出節點是1 個,輸入層和輸出層不設置激活函數,輸入層、輸出層都呈現線性映射。
2.2.2 初始值范圍的選定
采用土釘墻土釘軸力最大值作為訓練樣本,網絡初始權值是隨機生成,一般將初始值得范圍選定在(-1,1),這樣激活函數處于對最大變化率時調節各個神經元的權值。
2.2.3 網絡的輸入
如果輸入層輸入變量的數量級過于龐大也將不利于權值的調整,利用歸一化處理可以避免數值問題帶來的計算麻煩,歸一化后的數據將使網絡快速收斂。多因素影響的模型,神經網絡對樣本數據的評價標準不一樣,這時需要對其量綱化,做統一評價標準。數據不做歸一化,在計算過程中,凈輸入絕對值可能會過大,導致神經元輸出呈現飽和,較小的值將會被忽略,最終影響模型的預測精度,所以現在做神經網絡時,都不可避免的將數據進行歸一化處理。
2.2.4 學習速率
學習速率通常需要經過多次測算去選定為定值。在神經網絡的使用中,一開始是比較難選到最合適的學習速率,通常會導致學習速率過大或者過小。如果設置的學習速率太大,神經網絡在計算過程中可能會出現權值修正過頭的現象,導致模型的預測進度較差。如果設置的學習速率太小,神經網絡計算過程會很慢,耗費大量時間。神經網絡循環訓練產生權值變化量的大小是由學習速率決定,通過大量調節測算,認為選取學習速率為0.01 較為合適。
2.2.5 終止訓練設定
訓練目標均方差低于0.001。終止設定中設置如果訓練效果不佳,連續十步變差,就會訓練將會自動停止。
BP 神經網絡里面一般有newff()、train()、sim()3 個函數,可分別用于創建、訓練和預測。本文用newff()函數,該隱藏層設置2 個激活層,第一個激活層設置21 個節點,第二個激活層設置10 個節點,這個兩個激活層的激活函數都使用正切S 型函數tansig。因為S 型函數tansig 性能好,比較穩定,不容易梯度消失,計算性能好,對于輸入值要求相對寬容。
設置優化方法選擇trainlm 函數,因為動量反轉和動態自適應學習率的梯度下降BP 算法訓練函數traingdx、levenberg_Marquardt 的BP 算法訓練函數trainlm,這用優化函數是系統默認的最優于處理中等規模的神經網絡的算法。訓練樣本都有很大的計算量,trainlm 能將這部分的計算量減少,避免復雜的矩陣運算,提高訓練樣本的計算速率。
用于生成神經網絡的土釘墻土釘軸力最大值數據樣本容量來源于闕云等[12]在簡化增量法計算土釘軸力模型準確性分析中的土釘軸力數據庫。其收集了國內現有的178 根土釘軸力數據,提出異常和最后一根土釘的軸力實測數據后土釘為143 根。
經過多次訓練和篩選,找到比較合適的神經網絡模型,每次生成的模型都不一樣,多次篩選必不可免。這神經網絡本身調節值得隨機生成有關。通過Matlab編寫神經網絡代碼,建立用于預測土釘軸力的神經網絡模型,最終的得到神經網絡預測值與實測值如下圖4 所示。由圖4 可知,該神經網絡模型土釘軸力最大預測值與最大實測值吻合程度很高,離群點較少。

圖4 神經網絡預測值與實測值Fig.4 Neural network predicted value and measured value
通過Performance 得到其迭代次數與均方誤差的關系,如圖5 所示。由圖可知,訓練、驗證和測試的MSE 隨著迭代次數的增加而減小,且MSE 值較小,驗證和測試的MSE 值差不多。驗證的MSE 最小值發生在第5 次迭代,而且在此之前沒有過擬合現象,即沒有訓練MSE 值遞減但驗證MSE 值遞增的現象出現。

圖5 迭代次數與均方誤差的關系Fig.5 The relation between epochs and mean square error
通過Training state 得到其驗證數據的梯度、Mu、驗證檢查與迭代次數的關系如圖6 所示。由圖可知,梯度隨著迭代次數的增加而減小,Mu 是LM 算法里面的一個參數,基本上隨著迭代次數是穩定變化的,最大值也未超過0.001。驗證檢查就是找到一個時點,而它之后6 個時點對應的MSE 都沒有減小。在時點5~15 上,驗證的MSE 單調增大,因此算法停止,最小的驗證MSE 發生在5 次迭代上。

圖6 驗證數據的梯度、Mu、驗證檢查與迭代次數的關系Fig.6 The relationship between gradient,Mu,validation check of validation data and epochs
通過Regression 得到其擬合回歸圖,如圖7 所示。由圖可知,訓練R 值為0.981,驗證R 值為0.73,測試R 值為0.82,整體R 值為0.92。經過多次嘗試,結果還是比較理想的,但是這樣的結果并不完美,如果想要得到更好的擬合結果可以做如下嘗試:多次切換影響結果的初始值;改變神經元數量繼續嘗試來獲取更好的結果;通過增加數據來進一步來完善該神經網絡模型;通過應用不同的函數來訓練數據建模。

圖7 擬合回歸圖Fig.7 Fit regression graph
神經網絡模型建成后,神經網絡預測土釘軸力最大值提取出來和土釘軸力實測值進行分析對比。圖8為神經網絡預測土釘軸力最大值與土釘軸力實際監測值關系圖。由圖可知,預測最大釘軸力最大值均小于100 kN,實測土釘軸力最大值和預測土釘軸力最大值與1∶1 對應線的偏差,圖形不完全吻合,造成不吻合的原因可能有以下四個方面:可能與土壤類型、地形、環境;試驗儀器本身的誤差;人為造成的誤差;模型本身的誤差。

圖8 神經網絡預測土釘軸力最大值與土釘軸力實際監測值Fig.8 Neural network predicts the maximum value of soil nail axial force and the actual monitoring value of soil nail axial force
圖9 為土釘軸力最大值神經網絡模型的模型因子λB與預測土釘軸力最大值關系圖。由圖可知,土釘軸力的μλ 和COVλ分別1 和0.37。表明預測土釘軸力最大值的平均值比實測土釘軸力最大值的平均值一樣。圖中λ 大于2 的數據點有2 個,但未發現將這些土釘軸力最大值識別為異常值的原因,剔除問題數據后土釘軸力最大值數據(n=143)的斯皮爾曼秩相關系數為ρ=0.88(大于零)P 值<0.05。表明拒絕了λ 和預測土釘軸力最大值相互獨立的零假設。由于該方法的準確性取決于土釘軸力最大值的大小,即使從數據集中省略2 個最高數據點,偏差依賴性的定量指標顯示仍然相關。

圖9 神經網絡模型的模型因子與λB 預測土釘軸力最大值關系Fig.9 The relationship between the model factor of the neural network model and λB to predict the maximum axial force of soil nail
表1 為不同土釘軸力模型相關參數對比表,由表可知,對比國內現有常應用于實際工程的土釘軸力模型,可知該神經網絡土釘軸力預測模型中的土釘軸力平均值更加精確,模型因子的變異性更小。且該神經網絡土釘軸力預測模型的預測精度和預測土釘軸力最大值之間不存在相關性,因而適用性更廣泛。

表1 不同土釘軸力模型相關參數對比Tab.1 Comparison of parameters of different soil nailing axial force models
收集大量工作狀態下土釘軸力最大值的實測數據,建立一個考慮土釘墻參數、土釘參數、土參數和超載情況等因素的土釘軸力預測模型,然后通過Matlab神經網絡代碼和神經網絡工具箱進行土釘軸力最大模擬。得出的主要結論如下:
(1)該神經網絡模型土釘軸力最大值預測的預測值與土釘軸最大值實測值吻合程度很高,離群點較少。
(2)該神經網絡梯度穩步降低,其中LM 算法里面的參數Mu 基本上隨著迭代次數穩定變化,最大值也未超過0.001,訓練R 值為0.981,驗證R 值為0.73,測試R 值為0.82,整體R 值為0.92。
(3)對比規范現有土釘軸力模型,該神經網絡土釘軸力預測模型的土釘軸力平均值更精確,模型因子變異性更小,且預測精度和土釘軸力最大值之間不存在相關性,因此適用性更廣泛。