邵艷坡 郭長恩
(1. 山東省地質礦產勘查開發局八○一水文地質工程地質大隊, 山東 濟南 250014;2. 山東省水工環地質工程有限公司, 山東 濟南 250014)
在城市建設進程中基坑工程是不可缺少的一環,同時,基坑工程正朝著深度深、面積大的方向發展,基坑安全問題也越來越多地受到人們的關注。建立有效的變形預報模型是分析變形監測資料、理解變形機理和檢驗工程設計理論的重要手段[1],同時,變形預測成果為災害預警和工程安全性評估提供了重要的決策依據。許多學者在這方面進行了研究并取得了不少的成果,魏冠軍等從變形預測的不確定性出發,研究了變形預測的概率預報方法,通過概率規則實現了預報的遞推過程[2];尹暉等將單點變形分析擴展到空間多點的整體變形分析,建立了基于非等間距的多點變形預測模型[3];范千等改進了貝葉斯極限學習機(BELM)方法,提出了動態貝葉斯極限學習機(DBELM)方法,實現了高效率動態預測[4];潘國榮在時間序列建模方法研究中,在原有傳統最小二乘法的基礎上推導出序貫最小二乘解法,從而解決了反復處理歷史數據帶來的巨大計算問題[5]。另外,回歸分析模型、灰色系統模型、神經網絡模型、小波分析模型及其多模型組合預測方法作為代表性預測模型被研究與實踐較多,取得了一系列的應用成果[6-13]。
上述研究中大多是基于不同時期觀測點變形數據的數學處理方法,而影響變形的力學因素少有納入計算模型之中。為此,本文采用考慮錨索軸力的回歸分析方法,對基坑某變形特征點的物理特征進行變形分析。同時,從樣本數據著手,以3倍中誤差作為判定觀測粗差的準則并予以剔除[14],使擬合具有更高的準確性。
回歸分析模型是對統計關系進行定量描述的一種數學模型,根據所選自變量的數量可分為一元回歸分析模型和多元回歸分析模型。若自變量與因變量之間存在線性關系,則為線性回歸;若為非線性關系,則可根據曲線圖形匹配或多項式擬合等方法將其轉化為線性回歸問題[15]。
多元線性回歸模型為一元線性回歸模型的拓展,故僅闡述多元線性回歸模型,其數學表達形式為
(1)
式中,x1i,x2i,…,xmi為不含測量誤差的非隨機變量;β0,β1,…,βm為回歸參數;yi為第i次樣本觀測值,根據林德伯格中心極限定理,νi為符合正態分布的隨機誤差,且其數學期望E(νi)=0,方差為σ2,協方差σνi·νi-k=0(k≠0)。
由于νi的存在,必然造成yi為隨機變量,容易得
(2)
式(1)矩陣形式為
(3)
式中,En為n階單位矩陣。
(4)
使殘差平方和最小有
(5)
由微分學知識可知,多元函數存在極值的必要條件為
(6)
整理化為正規方程組并寫成矩陣形式,即在VTV=min條件下得到法方程為
(7)
進而得出模型參數的最小二乘解為
(8)

(9)
將此原假設作為模型(1)的約束條件,構造如下統計量
(10)

在顯著性水平α下,若F≥Fα(n-m-1),則拒絕原假設,即模型線性回歸關系顯著,反之則認為模型線性回歸關系不顯著。
為進一步檢驗每個自變量對因變量的顯著性,有如下原假設:
(11)
構造統計量
(12)
式中,cjj為(XTX)-1第j個對角元素。

為檢驗模型擬合及預測的可靠性,采用均方根誤差、平均絕對誤差兩項精度評價指標進行檢驗;另外,以后驗化比值作為后驗差的檢驗指標來確定模型擬合及預測的整體精度等級。
(1)均方根誤差
(13)
(2)平均絕對誤差
(14)
(3)后驗化比值
(15)

引入預測模型精度檢驗標準[16-17],可將模型精度等級劃分為4種,見表1。

表1 模型精度等級劃分
本文的實例數據來自某基坑工程的安全監測資料,該基坑工程開挖深度15 m,基坑周長314 m,基坑安全等級為一級,采用“灌注樁+錨索”支護形式,坡頂水平位移監測與錨索軸力監測同期進行。本文選取位于基坑東側中部的坡頂水平位移監測點W7及其同一剖面位置上的錨索軸力監測點M2作為研究對象,顧及時間因素及錨索軸力分析坡頂水平位移點變形規律并建模,從而進一步對坡頂變形做出預測。
本文選取2021年10月18日—2022年2月16日期間共29期監測數據進行分析,其中前25期數據用于建模,后4期數據作為模型預測結果的對比分析。原始采樣數據如表2所示。

表2 變形點實測數據
在基坑變形監測中,出于基坑安全考慮,我們往往更注重垂直于基坑壁方向上的變形量。因此,表2中的坐標分量取該點在監測坐標系中垂直于基坑壁方向上的坐標分量。
從表2可以看出,各物理量的單位不同,甚至數據格式也不相同。這對于研究其相互間關系并進一步建模是不方便的,因此,需要對采集的原始數據進行變換。本文根據工程特點及研究需要,對原始數據做如式(16)所示的平移變換。
(16)
將原始數據平移至以初始值為原點的數據空間。該變換不改變數據間的位置關系,且在基坑監測工程中有實際意義,即變換后的數據就是累計變化量,這是基坑安全監測中最為重要的安全指標之一。相較于常用的數據標準化處理,該變換更具有工程實際意義且計算更為簡便。
平移變換后的數據如表3所示。

表3 平移變換后數據
在利用式(1)建立回歸模型時,因變量yi為含有偶然誤差的隨機變量,但當yi含有粗差時,所建立的模型將不能達到較好的擬合精度甚至失去意義。因此,本文在進行建模前先采用“3σ準則”剔除粗差。
由每個觀測周期坡頂水平位移監測點的變化量構成數據序列{y1,y2,…,yn},則描述該序列數據的變化特征值為
(17)
變化特征值偏差的絕對值與均方差的比值為
(20)
當qi>3時,則認為yi含有粗差,予以剔除。
經上訴方法處理后,2021-11-15期數據變化特征值偏差比值q=4.1>3,即該期數據超出3倍中誤差,予以剔除,該期數據不參與建模過程。
建立式(1)所述二元線性回歸模型,其中時間因素與錨索軸力分別作為2項影響因子。由式(4)~式(8),得出回歸參數為
(21)
回歸方程為
(22)
4.3.1顯著性檢驗
進行回歸模型線性關系顯著性檢驗與回歸參數顯著性檢驗。由上述兩項檢驗原假設式(9)、式(11)可知,若回歸參數檢驗通過,則模型線性關系檢驗必然通過,所以本文僅進行回歸參數的顯著性檢驗。
由式(12)可得統計量
(23)
取顯著性水平α=0.05,可查得t0.025(21)=2.079 6。顯然|t2|>|t1|>t0.025(21),即回歸參數β1、β2均通過顯著性檢驗。
4.3.2精度檢驗
為驗證本文所提模型方法的精度,采用均方根誤差、平均絕對誤差兩項精度指標進行評價,并結合一元回歸模型、BP神經網絡模型、GM(1,1)灰色模型進行對比分析。各模型均對同一組數據進行建模并基于Matlab程序語言實現。其中,本文所提模型為考慮時間因素與錨索軸力影響的二元回歸模型;一元回歸模型考慮時間因素與錨索軸力因素分別建模;BP神經網絡模型為以時間因素與錨索軸力為輸入層元素構建的3層網絡結構;GM(1,1)灰色模型以數據自身一次累加及對其一介微分式求解進行建模。各模型預測值殘差及精度指標值如表4~表5所示。

表4 模型的精度指標 單位:mm

表5 模型的精度指標 單位:mm
在精度指標計算時,許多學者將擬合數據與預測數據綜合在一起進行分析。擬合數據是在模型運行過程中按照運算規則被不斷優化的最優解,其擬合精度必然較高,而預測數據則沒有被修正,精度必然較低。因此,將擬合數據與預測數據綜合在一起分析不能準確描述模型精度。所以將擬合精度與預測精度分開描述更為合理。
從表4~表5可以看出:①二元回歸模型、BP神經網絡模型、GM(1,1)灰色模型預測值與實測值之間的殘差均未超過1 mm,預測效果相對較好;②擬合精度指標中,BP神經網絡模型的RMSE與MAE值最小,二元回歸模型次之,這是因為BP神經網絡模型為非線性模型且顧及了錨索軸力因素的影響,可以最大限度地將擬合值靠近目標值,但并不代表其預測能力最好;③預測精度指標中,二元回歸模型的RMSE與MAE值最小,BP神經網絡模型與GM(1,1)灰色模型次之,說明考慮時間因素與錨索軸力的二元回歸模型在本文實例中的預測能力最好;④從預測值殘差、擬合精度指標與預測精度指標三個方面來看,一元時間回歸模型與一元錨索軸力回歸模型在本文實例中的表現均不佳,而將兩因素結合考慮的二元回歸模型與BP神經網絡模型可以將模型精度有效地提高。
另外,根據該基坑工程設計文件要求,坡頂水平位移變化速率預警值為2 mm/d,參照《建筑基坑工程監測技術標準》,坡頂水平位移監測精度為RMSE≤1 mm。因此,本文所提預測模型能夠滿足該基坑工程變形監測的精度要求。
各模型后驗化比值計算結果如表6所示,并按照表1模型精度檢驗標準將各模型精度進行分級。

表6 模型精度等級對比
由表6可知,二元回歸模型與BP神經網絡模型精度等級均為一級,模型擬合及預測效果較好,二者都顧及了時間因素與錨索軸力影響,所以將錨索軸力納入基坑變形數據處理中具有顯著的工程實際意義;僅考慮錨索軸力的一元回歸模型與GM(1,1)灰色模型精度等級為二級,表明只依靠單一因素如錨索軸力、數據自身規律性等來建模預測變形量是不夠可靠的;一元時間回歸模型精度等級為三級,精度等級最低,僅能大致描述變形隨時間的變化規律,一般不能用來單獨建模。
本文從理論分析的角度出發,論述了回歸分析模型的理論基礎及其參數估計的推導過程,并將錨索軸力納入模型中進行分析,拓展了傳統的變形分析模型。在對工程實例的分析中,通過對5中模型的對比分析,驗證了所提模型的可行性及在變形預測中的優越性。同時,考慮錨索軸力的BP神經網絡模型與GM(1,1)灰色模型作為非線性模型也表現出了較高的擬合精度和預測能力。因此,將進一步探討把多元回歸模型中的影響因素進行曲線匹配或多項式擬合,使其表現出更符合實際的非線性關系,進而改進模型,以提高預測的精度。