王江榮,趙 睿,任泰明,袁維紅
(1.蘭州石化職業技術學院 信息處理與控制工程系,甘肅 蘭州 730060;2.蘭州石化職業技術學院 土木工程系,甘肅 蘭州 730060)
基于分位數自回歸的路基沉降數據預測分析
王江榮1,趙 睿1,任泰明1,袁維紅2
(1.蘭州石化職業技術學院 信息處理與控制工程系,甘肅 蘭州 730060;2.蘭州石化職業技術學院 土木工程系,甘肅 蘭州 730060)
高填方路基存在施工期穩定控制和工后沉降控制問題。解決這兩個問題的關鍵在于及時準確地預測出高填方路基的沉降量。通過對路基沉降時間序列分析,建立了自回歸AR(1)擬合預測模型。采取分位數回歸法和最小二乘法進行模型參數估計和比較分析,結果表明分位數回歸法在模型參數估計時有明顯的優勢,預測精度遠高于多變量灰色MGM( )模型和基于最小二乘估計的自回歸AR(1)模型。工程實例分析表明,分位數自回歸模型具有很好的預測和應變能力,完全可以用于路基沉降數據預測分析。
路基沉降;分位數回歸;AR(p)模型;預測分析

高填方路基存在施工期穩定控制和工后沉降控制問題。解決這兩個問題的關鍵在于及時準確地預測出高填方路基的沉降量。目前,國內外公路路基沉降預測主要采用回歸分析模型、統計模型和組合模型等[1-3]。這些數學模型往往具有統計特性, 并建立在觀測誤差的數學期望值為零 、各次觀測互相獨立、方差相等以及觀測誤差呈正態分布的假設基礎上。事實上,影響路基沉降的因素是多方面的[4-5],監測數據往往會出現波動大、異方差現象,致使這些假設缺乏合理性,在這種情況下如果采用最小二乘回歸法估算模型系數時穩健性較差、模型預測誤差會較大,難以滿足實際工程需要。與傳統的回歸方法相比,分位數回歸以其高精度、高效率及穩健性強等特點被廣泛應用于各類數據的預測分析中[6-8],而且用分位數回歸法估計模型的參數時,對隨機誤差的分布不做任何要求。另外,傳統回歸法只能得到一個回歸方程,容易丟失數據信息,不能對預測量進行準確預測,也不能精確描述自變量對預測量條件分布形狀的影響情況。分位數回歸能夠得到一組不同分數下的回歸方程,能夠準確描述自變量對不同部分的預測量分布產生的不同影響,全面捕獲預測量的分布特征。由于路基沉降監測數據是時間序列,數據具有相依性和相關性,可用時間序列分析法——自回歸AR(p)模型預測未來的沉降量,并利用分位數回歸進行參數估計,得到了不同分位點下的時間序列預測模型,由于在不同的分位點上預測的結果不同,可為決策者提供更加符合實際的選擇。另外,本文建立的基于分位數自回歸路基沉降預測模型與其他時間序列預測模型相比,可得到更加完整的路基沉降信息,預測精度更高。
傳統的回歸方法實質為均值回歸,KOENKER 等(1978)提出了分位數回歸(quantile regression)理論[9],其實質是對傳統以條件均值模型為基礎的最小二乘法的發展,能夠依據因變量Y的條件分位數對自變量X進行回歸。該方法最大的優勢在于保留了變量之間大部分信息的同時,在一定程度上消除了異方差問題。
設Y為實值隨機變量,分布函數為F(y)=P(Y≤y),對任意0<τ<1有:

則稱Q(τ)為Y的τ分位數,當τ取0.5時,即為中位數回歸。中位數常常和均值共同來反映數據的位置信息。最小二乘回歸是通過最小化殘差平方和來估算模型參數值,即:

式中,yi(1,2,…,n)為Y的一組隨機樣本;ξ為擬合值(模型的計算值);β?(向量)是模型的參數估計值。分位數回歸則是通過最小化樣本值與擬合值的加權誤差絕對值之和來估算模型參數,即

式(3)還可以表示為:

分位數回歸優點主要體現在以下3個方面[10]:
1)分位數回歸對時間序列模型的隨機誤差項不做任何要求,使得所建模型具有很強的數據適應能力。
2)分位數回歸的模型參數估計值不易受數據列中異常點(離群值)的影響,使得建立的模型具有較強的穩健性(魯棒性)。
3)分位數回歸對不同的分位點,都能估計出相應模型的參數值,進而得到不同的回歸方程,使得數據中的大部分信息都能被提取出來。
對平穩的時間序列建模,通常采用自回歸移動平均ARMA(p,q)模型:

1)當θ1=θ2=…=θq=0時,模型即為自回歸模型AR(p):

2)當β0=β1=…=βp=0時,模型為移動平均模型MA(q):

在實際應用中,可以利用時間序列模型的ACF、PACF統計特性識別模型,具體見表1。

表1 平穩時間序列的統計特性表
另外,還可以利用AKAIKE給出的信息準則法識別模型,即AR(p)、MA(q)和ARMA(p,q) 的AIC值最小者可作為時間序列預測模型。
3.1 數據來源
數據源自京哈(G102線)公路長春至德惠路段的K1144+240斷面上的1個監測點A,觀測以15 d為1個周期,在A處共測12個周期,所得數據見表2[11]。在12個周期的累計沉降數據序列中取前9個數據(序號1-9)用于建模,后3個數據(序號10-12)用于檢驗預測值的準確性。
3.2 數據平穩性檢驗
利用EViews6.0軟件對表1中的建模數據列(序號1~9)進行單位根法平穩性檢驗,得到檢驗的P值為0.004 8,檢驗T統計量-5.527 624小于1%、5%及10%的顯著性水平下的臨界值,所以可認為建模數據列是平穩的。因此可采用時間序列自回歸 AR(p)模型 、平均移動MA(q)模型和自回歸平均移動ARMA(p,q)模型對沉降數據進行分析及預測。

表2 A點觀測數據
觀測建模數據列的自相關系數ACF和偏自相關系數PACF圖的特征(ACF和PACF圖由軟件EViews6.0獲得,在此略去),ACF具有一階拖尾性,PACF具有一階截尾性;另外采用AIC信息準則法求得模型AR(1)、MA(1)和ARMA(1,1) 的AIC值分別為4.628 535、8.178 238和4.854 747,按AIC值最小原則選取時間序列模型。 AR(1)模型滿足上述兩方面的特性和要求,所以選AR(1)模型作為本文路基沉降時間序列預測模型。
3.3 基于分位數自回歸模型參數估計
依據分位數回歸的思想,構造損失函數為:

式中,p=1,n=9為建模數據列長度。則AR(1)模型的參數估計值
3.4 分位數自回歸AR(1)模型預測分析

表3 不同分位點下AR(1)對應系數估計值
可以看出各個分位點對應著不同的系數,由此得到了時間序列分位數模型。接下來對模型的殘差進行檢驗,如果殘差是白噪聲序列,則表明模型是合適的。用 Ljung-Box 檢驗法檢驗殘差是否為白噪聲序列,結果如表4所示。

表4 Ljung-Box檢驗的p值
表中的p值均很大,不能拒絕原假設(原假設:殘差序列為白噪聲序列,即互不相關序列),說明這些殘差序列都是白噪聲,因此建立的模型是顯著有效的。用得到的模型對表1中序號10~12的測試數據進行預測和分析,結果見表5。

表5 不同分位點對應的路基沉降量預測值/mm
從表5可以看出,AR(1)在0.1、0.3、0.5、0.7、0.9 5個分位數下的預測結果,其精度均高于基于最小二乘的AR(1)模型yt=29.937 12+0.747 708yt-1(t=2,3,…),尤其以0.5分位下的預測精度最高,誤差絕對值之和的平均值為0.626 7,其精度遠高于基于最小二乘AR(1)模型的預測精度。所以本文取AR(1)模型在0.5分位時建立的分位數回歸模型作為最終的預測模型yt=2.924 393+0.928 138yt-1(t=2,3,…),該模型對建模數據列的擬合程度和殘差情況如圖1所示,除了有一個異常點外,其他擬合效果都很好(沒有受異常點的影響)。另外,文獻[11]采用多變量灰色模型MGM(1,3) 對表2中的測試數據的預測結果為(30.34,31.56,33.38),其誤差絕對值之和的平均值為1.046 7,顯然預測精度不如本文模型。由此表明,將分位數回歸用于路基沉降量預測分析完全可行,能夠滿足工程需要。這里需要指出的是如果采集到的沉降數據列非平穩時,可采用差分等方法將數據平穩化,再用本文方法建模。

圖1 分位點0.5的自回歸模型擬合效果圖
分位數回歸拓展了平穩時間序列模型(ARMA)參數估計方法,而且按不同分位點可得多組估計量,使得模型在沉降量預測時有更多選擇。由于分位數回歸時對模型的隨機誤差項不做任何假設,同時具有很強的數據適應能力,對數據的平穩性要求不高(近似平穩即可),使得模型的應用范圍更加廣泛。另外,可利用Eviews6.0軟件和MATLAB等軟件方便地完成模型的建立和最終模型的選取。工程實例表明,基于分位數回歸的AR模型預測結果優于基于最小二乘估計的AR模型,也優于多變量灰色時間序列預測模型MGM( ),為路基沉降數據分析研究提供了一種新思路、新方法。需要指出的是不同的分位點(可分為低分位和高分位)代表了不同的路基沉降發展水平,按施工期和工后期的不同狀態選擇不同分位數下的預測模型會更符合實際,效果會更佳,對此需要進一步研究。
[1] 鄭建國,王婷,張繼文.黃土路基沉降量預測方法的研究[J].巖土力學,2010,31(1):321-326
[2] 甄京山.曲線擬合法在軟土路基沉降預測中的應用[J].公路交通科技,2012(11):195-197
[3] 張濤,蔡國軍,劉松玉.基于Weibull模型的軟土路基沉降預測方法[J].巖土工程學報,2013,35(S1):212-216
[4] 崔曉如.高填方路基沉降變形分析與預測及其控制標準研究[D].長沙:長沙理工大學,2010
[5] 梅源.濕陷性黃土高填方地基處理技術及穩定性試驗研究[D].西安:西安建筑科技大學,2013
[6] 陳雪蓉.復雜數據下分位數回歸建模及其應用[D].昆明:云南大學,2012
[7] 姜成飛.分位數回歸方法綜述[J].科技信息,2013(25):185-240
[8] 彭良玉.分位數回歸在時間序列中的應用[D].天津:天津大學,2010
[9] PARZEN E.Quantile Probability and Statistical Data Modeling[J].Statistical Science,2004,19(4):625-662
[10] 盛選義,彭良玉.分位數回歸在時間序列中的應用[J].太原師范學院學報(自然科學版),2011,10(3):25-29
[11] 向一鳴,吳輝.基于多變量灰色模型的路基沉降預測[J].交通科技,2013(5):58-60
P258
B文章編號:1672-4623(2017)06-0081-03
10.3969/j.issn.1672-4623.2017.06.025
王江榮,教授,主要從事基路沉降、控制理論與應用方面的研究。
2016-02-02。
項目來源:蘭州市科學技術局計劃項目(蘭財建發[2015]85號);蘭州石化職業技術學院科技資助項目(院發〔2015〕69號);甘肅省科技廳項目 ( 1204GKCA004 );甘肅省財政廳專項資金立項資助項目(甘財教[2013]116號)。