王江榮,袁維紅,趙 睿,任泰明
(1.蘭州石化職業(yè)技術(shù)學(xué)院 信息處理與控制工程系,甘肅 蘭州 730060;2.蘭州石化職業(yè)技術(shù)學(xué)院 土木工程系,甘肅 蘭州 730060)
基于分位數(shù)回歸的冪多項(xiàng)式在數(shù)據(jù)分析中的應(yīng)用
王江榮1,袁維紅2,趙 睿1,任泰明1
(1.蘭州石化職業(yè)技術(shù)學(xué)院 信息處理與控制工程系,甘肅 蘭州 730060;2.蘭州石化職業(yè)技術(shù)學(xué)院 土木工程系,甘肅 蘭州 730060)
針對(duì)路基沉降與觀測(cè)時(shí)間存在非線性關(guān)系,且傳統(tǒng)最小二乘參數(shù)估計(jì)精度不高的問(wèn)題,建立具有較強(qiáng)逼近能力的冪多項(xiàng)式路基沉降預(yù)測(cè)模型,并用分位數(shù)回歸估算模型系數(shù)。工程實(shí)例表明,基于分位數(shù)回歸估計(jì)的冪多項(xiàng)式預(yù)測(cè)模型具有較高的精確度,優(yōu)于最小二乘估計(jì)的冪多項(xiàng)式預(yù)測(cè)模型和多變量灰色預(yù)測(cè)模型,為沉降預(yù)測(cè)提供一種新方法。
高速公路;路基沉降;冪多項(xiàng)式函數(shù);分位數(shù)回歸;沉降量預(yù)測(cè)
高速公路在施工期和工后運(yùn)營(yíng)期均存在著路基沉降問(wèn)題,利用現(xiàn)場(chǎng)沉降觀測(cè)量準(zhǔn)確預(yù)測(cè)后期沉降量,對(duì)于公路施工質(zhì)量監(jiān)管、道路安全、公路維護(hù)等具有重要的實(shí)現(xiàn)意義,同時(shí)為公路管理等部門(mén)提供科學(xué)的決策依據(jù)。現(xiàn)有的沉降預(yù)測(cè)方法主要采用回歸分析模型、統(tǒng)計(jì)模型、組合模型[1-5]、神經(jīng)網(wǎng)絡(luò)[6]和灰色理論[7]等,這些模型的參數(shù)估計(jì)大多采用了最小二乘估計(jì)法,該估計(jì)法要求模型的隨機(jī)誤差服從獨(dú)立同分布且呈正態(tài)分布,但在實(shí)際沉降問(wèn)題中,受多因素影響[8-9],估算出的參數(shù)并非最優(yōu),得到的模型穩(wěn)健性較差,預(yù)測(cè)精度不高。與傳統(tǒng)最小二乘回歸相比,分位數(shù)回歸是一種非常穩(wěn)健的參數(shù)估計(jì)方法[10-12],模型參數(shù)的估計(jì)結(jié)果不會(huì)受異常觀測(cè)數(shù)據(jù)的影響,且對(duì)模型的隨機(jī)誤差項(xiàng)無(wú)任何要求,克服了最小二乘估計(jì)法的不足。另外,用最小二乘法建模時(shí)只能得到一個(gè)回歸方程,容易丟失數(shù)據(jù)信息,致使所建模型難以對(duì)預(yù)測(cè)量進(jìn)行準(zhǔn)確預(yù)測(cè);用分位數(shù)回歸估算模型參數(shù)時(shí)在不同分位點(diǎn)上估算出的模型參數(shù)往往不同,因而可以得到多個(gè)不同的回歸方程,從而在不同的分位點(diǎn)上預(yù)測(cè)結(jié)果不同,為決策者提供了多種選擇,以便選出符合實(shí)際的回歸方程。由于沉降觀測(cè)數(shù)據(jù)列具有非線性特征,而冪多項(xiàng)式函數(shù)具有良好的數(shù)據(jù)適應(yīng)能力和實(shí)際曲線逼近能力。基于此,本文建立基于分位回歸估計(jì)的冪多項(xiàng)式模型,并對(duì)建模以外的路基沉降觀測(cè)量進(jìn)行預(yù)測(cè)分析,結(jié)果表明該模型具有較強(qiáng)的預(yù)測(cè)能力和更高預(yù)測(cè)精確度。
分位數(shù)回歸方法最早由Koenker和Bassett提出[13],該方法是一種全面數(shù)據(jù)分析方法,具有很強(qiáng)的抗干擾能力和穩(wěn)健性。
設(shè)FY|X(y)為在隨機(jī)變量X下Y的條件分布函數(shù),則Y的第τ∈(0,1)個(gè)條件分位數(shù)為
(1)
其中,inf(?)表示下確界函數(shù)。

(2)

式(2)的估計(jì)式等價(jià)式(3):
(3)
可見(jiàn),分位數(shù)回歸是通過(guò)最小化樣本觀測(cè)值與樣本擬合值的加權(quán)誤差絕對(duì)值之和來(lái)估算模型參數(shù)的;而傳統(tǒng)最小二乘回歸則是通過(guò)最小化誤差平方和來(lái)估算模型參數(shù)值。
用分位數(shù)回歸建模時(shí)得到不同分位點(diǎn)的回歸
方程,決策者從中選擇最能反映實(shí)際問(wèn)題的回歸方程,解決問(wèn)題更具靈活性。
2.1 冪多項(xiàng)式模型及線性化
軟基路基沉降的基本特征:初期階段沉降逐漸增加,中期階段沉降加速發(fā)展,后期階段沉降變緩并趨近于一個(gè)定值(進(jìn)入穩(wěn)定狀態(tài))。因此,沉降量S與時(shí)間t呈非線性關(guān)系,進(jìn)而知S-1與t-1也呈非線性關(guān)系。因多項(xiàng)式函數(shù)具有較強(qiáng)的數(shù)據(jù)適應(yīng)能力和實(shí)際曲線逼近能力,所以可選用多項(xiàng)式函數(shù)對(duì)路基沉降量進(jìn)行擬合預(yù)測(cè)。由于冪多項(xiàng)式對(duì)觀測(cè)數(shù)據(jù)無(wú)過(guò)多要求,因此本文采用冪多項(xiàng)式來(lái)逼近S-1,即建立模型:
(4)

(5)
線性化后的模型(5)可方便地利用分位數(shù)回歸估計(jì)其參數(shù)β0,β1,…,βn。
2.2 模型參數(shù)的分位數(shù)回歸估計(jì)
依據(jù)分位數(shù)回歸的基本原理,構(gòu)造模型損失函數(shù):
(6)
式中:m為建模數(shù)據(jù)列長(zhǎng)度,
Si為第i個(gè)觀測(cè)沉降量,則模型的參數(shù)估計(jì)值
3.1 數(shù)據(jù)來(lái)源
數(shù)據(jù)源自京哈(G102線)軟基公路長(zhǎng)春至德惠路段的K1144+240斷面上的某監(jiān)測(cè)點(diǎn),觀測(cè)以15天為1個(gè)周期,所得觀測(cè)數(shù)據(jù)見(jiàn)表1[15]。

表1 數(shù)據(jù)資料[15]
表1給出的數(shù)據(jù)資料中,等間隔(對(duì)非等間隔本文模型依然適用)的實(shí)際觀測(cè)次數(shù)共12 次,在12個(gè)周期的累積沉降數(shù)據(jù)序列中取1~9次的沉降S-時(shí)間t數(shù)據(jù)估算模型的參數(shù)β0,β1,…,βn;取10~12次的沉降S-時(shí)間t數(shù)據(jù)來(lái)檢驗(yàn)?zāi)P皖A(yù)測(cè)值的準(zhǔn)確性。作出1~9次的S-1-t-1的散點(diǎn)圖,如圖1所示。

圖1 S-1-t-1關(guān)系圖
圖1表明S-1與t-1為非線性關(guān)系,可用以t-1為自變量的多項(xiàng)式逼近S-1,經(jīng)線性化后用條件分位數(shù)估算模型參數(shù)。經(jīng)分析比較選用4次冪多項(xiàng)式為擬合預(yù)測(cè)模型,即
(7)
從而
(8)
3.2 模型參數(shù)估計(jì)
利用Matlab2014a軟件編寫(xiě)分位數(shù)回歸法程序并結(jié)合表1中1~9次的沉降S-時(shí)間t數(shù)據(jù)來(lái)估算模型參數(shù)β0,β1,…,β4。這里選用5個(gè)不同分位點(diǎn)τ=0.1,0.3,0.5.0.7,0.9估計(jì)模型系數(shù)。由于數(shù)據(jù)量較少,計(jì)算時(shí)選擇單純性算法。通過(guò)計(jì)算,得到的估計(jì)結(jié)果見(jiàn)表2。

表2 不同分位點(diǎn)下模型系數(shù)的估計(jì)值


表3 不同分位點(diǎn)下模型的擬合優(yōu)度值
表3中數(shù)據(jù)表明5個(gè)模型的擬合優(yōu)度都比較高,說(shuō)明回歸的效果是顯著的,可以用所建模型對(duì)后續(xù)沉降進(jìn)行預(yù)測(cè)分析。τ=0.7時(shí)回歸方程的擬合效果圖如圖2所示。
圖2表明τ=0.7對(duì)應(yīng)的回歸方程擬合效果很好,其他分位點(diǎn)對(duì)應(yīng)的回歸方程擬合圖略去。
3.3 預(yù)測(cè)分析
根據(jù)表2中的模型參數(shù)及式(8)得到τ=0.3,0.5,0.7時(shí)預(yù)測(cè)模型如下:

圖2 分位點(diǎn)為0.7的回歸方程擬合效果圖
1)τ=0.3,
2)τ=0.5,
3)τ=0.7,
利用τ=0.1,0.3,0.5,0.7,0.9的模型對(duì)表1中序號(hào)10~12的測(cè)試數(shù)據(jù)進(jìn)行預(yù)測(cè)分析,結(jié)果見(jiàn)表4。采用最小二乘回歸法估算出的模型系數(shù)為(-0.034 612,22.788 91,-2 585.586,125 419.8,-203 562 7),對(duì)測(cè)試數(shù)據(jù)的預(yù)測(cè)值及誤差見(jiàn)表4第3列。文獻(xiàn)[15]的預(yù)測(cè)結(jié)果見(jiàn)表4最后一列。

表4 不同分位點(diǎn)對(duì)應(yīng)的路基沉降量預(yù)測(cè)值 mm
從表4可以看出,基于分位數(shù)冪多項(xiàng)式模型對(duì)軟基高速公路沉降量的預(yù)測(cè)精度高于基于最小二乘參數(shù)估計(jì)的冪多項(xiàng)式預(yù)測(cè)模型(誤差絕對(duì)值之和的平均值為1.543 2),也高于文獻(xiàn)[15]多變量灰色預(yù)測(cè)模型MGM(1,3)(誤差絕對(duì)值之和的平均值為1.046 7),尤其以0.7分位數(shù)冪多項(xiàng)式模型的預(yù)測(cè)精度最高(誤差絕對(duì)值之和的平均值為0.366 3)。因此,選取0.7分位數(shù)回歸的冪多項(xiàng)式模型作為最終的預(yù)測(cè)模型。
文獻(xiàn)[15]還提供了另外兩個(gè)觀測(cè)點(diǎn)上的12個(gè)數(shù)據(jù),采用本文建模方法均取得理想效果,綜合分析表明,將分位數(shù)回歸用于路基沉降量預(yù)測(cè)分析完全可行,能夠滿(mǎn)足工程需要。
1)最小二乘估計(jì)只有在模型的隨機(jī)誤差項(xiàng)服從正態(tài)獨(dú)立同分布時(shí)才能得出參數(shù)的無(wú)偏差估計(jì),但在實(shí)際問(wèn)題中這些條件往往難以滿(mǎn)足,因而使參數(shù)估計(jì)值偏離理想值,導(dǎo)致模型精度下降。分位數(shù)回歸估計(jì)拓展了最小二乘估計(jì)方法,按不同分位點(diǎn)可得多組估計(jì)量,從而得到多個(gè)回歸方程,使得在進(jìn)行沉降量預(yù)測(cè)時(shí)對(duì)預(yù)測(cè)模型有更多選擇。由于分位數(shù)回歸時(shí)對(duì)模型的隨機(jī)誤差項(xiàng)不做任何假設(shè),同時(shí)具有很強(qiáng)的數(shù)據(jù)適應(yīng)能力,對(duì)少量樣本也能取得理想效果。
2)冪多項(xiàng)式模型結(jié)構(gòu)簡(jiǎn)單,對(duì)數(shù)據(jù)質(zhì)量要求不高,具有很好的數(shù)據(jù)逼近和擬合能力,且容易線性化,非常適合用分位數(shù)回歸估算其參數(shù)。另外,利用Eviews軟件和MATLAB軟件可方便地完成冪多項(xiàng)式模型的建立和最終模型的選取。工程實(shí)例表明,基于分位數(shù)回歸的冪多項(xiàng)式模型預(yù)測(cè)精度優(yōu)于基于最小二乘估計(jì)的冪多項(xiàng)式模型,也優(yōu)于多變量灰色時(shí)間序列模型MGM(1,3)的預(yù)測(cè)結(jié)果,為路基沉降數(shù)據(jù)分析研究提供一種新思路、新方法。
3)不同的分位點(diǎn)(可分為低分位和高分位)代表不同的路基沉降發(fā)展水平,按施工期和工后期的不同狀態(tài)選擇不同分位數(shù)下的預(yù)測(cè)模型,會(huì)更符合實(shí)際,效果會(huì)更佳,對(duì)此需要進(jìn)一步研究。另外,冪多項(xiàng)式建模的通用性有待論證。
[1] 鄭建國(guó),王婷,張繼文.黃土路基沉降量預(yù)測(cè)方法的研究[J].巖土力學(xué),2010,31(1):321-326.
[2] 甄京山.曲線擬合法在軟土路基沉降預(yù)測(cè)中的應(yīng)用[J].公路交通科技,2012(11):195-197.
[3] 張濤,蔡國(guó)軍,劉松玉.基于Weibull模型的軟土路基沉降預(yù)測(cè)方法[J].巖土工程學(xué)報(bào),2013,35(增2):212-216.
[4] 陳善雄,王星運(yùn),許錫昌,等.路基沉降預(yù)測(cè)的三點(diǎn)修正指數(shù)曲線法[J].巖土力學(xué),2011(11):3355-3360.
[5] 陳威,唐德燕,張屆.三點(diǎn)法-灰色GM(1,1)組合模型在鐵路路基沉降預(yù)測(cè)中的應(yīng)用[J].測(cè)繪科學(xué),2015,40(7):37-40.
[6] 辛大鵬,田林亞,沈哲輝.小波分解AR-BP網(wǎng)絡(luò)模型在大壩垂直位移預(yù)測(cè)中的應(yīng)用 [J].測(cè)繪工程,2015,24(12):53-54.
[7] 盧辰龍,匡翠林,陳曉林,等.基于TLS的多變量灰色模型在大壩變形預(yù)報(bào)中的應(yīng)用[J].測(cè)繪工程,2015,24(12):53-54,48-52.
[8] 崔曉如.高填方路基沉降變形分析與預(yù)測(cè)及其控制標(biāo)準(zhǔn)研究[D].長(zhǎng)沙:長(zhǎng)沙理工大學(xué),2010.
[9] 梅源.濕陷性黃土高填方地基處理技術(shù)及穩(wěn)定性試驗(yàn)研究[D].西安:西安建筑科技大學(xué),2013.
[10] 陳雪蓉.復(fù)雜數(shù)據(jù)下分位數(shù)回歸建模及其應(yīng)用[D].昆明:云南大學(xué),2012.
[11] 姜成飛.分位數(shù)回歸方法綜述[J].科技信息,2013(25):185,240.
[12] 彭良玉.分位數(shù)回歸在時(shí)間序列中的應(yīng)用[D].天津:天津大學(xué),2010.
[13] PAREN E. Quantile Probability and Statistical Data Modeling[J].Statistical Science,2004,19(4):625-662.
[14] 朱志鐸,周禮紅.軟土路基全過(guò)程沉降預(yù)測(cè)的Logistic 模型應(yīng)用研究[J].巖土工程學(xué)報(bào),2009,31(6):969-969.
[15] 向一鳴,吳輝.基于多變量灰色模型的路基沉降預(yù)測(cè)[J].交通科技,2013(5):58-60.
[16] 楊曉松,張雙成.基于灰色二階模型的深基坑變形監(jiān)測(cè)分析[J].交通科技與經(jīng)濟(jì),2015,17(6):122-124.
[17] 謝文國(guó),高俊強(qiáng),徐東風(fēng).時(shí)間序列在地鐵隧道變形監(jiān)測(cè)數(shù)據(jù)處理中的應(yīng)用[J].交通科技與經(jīng)濟(jì),2015,17(4):114-116.
[責(zé)任編輯:李銘娜]
本刊鄭重聲明
近來(lái),在一些搜索引擎上,經(jīng)常充斥一些假冒網(wǎng)站、機(jī)構(gòu)及個(gè)人以《測(cè)繪工程》雜志社名義征稿、組稿、代發(fā)論文,收取審稿費(fèi)、代寫(xiě)費(fèi)、版面費(fèi),欺詐投稿人,嚴(yán)重?fù)p害了我刊名譽(yù)。據(jù)查其刊名及國(guó)內(nèi)統(tǒng)一刊號(hào)、國(guó)際標(biāo)準(zhǔn)刊號(hào)純屬盜用;發(fā)給作者的用稿通知上所蓋公章純屬偽造。
所謂的征稿行為已涉嫌侵權(quán)、詐騙、偽造企事業(yè)單位公章等多項(xiàng)犯罪,本刊已向公安機(jī)關(guān)報(bào)案。
本刊敦促相關(guān)網(wǎng)站及個(gè)人立即停止這一嚴(yán)重?fù)p害我刊名譽(yù)的侵權(quán)行為,本刊將依法保留追究有關(guān)人員法律責(zé)任的權(quán)利。特此聲明!
獲取在線投稿平臺(tái)地址郵箱:chgc2008@vip.com,咨詢(xún)電話(huà):0451-88028906
(本刊編輯部)
Application of power polynomial based on Quantile Regression to data analysis
WANG Jiangrong1,YUAN Weihong2,ZHAO Rui1,REN Taiming1
(1. Dept. of Information Processing and Control Engineering,Lanzhou Petrochemical College of Vocational Technology, Lanzhou 730060, China;2.Department of Civil Engineering, Lanzhou Petrochemical College of Vocational Technology, Lanzhou 730060, China)
According to the nonlinear relationship between subgrade settlement and observation time, the accuracy of the traditional least squares parameter estimation is not high, so a power polynomial subgrade settlement prediction model with strong approximation ability is established, of which the model coefficients are estimated by quantile regression. Engineering example shows that the prediction based on the quantile regression estimates of power polynomial model has high accuracy, which is better than the least squares estimation of power polynomial prediction model and multi variable grey forecast model. This model can provide a new method for settlement prediction.
highway; subgrade settlement; power polynomial function; quantile regression; prediction of settlement
引用著錄:王江榮,袁維紅,趙睿,等.基于分位數(shù)回歸的冪多項(xiàng)式在數(shù)據(jù)分析中的應(yīng)用[J].測(cè)繪工程,2017,26(4):43-46,52.
10.19349/j.cnki.issn1006-7949.2017.04.008
2016-01-22
蘭州市科學(xué)技術(shù)局計(jì)劃項(xiàng)目(蘭財(cái)建發(fā)[2015]85號(hào));蘭州石化職業(yè)技術(shù)學(xué)院科技資助項(xiàng)目(院發(fā)〔2015〕69號(hào))
王江榮(1966-),男,教授,碩士.
TV196;U416
A
1006-7949(2017)04-0043-04