孫尹碩 潘思敏 耿立艷 于建立



摘要:城際高鐵客流量序列呈現(xiàn)出不平穩(wěn)和波動(dòng)性特征,常規(guī)預(yù)測(cè)方法很難對(duì)其進(jìn)行精準(zhǔn)預(yù)測(cè)。為提高城際高鐵客流預(yù)測(cè)精度,先通過(guò)小波分析對(duì)高鐵客流量數(shù)據(jù)進(jìn)行平穩(wěn)化處理,再構(gòu)建自回歸差分移動(dòng)平均(ARIMA)模型進(jìn)行預(yù)測(cè)。應(yīng)用該方法預(yù)測(cè)某城際高鐵站日客流量,結(jié)果表明,本文提出的方法獲得了更高的高鐵客流量預(yù)測(cè)精度。
關(guān)鍵詞:高鐵客流量;小波分析;ARIMA模型;預(yù)測(cè)
由于城際高鐵客運(yùn)系統(tǒng)受到多種復(fù)雜因素的共同作用,其客流量數(shù)據(jù)序列呈現(xiàn)出不平穩(wěn)與波動(dòng)性特征。小波分析能夠?qū)⒕哂胁▌?dòng)性的城際高鐵客流量數(shù)據(jù)進(jìn)行分解重構(gòu)的處理,既能精準(zhǔn)的進(jìn)行時(shí)頻雙分析,又能使城際高鐵客流量序列變得平穩(wěn)。自回歸差分移動(dòng)平均(ARIMA)模型[2]是一類(lèi)用于分析時(shí)間序列數(shù)據(jù)隨機(jī)模型,簡(jiǎn)單易操作,但對(duì)于不平穩(wěn)波動(dòng)性數(shù)據(jù)的差分損失了大量信息,使得數(shù)據(jù)的預(yù)測(cè)與真實(shí)值有較大偏差。本文將小波變換與ARIMA模型相結(jié)合(文中以下簡(jiǎn)稱(chēng)W-ARIMA模型)預(yù)測(cè)高鐵客流量,充分發(fā)揮兩者的優(yōu)勢(shì),提升高鐵客流量預(yù)測(cè)精度。
1. W- ARIMA模型
1.1小波分析
基于正交多分辨分析的小波變換將信號(hào)通過(guò)共軛濾波器進(jìn)行分解和還原,通過(guò)Ingrid Daubechies正交小波構(gòu)造方法構(gòu)造具有緊支撐和較好正則性的Daubechies小波。在小波變換物理意義的分析中,小波變換將數(shù)據(jù)以圖形方式表達(dá),使信息更加緊湊。小波變換將原始像分解,得到“模糊像”和“細(xì)節(jié)像”。
1.2ARIMA模型
ARIMA模型是對(duì)數(shù)據(jù)進(jìn)行差分后建立ARMA模型。由于建立ARMA模型的前提條件是時(shí)間序列的均值和方差沒(méi)有發(fā)生系統(tǒng)變化,ARMA模型要求數(shù)據(jù)具有平穩(wěn)性的特性。差分是對(duì)求導(dǎo)的近似,數(shù)據(jù)在差分后具有很好的平穩(wěn)性。
ARIMA模型的差分能使數(shù)據(jù)更好地適用模型,但不能過(guò)多進(jìn)行差分, 因?yàn)橥ǔP畔⒌募庸?huì)造成信息的損失,差分掉的數(shù)據(jù)沒(méi)有參加模型擬合。
1.3W- ARIMA模型構(gòu)建
對(duì)于變化較平滑的數(shù)據(jù)而言,被差分掉的信息之間的差異較小,適于建立ARIMA模型。而城際高鐵客流量數(shù)據(jù)具有明顯的不平穩(wěn)性和波動(dòng)性特征,不適合用ARIMA模型直接預(yù)測(cè)。W-ARIMA模型首先通過(guò)小波分析中的Mallat算法進(jìn)行對(duì)城際高鐵客流量數(shù)據(jù)進(jìn)行分解處理,再對(duì)分解得到的小波系數(shù)建立ARIMA預(yù)測(cè)模型。
在mallat算法中,小波的低頻分量相當(dāng)于小波通過(guò)低通濾波器,是信號(hào)向低頻基的投影,即得到的部分是小波變化緩慢的部分——“模糊像”。如,在haar小波中“模糊像”是以相鄰兩點(diǎn)的平均值來(lái)代替原來(lái)的兩點(diǎn)的數(shù)值,由于“模糊像”留下的數(shù)據(jù)是相鄰兩點(diǎn)的平均值,所以它依然能近似地反映圖像的整體狀態(tài)[1]。“模糊像”降低數(shù)據(jù)的離散程度,“模糊像”的離散系數(shù)或在歸一化消除量綱后的方差值均小于原數(shù)據(jù)的離散系數(shù)或在歸一化消除量綱后的方差值。處理后得到的低頻時(shí)間序列數(shù)據(jù)會(huì)變得平緩,進(jìn)行差分時(shí)差分掉的數(shù)據(jù)所攜帶的信息減少,信號(hào)方差的系統(tǒng)變化減弱,此時(shí)則適合于應(yīng)用ARIMA模型進(jìn)行預(yù)測(cè)。
而高頻部分的系數(shù)可看作是小波窗范圍內(nèi)數(shù)據(jù)的加權(quán)求和(權(quán)重和為零),是數(shù)據(jù)的差異平均,小波的高頻分量相當(dāng)于小波通過(guò)高通濾波器,得到的部分是小波變化迅速的部分——“細(xì)節(jié)像”。此變換與數(shù)據(jù)的差分處理效果相同,可通過(guò)數(shù)據(jù)的平穩(wěn)性檢驗(yàn),同時(shí)由于正交小波變換的矩陣是酉矩陣,在進(jìn)行信號(hào)重構(gòu)時(shí)產(chǎn)生的誤差微乎其微。
若低頻“模糊”處理效果不明顯時(shí)可繼續(xù)進(jìn)行下一級(jí)小波分解,當(dāng)高頻系數(shù)的擬合不好時(shí),還可以對(duì)高頻系數(shù)進(jìn)行同樣的小波分解,循環(huán)使用小波數(shù)據(jù)平穩(wěn)化法。
2.實(shí)證研究
2.1數(shù)據(jù)描述
以某城際高鐵站日客流量數(shù)據(jù)為例進(jìn)行實(shí)證研究,時(shí)間區(qū)段為2017年2月27日至2017年12月30日,共306個(gè)樣本。圖1為高鐵站日客流量的自相關(guān)和偏自相關(guān)圖,從圖1可看出,自相關(guān)圖在約200階后出現(xiàn)拖尾現(xiàn)象,而偏自相關(guān)圖沒(méi)有任何拖尾或截尾現(xiàn)象,表明原城際高鐵站日客流量具有不平穩(wěn)性,不適合直接建立ARMA模型。
2.2小波分解
用小波濾波器系數(shù)構(gòu)造小波矩陣,時(shí)間序列向量與小波矩陣相乘得到時(shí)間序列數(shù)據(jù)的小波分解結(jié)果——低頻系數(shù)和高頻系數(shù)。圖2、圖3分別為高、低頻系數(shù)的自相關(guān)和偏自相關(guān)圖。從圖2和圖3可看出,自相關(guān)圖出現(xiàn)拖尾現(xiàn)象,而偏自相關(guān)圖出現(xiàn)截尾的現(xiàn)象,所以,高低頻系數(shù)差分后的數(shù)據(jù)適合建立ARMA模型。
2.3預(yù)測(cè)過(guò)程
在306個(gè)樣本中,從第1天至第50天,每次取當(dāng)日及以后的256個(gè)數(shù)據(jù),前256個(gè)樣本用于模型構(gòu)建和系數(shù)估計(jì),后1個(gè)樣本用于檢驗(yàn)?zāi)P偷念A(yù)測(cè)精度。利用小波濾波器系數(shù)構(gòu)造256階和258階方陣,對(duì)前256個(gè)樣本數(shù)據(jù)進(jìn)行一級(jí)小波分解和ARIMA模型預(yù)測(cè),將數(shù)據(jù)的分解值和預(yù)測(cè)值進(jìn)行小波重構(gòu)可得到的2個(gè)預(yù)測(cè)數(shù)據(jù),取第一個(gè)作預(yù)測(cè)結(jié)果。
2.4結(jié)果分析
同時(shí)利用ARIMA模型直接對(duì)城際高鐵客流量進(jìn)行預(yù)測(cè),比較W-ARIMA模型和ARIMA模型的預(yù)測(cè)結(jié)果。選用均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)、平均百分比誤差(MPE)、西爾統(tǒng)計(jì)量(Theil)四項(xiàng)評(píng)價(jià)指標(biāo)比較W-ARIMA模型和ARIMA模型的預(yù)測(cè)性能。
表1為W-ARIMA模型和ARIMA模型的預(yù)測(cè)結(jié)果,在所選取的樣本期內(nèi),W-ARIMA模型的預(yù)測(cè)性能明顯優(yōu)于ARIMA模型,主要體現(xiàn)W-ARIMA模型的RMSE、MAE、MPE和Theil值均小于ARIMA模型的對(duì)應(yīng)值。由此可見(jiàn),經(jīng)小波變換后,ARIMA模型能更有效利用數(shù)據(jù)信息,進(jìn)而提高高鐵客流量的預(yù)測(cè)精度。
圖4為W-ARIMA模型和ARIMA模型的預(yù)測(cè)值曲線圖。由圖6可看出,W-ARIMA模型較好地預(yù)測(cè)出城際高鐵客流量每日流量,客運(yùn)量預(yù)測(cè)值均比較接近于實(shí)際值,而ARIMA模型的客流量預(yù)測(cè)值與每日實(shí)際值偏差較大。
3.結(jié)論
本文提出一種結(jié)合小波分析與ARIMA模型的高鐵客流量預(yù)測(cè)模型。實(shí)證研究結(jié)果表明,該模型與ARIMA模型相比,能更好的利用非平穩(wěn)數(shù)據(jù)信息,預(yù)測(cè)能力較強(qiáng)。
參考文獻(xiàn)
[1]張旭俊.用小波矩陣分析Mallat算法的物理幾何含義[J],江西電力,2010 ,34(1):18-22.
[2] BOX G E P, JENKINS G M. Time series analysis: forecasting and control[M]. San Francisco:Holden Day, CA,1976.
[3]耿立艷.基于波動(dòng)聚集性的城際高鐵客流量預(yù)測(cè)[J].鐵道科學(xué)與工程學(xué)報(bào), 2019,16(8) :1891-1892.
[4]楊叔子.時(shí)間序列分析的工程應(yīng)用(上冊(cè))[M].2版.武漢:華中科技大學(xué)出版社,2007:236-237.
[5]珀西瓦爾.時(shí)間序列的小波方法[M].北京:機(jī)械工業(yè)出版社,2004.
基金項(xiàng)目:2019年度大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目“基于特性分析的城際高鐵客流智能預(yù)測(cè)方法研究”(項(xiàng)目編號(hào):201910107007);國(guó)家自然科學(xué)基金青年項(xiàng)目(項(xiàng)目編號(hào):61503261);2019年度河北省人才培養(yǎng)工程項(xiàng)目(項(xiàng)目編號(hào):A201901048);2019年中國(guó)物流學(xué)會(huì)、中國(guó)物流與采購(gòu)聯(lián)合會(huì)面上研究課題(項(xiàng)目編號(hào):2019CSLKT3-020)。
通訊作者:耿立艷(1979-),女,天津人,教授,博士。