魯文博 馬超群 李國(guó)棟 曹 蕊 徐金華
(長(zhǎng)安大學(xué)交通運(yùn)輸工程學(xué)院,710064,西安∥第一作者,碩士研究生)
城市軌道交通客流兼具長(zhǎng)期的線性增長(zhǎng)趨勢(shì)、周期性季節(jié)變化及隨機(jī)波動(dòng),呈現(xiàn)復(fù)雜的非線性特點(diǎn)。傳統(tǒng)的預(yù)測(cè)方法,如線性回歸模型、ARIMA模型等,通過調(diào)整預(yù)測(cè)數(shù)據(jù)以達(dá)到對(duì)非線性客流量的預(yù)測(cè)[1-2]。在季節(jié)指數(shù)應(yīng)用方面,目前主要是對(duì)其值的估計(jì)[3-5]和預(yù)測(cè)模型的改進(jìn)[6-8],缺少對(duì)月份分組和季度分組的比較以及更準(zhǔn)確的季節(jié)分組的研究。
本文基于月客流殘差,以弗雷歇距離作為曲線相似性度量,達(dá)到對(duì)季節(jié)分組的精確性把握。該季節(jié)分組即體現(xiàn)了同一分組內(nèi)月份的相同特征,又突出了不同分組之間的特殊區(qū)別,為確定最優(yōu)的季節(jié)分組提供了新的思路??紤]到季節(jié)指數(shù)法能夠有效地消除季節(jié)性因素影響,而人工神經(jīng)網(wǎng)絡(luò)對(duì)非線性時(shí)間序列具有良好的適應(yīng)性,結(jié)合兩種模型的優(yōu)勢(shì),對(duì)地鐵月客流量進(jìn)行預(yù)測(cè),以驗(yàn)證分類結(jié)果的準(zhǔn)確性。
基于月客流殘差的季節(jié)分組流程如圖1所示。

圖1 季節(jié)分組流程
假設(shè)歷史數(shù)據(jù)的時(shí)間序列為{Yt},t=1,2,3,…,n。
步驟1:建立時(shí)間序列線性回歸趨勢(shì)方程:
Yt′=α1-α2t
(1)
式中:
Yt′——因變量;
a1,a2——回歸系數(shù);
t——時(shí)間。
步驟2:根據(jù)趨勢(shì)方程計(jì)算每月客流量的趨勢(shì)值,從而計(jì)算客流量殘差δt,計(jì)算公式為:
δt=Yt-Yt′
(2)
式中:
Yt——實(shí)際客流量,萬(wàn)人次。
步驟3:基于弗雷歇距離算法計(jì)算任意兩個(gè)月客流殘差曲線的弗雷歇距離及曲線相似度。
步驟4:根據(jù)相似度對(duì)月份進(jìn)行區(qū)間分類。
距離空間的概念是法國(guó)數(shù)學(xué)家弗雷歇于1906年提出的,又稱為弗雷歇距離。它將現(xiàn)實(shí)空間的距離概念推廣到一般的集合上,為抽象空間之間的距離度量提供了理論基礎(chǔ)。其著重將路徑空間距離考慮進(jìn)去,相比之下,其對(duì)有一定空間時(shí)序的曲線相似度評(píng)價(jià)效率更高。
設(shè)A和B是空間S上的兩條連續(xù)曲線,即A:[0,1]→S,B:[0,1]→S;又設(shè)α和β是單位區(qū)間的兩個(gè)重新參數(shù)化函數(shù),即α:[0,1]→[0,1],β:[0,1]→[0,1];則曲線A與B的弗雷歇距離F(A,B)定義為:

式中:
d——S上的度量函數(shù)。
弗雷歇距離越小,說明兩條曲線之間的相似程度越高;弗雷歇距離越大,說明兩條曲線之間的相似程度越低。因此對(duì)曲線A和B來說,相似度IA,B的定義如下:
(3)
季節(jié)指數(shù)是基于統(tǒng)計(jì)學(xué)的一種簡(jiǎn)化時(shí)間序列數(shù)據(jù)的方法,該方法對(duì)季節(jié)時(shí)間序列的季節(jié)性進(jìn)行處理,同時(shí)使原始數(shù)據(jù)中的一些重要信息不會(huì)被丟失,一般采用直接平均季節(jié)指數(shù)法對(duì)原始客流數(shù)據(jù)進(jìn)行預(yù)測(cè)前的調(diào)整。直接平均季節(jié)指數(shù)法用算數(shù)平均值直接計(jì)算各月或各季度的季節(jié)指數(shù),將其擴(kuò)展到季節(jié)區(qū)間的季節(jié)指數(shù),其計(jì)算公式為:
(4)
式中:
Sj——第j分組的季節(jié)指數(shù);
xijp——第i年第j分組中第p月的全線客流量,萬(wàn)人次。
利用季節(jié)指數(shù)對(duì)客流原始數(shù)據(jù)進(jìn)行修正,修正值為x′ijp,以降低季節(jié)對(duì)預(yù)測(cè)客流的影響,即:
x′ijp=xijp/Sj
(5)
對(duì)原始客流數(shù)據(jù)處理之后,通過預(yù)測(cè)得到未來時(shí)期某月份的客流量y′ijp,經(jīng)逆向調(diào)整后的該月預(yù)測(cè)客流為:
yijp=y′ijpSj
(6)
式中:
yijp——第i年第j分組中第p月的客流量,萬(wàn)人次。
BP(誤差反向傳播)算法的多層感知器是至今為止應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)。在多層感知器的應(yīng)用中,以單隱層網(wǎng)絡(luò)的應(yīng)用最為普遍。一般習(xí)慣將單隱層感知器稱為三層感知器,所謂三層包括了輸入層、隱含層和輸出層。
訓(xùn)練的過程就是不斷調(diào)整權(quán)值的過程,當(dāng)誤差小于設(shè)置值時(shí)停止訓(xùn)練。整個(gè)網(wǎng)絡(luò)的信息都儲(chǔ)存在權(quán)值矩陣中。當(dāng)輸入一個(gè)預(yù)測(cè)值時(shí),網(wǎng)絡(luò)根據(jù)權(quán)值矩陣進(jìn)行計(jì)算,以達(dá)到記憶的目的。
Elman神經(jīng)網(wǎng)絡(luò)是在BP神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)的基礎(chǔ)上,在隱含層增加一個(gè)承接層,作為一步延時(shí)算子,達(dá)到記憶的目的,從而使系統(tǒng)具有適應(yīng)時(shí)變特性的能力,增強(qiáng)了網(wǎng)絡(luò)的全局穩(wěn)定性。
根據(jù)季節(jié)指數(shù)對(duì)原始客流數(shù)據(jù)進(jìn)行調(diào)整,分別應(yīng)用三種不同的季節(jié)指數(shù)調(diào)整后的數(shù)據(jù)進(jìn)行預(yù)測(cè),最后分別對(duì)預(yù)測(cè)后的數(shù)據(jù)進(jìn)行逆向調(diào)整,以得到更精確的結(jié)果。
主要分為以下步驟:①對(duì)異常值進(jìn)行修正;②根據(jù)時(shí)間序列數(shù)據(jù)建立趨勢(shì)方程,并計(jì)算月客流趨勢(shì)值、殘差;③計(jì)算任意兩月客流殘差曲線的弗雷歇距離和相似度;④根據(jù)月客流殘差曲線間的相似度進(jìn)行季節(jié)區(qū)間分類;⑤根據(jù)式(4)計(jì)算不同分類方法中每個(gè)季節(jié)區(qū)間的季節(jié)指數(shù),并對(duì)原始客流數(shù)據(jù)按式(5)進(jìn)行調(diào)整,獲得調(diào)整后的客流量;⑥由于Elman神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的特殊性,需要以原始客流數(shù)據(jù)對(duì)隱含層神經(jīng)元數(shù)目進(jìn)行尋優(yōu),采用優(yōu)化后的網(wǎng)絡(luò)預(yù)測(cè)得到的客流量按式(6)進(jìn)行逆向調(diào)整,從而獲得最終的預(yù)測(cè)客流量。
選取西安地鐵2號(hào)線全線2014年1月—2018年8月共56個(gè)月的客流量為基礎(chǔ)數(shù)據(jù),以此數(shù)據(jù)為原始客流數(shù)據(jù),預(yù)測(cè)2018年9月—2019年2月的客流量。
由于西安地鐵3號(hào)線在選取時(shí)間區(qū)間中開通,因此直接對(duì)2016年11月的客流造成影響。采用平均值法計(jì)算修正值,并在后續(xù)過程中采用修正值進(jìn)行計(jì)算。
應(yīng)用2014年1月—2017年12月共48個(gè)月的全線客流量建立趨勢(shì)方程并計(jì)算月客流殘差,結(jié)果如表1所示。

表1 不同年份的月客流殘差計(jì)算結(jié)果
根據(jù)表1中的數(shù)據(jù)繪制的不同年份的月客流殘差曲線如圖2所示。利用弗雷歇距離算法計(jì)算任意兩條月客流殘差曲線之間的相似度,結(jié)果如表2所示。

圖2 西安地鐵2號(hào)線2014年1月—2017年12月的月客流殘差曲線
對(duì)圖2的月客流殘差曲線進(jìn)行定性分析,大致可以看到3~5月的客流殘差曲線比較相似,6~11月的客流殘差曲線比較相似,12月、1月、2月的客流殘差曲線各不相同。根據(jù)表2結(jié)果,繪制3~5月和6~11月的客流殘差相似度曲線,分別如圖3和圖4所示。

表2 利用弗雷歇距離算法計(jì)算的任意兩個(gè)月客流殘差曲線之間的相似度
由圖3可見,3~5月的月客流殘差曲線相似度比較高,故認(rèn)為3~5月為同一季節(jié)區(qū)間。

圖3 西安地鐵2號(hào)線2014年1月—2017年12月中3~5月的客流殘差曲線相似度
由圖4中可見,6~11月客流殘差相似度曲線的特征比較相似,故認(rèn)為6~11月為同一季節(jié)區(qū)間。

圖4 西安地鐵2號(hào)線2014年1月—2017年12月中6~11月的客流殘差曲線相似度
圖5為12月、1月和2月的客流殘差相似度曲線。由圖5可見,12月、1月和2月的客流殘差曲線相似度較小,且與其它月份的并不相同,因此認(rèn)為12月、1月和2月各為一個(gè)季節(jié)區(qū)間。根據(jù)上述分析,將地鐵客流季節(jié)分為5個(gè)區(qū)間,即:3~5月為第一季度,6~11月為第二季度,12月、1月和2月各自為一個(gè)季度。

圖5 西安地鐵2號(hào)線2014年1月—2017年12月中12月、1月和2月的客流殘差曲線相似度
以2014年3月—2018年2月的客流量為基礎(chǔ)數(shù)據(jù),分別采用SIR(季節(jié)分組區(qū)間)分類方法、TMC(傳統(tǒng)月份分組區(qū)間)分類方法、TQC(傳統(tǒng)季度分組區(qū)間)分類方法,按照直接平均法(式(4))進(jìn)行計(jì)算,結(jié)果如表3~5所示。

表3 基于SIR分類法計(jì)算的季節(jié)指數(shù)
1) 以原始客流數(shù)據(jù)為基礎(chǔ),優(yōu)化Elman神經(jīng)網(wǎng)絡(luò)的隱含層節(jié)點(diǎn)數(shù)。
(1) 選取2014年3月—2018年2月基于SIR、TQC、TMC分類方法并計(jì)算調(diào)整后的數(shù)據(jù)作為訓(xùn)練集。
(2) 選取2018年3月—8月基于SIR、TQC、TMC分類方法調(diào)整后的調(diào)整數(shù)據(jù)作為測(cè)試集。

表4 基于TMC分類法計(jì)算的季節(jié)指數(shù)

表5 基于TQC分類法計(jì)算的季節(jié)指數(shù)
(3) 先設(shè)置較少的隱含節(jié)點(diǎn)訓(xùn)練網(wǎng)絡(luò),然后逐漸增加隱含節(jié)點(diǎn)數(shù),用同一樣本集進(jìn)行訓(xùn)練,從中確定網(wǎng)絡(luò)誤差最小時(shí)對(duì)應(yīng)的隱含層節(jié)點(diǎn)數(shù)。
經(jīng)過檢驗(yàn),最佳隱含層節(jié)點(diǎn)數(shù)取值公式為:
(7)
式中:
n——輸入層節(jié)點(diǎn)數(shù)(本文為6);
l——輸出層節(jié)點(diǎn)數(shù)(本文為1);
ω——1~10之間的常數(shù);
m——隱含層節(jié)點(diǎn)數(shù),取尋優(yōu)范圍為[1,16]。
(4) 確定適應(yīng)度函數(shù),以2018年3月—8月預(yù)測(cè)客流量絕對(duì)誤差作為適應(yīng)度函數(shù),即:
(8)
式中:
xj,yj′,yj″,yj?——為2018年第j月的實(shí)際客流量應(yīng)用SIR、TQC、TMC分類法預(yù)測(cè)后的調(diào)整客流量。
由于尋優(yōu)范圍較小,采用遍歷法對(duì)節(jié)點(diǎn)數(shù)進(jìn)行尋優(yōu),尋優(yōu)結(jié)果如圖6所示。由圖6可見,最優(yōu)隱含層節(jié)點(diǎn)數(shù)為3,即建立6-3-1的三層神經(jīng)網(wǎng)絡(luò)。

圖6 適應(yīng)度函數(shù)曲線
2) 以2014年3月—2018年8月客流量為訓(xùn)練集,應(yīng)用優(yōu)化后的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)2018年9月—2019年2月的客流量,經(jīng)過逆向調(diào)整(式(6)),最終得到預(yù)測(cè)值,如表6所示。

表6 西安地鐵2號(hào)線2018年9月—2019年2月的客流量預(yù)測(cè)結(jié)果 單位:萬(wàn)人次
為了消除隨機(jī)性,分別訓(xùn)練100次并對(duì)預(yù)測(cè)客流取平均值,預(yù)測(cè)結(jié)果如表6所示。根據(jù)實(shí)際值計(jì)算相對(duì)誤差(RE)、平均絕對(duì)百分比誤差(MAPE)、和均方根誤差(RMSE)來對(duì)預(yù)測(cè)結(jié)果進(jìn)行分析,結(jié)果如表7所示。

表7 西安地鐵2號(hào)線2018年9月—2019年2月的客流量預(yù)測(cè)誤差對(duì)比分析
進(jìn)一步地,可由表7得到如圖7所示的各分類方法預(yù)測(cè)誤差對(duì)比圖。

圖7 西安地鐵2號(hào)線2018年9月—2019年2月不同分類方法的客流量預(yù)測(cè)誤差對(duì)比圖
通過比較各分類方法的預(yù)測(cè)指標(biāo),SIR分類預(yù)測(cè)所得到的相對(duì)誤差、平均絕對(duì)百分比誤差、均方根誤差小于傳統(tǒng)的季節(jié)分類方法的,相對(duì)誤差控制在10%以內(nèi)(由于對(duì)2016年11月客流量的修正誤差,其對(duì)應(yīng)月份預(yù)測(cè)誤差較大),個(gè)別月份達(dá)到1%以內(nèi),預(yù)測(cè)精度相對(duì)較高。
自然季節(jié)性和制度節(jié)性是影響季節(jié)性波動(dòng)最主要的因素。TMC和TQC分類方法的季節(jié)分組只體現(xiàn)了自然季節(jié)性,而本文所采用的方法根據(jù)兩者疊加的結(jié)果進(jìn)行分組,更為準(zhǔn)確。
綜上所述,基于月客流殘差的季節(jié)指數(shù)預(yù)測(cè)方法具有較高的預(yù)測(cè)精度和較好的穩(wěn)定性。
本文通過對(duì)月客流殘差分析,提出了基于月客流殘差的季節(jié)分類方法,以季節(jié)指數(shù)調(diào)整客流達(dá)到提高預(yù)測(cè)精度的目的。通過對(duì)三種分類方法進(jìn)行對(duì)比分析,本文提出的分類方法在月度客流預(yù)測(cè)中精度較高,基本滿足對(duì)客流量的預(yù)測(cè)需求。
通過該分類方法計(jì)算出的季節(jié)指數(shù)用于預(yù)測(cè)時(shí),能更好地適應(yīng)城市軌道交通客流的季節(jié)性變化趨勢(shì),從而使運(yùn)營(yíng)公司及時(shí)調(diào)整相關(guān)運(yùn)能運(yùn)力,制定更加經(jīng)濟(jì)合理的月度或年度運(yùn)營(yíng)計(jì)劃。
考慮到影響城市軌道交通客流季節(jié)性因素的多樣性,后續(xù)需要對(duì)網(wǎng)絡(luò)、不同線路和站點(diǎn)的季節(jié)區(qū)間進(jìn)行對(duì)比分析。