王夏秋 張 寧 王 健
(1. 東南大學智能運輸系統研究中心軌道交通研究所, 210096, 南京;2. 南京地下鐵道有限責任公司, 210024, 南京//第一作者,碩士研究生)
短期客流預測指預測1年內(主要以小時、日、月、季度等時間單位作為時間粒度)的軌道交通網絡或者線路的客流特征、服務水平以及出行效率等[1-3],是城市軌道交通運營部門展開各項管理工作的基礎與依據。在以往的短期客流預測研究中,主要集中于短期客流的日/小時預測[4-5],而對于月度或季度等更長時間跨度的短期客流預測還少有研究。但在城市軌道交通的實際運營中,車輛月度檢修計劃、運用車配備計劃以及日常運輸計劃的調整等大型生產計劃需要參考月度、季度客流預測的結果,同時,運營企業可根據該預測結果合理制定年度/季度生產運營計劃。有鑒于此,本文針對月度客流預測展開研究。
與小時/日客流不同的是,城市軌道交通月度客流受偶然因素影響的隨機波動性不大,但因預測的時間跨度較大,其受季節氣候變化、法定節假日分布、學校寒暑假等較穩定因素影響呈現出季節性波動的周期性特征[5]。因此,針對月度客流量呈現的明顯季節性特點,引入季節指數對原始月度客流數據進行季節處理,以季節調整原始數據并利用自回歸積分滑動平均(ARIMA)模型對城市軌道交通月度客流進行預測,從而使構建的預測模型具有更好的預測精度,提高預測結果的準確度。
現代城市軌道交通系統采用自動售檢票(AFC)系統記錄乘客的交易數據,是獲取軌道交通客流數據的良好平臺,為月度客流特性分析和城市軌道交通短期客流預測工作提供了數據支撐。本文采用的城市軌道交通運營客流數據來自于南京地鐵自動售檢票系統,以月份為統計時間間隔,南京地鐵2號線月度進站客流的時間演變如圖1所示。

a) 年度時間序列

b) 月度時間序列圖1 網絡化運營后的南京地鐵2號線月進站客流演變圖
由圖1可見,月度客流量有以下變化特征:
(1) 趨勢增長性。圖1 a)年度時間序列反映的是月度客流量在同一月份不同年份的變化情況,體現了客流量隨著沿線土地開發利用逐漸實施與完善以及網絡化運營效應的影響所呈現出的增長趨勢。具體表現為在相鄰的兩個年份之間,其客流量具有相同的分布特性,且隨著城市經濟的發展,客流總體隨著各月份呈現出增長趨勢。
(2) 季節波動性。圖1 b)月度時間序列反映的是月度客流量隨著時間的逐漸推移呈現出不同的變化情況,體現了該月度客流量由于季節變化的不同而引起波動的發展趨勢。具體表現為:由于春節假期原因,客流量在每年1、2月份出現低谷;7、8月份受到炎熱天氣以及學生放假的影響,其客流量略少于其他月份。因此,月度客流量每年重復出現循環變動,即以12個月為周期的季節波動性。
從圖1可以發現,城市軌道交通月度客流受偶然因素影響的隨機波動性不大,但因預測的時間跨度較大,一方面,受季節氣候變化、法定節假日分布、學校寒暑假等較穩定因素影響,呈現出季節性波動的周期性特征;另一方面,在無新線接入的條件下,主要受線路周邊土地開發利用程度和網絡化運營效應影響而呈現趨向于線性但不夠平穩的趨勢增長性特征。考慮到季節指數法能夠有效地消除季節性因素影響,且ARIMA模型是線性估計模型,其對線性且非平穩性時間序列數據能進行較好的處理,因此,結合兩種模型的優勢,引入季節指數法和ARIMA模型共同對城市軌道交通月度客流量進行預測,從而使構建的預測模型具有更好的預測精度,提高預測結果的準確度。
形成以12個月為循環周期的這種季節性波動最主要的因素是自然季節性和制度季節性的綜合影響。其中,自然季節性是一年中氣候、光照時長、溫度等因素變化的結果;而制度季節性則是由于法定節假日及一些特殊時期的活動引起的,尤其是法定節假日是制度季節性的最一般性的表現。正是由于這兩種因素的疊加,形成了我國城市軌道交通月度客流季節性波動的獨特性。因此,需要從該時間序列中剔除季節因素,在建模預測前引入季節指數調整[6],建模預測過程中對預測值用季節指數逆向季節調整,使預測結果更符合客觀規律[7]。
季節指數是基于統計學的一種簡化時間序列數據的方法,通過該方法對季節時間序列的季節性進行處理,同時使得原始數據中的一些重要信息不被丟失。本文采用的是直接平均季節指數法對原始客流數據進行建模前的季節指數調整。直接平均季節指數法用算數平均值直接計算各月或各季度的季節指數[6],其計算公式為:
(1)
式中:
cj——第j個月的季節指數;
xij——第i年第j個月份的客流量。
然后利用該指數對歷史各月份的月度流量xij進行季節調整:
(2)
經過對歷史數據的處理之后,通過預測得到未來時期某個月份的客流總量為yj,那么逆向季節調整后的該月客流總量為:
(3)
ARIMA模型是將非平穩時間序列通過差分計算轉化為平穩序列后,將因變量僅對其滯后值及隨機誤差項的現值和滯后值進行回歸建模[8]。由此可知,ARIMA模型是對時間序列進行差分轉化、自回歸、移動平均的一種預測方法,故ARIMA(p,d,q) 稱為差分自回歸移動平均模型。其表達式為:
xt=φ0xt-d+φ1xt-d-1+…+φpxt-d-p+εt-
θ1εt-1-θ2εt-2-…-θqεt-q

(4)
式中:
xt,xt-1,…,xt-p——觀測序列值;
B——延遲算子;
{εt}——零均值白噪聲;
φ0,φ1,φ2,…,φp,θ1,θ2,…,θq,εt——均為待估參數;
p——自回歸項;
q——移動平均項數;
d——時間序列成為平穩時所做的差分次數。
基于季節指數的ARIMA模型的短期客流預測是先通過季節指數調整原始客流序列后,再通過差分處理將序列平穩化,最終將其轉化為ARIMA模型來解決。主要預測步驟如下:① 計算季節指數并調整月度客流序列。根據數據優化處理方法,利用原始客流數據計算各月份的季節指數,并用計算得到的季節指數按照式(2)對樣本中的各月份客流量進行季節調整,以獲得變換后的月度客流序列。② 利用經過變換后的客流序列建立ARIMA模型。將經過變換后的客流數據按照數據平穩化處理、模型識別、參數估計和檢驗這三步構建出合適的ARIMA模型。③ 利用季節指數逆向季節調整預測值。利用上一步得到的模型預測未來時期某個月份的客流量,并按照式(3)對預測值進行逆向季節調整,得到的結果即為最終的月度客流預測值。
本文選取網絡化運營穩定后南京地鐵2號線2011—2013年共36個月的進站客流量為基礎數據,通過本文計算方法對36個月的原始月度客流時間序列數據進行計算,得到季節指數(如表1)。

表1 月度客流時間序列的季節指數
根據表 1的季節指數,對原始客流序列進行季節調整,經過變換后的月度客流序列如圖 2所示。
利用變換后的月度客流序列構建ARIMA(1,1,1)(0,1,0)12模型,對月度客流量進行預測,得到的預測結果如表 2所示。同時,為驗證本文提出的預測方法的有效性,將原始數據直接建模預測得到的結果與之對比分析,有無季節指數調整的ARIMA模型預測結果如表 2所示。

表2 有無季節指數調整的預測結果
通過相對誤差(PE)和平均絕對百分比誤差(MAPE)兩個指標來檢驗兩個模型的預測精度,其性能評價指標結果如表3所示。

表3 有無季節指數調整的ARIMA模型誤差對比分析 %
進一步地,得到有無季節指數調整的預測客流趨勢曲線與實際客流曲線對比,如圖3所示。

圖3 2014年1—6月有無季節指數調整的預測客流趨勢曲線與實際客流曲線對比圖
通過兩個指標對比分析可見,基于季節指數的ARIMA模型預測各月度客流量的相對誤差較無季節指數調整的ARIMA模型的相對誤差好,均在10%以內,有些月份的相對誤差更達到了2%以內,相對誤差主要在5%范圍上下波動,平均絕對誤差也在5%以內。 對于個別月份的相對誤差比無季節指數調整的ARIMA模型預測結果的誤差值大(如2月份和5月份),是因為2014年的春節處于2月份,期間客流出行受走訪探親、購物、旅游等多種隨機因素的綜合影響,且歷史年的春節并非都處于2月份,僅通過季節調整而不考慮日歷因素影響得到的預測結果,反而比單純利用ARIMA模型預測的結果誤差更大,未來可考慮加入日歷因素影響因子以提高預測結果的準確度。而2014年5月31日南京為迎接青奧會的到來在南京玄武湖舉辦環湖大型徒步活動,致使當日客流量較歷史同期的客流量大幅度增加,進而影響5月份的客流總量。與此同時,圖3的趨勢曲線表明,相對于無季節指數調整的預測客流趨勢曲線而言,基于季節指數調整的預測客流趨勢曲線與實際客流曲線更加吻合。綜上所述,基于季節指數的ARIMA模型預測效果更佳。
本文提出的基于季節指數的預測方法是在采用ARIMA 模型建模預測前引入季節指數對原始客流數據進行季節調整,以消除季節因素對建模的影響,并在預測結束后用季節指數對預測值進行逆向季節調整,使預測結果更加符合客觀規律。通過與未經過季節指數調整的ARIMA模型預測結果對比分析,說明了本文提出的方法在月度客流預測中精度較高,基本滿足對客流量的預測需求。運營單位可根據該方法得到的預測量及時調整相關運能運力,制定更加經濟合理的季度或年度運營計劃。需要指出的是,基于季節指數的ARIMA模型適用于具有周期性變化規律的客流量預測,而以小時、天等更小的預測時間跨度也具有一定的周期波動性,未來可嘗試采用該模型進行預測。