徐熠明
(上海工程技術大學數理與統計學院,上海 201620)
隨著我國城市軌道交通事業的不斷發展,許多大中城市地面交通的客流擁堵現象得到了一定緩解,同時受到嚴重尾氣污染的環境也得到了一定改善。然而,隨著地面客流量逐漸轉向城市軌道交通,客流規模持續攀升,城市軌道交通的運營壓力與日俱增[1-4]。為了緩解日益增長的城市軌道交通客流壓力,避免因為過度擁擠的客流導致一系列事故發生,負責城市軌道交通運營的相關部門需要更好地把握客流趨勢,以此制定合理的客流組織計劃以及各種應急方案[3-5]。上海市作為軌道交通發展水平較高的大城市,城市軌道交通客流量過于擁擠的現狀較為嚴重,甚至直接導致一些事故的發生。因此,合理預測軌道交通客流趨勢已經成為目前上海市軌道交通建設工作的重中之重。目前有許多客流預測方法,如線性預測方法中的時間序列模型[6]、卡爾曼濾波模型[7-8]和非線性預測方法中的非參數回歸、神經網絡模型、支持向量機[9-11]等。不同的模型都有其適用性和優點,但是許多模型有著過于依賴歷史數據或計算量特別繁瑣復雜的劣勢。在數據量較少情形下的短期客流量預測方面,灰色新陳代謝預測模型有其獨特優勢,它不僅具有傳統灰色預測模型計算簡便、易學好用、所需樣本信息少、適用范圍廣等優點[12-13],而且彌補了傳統灰色預測模型的缺點:易受預測中隨機干擾因素的影響。如刁文君[4]在分析灰色模型不足的基礎上,提出改進后的模型即灰色新陳代謝預測模型,并以實例證實了灰色新陳代謝預測模型在軌道交通短期客流預測中具有更高的預測精度和良好可行性;田麗[14]提出使用灰色預測方法對鐵路客流量進行預測,并使用我國以往鐵路客運量實例驗證了該方法的可行性,預測精度也滿足實際要求;薛亮等[15]提出使用灰色預測模型用于城市軌道交通客流量預測工作中,并通過具體的實際數據對預測精度進行了分析,證實了該預測模型用于城市軌道交通客流預測中是切實可行的;謝輝等[16]提出使用灰色預測模型用于城市軌道交通的短時客流預測,并用實例證明了該預測模型可以滿足預測要求;李云晶等[17]選取灰色預測模型對2020-2025 年黑龍江省人均地區生產總值的發展趨勢進行預測,并采用后驗差方法進行檢驗,發現預測具有較好的信度。
基于歷史客流量數據,本文發現上海城市軌道交通總客流量呈線性增長趨勢,在現有灰色預測模型算法的基礎上,采用Holt 雙參數指數平滑法對灰色新陳代謝模型進行優化,建立了灰色改良新陳代謝模型。根據2017-2018 年度灰色改良新陳代謝模型與傳統灰色新陳代謝模型預測效果對比發現,灰色改良新陳代謝模型預測更具優勢。最后,使用該模型對上海城市軌道交通2019-2022 年12 月份3 類日均客流量進行了預測,取得了較好的預測效果。
灰色系統思想由中國學者鄧聚龍教授于1982 年提出,基本原則是確定系統因素之間的不相似程度,即進行相關性分析,生成并處理原始數據以找到系統變化的規律,并生成具有強規律性的數據序列,然后建立并求解相應的微分方程,最終達到預測事物發展趨勢的目的。
本文擬使用改良的灰色模型研究上海市軌道交通短期客流量預測問題,對上海市軌道交通客流量預測問題的基本建模過程如下。
(1)由歷年上海城市軌道交通的原始客運量數據所構成的原始序列為:

對數據進行累加后得到:

(2)構造包含累加序列x(1)的一階微分方程,即:

其中,a、u表示待定參數。

(3)解出待定系數a、u后代入式(4)可得到時間響應方程,即預測模型。

對式(6)進行一階累減還原得到原始序列預測模型。

(4)精度檢驗。灰色預測模型的精度檢驗方法主要包括殘差檢驗、后驗差檢驗和關聯度檢驗等。在此主要介紹殘差檢驗和后驗差檢驗。
殘差檢驗如下:
殘差為:

相對殘差為:

通過觀察計算出的|e(k)|大小判斷精度是否理想。如果|e(k)|<0.1,則認為精度達到較高要求,如果|e(k)|<0.2,則認為精度達到一般要求。

通過比較P 與C 的值,可以將預測的準確度劃分為4個不同的級別,灰色預測模型預測精度測試水平標準與測試指標P 和C 之間的關系如表1 所示。
為了取得更好的預測效果,在傳統灰色預測模型的基礎上修正了其缺陷和不足,建立了灰色新陳代謝模型。這一概念在文獻[4]中已經給出,并通過實例展示了灰色新陳代謝模型的預測優勢。其原理是在原始的數據序列x(0)中加入新數據x(0)(n+1),同時將最老的數據x(0)(1)去掉,用序列(x(0)(2),x(0)(3),…,x(0)(N+1)) 作為模型輸入序列,并構建出模型,在多次老數據與新數據的反復遞補后,最終達到預測目標要求。而去掉老數據,并且加入新數據的這一過程也即實現了數據新陳代謝。灰色新陳代謝模型的建模過程與傳統灰色預測模型幾乎一致,在此不再具體闡述。

Table 1 Prediction grade comparison表1 預測等級對照
霍爾特在1957 年提出了Holt[18]指數平滑模型,主要計算公式如下:

其中,a、β分別為兩個平滑系數,xk+1為修勻后的預測序列,rk為修勻后的趨勢序列。
Holt 指數平滑法由于其結構簡單、整體效果好等優點已被普遍運用于經濟管理、控制科學、教育衛生等領域,適用于對含有線性趨勢的序列進行修勻,與簡單指數平滑模型的區別在于其可以處理具有長期趨勢的時間序列,并可以在處理原始數據之后對數據進行直接預測[19-20]。高曉輝[21]提出指數平滑方法在研究空氣質量預測的問題中具有優越性。
鑒于指數平滑的獨特優勢,本文擬采用Holt 雙參數指數平滑法對灰色新陳代謝模型進行優化,建立灰色改良新陳代謝模型,對上海市軌道交通短期客流量進行有效預測。本文主要分析近年來上海市軌道交通短期客流量的特征,為預測分析提供參考依據。本文數據來源于上海地鐵微博平臺(https://www.weibo.com/shmetro)。
以上海市軌道交通2014-2018 年12 月全線客流總量分布為例,軌道交通全線總客流量數據如圖1 所示。
從圖1 可以看出,自2014 年以來在上海市選擇軌道交通作為出行方式的人數變化呈線性遞增趨勢。因此,有效預測客流量可以為軌道交通相關部門提供重要數據參考。

Fig.1 Total passenger flow data of Shanghai rail transit from 2014 to December 2018圖1 上海市軌道交通全線2014-2018 年12 月份客流總量
以上海市軌道交通全線2018 年全年12 個月的客流總量分布為例,客流分布如圖2 所示。

Fig.2 Annual distribution of passenger flow of Shanghai rail transit in 2018圖2 上海市軌道交通2018 年全線客流量年分布
從圖2 可以得出,1-3 月之間的月客流量有較大波動,3-12 月的月客流量變化趨勢則相對平穩。
對2018 年12 月1 日-12 月7 日上海市軌道交通全線客流量進行分析,客流分布如圖3 所示。

Fig.3 Weekly distribution of passenger flow in Shanghai rail transit from December 1 to 7,2018圖3 2018 年12 月1 日-7 日上海市軌道交通全線客流量周分布
從圖3 可以看出,一周內各天的客流量有著較大差異性,周一至周四的客流量發展趨勢相對較穩定,周五的客流量則到達一周內的高峰點,而周六、周日的客流量相對工作日有大幅度下降。由于一周內不同階段的客流分布具有不同的特征,因此根據上述客流分布特征,需將一周的客流量分為3 類進行預測,分別是普通工作日(周一至周四)、特殊工作日(周五)和周末(周六、周日)。
對上海市軌道交通客流特征進行分析,為了盡可能排除國定節假日因素對于客流預測的影響,本文選擇上海城市軌道交通2014-2018 年12 月份不同時段的日均客流量為原始數據,構建傳統灰色新陳代謝模型和經Holt 指數平滑處理后的灰色改良新陳代謝模型;通過對比兩類模型預測效果,說明灰色改良新陳代謝模型優良的預測效果,從而對上海市軌道交通全線2019-2022 年12 月份普通工作日、特殊工作日和周末3 種不同情況下的日均客流量進行預測。
針對2014-2018 年12 月份客流量數據,依據不同客流量時段將其分為3 類,對相關參數進行計算,并討論其預測精度,說明灰色改良新陳代謝模型方法的優勢。
3.2.1 普通工作日客流量
2014-2018 年12 月普通工作日的日均客流量數據的原始序列為[875,961,1 036,1 085,1 123],將其代入傳統灰色新陳代謝模型,利用Python 軟件求得模型的待估計參數為a=-0.050 5,u=904.234,方差比為:C=0.12%,小誤差概率為:P=100%。而經過Holt 指數平滑處理后的灰色改良新陳代謝模型,方差比為:C=0.023%,小誤差概率為:P=100%。精度檢驗對比結果如表2 所示。

Table 2 Accuracy test comparison(common working day)表2 精度檢驗對比(普通工作日)
3.2.2 特殊工作日客流量
將2014-2018 年12 月特殊工作日的日均客流量原始序列[921,1 035,1 116,1 150,1 197]代入傳統灰色新陳代謝模型后可求得原始待估計參數為a=-0.046,u=981.834,方差比為:C=0.11%,小誤差概率為:P=100%。經過Holt 指數平滑處理后的灰色改良新陳代謝模型,方差比為:C=0.06%,小誤差概率為:P=100%。
精度檢驗對比結果如表3 所示。

Table 3 Accuracy test comparison(special working days)表3 精度檢驗對比(特殊工作日)
3.2.3 周末客流量
將2014-2018 年12 月份周末的日均客流量原始序列[663,700,718,788,811]代入傳統灰色新陳代謝模型可求得待估計參數為a=-0.053 4,u=640.848,方差比為:C=1.6%,小誤差概率為:P=100%,經過Holt 雙參數指數平滑處理后的灰色改良新陳代謝模型,方差比為:C=0.4%,小誤差概率為:P=100%。精度檢驗對比結果如表4 所示。
將兩種模型應用于上海市城市軌道交通3 類客流量后的精度對比結果如表5 所示。

Table 4 Accuracy test comparison(weekends)表4 精度檢驗對比(周末)

Table 5 General table表5 總表
由表5 可知,雖然兩種模型的精度測試在小誤差概率上均為:P=100%,對照表1 可知均為一級水平。但是,通過另一項指標也即方差比的比較,可以看出經灰色改良新陳代謝模型預測不同時段客流量的精度均明顯高于未經平滑處理的灰色新陳代謝模型的精度。
在進行預測前,首先將2012-2016 年12 月份的客流量實際數值作為測試樣本,分別運用傳統灰色新陳代謝模型和灰色改良新陳代謝模型對2017 年和2018 年12 月份的客流量數據進行預測,并與實際值進行對比,對比情況如表6 所示。

Table 6 Comparison of predicted values and actual values between traditional grey metabolism model and grey improved metabolic model in December from 2017 to 2018表6 傳統灰色新陳代謝模型與灰色改良新陳代謝模型2017-2018 年12 月份客流量預測值與實際值對比
由表6 可知,灰色改良新陳代謝模型對2017-2018 年12 月份3 類客流的預測值明顯更接近于真實值,說明灰色改良新陳代謝模型的預測變得更加合理有效,適用于軌道交通客流量短期預測。因此,采用灰色改良新陳代謝模型分別預測上海市軌道交通全線2019-2022 年12 月份的普通工作日、特殊工作日以及周末的日均客流量。
采用灰色改良新陳代謝模型的預測結果如下:上海市軌道交通2019-2022 年12 月份全線普通工作日的平均每日客流量預測數據如下:1 161 萬、1 186 萬、1 213 萬、1 239萬。上海市軌道交通全線2019 -2022 年12 月份特殊工作日的平均每日客流量預測數據如下:1 244 萬、1 256 萬、1 301 萬、1 325 萬。上海市軌道交通全線2019-2022 年12 月份周末的平均每日客流量預測數據如下:888 萬、929萬、972 萬、1 017 萬。大致走向如圖4 所示。

Fig.4 The predictive value of average daily passenger flow of Shanghai rail transit in December from 2019 to 2022圖4 上海市軌道交通全線2019-2022 年12 月份日均客流量預測值
經過整理后可得上海市軌道交通全線2015-2022 年12 月普通工作日、特殊工作日,周末的日均客流量(萬人次)分布如表7 所示。

Table 7 Distribution of passenger flow in three periods in December from 2015 to 2022表7 2015-2022 年12 月份3 類時段日均客流量分布
從表7 可以看出,在2015-2022 年,日均客流量仍呈現遞增趨勢,與之前的客流趨勢相符,在一周內客流量最多的依舊為特殊工作日,其次為普通工作日,而周末日均客流量則最少。
針對以上客流預測結果,本文給出如下建議:①對于客流量最多的特殊工作日以及客流量相對較多的普通工作日,運營組織需要做好充分的應對準備以及對于客流的疏導工作;②對于客流量最少的周末,運營組織則可以通過一系列措施,例如票價定制吸引客流,提高運能效率;③運營組織須調節不同時段客流之間的平衡,盡可能避免因為客流均衡性導致的客流量失衡現象而給軌道交通運營管理工作帶來的影響。
本文采用Holt 雙參數指數平滑法優化了傳統的灰色預測模型,并對上海市城市軌道交通短期客流量進行預測。結果顯示,經過改良后的模型對于城市軌道交通短期客流預測具有更高的預測精度。因此,灰色改良新陳代謝模型更適用于上海市軌道交通短期客流量的預測與分析。當然,本文僅對上海市城市軌道交通短期日常客流量進行了分析與研究,尚未考慮其國定節假日的客流量情況。因此,在目前研究工作的基礎上,將進一步對上海市城市軌道交通國定節假日的客流量進行分析并預測。