楊 飛 張云嬌 范丁元
(中鐵工程設計咨詢集團有限公司,北京 100055)
隨著我國工業化和城鎮化的快速發展,鐵路因其大運量、便捷、快速、舒適等特性,在保障城鎮人口大量流動,促進經濟聯系,帶動相關產業結構優化升級方面起到了重要作用。鐵路客運量預測是制定鐵路客運宏觀發展戰略和編制客運計劃的重要依據,其準確性與可靠性對制定鐵路線網規劃、設計列車開行方案、優化客運產品結構、提升旅客運輸服務水平等具有重要意義[1]。
鐵路客運量預測方法可分為線性預測和非線性預測模型兩類。其中,線性預測模型中應用較廣的是線性回歸預測,而神經網絡預測模型憑借其高度的非線性、強大的學習性等特點成為非線性預測方法的代表。無論采用哪一種預測方法,預測結果與實際客運量均存在一定的誤差。因此,許多學者會先對研究對象進行運量預測,再借助馬爾科夫模型對預測結果進行修正,以提高模型預測結果的精度。呂鵬飛[2]應用馬爾科夫模型對船舶交通量的多層感知器神經網絡預測結果進行修正;裴同松[3]應用馬爾科夫模型對公路客運量的多層感知器神經網絡預測結果進行改進;尚慶松[4]結合馬爾科夫模型與灰色預測模型對售票窗口的客運量進行預測;周子東[5]利用馬爾科夫模型對最小二乘回歸模型的預測結果進行修正;馬彩雯[6]利用馬爾科夫模型對灰色預測模型的預測結果進行改進。馬爾科夫模型在預測過程中,通常采用統計估算法對預測結果所屬的狀態區間進行劃分,常用的有均等劃分、均值-方差法和黃金分割法等。這類方法劃分狀態區間時,狀態區間劃分的數量和取值具有一定的主觀性和隨機性,使得馬爾科夫模型對預測值的改進效果具有一定的不確定性,可能導致馬爾科夫修正值的精度更差,影響整體預測精度。潘麗[7]將預測誤差狀態區間劃分為長度相等的區間并進行馬爾科夫修正,即區間均等劃分,其第5 組馬爾科夫預測修正值的誤差較修正前大1.87%;何啟[8]通過均值-方差法將預測結果劃分為5 個不同的狀態,其第4 組馬爾科夫預測修正值的誤差較修正前大0.336%。
為了解決馬爾科夫模型在預測過程中的不確定性問題,并提高其預測精度,本文在預測精度更優條件下,研究馬爾科夫模型中狀態區間劃分的取值方法。通過多層感知器神經網絡預測2004—2019年的北京市鐵路客運量,運用改進的馬爾科夫模型對多層感知器神經網絡預測結果進行修正,并與均等劃分、均值-方差法劃分狀態區間的馬爾科夫模型的預測修正結果進行對比,以驗證改進馬爾科夫模型的預測效果。
馬爾科夫理論多用于研究時間序列數據的狀態和轉移規律,其認為一個序列可劃分為若干種狀態,時刻ti的狀態僅由時刻ti-1的狀態決定,而與ti-1之前的狀態無關,即馬爾科夫性質。假設鐵路客運量預測誤差的狀態變化具有馬爾科夫性質,一組鐵路客運量的預測誤差序列S(t)可劃分為m 種狀態,通過研究序列S(t)中各狀態的初始概率向量和狀態轉移規律,來預測該序列下一時刻最有可能所處的狀態,進一步對預測結果進行修正。運用馬爾科夫模型對鐵路客運量進行預測修正過程可分為以下5 步:
(1)鐵路客運量預測
選擇一種合適的方法先對研究區域往年及預測年度的鐵路客運量進行預測并計算其誤差。
(2)劃分狀態區間

(3)計算狀態轉移概率矩陣
根據狀態劃分區間將往年客運量的預測誤差歸屬于相應的狀態,并計算狀態Ei經過一步轉移到狀態Ej的概率[9]:

則一步狀態轉移矩陣為:
根據C-K 方程,狀態Ei經過k 步轉移到狀態Ej的概率矩陣為:
(4)計算初始狀態的概率向量
假設往年鐵路客運量預測誤差序列S(t)中最后一組樣本的狀態為Ei,則其初始狀態概率向量P(0)是第j 列概率為1 且其余列概率為0 的行向量:
(5)修正鐵路客運量預測值
初始狀態概率向量經過k 步轉移到預測年度的狀態概率向量P(k)為:
根據狀態向量P(k)可以判斷預測年度所處的誤差狀態Ei,原預測值的馬爾科夫修正值計算公式為:
式中:S預測——鐵路客運量預測值;
S修正——鐵路客運量預測值的馬爾科夫修正值;
ai、bi——狀態Ei的區間取值。
為提高預測年度馬爾科夫預測修正值的精度,馬爾科夫預測修正值與原預測值、實際值具有以下關系:
式中:S實際——實際鐵路客運量。
將式(6)帶入式(7)可得:
整理可得狀態劃分區間取值范圍為:
同理,求解可得狀態劃分區間的取值范圍:
式(11)、式(13)為劃分的狀態區間取值與鐵路客運量預測值和實際值的關系,當滿足其一時,可進一步提高馬爾科夫預測修正值的精度。
根據劃分狀態區間的取值范圍約束,對馬爾科夫預測過程進行優化,如圖1所示。

圖1 馬爾科夫預測優化過程圖
該方法是根據式(11)或式(13)先計算往年的客運量預測誤差序列S(t)中每一組數據對應的ai+bi的取值范圍[αi,βi],將每組數據取中值,即(αi+βi)/2,再取其平均值帶入式(6)對預測年度的預測值進行修正。此法打破傳統馬爾科夫預測的流程和模式,無需計算k 步狀態轉移概率矩陣,解決了狀態劃分方法優化難度大、狀態轉移概率矩陣計算量大等問題,其誤差精度的優劣是本文論證研究的重點。
影響鐵路客運量預測的因素[10]可分為宏觀因素和微觀因素兩類。宏觀因素包括經濟實力、人口規模、社會發展水平、交通建設情況、旅游業發展水平、國家政策等;微觀因素包括鐵路運輸設施設備屬性和旅客屬性兩類,主要有運輸時間、費用、服務質量、出行目的、出行距離、出行偏好等??紤]北京市鐵路客運量的特點及指標數據獲取的可操作性,本文主要考慮地區生產總值、地區常住人口、人均消費水平、旅游人數對鐵路客運量預測的影響。通過北京市2020年統計年鑒獲取相關數據,借助SPSS 軟件構造其多層感知器神經網絡預測模型,如圖2所示。其中,隱藏層數設為1 層,隱藏單元為1 個,隱藏層激活函數為雙曲正切函數。

圖2 北京市鐵路客運量多層感知器神經網絡預測模型圖
借助SPSS 軟件預測北京市2004—2019年鐵路客運量,預測殘差如圖3所示,預測結果如表1所示。

表1 北京市鐵路客運量預測結果表

圖3 北京市鐵路客運量多層感知器神經網絡預測殘差圖
由圖3 可知,部分多層感知器神經網絡預測值與真實值存在一定的差異,可結合馬爾科夫模型對預測值進行進一步修正,以提高預測精度。
為了對比常用的均等劃分、均值-方差法劃分誤差狀態區間的馬爾科夫預測精度以及本文提出的優化馬爾科夫預測過程法的預測精度,將2004—2016年北京市鐵路客運量實際值和多層感知器神經網絡預測值視為研究對象,研究其狀態區間劃分及狀態轉移規律,并視2017—2019年為預測年度,對其鐵路客運量多層感知器神經網絡的預測值進行修正計算。
(1)均等劃分法
由表1 可知,2004—2016年北京市鐵路客運量預測誤差范圍為-3.881%~3.006%,將誤差序列平均劃分為E1、E2、E3、E4、E5共5 個狀態,則每個狀態區間長度均為1.377%。因此,各狀態區間取值為:E1∈[-3.881%,-2.504%)、E2∈[-2.504%,-1.126%)、E3∈[-1.126%,0.251%)、E4∈[0.251%,1.629%)和E5∈[1.629%,3.006%]。
將2004—2016年多層感知器神經網絡預測的誤差按照狀態區間劃分結果進行分類,根據馬爾科夫過程,狀態Ei經過一步轉移到狀態Ej的頻數,如表2所示。

表2 均等劃分法的狀態轉移頻數表
由表2 和式(1)~式(3)計算得2016年鐵路客運量預測誤差狀態的一步、兩步和三步狀態轉移概率矩陣分別為:
2016年北京市鐵路客運量預測誤差所處狀態為E3,故其初始狀態的概率向量為P(0)=(0 0 1 0 0),根據式(5)計算可得2017—2019年狀態轉移概率向量分別為:
可知2017—2019年預測誤差最有可能所處的狀態分別為E4、E3、E3,概率分別為0.4、0.573、0.48。根據式(6)計算得其預測修正值,如表3所示。

表3 均等劃分法的馬爾科夫預測修正結果表
由表3 可知,采用均等劃分法對誤差狀態區間進行劃分時,2019年的馬爾科夫預測修正值的誤差比多層感知器神經網絡預測更小,這表明馬爾科夫模型在一定程度上能夠提高預測精度。然而,2017年、2018年的馬爾科夫預測修正值的誤差絕對值更大,這是因為狀態區間劃分時未考慮誤差精度的影響,確定的誤差狀態數和區間取值具有一定的主觀性和隨機性,影響馬爾科夫預測修正值的整體精度。
(2)均值-方差法
均值-方差法將預測誤差分為5 組,其變化區間計算公式為:
s——預測誤差方差。


表4 均值-方差法的馬爾科夫預測修正結果表
由表4 可知,均值-方差法的狀態區間劃分時也未考慮誤差精度的影響,其2017年、2018年的馬爾科夫預測修正值的誤差絕對值更大,影響馬爾科夫預測修正的整體精度。
(3)優化馬爾科夫預測過程法
根據式(13)計算得2004—2016年北京市鐵路客運量預測誤差狀態區間的ai+bi取值范圍,如表5所示。

表5 ai + bi 取值范圍表
由表1、表5 可知,當實際值大于預測值時,相應年份ai+bi取值范圍中值的平均值為-0.03;實際值小于預測值時,相應年份ai+bi取值范圍中值的平均值為0.013。計算可知2017年與2018年的ai+bi取0.013,2019年的ai+bi取-0.03 時預測精度最好,由式(6)計算可得2017—2019年鐵路客運量預測修正值如表6所示。

表6 優化馬爾科夫預測過程法的預測修正結果表
由表6 可知,本文提出的優化馬爾科夫預測過程法進行預測值修正時,其預測修正值的誤差絕對值均小于多層感知器神經網絡預測值的誤差,優化模型的精度較好。
綜上所述,各預測方法預測誤差絕對值的均值如圖4所示。

圖4 各預測方法誤差對比圖(%)
由圖4 可知:
①均等劃分和均值-方差法劃分的狀態區間取值受到劃分方法和劃分狀態數量的影響,具有一定的主觀性和隨機性,無法保證每一組預測修正值的誤差精度較原預測結果有所提升,導致馬爾科夫預測修正值的平均誤差較多層感知器神經網絡的預測誤差更大。
②本文考慮誤差精度而改進的馬爾科夫預測過程法的精度更佳,其誤差比均等劃分和均值-方差的馬爾科夫預測方法分別降低了0.601%、0.683%,比多層感知器神經網絡預測誤差降低了0.541%,且無需計算k 步狀態概率轉移矩陣,降低了預測過程的復雜性。
馬爾科夫預測模型一定程度上能提高鐵路客運量預測的精度,但其狀態劃分方法及狀態數量的選擇具有一定的主觀性和隨機性,導致模型的預測精度存在不確定性。為解決這一問題,本文在考慮誤差精度的條件下,對劃分狀態區間的取值范圍進行了研究,得到的主要結論如下:
(1)考慮誤差精度更優條件下確定馬爾科夫模型劃分狀態區間取值范圍對解決馬爾科夫預測精度的不確定性問題具有重要意義,能有效保證馬爾科夫對預測值進行改進的效果。
(2)改進的馬爾科夫模型無需計算k 步狀態轉移概率矩陣,降低了預測過程的復雜性。
(3)相比于多層感知器神經網絡、均等劃分的馬爾科夫模型、均值-方差的馬爾科夫模型,改進的馬爾科夫模型具有更高的預測精度。
未來的研究仍需重點關注考慮誤差精度后狀態區間劃分方法的優化,以進一步提高馬爾科夫模型的預測精度。