



摘要 隨著城際鐵路列車的日常化運營,城際鐵路承載客流量不斷增加,不同類型車站客流量存在較大變化,從而導致城際列車客流的分布不均勻,列車開行方案和車站客流組織難度增加。為更好地掌握城際鐵路客流規律并進行長短時客流預測,文章以京津城際2023年7月旅客發送量的客流數據為基礎,結合客流影響因素及分布特點,采用基于多層LSTM神經網絡的客流預測模型,實現了不同類型車站的客流預測,并解決了梯度消失和梯度爆炸等一般循環神經網絡在運算時存在的問題。結果表明:客流預測值的平均絕對百分比誤差在可接受范圍內,且準確程度較高。
關鍵詞 城際軌道交通;客流預測;長短時記憶神經網絡;門控循環單元
中圖分類號 U294.1+2 文獻標識碼 A 文章編號 2096-8949(2024)13-0004-04
0 引言
近年來,城際鐵路客流量隨著我國經濟的快速發展和城市邊界的相互延伸而迅速增長,如何精確掌握城市間的客運需求,合理配置運輸資源,精準實施“一日一圖”,從而在滿足旅客需求的同時降低運輸成本是一個重要問題。而客流預測是把握未來一段時間內客運需求的重要手段,也是鐵路運輸企業運營決策和動態調整運輸資源的重要依據。
客流預測一般是指利用一定的方法和技術對未來一定時期內客流的需求、性質進行預先推測和判斷[1]。城際軌道交通短期客流預測可分為:以實時管理為目的,對未來一周或一個月內的交通狀態進行評估,或者對未來5~15 min內的客流進行預測。關于短時客流預測,目前國內外研究比較廣泛,國內學者田壯壯[2]對南昌市地鐵1號線進出站的客流量預測構建了BP神經網絡預測模型,并在模型中輸入站點周圍人口密度等信息作為影響因子;王秋雯等人[3]提出了基于卷積長短時記憶神經網絡(Convolutional Long Short-Term Memory, ConvLSTM)和K均值聚類算法(K-means clustering algorithm, K-means)的預測模型,在充分考慮變量時空特性的同時,以客流時空網絡圖像為基礎進行預測,確??土魈匦缘某浞掷?;趙陽陽等人[4]在長短時記憶神經網絡模型(Long-Short Term Memory, LSTM)中融入了經驗模態分解,大幅降低了噪聲對預測結果的影響,相較于傳統模型,客流預測準確度有所提高。國外學者Haibo Chen等[5]在短時交通流預測中,研究了一種基于動態排序學習的神經網絡模型;Coskun Hamzacebi[6]認為改進的BP神經網絡模型在預測時間序列數據方面具有重要的參考價值;Luca Quadrifoglio等[7]在研究短時客流預測時,加入了影響乘客需求響應的調度策略等因素。
基于以上專家學者的研究,該文依據2023年7月京津城際客流數據,在綜合考慮客流影響因素和分布特征的基礎上,提出了以多層LSTM神經網絡構建客流預測模型,從而解決一般性循環神經網絡運算時出現的梯度消失、梯度爆炸的問題,用以分析京津城際鐵路沿線不同車站的客流特點并進行了長短時客流預測,為車站客運組織提供支持。
1 客流特征及影響因素
客流預測分為長期、中期和短期預測三種[8]。短期客流預測一般是指對未來一周到一個月內的客流量進行預測,主要是為了優化列車開行方案、客流組織、票價策略等。2023年6月15日京津城際列車運行圖進行了一次較大調整,在對整體列車開行方案進行優化的同時,將部分交路車次在客流高峰期使用重聯或大編組的列車運行方式,使得城際線運能得以大幅提升,沿線各站的客流量也隨之快速增長,這使得以往的客流數據在現行列車開行方案下,無法起到以歷史數據預測未來客流量的作用。因此,研究如何利用短期數據準確預測未來客流量并探索客流規律,對京津城際沿線各站的售票策略調整和客運組織具有重要意義。
1.1 數據收集
京津城際高速鐵路及延長線全長約166 km,設計運營速度為350 km/h,共設7個車站,如表1所示。除此之外,天津西站通過南倉城際高速聯絡線接入京津城際,也屬于線路始發站之一。該線路客流需求量大,列車發車頻繁,旅客具有明顯的出行規律。
該文以京津城際鐵路2023年7月1日至2023年7月16日的歷史出發客流數據為依據,所有數據來源于鐵路客票系統。
1.2 客流影響因素分析
在城際軌道交通運營過程中,不同車站客流量受該站點列車時刻表、區域內旅客工作時間、通勤時間、出行偏好及周邊地理環境影響而呈現不同的變化。通過分析三個重點車站的日均客流量,如圖1所示,可以看出三個車站客流在規模上相差較大,天津站與天津西的客流規律比較相似。天津站作為京津城際線天津地區最重要的一站,日均客發量占上行發送量的55%,武清站作為通勤流、購物流疊加的中間站,客流長期處于高峰狀態。因此,該文選取天津站、武清站為研究對象,將天津站作為典型車站,武清站作為普通車站,對旅客出行需求按不同出發日期和出發時段進行分析。由圖2、圖3可得出不同類型車站在不同日期、不同時段乘客需求量的變化情況。
(1)從時間維度分析,隨著出發時間的不同,客流需求呈現出不同的波動特點,一天內的客流高峰期和低谷期明顯;天津站的客流高峰出現在8:00—9:00、19:00—20:00兩個時間段,武清站客流高峰出現在10:00—11:00、12:00—13:00和18:00—19:00三個時間段,兩站高峰時段的持續時間不長。
(2)一周內不同日期的客流需求在某一時段內具有一定的相似性。上述分析可以看出旅客需求具有時變特征,即隨著時間的推移,相應的客流也會發生變化。雖然不同日期在同一時間段內的客流量不同,但整體的波動規律具有相似性。客流數據中5:00—6:00、23:00—24:00之間的客發量較小,因此選取6點到23點為該文研究時段。
(3)非工作日與工作日的客流量在相同時間段也有較大差異,例如7月2日、7月9日6:00—7:00與19:00
—20:00時間段內,客流量與普通工作日相比,進站客流差異顯著,非工作日客流量明顯增加,出行時間相對集中。工作日和非工作日客流量的不同說明不同時期旅客出行規律不同,客流成分也不同。
2 客流預測模型
2.1 LSTM模型介紹
關于城市軌道交通客流預測的問題,已有專家學者將其定義為長時間序列預測類問題。而針對長時間序列的預測模型中,長短期記憶網絡(LSTM,Long Short-Term Memory)及其改進模型已經得到了廣泛應用,該文將對LSTM模型改進后對城際軌道交通客流進行預測,相應的模型介紹如下:
LSTM模型是眾多神經網絡中以時間循環為核心的網絡模型,主要是為了解決一般循環神經網絡在運算時出現的長期依賴問題,更具體地說,LSTM旨在解決較長時間序列在訓練過程中產生的梯度消失和梯度爆炸問題,這也是LSTM相對于一般循環神經網絡的優勢。但是,LSTM在結構上的復雜性加劇,較一般性循環神經網絡增加了單元狀態c,選擇效果較優的策略控制LSTM模型的狀態是保存長期預測狀態的關鍵。
在LSTM模型的通用結構中,有三個及以上的開關單元控制著信息的傳遞,如圖4所示。開關1用來決定歷史時刻的長期狀態是否受到當前狀態的影響,開關2用來控制當前狀態是否要輸入到長期狀態,開關3用來控制長期狀態是否作為設計好的LSTM模型的輸入。
為完成預測目標,對應LSTM模型的重復模塊如圖5所示。重復模塊的核心是其中各個單元的狀態,單元間狀態的傳遞呈傳送帶式,依托時間鏈運行;與此同時,各類中間值可進行線性交互,以更好地保留各個單元的相關信息。
2.2 LSTM預測模型建立
建立的預測模型如圖6所示,遺忘門通過設置Sigmoid激活函數(即σ)作為監測條件,將上層輸出ht?1和當前輸入xt作為輸入信息,得到一個二維的0?1輸出向量ft,其計算方法見式(1)。輸入門的作用是根據Sigmoid函數,計算當前輸入在長期記憶Ct中的占比程度,計算方法見式(2),在這一計算過程中,可通過創建候選門計算當前輸入的單元狀態[9],計算方法見式(3)。
值得注意的是,神經元在每一次數據迭代中都不可避免地處于不間斷的更新狀態。根據式(4)的計算方法,對比計算前一次記憶信息和當前處理階段的保留信息,使得Ct值不斷變化,促使LSTM模型不斷循環。
同輸入門類似的有,輸出門ot也通過Sigmoid函數確定輸出信息,結合tanh函數并根據式(5)和(6)進行計算,得到輸出結果ht。
該文采用多層LSTM神經網絡構建預測模型,將dropout引入模型的第三層。另外,LSTM神經網絡最后加入units為1的全連接層,達到降維效果。相關參數設置包括:時間粒度為15 min,學習步長為3,將LSTM神經網絡層的隱藏層units分別設為128、64和32,采用Relu為激活函數,選擇Adam為優化器。
3 LSTM預測分析
3.1 實驗結果
實驗用的計算機配置如下:主機使用Inter(R) i5-6300HQ,搭載NVIDI GTX 960顯卡,8G內存,應用程序中配置Python3.8.5、keras2.3.1、tensorflow2.4.0整體環境。針對客流數據中工作日與非工作日,實驗中將每個車站的客流數據按歷史客流數據進行測試和訓練。
利用2023年7月1日—2023年7月16日天津站、武清站分時段歷史客流數據,進行測試和訓練,對兩站下一周工作日和非工作日各時段客流情況分別進行預測。因不同日期分時段的客流差異較大,該文選取典型日期進行預測,其中工作日選取周一、非工作日選取周日,并將預測結果與周一(7月17日)和周日(7月23日)的真實數據進行比較。
各車站在相應參數下通過LSTM模型得到的客流預測結果如圖7~8所示。
3.2 實驗分析
從上述結果可以看出,客流預測值與真實值匹配程度較高,其中在典型車站天津站客流曲線中存在1個異常點差值區間;普通車站預測結果中,武清站LSTM預測值與實際值間不存在異常點差值區間。由于客流受工作日與非工作日影響較大,通過將兩個車站工作日與非工作日各時段的客流預測數據與實際值做對比,發現客流演化趨勢與歷史數據相關性較強,量化預測后各級數據之間的變化也具有一定的相關性。
將客流預測值與實際值之間的差值做CDF分析,典型車站預測值與實際值之間的相對誤差絕對值小于200的點占到90%以上,普通車站預測值與實際值之間的相對誤差絕對值小于80的點占到95%以上。在預測值的平均絕對百分比誤差方面,典型車站ΔMAPE=0.084 2,普通車站ΔMAPE=0.092 1,說明模型的預測性能較好。
4 結論
該文提出了LSTM模型的改進模型,基于京津城際2023年7月旅客發送量的客流數據,對不同類型車站的客流進行了預測,并與真實值進行了對比分析,驗證了模型在城際鐵路車站短時客流預測中的準確性。后續研究可在目前研究工作的基礎上,對城際列車長期的客流影響因素進行進一步探究,加入列車開行方案及列車編組、定員等影響因素,建立更加有效的客流預測模型。
參考文獻
[1]白麗. 城市軌道交通線網運營安全保障及評估體系研究[D]. 北京:中國鐵道科學研究院, 2016.
[2]田壯壯. 城市軌道交通延伸線的進出站客流預測[D]. 南昌:華東交通大學, 2019.
[3]王秋雯, 陳彥如, 劉媛春. 基于卷積長短時記憶神經網絡的城市軌道交通短時客流預測[J]. 控制與決策, 2021
(11): 2760-2770.
[4]趙陽陽, 夏亮, 江欣國. 基于經驗模態分解與長短時記憶神經網絡的短時地鐵客流預測模型[J]. 交通運輸工程學報, 2020(4): 194-204.
[5]CHEN H B, GRANT- MULLER S. Use of sequentiallearning for short-term traffic flow forecasting[J]. Transportation Research, 2001(9): 319-336.
[6]COSKUN HAMZACEBI. Improving artificial neural networks performance in seasonal time series forecasting[J]. Information Sciences I, 2008(78): 4550-4559.
[7]LUCA QUADRIFOGLIO, MAGED M DESSOUKY, FEMANDO ORDONEZ. A simulation study of demand responsive transit system design[J]. Transportation Research, 2008(42): 718-737.
[8]常昊. 基于LSTM神經網絡的地鐵短時客流量預測研究[D]. 西安:西京學院, 2022.
[9]賈島. 基于經LSTM的祁連水文站月徑流預測研究[J]. 黑龍江科學, 2022(22): 22-25.
收稿日期:2024-04-02
作者簡介:朱海笑(1989—),女,碩士,工程師,從事客運組織工作。