基于深度神經網絡的軌道交通客流預測及可視化

2020-02-03 02:39:04施雪蓉王寵惠劉東杰張瀟張博

電子技術與軟件工程 2020年19期

關鍵詞：模型

施雪蓉王寵惠劉東杰張瀟張博

（甘肅農業大學甘肅省蘭州市 730070）

城市軌道交通技術的飛速發展給人口基數不斷增大的城市提供了一個較為合理的出行方案。但也存在一些問題:一方面，由于需求與供給能力的不均衡性，在城市軌道交通網絡上常會造成難以預見的客流擁塞狀況，給地鐵的安全運營帶來極大的挑戰；另一方面，城市交通擁堵問題逐漸成為制約經濟發展的重要影響因子，因此以地鐵為代表的城市軌道交通系統得到了極大的發展空間。它可以為各個站點提供合理依據來分配人力物力，從而便捷市民的出行，或者為應對突發事件提供有效保障。例如今年年初突發的疫情事件，我們就可以通過分析預測得知某一站在某一時段內的人流量，從而設立相對合理的防疫點和防疫工作人員。預測客流可以為未來軌道交通和城市的規劃建設提供可行的數據支持。

1 研究內容及框架

1.1 長短期記憶神經網絡LSTM

長期和短期記憶網絡(通常稱為" LSTM")是存在長期學習依賴關系的RNN 的一種，是為了解決長期依賴問題而被提出的。LSTM 的重中之重就是神經元的所處的狀態，上水平線包含在整個結構的內部。它的狀態類似于一個運輸帶。其線性作用非常小且運用于整個結構。運輸帶上的數據易于傳播且狀態不會隨之變化。如圖1所示。

Sigmod 層輸出0～1 之間的數字，描述了一個神經元有多少信息能夠通過。輸出"0":"所有不能通過";輸出"1":"全部允許通過"。一個深度模型有三個用于保護和控制神經元狀態的門限。

為了控制存儲單元狀態c 中的信息量設計了兩個門:遺忘門（forget gate）與輸入門（input gate）。為了便于演示，許多文檔都添加了一個名為"候選門"的門。

2 基于LSTM深度神經網絡地鐵客流量預測

本文以天津市地鐵9 號線塘沽站客流為例進行客流預測分析

首先，原始的AFC(自動票價收集系統)乘客流量數據經過數據預處理后轉換為一維時間序列，可以通過BPNN，LSTM 和RF神經網絡直接進行訓練。然后從時間維度分析天津地鐵客流數據，以了解天津地鐵客流的分布特征。然后構建三種神經網絡:BPNN(反向傳播神經網絡)，LSTM(長期短期記憶)和RF(隨機森林)來分析和調整數據，最后將三種模型比較分析，選出相對優于其他模型的LSTM 預測模型，基于網格搜索算法確定LSTM 模型的最優超參數組合。最后以塘沽站客流為例，利用LSTM 模型對客流數據進行預測，并對預測結果進行分析。

表1：AFC 數據字段注釋

表2：LSTM 模型超參數取值

表3：各項指數具體數值

圖1：LSTM 核心構造

2.1 客流量數據預處理及分析一時間維度

2.1.1 客流量數據預處理

圖2：LSTM 模型結構圖

圖3：BPNN 預測周五進站

圖4：BPNN 預測周五出站

圖5：BPNN 預測周天進站

2.1.1.1 模型原理（以LSTM 為例）

圖6：BPNN 預測周天出站

圖7：LSTM 預測周五進站

圖8：LSTM 預測周五出站

圖9：LSTM 預測周天進站

該模型擅長處理時間序列數據，因此在數據預處理之后，將AFC 數據建模為一維時間序列數據。常見的時間序列預測方案主要包括單步預測，多步預測和滾動預測:單步預測，使用前n 個歷史數據{x1，...} Xn-1} xn}來預測下一個數據 Xn +1;多步預測，在預測m 個數據{Xn 十l，...，xn +1}之后，使用前n 個歷史數據{x}}...}J(n_}} Xn};滾動預測，下一個將Xn+1，隨著新的歷史數據繼續用于預測;從預測效果的角度來看，單步預測的準確性要高于多步預測和滾動預測的準確性。地鐵客流的單步預測方法為了進行預測，將預測步驟n 用作模型的超參數。本節采用網格搜索算法來選擇最優的超參數參數組合。

2.1.1.2 AFC 數據預處理

AFC 數據部分字段注釋如表1所示 AFC 數據字段注釋，分別包含了進站和出站的站名、線路、時間等字段：

原始的AFC 數據是天津地鐵各個線路在從星期一至星期六選擇的任意一天的全日客流數據。過濾從06:00:00 到24:00:00 的每日客流數據作為訓練集。預測客流時，必須在特定時間間隔內指定客流數據。此部分以五分鐘為間隔對客流量計數和預測。由于在同一天的不同時間，客流值相差很大，因此需要對客流數據進行歸一化，將客流數據映射到規定范圍內處理，再用于模型訓練。考慮到地鐵的實際運行，按站點比按線路預測客流更具研究性。因此，本節以天津地鐵9 號線塘沽站的客流數據為例，通過模型進行訓練和預測。原始AFC 數據不能直接用于訓練BPNN，LSTM 和RF 模型。數據必須先進行預處理，然后才能用于模型訓練。

圖10：LSTM 預測周天出站

圖11：RF 預測周五進站

圖12：RF 預測周五出站

圖13：RF 預測周天進站

圖14：RF 預測周天出站

為了將原始AFC 數據建模為一維時間序列數據，BPNN，LSTM 和RF 模型用于訓練和預測。需要經過以下數據預處理:

（1）過濾06:00:00 至24:00:00 的客流記錄，為了使開始和結束的客流時間與地鐵的實際運營時間保持一致，根據原始AFC 數據中的OD_Entry_Tm(入站時間)字段，從06:00:00 統一過濾AFC客流到24:00:00 數據。

（2）過濾9 號線塘沽站客流數據，根據原始數據中的ODEntry-Line-ID 和OD-Entry-Station-ID(傳入站名ID)字段，過濾出9號線客流數據，并計算出特定線路的客流數據。

（3）每隔五分鐘計算一次客流數量。五分鐘的間隔不僅可以確保模型預測的準確性，還可以體現出客流的變化。為了便于統計客流，將原始AFC 數據中的字符串時間轉換為整數時間，以分鐘為單位。

（4）歸一化原始數據。通常需要對時間序列數據的預測進行歸一化。將客流數據歸一化到相同范圍內可以使模型盡快收斂，并提高預測效果。本節采用最小最大歸一化方法，將天津地鐵客流量原始數據歸一化到0 到1 范圍內。式中X 為樣本值，Xmin 為所有樣本的最小值，Xmax 為所有樣本的最大值：

（5）劃分訓練集和測試集。訓練集用于模型訓練階段，以探索數據之間的潛在關系；測試集用于測試階段，以評估模型的有效性。測試集和訓練集彼此獨立，需要分開。

2.1.2 天津地鐵客流量數據分析

通過對原始AFC 數據的預處理，對天津地鐵客流數據進行詳細分析，以了解天津地鐵客流在時間維度上的分布特征，為后續的模型訓練奠定基礎。考慮到工作日和非工作日之間的客流變化存在一定偏差，因此將數據集分為兩部分(即周一至周四和周一至周六)進行研究。本節將首先對它們的客流分布進行分析，并觀察其分布差異。

周一到周四與周一到周六客流量分布對比：以5 分鐘為時間間隔，整理得出天津地鐵9 號線塘沽站在周一到周四和周一到周六的客流分布情況，然后分別就進出站客流分布規律進行分析。

由圖2-1、圖2-2、圖2-3、圖2-4 可以看出，天津地鐵9 號線塘沽站客流量一天之內存在較為明顯的早晚高峰，整體存在周期性變化。

通過應用大數據分析技術對抽油機懸點載荷進行了研究，依據現場實際生產數據確定出了抽油機最優懸點載荷利用率為67%，基于最優懸點載荷利用率可以進行適當的參數調整及抽油機選型，從而實現抽油機低能耗高效運行，延長收油機使用年限并現場調平衡50井次，調沖程、沖速62井次，優化設計標柱197次，年節電26.55×104kWh。

2.2 深度神經網絡模型搭建與調參

2.2.1 以LSTM 模型為例搭建

LSTM 模型建立過程：

在構建過程中，LSTM 模型通常包含4 層結構：

（1）輸入層；

（2）LSTM 層；

（3）全連接層；

（4）輸出層。

在建立LSTM 模型時，要指定損失函數。

地鐵客流預測是一個回歸問題，對比絕對值損失函數和平方損失函數，發現后者會放大真實值和估計值之間的距離，并懲罰較大的偏差誤差。因此，在LSTM 模型的構建中選擇平方損失函數。

由于LSTM 深度神經網絡模型更復雜且具有許多參數，因此很容易在訓練過程中過度擬合。如圖2所示。

2.2.2 LSTM 模型基于網格搜索算法調參

在本文中，歸一化數據的MAE 指數用于評估模型在網格搜索中的性能，并比較LSTM 和傳統機器學習模型的效果。如表2所示。

上一部分的分析表明，天津地鐵的客流數據在周一至周四以及周一至周六的分布上有很大差異。因此，使用網格搜索算法來找到模型的最佳超參數組合。將平均絕對誤差用作評估指標，并且按照從小到大的順序排列誤差。從網格搜索結果中，我們可以看到，從周一到周四，當訓練次數、批處理數量、LSTM 層中神經元的數量以及步長為24、8 和4 時，LSTM 深度神經網絡的性能最佳。基于這四個最佳超參數值，將構建一個LSTM 模型來預測周一至周四的客流數據。

3 模型預測結果分析

3.1 BPNN模型天津地鐵客流量預測結果

結果如圖3、圖4、圖5、圖6所示。

3.2 LSTM模型天津地鐵客流量預測結果

結果如圖7、圖8、圖9、圖10所示。

3.3 RF模型天津地鐵客流量預測結果

結果如圖11、圖12、圖13、圖14所示。

4 模型比對分析

4.1 確定最終訓練集

模型訓練初期采用兩個數據集(即周一到周四的數據預測周五的客流量和周一到周六的數據預測周天數據)放入模型進行預測比對，因為模型具有一定學習性，可以忽略隨機因素的影響，因此選擇周一到周六的數據作為最終訓練數據集，得出模型規律以便于對將來的數據做出預測。

4.2 模型對比

上述三種模型均用到如下指標:MAE、RMSE、MAPE、R2。以周天出站的預測結果為例，各項指標具體數值如表3所示。

對于MAE 指標來說，數值大小與預測值的誤差成正比；RMSE 是指均方根誤差，它用來衡量觀測值和真實值之間的偏差，數值大小與偏差值成正比；MAPE 是指平均絕對百分比誤差，數值大小與預測值的誤差成正比，當預測值與真實值完全吻合時它的值為0，即為完美模型；R2為擬合優度，最大值為1，值越接近1 說明擬合程度越好。

由數據模型預測圖和和項指標精確數值進行對比分析，得出結論:利用網格搜索算法查找模型的最優超參數組合確定LSTM 為最優訓練模型。

4.3 預測結果小結

本研究首先進行數據預處理，將原始數據轉換為一維時間序列數據，用于對BPNN、LSTM、RF 模型進行訓練。然后從時間維度上對地鐵客流量數據進行分析，主要研究了周一到周四和周一到周六的客流量分布差異和周期性變化規律根據訓練數據結果以及數據的學習性確定周一到周六的客流量為最佳訓練數據。進而搭建BPNN、LSTM、RF 深度神經網絡模型，利用網格搜索算法查找模型的最優超參數組合確定LSTM 為最優訓練模型。最后以天津地鐵9 號線塘沽站的進站客流為例，使用LSTM 深度神經網絡模型對地鐵客流進行預測，并對預測結果進行分析。由預測數據可知，直觀分析得到LSTM 模型在周一到周六上，有較高的預測精度。由平均絕對誤差隨著訓練迭代次數增加的變化趨勢可知，LSTM 模型能更快速學習到在周一到周六時，客流量數據的變化規律。由預測數據和真實數據的對比可以得到，LSTM 模型在預測周一到周六的客流數據時，預測曲線更加平滑。

5 結語

隨著我國近幾年現代化建設的不斷發展，信息化和智能技術作用的領域越來越廣泛，而城市軌道交通更是衡量城市經濟發展的重要指標。它的發展更應該借助于這些新興技術(例如大數據技術、云計算、物聯網等)來完善自己的體系架構，謀求全方位高水平建設。在“軌道交通+數字經濟”引領數字科技的新風向下，城市軌道發展、“云票務”、大力推進地下隱蔽資源開發等項目。”“精耕細作”的地鐵商業資源、地下“黃金走廊”、“地上”、“云經濟”為城市經濟發展注入了新的血液。