孫舒淼,趙嘉偉,張 寧
(1. 南京地鐵建設有限責任公司,南京 210024;2. 東南大學智能運輸系統研究中心軌道交通研究所,南京 210018)
現階段,許多城市的軌道交通進入網絡化運營階段,同一起訖點(OD)對間乘客的出行選擇增多,而自動售檢票系統只能記錄乘客的進出站刷卡時間,并不會記錄乘客的具體出行路徑,為軌道交通的運營管理及票務清分帶來了困難。關于乘客的路徑選擇問題,以往主要通過概率論的方法進行研究[1-3],這些方法以隨機效用理論為基礎,通常需要研究影響出行者路徑選擇的因素,根據影響因素構建效用函數,然后使用集計模型計算每條路徑被選擇的概率以完成客流分配。近年來隨著數據挖掘技術的不斷發展,利用刷卡記錄還原乘客的路徑選擇成為軌道交通研究的熱點。Sun Yanshuo[4]、石俊剛[5]、高圣國等[6]認為多路徑OD 對間的乘客旅行時間分布是由各條路徑旅行時間分布按照客流分配比例疊加而成。何宇[7]在此基礎上,以南京地鐵為例,論證了多路徑OD 對間乘客旅行時間服從混合高斯分布,并利用EM 算法對混合模型進行求解,找出各條路徑的客流分配比例。然而上述方法均無法針對單個乘客進行路徑匹配。Ling Hong 等[8]通過軌道交通刷卡數據及列車運營時刻表,推斷出乘客在車時間并利用基于旅行時間的比例進行聚類分析,解析出每位乘客的出行路徑,然而該方法在進行時刻表匹配時,假定乘客不會由于擁堵等原因錯過車次,未考慮到乘客在候車過程中出現二次等待的情況。Zhu Yiwen[9]等通過預估乘客的步行時間,結合列車發車時刻表,估計乘客無法登車的概率,并依據旅行時間,判斷乘客的路徑選擇,然而該模型參數對步行速度的敏感性較大。為解決上述不足,本文提出一種基于時刻表匹配的客流分配方法,首先根據乘客進出站刷卡時間及列車時刻表,找到其所有可能乘坐的車次。并以只匹配到單條出行時間鏈的乘客作為參考乘客,對其余乘客的出行行為進行分析、篩選,得到其最有可能的出行路徑及完整的出行時間鏈,為軌道交通票務清分及運營管理提供依據。
在軌道交通中,一條完整的出行記錄應該包括乘客進站刷卡時間、上車時間、下車時間及出站刷卡時間。然而,由于國內軌道交通實行一票換乘制,乘客在上下車及換乘時并不需要刷卡,故自動售檢票(AFC)系統能夠記錄的信息有限,以南京地鐵為例,AFC 系統記錄的乘客出行信息如表1 所示。在網絡化運營情況下,一個OD 對間可能存在多條有效路徑,僅僅依據AFC 系統記錄的信息往往難以準確推斷出乘客具體的出行路徑。本文旨在利用列車時刻表信息,還原出每位乘客的完整出行時間鏈,以此確定乘客的路徑選擇。

表1 AFC交易數據Tab.1 AFC transaction records
列車時刻表記錄了列車在各個車站的到達和出發時間,定義線路集合L={1,2,…,l,…,N,},各線路上的車站集合Sl={1,2,…,i,…,M,},第j輛列車到達線路l上的車站i的時間為Ali
j,離開線路l上的車站i的時間為Dli
j,則某一車站的列車時刻表信息可表 示 為乘客的出行時間鏈包括乘客進出站刷卡時間以及在出行路徑上的上下車時間。在此,假定所有乘客均在列車離開站臺時上車,在列車到達站臺時下車,則一條完整的出行時間鏈可表示為:

式中:
Checkin表示進站刷卡時間;
Checkout表示出站刷卡時間;
Sli(Alij)列車j在線路l上的車站i的到達時刻;
Sli(Dlij)列車j在線路l上的車站i的出發時刻;中括號內表示換乘過程,乘客在換乘站從一條線路換乘到另一條線路。
獲取乘客出行時間鏈的具體方法如下。
Step1:給定起訖點,在路網中找出起訖點間所有有效路徑。每個OD 對間可能存在大量可達路徑,有效路徑定義為滿足以下條件的可達路徑[10]。
在同一換乘站,乘客最多進行一次換乘;路徑中不存在相同的區間;以最短路徑的阻抗為標準,其余路徑的阻抗不超過最短路徑阻抗的 (1+H) 倍,H>0。
Step2:對有效路徑進行簡化處理,使之僅包含起訖點及換乘站點。這樣將一條完整的出行路徑以換乘站為節點拆分為多條短路徑。規定第一條短路徑的進站時間為乘客進站刷卡時間,其余短路徑的進站時間為上一條短路徑乘客的下車時間。
Step3:對每一段短路徑,根據進站時間及設定的時間閾值,從列車時刻表中找出此段時間內經過起點站的列車車次,記錄列車的出發時間及到達時間。將到達時間作為下一條短路徑的進站時間。時間閾值的設定由運營時間段、地鐵車站的換乘形式及列車的發車時刻表確定,在閾值設定時,為了保證每位乘客在每條短路徑上都可以匹配到車次,閾值設定范圍應該適當擴大。
Step4:將每一條路徑的時間點進行拼接,形成完整的出行時間鏈。
如圖1 所示,如果一個OD 對間有多條有效路徑,根據OD 對間與終點站連通路徑數量的不同,有兩種基本形式。一條交易記錄在每條路徑上均可能會匹配到多條出行時間鏈,而在理想情況下,一條交易記錄只匹配到一條出行時間鏈,可以唯一確定該乘客的路徑選擇及乘坐車次,本文稱這部分乘客為參考乘客并基于其旅行時間鏈中的換乘等待時間和下車出站時間差,判斷其余乘客的路徑選擇。
換乘等待時間定義為乘客在換乘站下車換乘至換乘列車到達換乘站的時間,本文在獲取乘客出行時間鏈的過程中,為了保證一定可以匹配到出行時間鏈,設置了相對較寬泛的時間閾值,有了參考乘客在換乘站的換乘等待時間后,可以對該時間閾值做適當調整,減少匹配時間鏈的數量。

圖1 乘客出行路徑中到達終點站的兩種形式Fig.1 Two arriving types at the terminal in passenger travel route
下車出站時間差定義為乘客出站刷卡時間與終點站下車時間的差值。一般情況下,乘客在到達終點站之后,會盡快找到對應的出口刷卡出站,完成旅行,不會在終點站做長時間停留。故乘客下車出站時間差波動性較小。以參考乘客的下車出站時間差為樣本,擬合其分布規律,對匹配到多條出行時間鏈的交易記錄做篩選,可判斷出乘客最可能的出行路徑。考慮到從不同線路、不同的出口出站,乘客的平均步行時間可能會存在差異,而自動售檢票系統記錄的數據中僅有乘客出站刷卡的閘機編號信息,缺乏閘機所對應的出口信息,故在找到參考乘客后,依據其所選擇的線路及出站刷卡的閘機編號進行分類,對每個類別,擬合其下車出站時間差分布。
對于圖1 中第一種路徑,因終點站為屬于換乘車站,乘客從各條線路到達各個出口的時間可能會存在差異,故需按車站所屬線路進行分類。而對于圖1 中第二種路徑,因終點站不屬于換乘車站,故無需對線路做分類,直接針對各個出站口,擬合參考乘客的下車出站時間差分布。
之后,將旅行時間無顯著差異的閘機編號合并,認為同一類閘機口對應同一個出站口并對出站口重新編號。雙樣本K-S(Kolmogorov-Smirnov)檢驗是一種基于累計分布函數的檢驗方法,用于檢驗一個分布是否符合某一理論分布或比較兩種經驗分布是否具有顯著差異。由于其對兩樣本的經驗分布函數的位置和形狀參數的差異都敏感,是比較兩樣本的最有用且最常用的非參數方法之一,故本文選擇雙樣本K-S 檢驗進行閘機口的合并。
最后,尋找合適的分布函數擬合參考乘客到各個出站口的下車出站時間差,得到概率密度曲線,對于匹配到多條時間鏈的出行記錄,由概率密度函數計算每條時間鏈被選擇的概率。將概率較大者對應的路徑作為乘客最終的路徑選擇。
目前,南京地鐵已開通10 條運營線路,包含159 個車站,13 個換乘車站,已進入網絡化運營階段。
本文以龍華路-新街口為例,采用上述方法,確定乘客的路徑選擇。乘客從龍華路站出發去往新街口站,有兩條路徑可供選擇:1)經元通站換乘2號線;2)經安德門站換乘1 號線。如圖2 所示。
因新街口站為換乘車站,從龍華路-新街口的路徑屬于圖1 中的第一種情況。故參考乘客的下車出站時間差需按車站所屬線路進行分類。選取2019年3 月1 日至28 日乘客的刷卡數據,標定參考乘客的下車出站時間差分布參數。如經元通站換乘到達新街口站并通過編號為“33687830”閘機出站的參考乘客,其下車出站時間差分布如圖3 所示;經安德門站換乘到達新街口并通過該閘機出站的參考乘客,其下車出站時間差的分布如圖4 所示。

圖2 南京地鐵線路圖(部分)Fig.2 Nanjing metro map (part)

圖3 選擇路徑1參考乘客下車出站時間差Fig.3 Time difference between alighting and departure is the references for selecting route 1

圖4 選擇路徑2參考乘客下車出站時間差Fig.4 Time difference between alighting and departure is the references for selecting route 2
收集所有出站口參考乘客的下車出站時間差數據,采用雙樣本K-S 檢驗的方法,對分布無顯著差異的閘機口進行合并,形成新的出站口,并采用對數正態分布進行擬合。擬合結果如表2、3 所示,其中經2 號線元通車站換乘至新街口并且從編號為B1 出站口出站的參考乘客,其下車出站時間差概率分布如圖5 所示。

表2 2號線新街口站各出站口擬合參數Tab.2 Fitting parameters for each exit of the Xinjiekou Station of Line 2

表3 1號線新街口站各出站口擬合參數Tab.3 Fitting parameters for each exit of the Xinjiekou Station of Line 1

圖5 2號線新街口站B1出站口參考乘客下車出站時間差分布Fig.5 Distribution for time difference between alighting and departure is the references for Exit B1 at Xinjiekou Station of Line 2
選取2019 年3 月29 日南京地鐵AFC 記錄的乘客刷卡數據,從中提取從龍華路-新街口站的出行記錄,共409 條,按上述方法確定乘客的路徑選擇,結果如表4 所示。選擇從2 號線元通車站換乘的乘客占79.22%,而選擇1 號線安德門站換乘的乘客占20.78%。根據兩換乘站的換乘步行距離,從元通站換乘步行距離為54 m,而從安德門站換乘,步行距離為193 m,上述分配結果符合乘客的日常出行習慣,有一定參考價值。

表4 龍華路至新街口站客流分配情況Tab.4 Passenger f low assignment of Longhua Road to Xinjiekou Station
本文利用AFC 記錄的交易信息及列車運行時刻表信息,建立路網仿真模型,找到乘客所有可能的出行時間鏈,并參考乘客的出行時間特征,篩選出其余乘客最可能的出行路線,以此來完成多路徑OD 對間的客流分配。該客流分配方案以歷史客流數據標定模型中的參數,且能夠針對單個乘客判斷其具體出行路徑,克服了傳統分配模型中大量的基礎數據調查與只考慮群體路徑選擇的不足,其結果更具有可靠性。