黃天印 徐文潔 陸林華 趙時旻
(1.上海申通地鐵集團有限公司,201103,上海; 2.上海久譽軟件系統有限公司,200233,上海∥第一作者,高級工程師)
?
基于移動實時位置信令數據的軌道交通換乘行為分析
黃天印1徐文潔1陸林華2趙時旻1
(1.上海申通地鐵集團有限公司,201103,上海; 2.上海久譽軟件系統有限公司,200233,上海∥第一作者,高級工程師)
介紹了上海軌道交通清分規則。在現有上海軌道交通K條最短路徑的清分算法基礎上,融合移動實時位置信令(OIDD)數據,對換乘行為中的主要換乘路徑選擇比例進行精細化設置,并對次要換乘路徑的換乘比例算法作出補充。通過對乘客行為的分析和應用,實現了對現有上海軌道交通清分規則中換乘路徑比例的精細化計算。
軌道交通; 移動實時位置信令數據;K條最短路徑; 清分算法
First-author′s address Shanghai Shentong Metro Group Co., Ltd.,201103,Shanghai,China
2016年,上海城市軌道交通路網總長度達617 km,包括14條線路和366座車站。其中,換乘車站有51座。隨著上海城市軌道交通出行路線選擇的多樣化,客流出行模式從先前的同線出行或一次換乘出行轉變為同線出行、一次換乘為主、多次換乘為輔的混合模式。這種模式的轉變使軌道交通運營方對軌道交通換乘客流及票價清分的精細程度提出了更高要求。
上海軌道交通票務的清分模型主要依據基礎數據建立、路網路徑選擇和路徑比例分配等3部分內容。基礎數據主要包括線路與車站名、站間距、區域表、換乘站設定、換乘步行時間、列車平均行駛速度、收益方及比例、擁擠系數等[1]。路網路徑選擇采用基于Dijkstra算法的K條最短路徑法(KSP)。首先,通過Dijkstra算法計算K條路徑;然后,結合“換乘權”優化處理,剔除大于最小路徑(計算權)1.5倍的路徑,從而得到每對OD記錄(起終點間的出行量)最多K條路徑(包含換乘次數、總權重、實權、虛權、計算權)。通過使用“正態分布方式”可得到各路徑比例[2-3]。
現有的上海軌道交通的清分模型是基于經驗權重值計算的概率分布模型,其在換乘路徑比例(即選擇某換乘路徑的客流量占總換乘客流量的比例)的精細化程度上有進一步提升的空間。
本文所使用的數據資源覆蓋時間范圍從2015年4月1日至2015年4月30日,包括近27萬條電信OIDD (移動實時位置信令)數據,近4億條檢售票系統交易數據,以及近340萬條ATS (列車自動監視)系統數據及軌道交通運營計劃圖數據。
理解乘客出行的路徑選擇行為是一個重要的研究方向[5-8],其研究成果可應用于許多場景。
交通領域中很早就有人對這一問題進行了研究。典型的研究模型為UE (單位經濟)模型[9]和MPS (物質產品平衡表體系)模型[10]。然而,許多已有工作多是基于經驗的模型假設,缺乏數據支持[11-12]。隨著智能交通卡廣泛使用而生成的大量數據有助于進一步解決這一問題。在城市軌道交通中,智能交通卡數據不同于GPS (全球定位系統),某個OD (起訖)對間的乘客換乘選擇是沒有被記錄的,所以不能直接從數據中得到的結果。
文獻[13]利用經驗模型作為先驗知識,提出了一種基于貝葉斯推理的框架來解決路徑選擇這一問題。文獻[14]利用遺傳算法對路徑選擇問題進行了優化處理。這類方法結合了歷史數據,其模型精度較基于經驗的模型有較大提升。但是,不可避免的,這些方法均以經驗模型作為先驗知識,故在一定程度上仍會受到經驗的影響。
文獻[15]在預先知道特定OD對候選路徑的情況下,通過K-means聚類方法,統計不同路徑上的乘客數量,從而得到乘客路徑選擇的結果。文獻[16]將乘客的刷卡數據與城市軌道交通的營運時刻表相結合,從而識別乘客的換乘行為。這類方法避免了先驗知識的影響,但處理數據稀疏的OD對時,其模型的準確度會受到影響。
大量的OIDD數據可為城市軌道交通乘客匹配精確的位置信息,為實現乘客換乘行為的識別提供了支持。
3.1 OIDD數據
OIDD數據涵蓋了用戶手機聯絡基站的時間、基站號、聯扇區號、開關機信息等。在有通信行為時,手機還可通過心跳方式定期與基站聯絡,產生OIDD數據。也就是說,即使用戶沒有任何通信行為,只要開機,就可定期獲得用戶的大致位置。
使用OIDD數據,可在一定的時間周期內估測任意區域內的人數,可估測任意區域或路線上的人流車流,可用于分析大型活動期間人流的來源、去向及公交換乘鏈等信息,可根據電話歸屬地和用戶注冊信息來分辨本地用戶或外地游客。
3.2 OIDD數據的設備定位方法
目前,根據OIDD數據進行設備定位主要采用COO(cell of origin)方法,即通過單個基站ID(cell ID)定位。該方法計算簡單,速度極快。但定位精度與基站的覆蓋半徑R有關(如圖1所示)。監測區域內基站分為宏站、街道站和微站。利用COO方法進行定位時,如數據來自宏站,則誤差相對較大;如來自街道站和微站,則精度相對較高。
通過優化COO方法可進一步提高了OIDD數據定位精度。優化方法主要利用了信號跳變,并基于以下三個假設條件:①信號跳變由目標的移動引起,而非干擾;②任何基站的覆蓋范圍及信號發射強度相同,且不受建筑物和天氣因素的影響;③周邊建筑物、電網及電力電子設備等對電磁波無干擾。
優化后,OIDD定位時,設某人的周圍有k個基站,且基站的坐標集為 {P1(x1,y1),P2(x2,y2),…,Pk(xk,yk)}。其中,Pi代表第i個基站,(xi,yi)表示第i個基站的經緯度坐標。在某一段時間內,此人的手機信號在這k個基站間來回跳變。由優化方法的假設可得,當信號在2個基站間跳變時,人所在位置在平面上的分布必為對稱分布,且位置的期望必為兩基站連線的中心,從而實現定位(如圖2所示)。

圖1 COO定位方法

圖2 當信號在2個基站間跳變時的定位
3.3 基于OIDD的乘客OD數據統計
在OIDD數據基礎上,可進一步分析統計乘客換乘出行OD數據。具體的計算方法及步驟如下。
步驟1:從OIDD數據中抽取在城市軌道交通起始車站及其周圍出現的數據集{O1,O2,…,Oi}。
步驟2:按步驟1的方法抽取在目的地車站及其周圍出現的數據集{D1,D2,…,Di}。
步驟3:找出步驟1和步驟2所得數據的交集σ={O1,O2,…,Oi}∩{D1,D2,…,Di},即可找出從起始站上車和目的地站下車的人。
步驟4:根據步驟3的數據交集σ,分析出現在目的車站及其周圍的時間和出現在起始車站及其周圍的時間,并抽取時間間隔在15~90 min范圍內的數據集R={σt1,σt2,…,σti},15 min≤ti≤90 min;
步驟5:將一天按5 min刻度劃分為288個等級,將滿足步驟4的數據集分別劃分到這288個等級中,并統計各個等級中不同的數據集量值。最終即可得到基于OIDD數據的分時段OD客流。
其中,步驟3起始站上車和目的站下車的判斷規則為:如該人從起始車站及其周圍出現前60 min內沒有出現在其他車站,則視為該人為從起始車站上車;當該人從目的車站及周圍出現后的60 min內沒有出現在其他車站,則視為該人為從目的車站下車。
3.4 OD數據的匹配處理
不同年齡的人具有不一樣的移動終端設備使用習慣。小孩、老人與青年人相比較差異性很大。此外,人們使用手機的行為或習慣也不一致。有些人手機常關機或手機通話較少。而且手機數據采集技術本身也會漏抓部分數據。因此基于手機數據的出行行為分析針對的人群并不能表示總體人群。因此,需要將抽樣數據擴樣至總體人群的出行數據,進而反映總體人群的出行特征與出行規律[4]。
以上海軌道交通九亭站至人民廣場站(以下簡為“九亭—人民廣場”)的路徑為例分析,將在該路徑上涉及的相關換乘車站電信基站作為采樣基站。則詳細統計結果如表1所示。

表1 九亭—人民廣場路徑基站數量統計
以2015年4月期間九亭—人民廣場的OIDD數據作為擴樣樣本數據。首先,根據城市軌道交通的運營時間,將OIDD數據整理出OD數據;然后,將得到的結果與九亭—人民廣場的售檢票系統OD數據進行對比。對比結果如圖3所示。
售檢票系統數據處理采用多層擴樣模型。以軌道交通售檢票系統數據作為基準數據,先以單日樣本進行擴樣計算,再通過時間序列平滑法得到月平均擴樣值。
時間序列是數理統計的重要分支,在經濟發展和工業建設方面有著重要應用。時間序列是指在研究過程中,在一系列時刻(t1,t2,…,tn)對某1個或1組變量進行測量,得到的測量值序列。

圖3 2015年九亭—人民廣場基于售檢票系統OD數據與基于OIDD的OD數據對比
時間序列平滑法是指用平均的方法,把時間序列中的隨機波動剔除掉,使序列變得比較平滑,以反映出其基本軌跡,并結合一定的模型得到目標計算值。時間序列平滑法所用平均數可以是簡單平均數,也可以是加權平均數。在第一次平均計算之后,就局部而言,還可進行第二次、第三次以至更多次的平均計算,以實現多層次的平滑。時間序列平滑法計算如式(1)所示。
F(T+1)=(1/N)×∑X(I)
(1)
式中:
X(I)——時間序列的第I期實際值;
F(T+1)——目標計算值;
T——當前時刻;
T+1——目標時刻;
N——平均個數。
通過對擴樣值的平滑平均計算,即可得到合適的擴樣比例。以2015年4月期間九亭—人民廣場的OD數據為例分析,得到擴樣值序列如表2所示。根據表2及式(1)可得,平均擴樣比例為1∶6.95。
3.5 融合OIDD數據后的換乘路徑比例
以九亭—人民廣場路徑為例,根據K條最短路徑法計算可得,到九亭—人民廣場可選擇的換乘路徑為9號線換乘1號線(徐家匯站換乘),9號線換乘8號線(陸家浜路站換乘),9號線換乘7號線(肇嘉浜路站換乘)再換乘2號線(靜安寺站換乘),9號線換乘3/4號線(宜山路站)再換乘2號線(中山公園站換乘)。
對九亭—人民廣場的IODD數據進行采集分析,得到不同的換乘路徑比例(見圖4)。

表2 基于售檢票系統的數據OD和基于OIDD的OD數據擴樣值及擴樣比

圖4 2015年4月九亭—人民廣場換乘路徑比例
分別通過現有上海軌道交通清分算法,以及IODD數據權重分析后的清分模型,可計算得到九亭—人民廣場的換乘路徑比例(如表3所示)。

表3 通過不同計算依據得到的換乘路徑比例
由表3可見,按現有清分規則,選擇在陸家浜路站換乘8號線及在徐家匯站換乘1號線的客流量各占總客流量的50%,而選擇在肇嘉浜路站換乘7號線和在宜山路站換乘3、4號線的比例均為0。這顯然不符合實際情況。
因此,基于OIDD數據計算的結果更精細,而且在二次換乘的路徑比例設置上也有補充。
4.1 時段的劃分
由于乘客在不同的時段(如工作日、節假日,或高峰時段、其他時段等),其出行的目的和對出行的路徑選擇會有差異。因此,軌道交通線路的換乘比例也會變化。根據工作日和非工作日上海軌道交通各線路的換乘情況,工作日的乘客換乘比例通常比非工作日高出約10% (如圖5所示)。

圖5 工作日及非工作日上海軌道交通各線路換乘比例
在工作日期間,高峰時段(6:30—9:30及17:00—19:00)的出行客流量是低峰時段(除高峰時段外的其他時段)的1.6倍左右。而且,高峰時段的乘客出行目的與低峰時段不同,乘客對于換乘路徑的選擇也可能存在差異。針對這種情況,本文采用融合OIDD數據的計算方法,對工作日、非工作日,以及工作日中不同時段的換乘比例進一步研究。
以九亭—人民廣場為OD段,分別統計工作日及非工作日的換乘比例。
分析高低峰客流換乘情況采用的方法是將OIDD客流密度擴樣數據根據0.5 h時間維度進行細分。然后,以6:30—9:30及17:00—19:00作為高峰時段,其余時段作為低峰時段進行分析。
4.2 處理邏輯
對OIDD數據處理邏輯查詢包含3層嵌套。
(1) 第1層嵌套。對九亭—人民廣場基于OIDD的OD客流量數據表進行處理,獲取記錄中的進站代碼、日期、高低峰標志、進站時間、站點1代碼、站點1經過時間、站點2代碼、站點2經過時間、出站時間、客流量、換乘標志、30 min進站時間標示ID (將時間折算成以30 min為間隔的進位取整的整數)等字段。
(2) 第2層嵌套將第1層嵌套查詢得到的記錄,以日期、換乘標志及時間ID為維度來統計符合條件記錄的客流總量。
(3) 第3層嵌套將第2層嵌套查詢到的記錄,以起始時間、結束時間、換乘標志及高低峰標志等維度來統計客流總量。
(4) 最外層將第3層嵌套查詢到的記錄,以換乘標志、高低峰標志、起始時間,結束時間及客流量等維度統計客流總量,以及不同換乘線路在高低峰時段的客流量占比情況。得到的數據結果(部分)如圖6所示。

注:TYPE_NAME表示換乘線路名稱;PEAK_NAME為高低峰標志;BEGIN_RANGE為起始時間;END_RANGE為結束時間;CUST_CNT為客流量;offpeak為低峰時段peak為高峰時段
根據圖6所示的數據,計算換乘路徑比例,得到的結果如表4所示。

表4 基于OIDD數據計算得到的九亭—人民廣場高低峰時段乘客換乘路徑比例
同樣,將基于OIDD的客流密度數據按工作日及非工作日的時間維度進行劃分,并根據劃分結果計算,即可得到換乘路徑比例情況(如表5所示)。

表5 基于OIDD數據的九亭—人民廣場工作日及非工作日乘客換乘路徑比例
由表5可以看出,乘客的出行選擇會隨著時段的不同而發生變化。研究換乘路徑比例在不同時段的變化情況,對未來上海軌道交通的清分規則中換乘比例分配的精細化發展是有幫助的。
本文將OIDD實測數據融入清分算法分配的權重設置中。一方面可驗證現有分配比例的正確性和合理性,對現有的清分算法換乘路徑比例分配算法形成補充,使得現有清分規則無論在主要換乘路徑還是次要換乘路徑上的比例分配都能更為精細;另一方面也可對不同場景下的換乘路徑比例進行細分,為未來上海清分系統分時段調整換乘路徑比例提供數據參考。
未來,還將通過OIDD數據計算全路網的換乘比例,并結合現有的軌道交通刷卡的OD數據、軌道交通ATS數據(包括進站時間、出站時間、上下行方向等)、列車滿載量、車站容積率等數據,相對精確地計算出城市軌道交通客流的移動情況、客流在站臺的積壓程度及列車的滿載率等數據。這些數據對于城市軌道交通運營方的客運組織、大客流應對,以及運能效率的規劃均有較大的參考價值。
[1] 殷錫金.軌道交通網絡客流清分規則與“鑒識車票乘車路徑”理論[J].軌道交通,2009(12):44.
[2] 韋強,謝宗毅,諸仕榮,等.基于概率模型的軌道交通清分算法[J].城市軌道交通研究,2009(12):43-46.
[3] 顧佳源.城市軌道交通清分算法的介紹與比較[C]//中國土木工程學會城市軌道交通技術推廣委員會.城市軌道交通關鍵技術論壇暨地鐵學術交流會.上海:上海申通地鐵集團有限公司,2010.
[4] 冉江宇,過秀成,何小洲.基于出行鏈的OD擴樣方法研究[J].交通運輸工程與信息學報,2010(6):37.
[5] LIU C,QU Q.Trip fare estimation study from taxi routing behaviors and localizing traces[C]//IEEE International Conference on Data Mining Workshop.Atlantic City,NJ:IEEE,2015:1109-1116.
[6] WU H,MAO J,SUN W,et al.Probabilistic robust route recovery with spatio-temporal dynamics[C]// ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco:ACM,2016:1915-1924.
[7] LI M,AHMED A,SMOMLA A J.Inferring movement trajectories from GPS snippets[C]//Eighth ACM International Conference on Web Search and Data Mining.San Francisco:ACM,2015:325-334.
[8] SU H,ZHENG K,HUANG J,et al.Calibrating trajectory data for spatio-temporal similarity analysis[J].The VLDB Journal,2015,24(1):93-116.
[9] WARDROP J G.Some theoretical aspects of road traffic research[J].OR,1952,1(3):325-362.
[10] DIAL R B.A probabilistic multipath traffic assignment model which obviates path enumeration[J].Transportation research,1971,5(2):83-111.
[11] NAKAYAMA S,KITAMURA R.Route choice model with inductive learning[J].Transportation Research Record Journal of the Transportation Research Board,2000(1725):63-70 .
[12] TALAAT H,ABDULHAI B.Modeling driver psychological deliberation during dynamic route selection processes[C]//Intelligent Transportation Systems Conference,2006.Toronto:IEEE,2006:695-700.
[13] SUN L,LU Y,JIN J G,et al.An integrated bayesian approach for passenger flow assignment in metro networks[J].Transportation Research Part C Emerging Technologies,2015,52:116-131.
[14] ZHU H W,HU H,HUANG Z.Calibrating rail transit assignment models with genetic algorithm and automated fare collection data[J].Computer-Aided Civil and Infrastructure Engineering,2014,29(7):518-530.
[15] FU X,LENG B,XIONG Z.Metro traffic route assignment using K-means clustering[C]// International Conference on Electronics,Communications and Control.Ningbo:IEEE,2011:902-905.
[16] ZHAO J,ZHANG F,TU L,et al.Estimation of passenger route choice pattern using smart card data for complex metro systems[J].IEEE Transactions on Intelligent Transportation Systems,2016,(99):1-12.
Analysis of Rail Transit Transfer Behavior Based on Real-time Location of Signaling Data
HUANG Tianyin, XU Wenjie, LU Linhua, ZHAO Shimin
The clearing rules of Shanghai rail transit is introduced.Based on Shanghai metro clearing algorithm——K shortest path,and combined with OIDD data,a better set in the main transfer path selection is made and the ratio of the secondary transfer path selection is replenished.Through analysis of passenger transfer behavior in rail transit,the fine calculation of transfer path selection ratio in Shanghai rail transit clearing rules has been achieved.
rail transit; OIDD;Kshortest path; clearing algorithm
U293.13
10.16037/j.1007-869x.2017.06.011
2016-01-01)