黃練 唐小淋 林鈺龍 詹承志



摘要:一卡通數據記錄了乘客的出行地點、時間信息,可反映城市居民公交出行的總體特征。文章提出了基于刷卡數據的常規公交、地鐵客流計算方法,結合深圳市實際刷卡數據,分析了公交客流的時段分布特征、線路與站點特征和接駁換乘特征,可為行業主管部門優化公交線網、提升公眾出行服務提供決策依據。
關鍵詞:公交客流;一卡通數據;時空特征分析;客流分析;公共交通 文獻標識碼:A
中圖分類號:U23 文章編號:1009-2374(2016)17-0087-03 DOI:10.13535/j.cnki.11-4406/n.2016.17.042
1 概述
隨著物聯網技術的不斷發展,公交一卡通在國內大量城市得到了廣泛應用,持卡出行的居民占比持續增加,一卡通刷卡數據作為公交乘客出行行為的記錄,通過與城市智能公交系統其他動靜態信息的結合,經過挖掘分析后,可為公交線網規劃、企業運營管理和市民出行服務提供決策依據。
本文基于一卡通數據,將乘客的一次出行劃分為上車、經過、下車/出站、換乘四類基礎行為,通過公交到站時間計算、公交乘客上下車站點匹配、地鐵乘客上下車站點識別等數據處理模塊,從時間和空間維度展開,挖掘分析常規公交和地鐵客流時空分布規律。
2 常規公交客流計算算法
隨著衛星定位數據的發展與廣泛應用,公車GPS數據已經成為輔助城市公交管理的重要數據基礎。本文綜合分析一卡通數據與公交GPS數據,識別乘客上下車點,實現常規公交的客流統計。
2.1 到站時間計算
公交車GPS數據包含有公交車的空間位置與速度信息,需要結合站點位置數據計算到站時間。首先,基于線路軌跡相似度分析確定車輛運行的實際線路;其次,通過計算連續GPS點的時空關系確定車輛運行方向;最后,以線路和方向為約束條件計算GPS軌跡點與各站點位置的距離,識別GPS點所在的站點區間,并取距離站點最近的軌跡點為進站點,記錄到站時間。
2.2 乘客上車站點匹配
得到了公交的到站信息后,可通過與一卡通數據融合,確定乘客的上車站點。深圳一卡通刷卡數據通過設備編碼號實現與特定車牌的關聯,因此可根據車牌和時間兩個關鍵字段判斷乘客上車站點,算法流程如下:(1)讀取當天深圳一卡通清洗后的數據和當天公交到站數據;(2)根據兩個數據表中的車牌號,篩選出深圳通數據中每一條刷卡記錄所乘坐的車輛的全天到站時間表;(3)選取到站時間和刷卡記錄中刷卡時間最近的一對,將對應的站點作為此乘客的真實上車站點。
2.3 乘客下車站點估計
由于深圳公交采取單次刷卡制,本文基于出行鏈估計推斷乘客下車站點。由于公交乘客在工作日出行呈現明顯的潮汐特性,故算法通過聚類分析識別公交乘客可能的居住地、工作地,進一步提升下車站點識別的可靠度,總體流程如下:(1)將每位乘客的刷卡記錄按照時間排序,將相鄰的兩條記錄合并為一條;(2)對于合并后的記錄,將距離第二次乘車的上車站點最近的第一次乘車方向的站點作為其第一次乘車的下車站點,同時去除距離大于2000米的數據;(3)取每位乘客每天的第一次上車站點刷卡站點作為可能的居住地站點;(4)取工作日與第一次刷卡記錄相鄰刷卡時間差大于3小時的第二次刷卡站點作為可能工作站點;(5)聚類分析一個月每位乘客的可能居住地和工作地站點,計數排序,取最可能的居住地/工作站點作為其最終居住地/工作站點;(6)對于乘客每天的最后一條刷卡記錄,若乘車時間處于工作日6∶00~8∶00/16∶00~18∶00,則其下車站點為其工作地/居住地。
3 地鐵客流計算模型
深圳地鐵乘客的進出站需要刷卡兩次,且通過設備編號與站點關聯,一卡通刷卡數據記錄了每位乘客的進出站時間、地點等交易信息。將當天地鐵乘客的刷卡記錄(進站、出站)按照時間排序,取第一、第二條記錄為進站、出站標識,保留進出站時間差小于3小時、進出站站點不相同的記錄,可判斷地鐵乘客的進出站點情況。
由于地鐵軌道網絡存在大量的站內換乘,當進出站之間有多條路徑可選擇時,乘客選擇的具體線路無從得知,為客流統計分析帶來困難。本文基于一卡通刷卡出行時刻和時間間隔,建立客流分配模型與算法,推斷出行者在軌道交通網絡中的出行路徑,實現城市軌道交通客流量的精確分配,步驟如下:
步驟1:讀取同一張卡ID下的相鄰兩個進站/出站記錄,通過進站和出站的車站代碼獲得出行的起訖點,即出行OD對。若該OD之間只存在一條可達路徑,則該路徑為出行路徑;若OD之間存在多條路徑,進入多路徑選擇的判斷過程。
步驟2:在多路徑選擇過程中,若該OD對是位于同一線路上且離進站時刻最近的發車班次和離出站時刻最近的進站班次相同,則認為出行過程沒有換乘。
步驟3:若進出站時的列車班次不一致,則認為中途發生換乘行為,進行換乘情況下的多路徑選擇的判斷過程,計算各條路徑所需的最短時間,最短出行時間通常定義為列車運行的必要時間與正常快速通過進出站和換乘通道所需的時間。
步驟4:若離進站時刻最近的合理發車班次和離出站時刻最近的進站班次所屬的運行線路有直接換乘站,且兩車發車間隔足夠通過換乘通道,則確定出行路徑,若兩條線路出現多次交匯,需結合運營時間來判斷出行路徑。
步驟5:若進站的線路和出站的線路需要經過兩次以上的換乘,判斷第一次換乘后所乘列車到達第二次換乘站的時刻與出站所乘列車班次的換乘是否合理,如不合理,則循環判斷兩個換乘站之間所有可能的列車班次,若存在多條可換乘的路徑,依次循環判斷最終找到合理路徑,并完成客流分配及統計。
4 深圳市公共交通客流特征分析
截至2015年底,深圳累計發放一卡通2600萬張,本文基于2015年9月的實際刷卡數據分析深圳市公共交通客流特征。
4.1 時間分布特征
常規公交和地鐵作為城市公共交通的兩個主要方式,承載了深圳市近90%的公共交通出行。從一周客流的分布來看,常規公交和地鐵的工作日客流高于雙休日,周一和周五的客流量高于其他工作日,常規公交、地鐵的日均客流量占比約為4∶6,地鐵日客流量和常規公交日客流量的皮爾遜相關系數r=0.60,兩者存在一定正相關關系。
如圖1所示,常規公交及地鐵的工作日分時客流量呈顯著雙峰現象,早高峰集中在7∶00~9∶00,晚高峰集中在17∶00~20∶00。高峰時段常規公交的小時客流量達35萬人次/小時,地鐵的高峰小時客流量達25萬人次/小時。周末各時段客流量與工作日平峰客流量基本持平,客流量總體少于工作日客流量。
4.2 空間分布特征
深圳地鐵共包含五條運營線路,從工作日地鐵各線路日均客流量來看,1號線客流量占比最大達35%,其次為3號線,2號線的客流量占比最小為11%,如圖2(a)所示,選取早晚高峰客流量均超2000人次/小時的站點為地鐵高峰時段繁忙站點,分布如圖2(b)所示。
以1km2的網格將深圳市市區劃分為1995個區域,早高峰時段和晚高峰時段小時出行量分布如圖3所示,早高峰出發區域和晚高峰到達區域客流量大于4000人次/小時基本重合,客流呈現較為明顯的潮汐分布特征。
4.3 接駁客流特征
以一卡通ID為關鍵字,時序分析乘客常規公交和地鐵上下客點,可實現常規公交和地鐵接駁客流識別與特征分析。如圖4所示,從常規公交和地鐵間換乘出行的換乘距離概率密度分布曲線來看,70%的換乘時間在10分鐘以內,90%的接駁換乘距離在700米范圍內。
以換乘步行距離700米為閾值,統計各地鐵車站換乘出行距離大于閾值的客流量(如圖5所示),清湖、布吉站換乘步行距離大于700米的換乘客流量超5000人次/小時,大芬、木棉灣站換乘步行距離大于700米的換乘客流量超4000人次/小時,其余站點遠距離換乘出行量較少,總體而言深圳市的地鐵站點分布和公交站點分布具有較好的接駁換乘服務水平。
5 結語
本文基于一卡通數據,提出常規公交、地鐵客流的計算方法,通過刷卡數據的時空信息與公交線網空間信息的匹配,實現了站點、線路、換乘客流的識別和統計。結合深圳市實際數據的挖掘分析,揭示了常規公交客流和地鐵客流的正相關關系,識別了早晚高峰、工作日非工作日的客流演變特征和城市通勤流向特征。通過海量出行數據的統計分布,提出了10分鐘、700米的換乘服務評估基礎指標,為進一步改善公交線網設置、提升出行服務水平提供了決策依據。
參考文獻
[1] 陳學武,戴霄,陳茜.公交IC卡信息采集、分析與應用研究[J].土木工程學報,2004,37(2).
[2] 陳學武,李海波,侯現耀.城市公交IC卡數據分析方法及應用[M].北京:科學出版社,2014.
[3] 周崇華.基于IC卡數據的深圳地鐵OD信息處理技術[J].城市軌道交通研究,2007,(1).
[4] 羅磊.基于IC卡信息的公交客流空間分布特征分析方法研究[D].東南大學,2006.
[5] 陳素平.基于數據自動采集的公交系統服務瓶頸診斷方法[D].東南大學,2010.
[6] 李海波,陳學武,陳崢嶸.基于公交IC卡數據的乘客出行時間特征研究[A].2013年中國城市交通規劃年會論文集[C].2014.
作者簡介:黃練(1982-),男,湖北武漢人,深圳市綜合交通運行指揮中心工程師,博士,研究方向:交通數據
分析。
(責任編輯:小 燕)