張欣環, 吳一昊, 吳金洪, 許明明, 毛程遠
(1.浙江師范大學 道路與交通工程研究中心,浙江 金華 321004;2.金華市公安局 交通警察支隊,浙江 金華 321000;3.寧波市公共交通客運管理局,浙江 寧波 315040)
公交客流分析是公交出行需求辨識、線網評估與優化,以及公交優先發展政策制定和實施的基礎.乘客出行、公交線網客流數據的傳統調查方法成本較高,受限于調查技術和調查誤差,精度難以保證,已有的單源數據(IC卡等)都不同程度地存在一定的局限性.現階段,公交IC卡、GPS系統的推廣使用,使得低成本的自動化采集海量多源數據成為可能,并為公交客流特征的提取奠定了良好的數據基礎.
目前,對公交客流特征的研究過于單一和理論化,且大多應用于廣義公交領域:蔡文學等[1]提出基于公交線網、GPS數據等多源數據構建公交旅行時間計算模型;呂玉坤[2]挖掘多源海量數據,推導出公交乘客的出行鏈模型;田源[3]以公交車GPS、IC卡數據為主,構建了以站點、路段和線路為準則層面的公交評價指標體系;余慶等[4]以深圳市為案例,基于公交IC卡、微博簽到數據等多源數據,構建了公交客流規模模型;王俊兵等[5-8]以IC卡、AFC等數據為主,關聯匹配各項數據后提取公共交通出行鏈,進而對公交客流進行分析.可以看出,目前還沒有一套完整的常規公交多源數據處理方法,難以獲取完整的客流信息;缺乏對常規公交數據整體深度挖掘和應用的研究,不適用于實際應用.
本文通過對多源異構數據的匹配與處理,構建客流特征分析的數據基礎;在客流特征信息提取過程中,提出了在判別過程中的合理匹配閾值、識別刷卡站點及匹配出行起訖點的方法與流程,建立基于多源數據的常規公交客流識別模型,充分考慮提取方法實際應用的可行性,所得成果有利于提高常規公交服務的可靠性,可實現乘客個體出行過程的再現并完成常規公交客流特征提取分析,對于后期公交運營計劃的調整、城市出行結構的優化具有重要的理論意義和應用價值.
通常,常規公交IC卡數據共有多個字段,包含了車輛編號、刷卡時間、刷卡時的經緯度等信息.根據不同的統計分析目的,從原始數據庫中抽取部分字段進行后續的融合、推斷.公交IC卡刷卡數據記錄了每位乘客單次乘車刷卡的詳細信息,本次研究提取金華市2018年3月1日全天的出行記錄,全天共有6.3萬余條記錄,數據結構如表1所示.

表1 公交IC卡部分數據
車載GPS終端實時采集公交定位數據,原始數據中每條記錄包含了車輛編號、經緯度、行程編號等多個信息.根據分析要求,從數據倉庫中選擇不同字段數據進行預處理.結合GPS、IC卡、線路站點等數據可以推斷上下站點、公交OD等信息.從原始數據中提取的公交車GPS數據,包含6個字段(車輛編號、車牌號、經度、緯度、時刻及所屬線路等),可以實時跟蹤車輛所處位置.
為進一步進行后續分析,本文將公交GPS數據(共計304萬條記錄)作進一步處理,獲得車輛到離站信息表(約14.5萬條記錄,數據結構如表2所示),這些記錄包括車輛編號、對應線路、上下行、站點編號、站點名稱、到離站時間等信息.

表2 公交車輛到離站數據
本次調查總共覆蓋了732臺公交車輛全天到離站數據,涵蓋140條線路(市區70條,城鄉70條),線路抽樣率80%(市區100%,城鄉67%),未覆蓋線路客流占全天客流的比例僅為4.3%,基本實現全市公交線路全覆蓋.
2.1.1 數據處理流程
數據處理流程如下:
1)基于ArcGIS的公交網絡的拓撲表達;
2)結合GPS數據獲得每一個IC刷卡點對應的公交線路行車路徑(Pattern)、在公交網絡上的位置(偏移量);
3)針對每一個公交線路行車路徑估算出車輛的進、出站時間,從而得到每個路段(transit link)上的旅行時間和站點停留時間;
4)將所有的路段旅行時間、站點停留時間一一對應到(分配到)公交網絡上.
2.1.2 基本時間特征
根據公交車輛運行特點,將公交車在相鄰站點間運行的時間進行分解,刷卡間隔分布如圖1所示,且具有以下特征:

圖1 刷卡間隔分布
1)站內最短刷卡間隔時間的平均值:根據每個站點站內最短刷卡間隔時間tmin(i,i),求得它們的平均值tmean(i,i).數據分析中,“IC卡刷卡數據是否發生在同一站點”為關鍵點,通常用刷卡間隔作為判斷依據.本調查中,抽取部分線路共4 265例刷卡間隔有效數據,得tmean(i,i)為22.5 s.
2)相鄰站點間最短刷卡間隔時間的平均值:根據相鄰站點間最短刷卡間隔時間tmin(i,i+1),求得它們的平均值tmean(i,i+1).如圖1虛線所示,數據基本呈正態分布,得tmean(i,i+1)為163.7 s.
3)判斷依據:可在兩曲線重疊部分選取一個特定值,作為判斷“IC卡刷卡數據是否發生在同一站點”的依據,因此刷卡間隔取72.0 s作為判斷閾值較為合適.
2.2.1 上車站點判斷
上車站點的判斷是完成進一步的乘客出行特征分析的前提和數據準備,是公交IC數據處理的關鍵環節.本文在對IC卡數據特點進行分析的基礎上,應用Oracle軟件編程解決了上車站點判斷問題.
1)數據準備.本文以其中一日刷卡數據作為基本分析數據段.在數據分析之前,需要從數據倉庫內的各類數據表中進一步對數據進行提取和篩選,只需提取需要用到的字段數據.
2)判斷流程.
①判斷思路.為匹配出公交乘客出行OD,需要推算出刷卡乘客的上車站點及下車站點.其中上車站點的推算較為簡單,先對IC卡數據進行時間聚類,將所有刷卡數據歸類到各個站點;通過IC卡、GPS數據表中的“刷卡時間”進行匹配,查找時間上最近的刷卡點;再結合公交線網GIS站點坐標,進行空間匹配.最終確定刷卡乘客的上車站點,如圖2所示.

圖2 數據處理流程
②判斷步驟.
步驟1:聚類分析.提取數據、排序后進行聚類處理,以刷卡間隔作為聚類依據,間隔較短的刷卡數據作為一組.
步驟2:最短刷卡間隔.設t(m,n)為任意兩組數據刷卡間隔,min[t(m,n)]為最短間隔,當min[t(m,n)]大于“相鄰站點間最短刷卡間隔min[t(i,i+1)]”時聚類停止[9].根據金華市常規公交基礎設施、刷卡數據等信息,本文取min[t(i,i+1)]為72.0 s.
步驟3:停靠時刻推算.公交車停靠時刻取公交車到達站點時刻與離開站點時刻的中間時刻,可用下式表示:
(1)
式(1)中:tS(n,i)表示公交車n在i站點的停靠時刻;tA(n,i)表示公交車n到達i站點的時刻;tD(n,i)表示公交車n離開i站點的時刻;tDW(n,i)表示公交車n在i站點的停留時間.
步驟4:時空匹配.計算站點停靠時刻后,搜索與該停靠時刻最接近的IC卡,進而獲取該卡刷卡點的空間位置SW(i)(由刷卡時的經緯度坐標表示);進一步搜索與該刷卡點SW(i)在空間上最接近的站點ST(i)(站點經緯度數據在線網數據庫中獲取),當min(|SW(i)-ST(i)|)≤D時(|SW(i)-ST(i)|和D為空間距離,D可根據不同站臺設計尺寸確定,本案例取15 m),所取ST(i)對應的公交站點就被認為是刷卡站點,即上車站點.
2.2.2 數據剔除與歸并
當公交車在紅燈前或遇到交通事件時停止,且同時有乘客刷卡時,其數據表現形式就會與在公交站點發生的刷卡事件相同,在處理數據的過程中,極易將其認為是站點的停留時間.因此,在數據分析前需要將該部分數據剔除.
其判斷方法及步驟同確定上車站點時的類似.不同的是最后一步的判斷標準,即
D=min(|SW(i)-ST(i)|)>D0.
(2)
式(2)中,D0為一固定值,可取線路上公交站臺最大長度(本文取15 m).當D>D0時,即認為該部分數據不是站點停留時間,應當將其作為旅行時間的一部分,并將其從停留時間內剔除,歸并到路段旅行時間內.
為匹配出公交乘客出行OD,需要推算出刷卡乘客的上車站點及下車站點.原則上,城市居民一日內公交出行具有規律性,本文采用“基于出行鏈下車站點推導”方法進行下車站點推算[10].結合上、下車站點的信息,最終獲取公交OD數據,如表3所示.根據上下車站點算法,結合VBA編程,實現對于多次刷卡乘客的公交出行OD的分析.本文最終共獲得1.74萬人次一日內4.09萬次的公交出行OD記錄,占全日公交出行總次數的23.1%.經擴算后,得到常規公交出行OD.數據顯示:江南與江北之間的出行比例大于江北、江南各自東西向的出行,也說明公交方式在長距離出行中具有一定的優勢.

表3 公交OD部分數據
截止2018年6月,金華市公交集團共有營運車輛1 061臺,全部運營車輛均配備GPS監控設備及IC卡刷卡裝置,并可實時存儲GPS數據及刷卡數據;營運線路共計175條,2017年市區公交分擔率為20.2%,與國內其他城市相比稍顯滯后[11].
本文以金華市普通工作日(2018年3月1日)的常規公交多源數據為算例:一張IC卡對應一位乘客,結合IC、GPS、線路站點、調度數據等多源數據,獲取乘客公交出行特征、線網客流特征,統計分析常規公交客流特征.
3.2.1 總體出行特征
對分析時段內所有IC卡(含BRT、市區公交、
郊區公交)數據進行統計:
1)乘客組成:50%以上的公交乘客為本市居民,郊區線路中暫住人員、外來人員占比較高.
2)支付方式:IC卡使用率偏低,近6成乘客仍使用投幣方式,公交客源不穩定.
3)出行目的:公交乘客出行以上下班、生活購物為主.
3.2.2 出行時間分布
1)日出行時耗:公交日出行時間為39 min,平均乘車時間為26 min.金東區與婺城新區之間的平均出行時間為55~65 min,出行時間較長.
2)客流時間分布:根據當日分時段IC卡的數據統計,早晚高峰系數分別為14.1%和13.2%(7:15—8:15為早高峰,16:45—17:45為晚高峰);平峰時段的客流量為高峰時段的45.0%左右,客流時間分布如圖3所示.

圖3 客流出行時間分布
3.2.3 出行空間分布
公交乘客出行主要集中在東關、西關、江南、湖海塘等區域,一環內公交出行量占比82.4%.金東區塊公交出行量約6 500人次;婺城區等新區公交出行總量偏低,占全市公交出行量的比重較少.東西兩翼公交出行總量僅維持在1 800人次左右.
在全市范圍內選擇72條線路,乘距統計信息顯示,公交乘客平均乘次站點個數為12站,平均乘次起終點站間距為7.32 km,居民公交乘車距離較大.城區線路中有超過16.1%的公交線路乘客“平均站距/線路單程”的值高于0.5.這部分線路未來可以采用大站快車的形式提高運行效率.
3.3.1 集散點客流特征
通過IC卡數據選取公交客流較大的11個站點,統計各站點高峰乘降情況(早高峰時段7:15—9:15,晚高峰時段16:45—18:45).從公交客流集散點上下客人數匯總可以看出,金華站公交站點客流量最大,其次為人民廣場和金華商城.
集散點客流數據顯示:在早高峰時段(7:15—8:15),江北的上車乘客人數多于下車乘客人數,在晚高峰時段(17:00—18:00),江南呈現出上車乘客人數多于下車人數的特征,而江北的樞紐站——金華站和汽車東站,則呈現出上車人數多于下車人數的現象.
3.3.2 線網客流特征
目前,市區公交主流向及其斷面流量如圖4所示,八一南街、八一北街為南北向主干道,集中了39.2%的全日公交客流;與其他橋梁相比,通濟橋斷面公交客流量最大(占43.2%的全日公交客流),雙龍大橋的交通量和公交車流量排名第二,這2座橋為連接江南江北的主要交通走廊.通濟橋公交車占總交通量的比例低于7.0%,卻承載了30.0%的公交客流,雙龍大橋公交車交通量占總交通量的2.45%,分擔了10.18%的載客量.雙溪西路、人民路為東西走向次一級的公交走廊,全天雙向運量約19 500人次.

圖4 斷面客流分布圖
公交服務水平對吸引乘客出行具有重要作用.結合乘客問詢調查統計有以下特點:
1)公交換乘:結合IC卡分析顯示,公交出行的換乘系數為1.15,很好地滿足了大城市中城市換乘系數不大于1.5的規范要求.
2)服務半徑:公交出行時間長短對吸引乘客出行具有重要作用,金華市公交站點分布情況較好,居民步行10 min的距離內就有公交服務(10 min以內占比84%),并且下車后也只需10 min就可到達目的地(10 min以內占比87%).但是,各項數據表明,站點500 m服務半徑未達到90%,覆蓋率有進一步提高的空間.
3)運行速度:公交線路高峰時段的平均行程速度是20.1 km/h,平峰時段的平均行程速度為23.4 km/h,最低運行車速為13.2 km/h(K27路);K9路、K15路、K20路、K24路、K35路、K53路、Y6路等公交線路,由于運營線路主要集中在中心區,因此,平均車速均低于15 km/h;郊區的線路,如游7路、K1路、318路等,運營速度較高.
4)滿載率:選取各跨江斷面進行公交高峰滿載率調查,共獲得34條城區線路的高峰時段滿載率數據,如表4所示.高峰時段金華城區公交線路的負荷度平均值為0.51,還未達到飽和,高峰時段滿載率為0.6~0.7,較為適中.高峰時段滿載率過高會降低乘客的乘坐舒適性,導致乘客向其他出行方式轉移,惡化出行結構.

表4 高峰時段滿載率
5)乘客滿意度:公交意愿調查結果顯示,61%的乘客認為金華常規公交的總體情況良好,只有2%的乘客對公交系統表示不滿.乘客認為,金華公交系統主要存在以下問題:等車時間太長、線路繞行過多、沒有直達車、末班車收車過早、車速較慢等.
將多源信息融合技術應用于城市常規公交領域,實現對乘客的出行特征精準描述,探求城市常規公交系統的規律性,有利于找出常規公交存在的問題并進行改善,以提高乘客的出行體驗.
利用公交IC卡、GPS等多源數據獲取金華市常規公交客流數據,有利于后期公交運營計劃的改善、公交線網的調整、城市出行結構的優化.案例表明:基于多源數據的常規公交客流特征分析方法可行,其分析結果較傳統方法成本低,且實時性好,可以有效提高后續常規公交系統的分析評估精度.