聞 帥,黃正東
(深圳大學(xué)智慧城市研究院,廣東 深圳 518060)
優(yōu)先發(fā)展城市公共交通是我國城市發(fā)展的重要戰(zhàn)略。而隨著我國城市化進程的不斷發(fā)展,各大中城市公共交通所面臨的交通出行壓力與日俱增,城市公共交通出行擁擠的狀況也飽受詬病。而另一方面,城市公共交通運營單位也在持續(xù)虧損,必須依靠政府補貼才能維持正常運轉(zhuǎn)。如何提高公共交通運行效益而又保證較高的服務(wù)水平是一個難以取舍的難題。公汽滿載率是反映常規(guī)公交出行擁擠程度的指標(biāo),又是衡量線路運行效益的指標(biāo),對于公交規(guī)劃、車輛調(diào)度和服務(wù)評價也都是重要的參數(shù)。然而目前公汽滿載率的應(yīng)用,如在公交線路規(guī)劃、乘客體驗及服務(wù)評價,還主要靠人工調(diào)查獲取少量線路或站點的滿載率[1-2]。
隨著公交信息采集系統(tǒng)的完善和自動化,公交大數(shù)據(jù)的獲取越來越方便,應(yīng)用也越來越廣泛[3]。使用大數(shù)據(jù)分析和挖掘技術(shù)從IC卡刷卡數(shù)據(jù)、車輛GPS數(shù)據(jù)等公交大數(shù)據(jù)獲取準(zhǔn)確的公交出行OD(origin-destination),用以研究公共交通問題和其他城市問題是當(dāng)前的研究熱點。本文提出使用公交大數(shù)據(jù)推算公汽滿載率的方法,并以深圳市數(shù)據(jù)為例,推算全市大部分公共汽車的滿載率,最后應(yīng)用該數(shù)據(jù)對深圳市公汽101路的擁擠情況進行了試驗,證明該方法的可行性。該方法相比人工調(diào)查方法具有獲取范圍廣、獲取時段長、成本低、獲取便捷等優(yōu)勢,對公交線路規(guī)劃、公交調(diào)度、公交服務(wù)評價等方面的研究有重要的意義。
車輛滿載率是指線路最大斷面的客流量與同一斷面運輸能力的比較,即車廂內(nèi)實際乘客人數(shù)與車型額定載客量之比。公共汽車上標(biāo)識的額定載客量是按照國家《機動車運行安全技術(shù)條件》(GB 7258)的標(biāo)準(zhǔn),即由每人站立面積不小于0.125 m2的標(biāo)準(zhǔn)計算得來。由于此站立面積設(shè)置過小,基于額定載客量得到的滿載率一般不能真實反映乘客的舒適度,因此有學(xué)者提出了滿載率更加合理的表示方法。文獻[4]根據(jù)人體尺寸和心理安全空間計算得出一個合理的乘客站立面積(0.256 m2),并將其運用到公交調(diào)度模型的研究中去。文獻[5]依據(jù)單位平方米擁擠度提出了滿載率的分級表示法,以實際案例說明了其在公交線路規(guī)劃和服務(wù)評價的應(yīng)用。這些對滿載率的重新定義使得針對不同情況的公交問題研究更加科學(xué)合理,具有一定的學(xué)術(shù)價值和應(yīng)用意義。
深圳市在2017年底已經(jīng)實現(xiàn)了公汽的全部電動化,成為全球首個專營公汽全面電動化城市。全市運營的純電動公汽車輛大多為比亞迪K8車型。該車長度為10.5 m,標(biāo)定載客量87人,座位數(shù)31個。文獻[5]根據(jù)深圳市2013年較為常見的11 m大巴,車內(nèi)布局為“36座+5 m2站位”的結(jié)構(gòu),以76人為載客最大值,根據(jù)客舒適度將滿載率劃分為5個級別。其使用的車型大小和載客量與K8車型較相似,因此本文根據(jù)其滿載率級別對乘客舒適度的研究,把最大載客量設(shè)為較合理的值76。已有研究表明滿載率達到80%或站立達到4~5人將引起人們的不適[6],本文把滿載率大于80%視為高滿載率。與線路流量不同的是,滿載率體現(xiàn)的是以人為核心的表示方法,是乘客真實乘車體驗的指標(biāo)。過高的滿載率不但導(dǎo)致乘客出現(xiàn)不適,也將影響乘客對于出行線路的選擇[7-8]。準(zhǔn)確可靠的滿載率信息對于評價現(xiàn)狀公交服務(wù)水平、提升未來公交服務(wù)質(zhì)量具有重要的理論和實踐價值。
獲取每輛車到達每個站點的上下車乘客數(shù)是推算公汽滿載率的關(guān)鍵。目前比較常用的公汽客流獲取方法即使用IC卡刷卡數(shù)據(jù)[9-10]。但目前很多IC卡數(shù)據(jù)的研究對于出行OD推導(dǎo)率不算太高,除了方法本身無法獲取精確的下車站點外,限制還包括數(shù)據(jù)量、時間范圍、數(shù)據(jù)完整度等方面[10-13]。
本文提出使用整個城市范圍較長時期的數(shù)據(jù),如一個月以上包含地鐵和公汽的IC卡刷卡數(shù)據(jù)和公汽車輛GPS定位數(shù)據(jù),對數(shù)據(jù)進行細致的預(yù)處理,保證數(shù)據(jù)的完善可靠,再綜合利用多種下車站點推導(dǎo)方法得到下車站點和下車時間,以提高出行OD的推導(dǎo)率。有了出行OD數(shù)據(jù)再根據(jù)到站時刻表統(tǒng)計上下車乘客,可以得到每輛車在每個線路段上的載客量,根據(jù)該車的車型核載量計算得到公汽滿載率(如圖1所示)。
1.2.1 到站時刻表提取
到站時刻表是公汽每個車次實際到站的時間記錄,用以根據(jù)刷卡時間提取上車站點、根據(jù)下車站點獲取下車時間,以及根據(jù)出行OD統(tǒng)計車輛到站的上下車乘客數(shù)。它是滿載率推算的數(shù)據(jù)基礎(chǔ),可以通過公汽GPS數(shù)據(jù)結(jié)合線路和站點數(shù)據(jù)提取得到。車輛到站時刻表提取步驟如下:
(1) 篩選正確的GPS定位點,篩選方法為在線路100 m緩沖區(qū)或者站點300 m緩沖區(qū)。
(2) 車次識別。設(shè)置起終點站300 m閾值,把最后一個離開起始站的定位點時間作為車次起始時間,第一個進入終點站閾值范圍的定位點時間作為到站時間;根據(jù)起終點站識別車次和方向。
(3) 中間站點按照線路方向上的站點順序,依此進行識別。設(shè)置到站距離識別閾值為100 m。
(4) 提取完所有站點后,還需要對漏過站點的到站時間進行插值補全,之后即可得到完整的公共汽車到站時刻表。
1.2.2 上車站點提取
得到車輛到站時刻表后,可根據(jù)車牌關(guān)聯(lián)將刷卡時刻與到站時刻進行匹配。在兩個到站時間內(nèi)的刷卡數(shù)據(jù)匹配到上一站點。將到站時間前30 s內(nèi)的刷卡識別為本站點,以減少因定位誤差及刷卡機時鐘偏差導(dǎo)致的誤提取。對于在起始站上車的情況,設(shè)置比車次開始時間早5~10 min的時間作為起始站上車識別時間。最終根據(jù)到站時刻表提取上車站點后,得到刷卡數(shù)據(jù)的線路方向、上車站點、上車站點序號、上車時間。
1.2.3 下車站點推導(dǎo)
公汽下車站點推導(dǎo)主要方法有[10,14-15]:①基于連續(xù)出行鏈的方法;②基于換乘行為的方法;③基于通勤出行時空特征的方法;④基于歷史出行頻率的方法。本研究主要使用基于連續(xù)出行鏈的方法,結(jié)合換乘行為,然后依據(jù)通勤出行特征和歷史出行推導(dǎo)下車站點,綜合利用以上多種方法,以提高下車站點推導(dǎo)成功率。
本文使用的連續(xù)出行鏈方法原理如圖2所示。一個人從家里出發(fā),步行到公汽站點b1,乘坐公汽線路L1到達公汽站點b2,然后步行到地鐵站點s1,進入地鐵網(wǎng)絡(luò)N1,之后從地鐵站s2走出,步行到公汽站點s3,搭乘公汽線路L2回到離家較近的另一公汽站點b4,最后步行回到家中。該方法假設(shè)乘客僅依靠公交、地鐵和有限的步行完成出行,中途不采用其他交通方式。這樣乘客的下車站點可以通過下次乘車的上車站點進行推斷。
整個下車站點的推導(dǎo)步驟如下:
(1) 基于連續(xù)出行鏈原理,假設(shè)上次乘車下車站點在下次乘車的上車站點附近,設(shè)置公汽站點換乘閾值為800 m,地鐵站點換乘閾值為1000 m,在上次乘車站點之后的方向上搜尋距離下車乘車站點最近的站點,即推斷為下車站點。
(2) 步驟(1)最多只能得到上次出行的下車站點,無法得到最后一次出行的下車站點。而一天的出行一般會返回到當(dāng)天的起始位置附近。因此假設(shè)最后一次出行乘坐公汽的,其下車站點可能在當(dāng)天上車站點(地鐵和公汽)附近。閾值和下車站點推導(dǎo)同步驟(1)。
(3) 假設(shè)當(dāng)天最后一次出行返回家里。家的位置推測可采用DBSCAN算法[16-17]。首先提取每天第1次出行的起始站點,然后使用DBSCAN算法求得聚類中心,即第1次出行站點最密集的地點,并以此中心作為家的位置。如果當(dāng)天最后一次公汽出行的線路方向上有在閾值范圍內(nèi)且離家最近的站點,即可推斷為下車站點。
(4) 根據(jù)通勤或歷史出行規(guī)律推導(dǎo)下車站點。出行目的通常具有相似性,可以假設(shè)每天相同時間段在同一站點乘坐同一條線路的情況,其目的地相同,而在不同時間段乘坐線路反方向的可以假設(shè)其上下車站點相反,以歷史出行頻率判斷其最可能的下車站點。
在得到上下車站點之后,可根據(jù)到站時刻表得到下車時間。
1.2.4 公汽滿載率推算
由乘客上下車站點和時間,結(jié)合車輛到站時刻表,可以獲取每輛車到站時的上下車乘客數(shù),進而計算得到車輛運行時的車廂乘客數(shù)量。根據(jù)前面制定的滿載量計算方法,最后推算得到基于刷卡數(shù)據(jù)的公汽車輛滿載率。
本文以深圳市為例,使用2017年9月的深圳通刷卡數(shù)據(jù)和公汽GPS定位數(shù)據(jù),還有從百度地圖抓取的地鐵和公交的線路及站點數(shù)據(jù)。由于7—12日、24日這7 d的GPS數(shù)據(jù)有缺失,因此選取剩余23 d作為本文公汽滿載率推算的時間范圍。
深圳通刷卡數(shù)據(jù)為2017年9月30 d的數(shù)據(jù),總卡數(shù)為885萬張,總刷卡量為2.58億條,其中地鐵刷卡入站和出站共1.59億條,公汽刷卡接近1億條。深圳通刷卡數(shù)據(jù)字段有卡號、刷卡時間、刷卡類型(地鐵入站、地鐵出站、巴士)、刷卡價格、優(yōu)惠后價格、設(shè)備編碼、線路名、地鐵站點名、公汽車牌、是否聯(lián)程等。
GPS定位數(shù)據(jù)是公共汽車運營時的位置記錄,采樣間隔最短為10 s,大部分在60 s內(nèi)。數(shù)據(jù)字段有車輛車牌、線路名、運營公司、經(jīng)度、緯度、時間、速度和方向等。
線路和站點數(shù)據(jù)包含公交線路949條,站點6482個,地鐵線路8條,站點共166個(根據(jù)不同線路名、站點名統(tǒng)計)。
根據(jù)上下車站點推導(dǎo)步驟得到公汽出行OD數(shù)據(jù)。最終共獲取了15 888輛公共汽車、覆蓋827條線路的上下車客流數(shù)據(jù)。車輛刷卡數(shù)據(jù)OD推導(dǎo)率在80%以上的有10 377輛,占推導(dǎo)后總車輛數(shù)的65.31%,推導(dǎo)率在60%以上的有13 925輛,占87.64%。
通過公汽滿載率推算方法,獲取了整個深圳市大部分公共汽車的滿載率。基于此數(shù)據(jù)可以對出行熱點線路進行分析,發(fā)現(xiàn)擁擠的時段和路段,以便采取調(diào)整措施,保障乘客的出行體驗,提高公共交通服務(wù)水平。
統(tǒng)計2017年9月16—22日各道路路段所承載的高滿載率車次發(fā)現(xiàn),周末(16、17日)的高滿載率路段數(shù)量相比工作日非常少,顯示出短時高密度出行需求主要集中在工作日。選擇18—22共5 d工作日的早高峰時段(7:00—9:00),對每一路段上公汽高滿載率的車次數(shù)進行統(tǒng)計,結(jié)果如圖3所示??梢钥吹礁邼M載率路段在整個市區(qū)均有分布,并且沿著主要公交廊道延伸,其中主要是“關(guān)外”至“關(guān)內(nèi)”的廊道,如從寶安西鄉(xiāng)到南山中心,從石巖、西麗到南山科技園,從龍華到福田CBD,從龍崗、布吉到羅湖商業(yè)區(qū)。這幾個廊道均是主要的入城通道,直觀地反映了深圳市“關(guān)外—關(guān)內(nèi)”往返通勤的擁擠現(xiàn)狀。另外南山至福田、羅湖的3條東西向主干道(濱海大道、深南大道、北環(huán)大道)也顯示出了較高的通勤擁擠程度。
深圳市公汽101路由火車站至西麗動物園總站,連接羅湖商業(yè)區(qū)、福田CBD、華僑城旅游度假區(qū)、南山科技園、西麗交通樞紐,是一條較為典型的常規(guī)公汽線路。包含運營車輛共49輛,非高峰時段發(fā)車間隔在6 min左右,早高峰時段在4 min左右。其東側(cè)沿深南大道幾乎與地鐵一號線完全重合,而西側(cè)則為地鐵線路尚未覆蓋的南山科技園北部。本文以101路為例,用推算得到的公汽滿載率數(shù)據(jù)分析其可能出現(xiàn)的擁擠路段和時段。
使用9月16—22日一周的數(shù)據(jù),對101路高滿載率車次分析發(fā)現(xiàn),其高滿載率車次主要集中在工作日的7—9點、18—20點及21點附近。具體的,對101路早晚高峰各方向路段所承載的高滿載率車次數(shù)進行統(tǒng)計,結(jié)果如圖4所示。往火車站的去行方向,早上從九祥嶺②開始到茶光①高滿載率車次是逐漸上升的,達到較高的峰值之后快速下降,又在豪方現(xiàn)代豪園達到另一個小高峰。此方向上豪方現(xiàn)代豪園附近為居民區(qū),因此也有較大量的上車乘客。晚上該方向前半程通往工作區(qū),與下班客流方向相反,而東側(cè)與地鐵線路重合,有較多的替代線路,因此除了科技園附近有少量擁擠外,整條線路表現(xiàn)不太擁擠。往西麗動物園總站的回行方向,早上從火車站到白石洲①有少量的高滿載率車次數(shù),而在白石洲①至朗山路西高滿載率車次較高,且逐漸降低。主要原因是作為深圳關(guān)內(nèi)最大的城中村的白石洲,有大量前往南山科技園上班的乘客。晚上從深大北門②至松坪村高滿載率車次數(shù)較高,且逐漸上升,之后一直到西麗法庭②逐漸下降,主要是從科技園返回松坪村附近居住區(qū)的客流,以及到茶光地鐵站換乘的客流。
通過以上分析發(fā)現(xiàn),101路的擁擠路段主要為西側(cè)半程,擁擠時段主要在早晚高峰。為了緩解擁擠狀況,提升乘客舒適度,可以采取的措施是在高峰時段的擁擠路段加開區(qū)間線路、縮短發(fā)車間隔。此處所分析的高滿載率車次并不涉及總體客流量規(guī)模,而是短時間內(nèi)高密度客流的時空分布,有利于提出針對性的服務(wù)質(zhì)量提升解決方案??傮w而言,從火車站至白石洲段還有相當(dāng)大的客流量,但分布則較為平緩。
公汽滿載率指標(biāo)是表示公汽車廂擁擠程度最直接的指標(biāo),在公交規(guī)劃、調(diào)度、服務(wù)評價等方面有著重要作用。本文利用長時期大范圍的IC卡數(shù)據(jù)、公共汽車GPS數(shù)據(jù)等公交大數(shù)據(jù)推導(dǎo)得到了成功率較高的OD數(shù)據(jù),為公汽滿載率的推算提供了基礎(chǔ),以此可以得到城市級別的公汽滿載率數(shù)據(jù)。經(jīng)深圳市案例分析,最終驗證此方法具有可行性,在數(shù)據(jù)完整的情況下可以獲取全市公交路網(wǎng)的乘客擁擠程度。通過對公汽滿載率的進一步分析,可以對出行擁擠路段和時段進行精準(zhǔn)識別。但是研究中對大數(shù)據(jù)處理的時間較長,未來可對大規(guī)模公交數(shù)據(jù)處理算法進行優(yōu)化,以提高搜索效率。