杜光遠,吳 瑞,譚桂菲,趙向宇,王 昌,張曉悅
(1.交通運輸部科學研究院,北京 100029;2.交科院技術咨詢(北京)有限公司,北京 100029)
近年來,我國城市軌道交通取得了快速發展,運營總里程和客運量均持續增長[1],但不少城市存在軌道交通與常規公交的銜接效率不高、公共交通系統整體吸引力較弱等特點。因此,提高兩網銜接服務能力,促進二者融合發展,已成為城市交通亟須解決的問題。軌道交通站點作為交通網絡節點,是兩網融合銜接的關鍵點。由于軌道交通站點在區域位置、功能定位、客流需求等方面存在差異,需結合多方面因素對站點進行分類,并針對性提出常規公交接駁服務要求。
截至目前,國內外學者從多個角度對軌道交通站點分類進行了研究,主要集中在以下幾個方面。1)基于站點客流量的形態特征、結構特征和客流強度對站點進行分類。如,尹芹等[2]通過提取站點進站客流量的極大值點、偏度和峰度對北京市軌道交通站點進行分類;陳艷艷等[3]以站點進站客流量高峰小時系數將軌道交通站點分為4 類。但這類研究主要基于專家知識選取客流宏觀特征對站點分類,對反映乘客個體微觀出行特征考慮不足,難以滿足精細化分類要求和需要。2)基于站點周邊建成環境對軌道交通站點分類。如,王煥棟等[4]通過獲取軌道交通站點空間影響范圍內興趣點(Point of Interest,POI),計算各類POI 比例、優勢度和均勻度,確定軌道交通站點類型;李清嘉等[5]通過獲取站點周邊人口密度、土地利用特征、交通條件特征以及站點自身特征等15 個變量,將武漢市軌道交通站點分為6類。但相關研究需要海量的網絡POI 數據對分類進行支撐,而網絡數據來源雜亂,無法確保數據的準確性,此外詳細的區域人口密度為政府非公開信息,數據獲取成本較高。3)基于站點時間序列客流特征對站點進行分類。如,楊興[6]以15 min 為時間粒度,提取每個站點運營時間內的進(出)站平均客流量,并采用高斯混合模型(Gaussian Mixture Model,GMM)聚類算法對站點進行類型識別;蔣陽升等[7]將進站客流量數據處理為時間序列數據,并采用K-Means++算法對各個站點的客流量進行聚類。但相關研究數據大多使用周一至周五的客流量,未考慮非工作日客流特征對站點分類的影響。
為提高軌道交通站點分類的科學性與客觀性,需充分考慮客流宏觀與微觀特征因素以及客流時間變化規律。本文將基于客流時間序列,對比周中、周末[8]乘客出行規律,從宏觀、微觀不同角度提取站點客流分布特征和乘客出行特征,應用層次聚類法、K-Means、DBSCAN 算法等8種聚類算法對軌道交通站點進行分類,選取最優聚類算法結果。最后,通過分析不同類別軌道交通站點客流特征,提出相應的常規公交出行接駁服務建議,為提高城市軌道交通與常規公交銜接服務能力提供支撐。
為明確軌道交通站點特征,通過分析乘客OD 出行數據,根據站點微觀、宏觀客流特征,構建三級軌道交通站點特征指標體系[9],其中選取2 個一級指標、4 個二級指標、10 個三級指標(見表1)。微觀方面考慮軌道交通站點乘客出行特征,參考文獻[9],通過計算高(低)概率軌道交通出行人群占比,探索軌道交通出行人群穩定性;宏觀方面考慮軌道交通站點客流分布特征,通過計算進(出)站客流占比[10]、進(出)站熵值[11]、車站客流時間序列特征[12],探索客流時間分布規律。表1中,高峰時段指工作日7:30—9:30和17:30—19:30,其余為平峰時段。

表1 站點特征指標
通過確定高(低)概率軌道交通出行人群,計算高(低)概率軌道交通出行人群占比,量化乘客出行特征。
1)高(低)概率軌道交通出行人群劃分
基于貝葉斯理論[13],計算不同時空條件下乘客在站點的出行概率,劃分高(低)概率軌道交通出行人群。依據文獻[9],將出行概率≤0.4 的乘客劃分為低概率軌道交通出行人群(一周內最多2 天利用軌道交通出行);出行概率>0.7 的乘客劃分為高概率軌道交通出行人群(一周內至少4 天利用軌道交通出行);0.4<出行概率≤0.7的乘客劃分為中概率軌道交通出行人群(一周內3 天利用軌道交通出行)。相比中概率軌道交通出行人群,高(低)概率軌道交通出行人群的客流量特征更能直觀反映車站乘客出行規律性,因此本文主要針對高(低)概率軌道交通出行人群展開研究,不考慮中概率軌道交通出行人群。乘客出行概率計算公式見式(1)~式(3):

式(1)~式(3)中:P(E|T,S)為t時段內乘客針對s站點的出行概率;S為軌道交通站點s的合集;P(M|T) 為乘客在t時段內乘坐軌道交通的概率;P(E|S,T,M)為乘客在t時段內由s軌道交通站點進(出)站的概率;T為t的合集,分為早高峰、平峰、晚高峰;Dmetro為乘客在統計周期內t時段內乘坐軌道交通的天數;Dall為統計周期內乘客乘坐軌道交通的總天數;Ro為乘客在統計周期內t時段在s站點進(出)站頻數;Rall為統計周期內乘客在s站點進/出站總頻數。
2)高(低)概率軌道交通出行人群占比計算
為判斷站點客流規律特征,計算高(低)概率軌道交通出行人群分別占進出站總客流的比例,計算公式見式(4):

式(4)中:P(E|T,S,F)表示在t時段內s站點中,f類進(出)站客流占總進(出)站客流的比例;T和S含義同前;F是f類客流的合集,指高概率、低概率軌道交通出行人群;Qf為t時段內在s站點進(出)站的f類客流量;Qall為t時段內在s站點進(出)站的全部客流量。
通過測算進出站客流占比、進(出)站熵值和車站客流時間序列特征,量化站點客流分布特征。
1)進(出)站客流占比
進出站客流占比能反映軌道交通站點的服務功能,包含高峰進(出)站客流與全天進(出)站客流的比值、高峰進站客流與高峰進出站客流比值、非工作日與工作日日均進(出)站客流量比值5 個三級指標。高峰進(出)站客流與全天進(出)站客流比值越大,表示該站點進(出)站客流時間越集中,站點可在高峰時段為乘客提供更多服務;高峰進站客流與高峰進出站客流比值越接近0.5,表示高峰時期該站進站客流量與出站客流量越接近平衡狀態,該站點的服務功能越均衡;非工作日與工作日日均進(出)站客流量比值越大,表示非工作日與工作日的客流量差異越明顯,該站點在非工作日時服務更多的出行人群。
2)進(出)站熵值
軌道交通站點進(出)站熵值可用來度量站點全天客流分布的均衡性。熵值越接近1,表示站點的全天客流在早高峰、平峰、晚高峰3 個時段內分布越均衡。進(出)站熵值的計算公式[14]見式(5):

式(5)中:H(X)為軌道交通站點進(出)站熵值;X為刷卡狀態,分進站和出站;Qt為t時期客流量;Qday為全天內客流量;T含義同前。
3)車站客流時間序列特征
為了判斷車站客流隨時間的集聚程度,以30 min 作為時間粒度,計算s車站在工作日(非工作日)運營時間內進(出)站的平均客流量,其計算公式見式(6):

為了降低算法運算成本,實現聚類結果的可視化,本文采用主成分分析法對數據進行降維處理。計算不同主成分個數對應的累計貢獻率(如圖1 所示),最后選取累計貢獻率達到85%的3 個主成分。

圖1 主成分累計貢獻率
為了對不同軌道交通站點進行分類,需對降維后的特征指標值進行聚類處理。常用聚類算法有K-Means[15]、DBSCAN[16]、層次聚類法[17]和GMM[18]等。以青島市軌道交通站點為例,基于其乘客刷卡數據,分別利用GMM-EM 聚類、KMeans 聚 類、Mean shift、DBSCAN 以 及4 類層次聚類共8 種算法對青島市軌道交通站點的客流特征進行聚類。用CH 系數、輪廓系數、DB 指標[19]來檢驗聚類結果的優劣性。聚類算法結果對比如表2 所示。從該表可以看出,與GMM 聚類和Mean shift 聚類相 比,K-Means 算法的CH 系數分別高55.1 和54.6,輪廓系數分別高0.21 和0.05,表明K-Means 聚類結果優于GMM 聚類和Mean shift 聚類算法。同時,從不同聚類算法分類結果(見圖2)可以看出,K-Means 能將軌道交通站點較明顯地分為4 類;DBSCAN 聚類算法分類結果較為雜亂;Mean shift和層次聚類算法幾乎將站點分為1 類或2 類,不能很好地區分不同站點之間的特征。因此,本文采用K-Means 算法對軌道交通站點進行分類。

圖2 不同聚類算法分類結果

表2 聚類算法結果對比
由于K-Means 聚類算法在聚類前需要確定最優聚類數k,為避免人為設定聚類數造成數據解釋和結論偏差,本文采用手肘法選擇最優聚類數,即通過計算聚類所得劃分簇的最小化平方誤差和確定k值。k值越小,表示簇內樣本越緊密,k取值越合理。
計算不同聚類數下K-Means 算法聚類結果的誤差平方和(如圖3 所示),當聚類數為4 時,誤差平方和的下降幅度逐漸減小,因此選擇4 作為K-Means 算法最終的聚類數,將軌道交通站點分為4類。

圖3 誤差平方和隨聚類數變化曲線
為了驗證本文方法對于軌道交通站點分類的有效性,本文以青島市軌道交通站點為例進行實例分析。
采集青島市2022 年5 月10 日—5 月16 日6 條軌道交通線路的128 個軌道交通站點的進出站刷卡數據,剔除乘客逃票、錯誤刷卡、反復刷卡、同站進出等數據,共獲取有效數據766 萬條,部分數據示例如表3所示。

表3 軌道交通刷卡數據(部分)
根據2.2 節中確定的聚類數,將1.4 節中降維后的主成分應用于K-Means 聚類算法。根據聚類結果(見圖2(b)),將青島市128 個軌道交通站點分為4 類,第1、2、3、4 類站點數量分別為90、29、7和2,具體如表4所示。

表4 青島市軌道交通站點聚類結果
通過分析工作日進出站客流時間分布、非工作日與工作日日均進(出)站客流比值、早晚高峰高(低)概率軌道交通出行人群占比、不同類型站點通勤客流量,明確不同類型軌道交通站點的交通流特征。
1)工作日進出站客流時間分布特征
工作日進出站客流時間分布特征可反映出客流隨時間的變化規律。4 類站點客流時間分布如圖4 所示,從客流整體分布情況來看,早高峰相比于晚高峰,進出站客流量更為集中。但第3 類站點,早高峰進站客流量小于晚高峰;第4 類站點,早高峰出站客流量小于晚高峰。從進出站客流均衡性方面來看,第2 類站點高峰時段進站與出站客流量基本持平。

圖4 4類站點客流時間分布
2)非工作日與工作日日均進(出)站客流比
非工作日與工作日日均進(出)站客流比可反映非工作日與工作日的客流變化情況。4 類站點非工作日進(出)站客流量分布如圖5 所示。從該圖可以看出,非工作日客流中,第4 類站點客流量最多,進出站日均總客流量平均在25 000人次以上,客流量主要集中在具有旅游性質的站點和對外客運樞紐性質的站點等。4 類站點非工作日與工作日日均進(出)站客流比如圖6所示。從該圖中可以看出,第4 類軌道交通站點和第1類個別站點的客流比明顯高于其他站點,在嶗山景區、黃島旅游區及臺東商業區等熱門區域,周末客流量變化明顯,周末日均客流量是周中的3倍以上。

圖5 4類站點非工作日進(出)站客流量分布

圖6 4類站點非工作日與工作日日均進(出)站客流比
3)早晚高峰高(低)概率軌道交通出行人群占比特征
高概率軌道交通出行人群占比情況可反映站點客流的穩定性。4 類站點早晚高峰高概率軌道交通出行人群出行占比分布如圖7所示,整體上,早高峰較晚高峰的高概率軌道交通出行人群出行占比大,表明早高峰站點客流比較穩定。第3 類站點早高峰高概率軌道交通出行人群出站占比和第2類站點的早高峰高概率軌道交通出行人群進站占比均超過70%,表現出第3類站點很強的出站客流穩定性和第2類站點很強的進站客流穩定性。

圖7 4類站點早晚高峰高概率軌道交通出行人群占比分布

圖7 (續)
基于3.3 中軌道交通站點客流量特征,分析青島市4 類軌道交通站點特征。青島市不同類型軌道交通站點分布如圖8所示。

圖8 不同類型軌道交通站點分布
第1 類:居住導向型站點。站點客流時間分布圖(圖4(a)、(e))具有突出的進站早高峰和出站早高峰特征。相比其他站點來說,該類型站點日均進(出)站客流量最少,但非工作日客流量與工作日日均進站客流比值較大,表明非工作日時,乘客出行需求反而增多。這與該類型站點周邊存在大型居住社區事實相符,如青島二中地鐵站點周邊具有大型居住社區,并配套學校、超市等便民設施。
第2 類:職住混合型站點。站點客流時間分布圖(圖4(b)、(f))存在明顯的左單峰形態,周中早高峰進(出)站客流都較為突出,與第1類站點類似,但其工作日高峰進站客流與高峰進出站客流比值接近0.5,表明此類站點的服務功能較為均衡,同時服務工作類客流和居住類客流。這與該類型站點周邊既存在辦公場所又存在居住區的事實相符,如萬年泉路地鐵站周邊既有研究所、醫院、學校、政府辦公區以及各類有限公司等辦公場所,又有各式住宅小區。
第3 類:就業導向型站點。站點客流時間分布圖(圖4(c)、(g))具有早高峰出站人數較多,晚高峰進站人數較多的特點,符合通勤人員早高峰出站上班,晚高峰進站下班的情況。相比其他站點類型,該類站點晚高峰進站的人員和早高峰出站的人員中,高概率軌道交通出行人群占比最多,表明該類型站點出行規律性較強,車站服務通勤類客流的特征較明顯,這與該類型站點附近存在金融商務辦公區和行政辦公中心的實際相符。
第4 類:娛樂購物型站點。站點周中日均入(出)站客流量均小于周末,表明周末客流量更大。相比于其他類型站點,該類站點周中晚高峰出站客流量大(圖4(h)),高峰值接近2 000 人次/d,表明晚上該類型站點較吸引人流量。這與該類型站點附近存在步行街和商圈,晚上和周末吸引客流的事實相吻合。站點客流時間分布圖也具有突出的早高峰進站客流(見圖4(d)),表明該站點周邊也具有一定的居住屬性。
1)對于居住導向型站點,針對其整體客流量小、乘客出行時間隨機的特點,建議提高小區周邊公交站點步行可達性,將步行到公交站點的時間控制在5 min 以內,在固定區域范圍內,以現有公交站點為基礎,為市民提供1 分鐘響應、動態發班的“區域巡游定制公交”服務,發展“靈活接駁軌道交通站點”的業務模式,在保障公共服務的基礎上,提升公交運營效率。
2)對于職住混合型站點,由于早高峰進站客流中高概率軌道交通出行人群較多,對常規公交存在準點和快速到達軌道交通站點的要求,建議采用早高峰定制接駁公交形式,整合出行起止點、出行時間、服務水平相似的個體出行需求,設計個性化公交運行線路和站點,滿足該類人員快速直達軌道交通站點的出行需求。
3)對于就業導向型站點,由于早高峰出站客流中通勤人員占比較多,對候車時間容忍度較低,建議以總換乘距離最短為目標,對接駁常規公交站點進行空間布局優化;以乘客總換乘時間最短為目標,優化接駁公交運營時刻表,減少乘客等待時間。采取準點到站的運營模式,將到站時間精確到±3 min 以內,實現從“趕公交”“等公交”到“準點上車”“掐點乘車”。
4)對于娛樂購物型站點,相比工作日,非工作日進出站客流量更多,大部分為娛樂購物人群,因此建議在保證與軌道交通站點接駁的同時,綜合考慮乘客的出行時間、游玩、購物需求,串聯起各大熱門景點商圈和“打卡點”,形成休閑微循環線路,在每周六至周日、法定節假日以及旅游旺季等運營,以滿足乘客出行需求。
本文利用軌道交通刷卡數據,基于乘客出行特征和客流分布特征,對軌道交通站點特征進行提取,應用K-Means 聚類算法將軌道交通站點分為就業導向型、職住混合型、居住導向型、娛樂購物型等4 類,并結合站點特征提出常規公交出行接駁服務建議。研究成果可為軌道交通站點功能分類提供參考,為優化常規公交接駁服務提供支撐。
由于數據可獲取性,本文僅基于客流特征對軌道交通站點進行了聚類,未考慮其他非客流因素,如周邊土地利用情況、居住人口數和就業崗位數等,而這些因素對站點分類精細度具有一定影響,在未來研究中,將考慮這些因素對軌道交通站點類型的影響,進一步提高站點功能分類的科學性。