曹敬浛,許 琰,孫立山,趙昇輝,王 艷
學術探討
基于軌道交通數據的客流特征與城市功能結構分析
曹敬浛,許 琰,孫立山,趙昇輝,王 艷
(北京工業大學城市交通學院,北京 100124)
隨著中國社會經濟和城鎮化的迅速發展,城市居民的職住空間關系不斷發生變化。在城市功能結構失衡導致交通擁堵問題日趨嚴重的背景下,居民軌道交通出行需求也在不斷增加。以北京市為例,基于軌道交通刷卡數據,從網絡客運量、客流時空分布狀態等方面深入挖掘乘客出行特征及規律。運用k均值聚類算法(K-Means聚類),以不均衡系數為指標對北京市各地鐵站乘客出行時空分布進行聚類分析,研究居民出行規律與城市功能結構間的不均衡關系,為城市軌道交通運營組織策略的研究提供理論支撐。
城市軌道交通;刷卡數據;客流特征;站點功能
隨著中國社會經濟和城鎮化的迅速發展,城市人口增長迅猛,居民出行需求不斷增加,城市軌道交通以其運量大、準時、快捷、低污染等特點得到了快速發展。為保證城市軌道交通的運營管理、客流組織等工作的合理進行,迫切需要對軌道交通客流分布特性進行深度挖掘。在軌道交通運營數據中,刷卡數據記錄了用戶的進出站時間以及站點信息,具有時間連續、覆蓋范圍廣、數據量大的特點,提供了真實、準確的客流數據來源,便于客流信息統計及出行特征研究。
在已有研究中,對于刷卡數據的研究主要包括以下3方面:乘客出行模式和行為挖掘、站點功能識別以及客流特征挖掘。在乘客出行模式挖掘中,Max[1]等根據IC卡交易數據確定了乘客的出行鏈,利用DBSCAN聚類算法對出行鏈進行分析,檢測乘客的歷史出行模式。Kieu[2]等在基于噪聲的DBSCAN聚類的基礎上提出了一種新的WS-DBSCAN方法,用于檢測乘客出行模式的日常變化。Wang[3]等通過分析地鐵乘客的出行數據,探討了個人出行距離與城市中心距離間的線性關系和環聚集模式。Briand[4]等應用高斯混合模型對乘客在公共交通使用中的時間習慣進行重組,并運用刷卡數據和聚類的方法分析了公共交通乘客出行行為的變化。Devilaine[5]等利用刷卡數據分析乘客的出行起點、出行時間、出行目的等行為信息,挖掘因社會、文化和地域引發的乘客行為模式差異。Jang[6]通過刷卡數據識別乘客出行中的關鍵換乘點,分析兩個區域間的換乘出行模式。Takahiko[7]等提出了一種基于樸素貝葉斯概率模型的刷卡數據與出行調查數據的融合方法,評估乘客出行行為屬性。在站點功能識別的相關研究中,唐超[8]利用K-Means聚類分析的方法,對南京地鐵車站進行聚類,為城市軌道交通站點的規劃及車站差異化運營提供了參考依據。冷彪和趙文遠[9]利用地鐵刷卡數據并依據出行規律相似性對地鐵站進行聚類分析,研究不同時段內的區域功能和相互客流關系。在客流特征挖掘的研究中,陳學武等[10]提出了將原始刷卡數據轉化為可直接用于城市交通規劃及公交運營調度的客流基本信息的理論方法,為發展智能化公交建立了一定基礎。戴霄和陳學武[11]對單條線路的刷卡信息進行統計分析,得到了全天客流總量、高峰小時客流量、斷面流量等線路客流信息,以及站點間車輛平均運行時間、運營速度、站點平均等車時間等運營信息,為線路運營評價和調整提供了數據支撐。
由于城市軌道交通站點周邊的用地特征對車站客流的發生和吸引具有較大影響,為探究不均衡現象的原因,基于2018年8月北京市軌道交通刷卡數據,從網絡客運量、客流時空分布以及客流變化規律等方面探究了乘客出行特點,并應用K-Means聚類對北京市軌道交通站點進行分類,結合北京市城市功能結構對站點進行功能劃分,分析出行規律與城市功能結構間的職住失衡關系,為大客流沖擊下城市軌道交通運營優化研究提供理論支撐。
城市軌道交通網絡形成后,網絡可達性逐漸提高,吸引了大量客流。如圖1所示,北京市軌道交通各線路的日均客流量空間分布具有不均衡性,日均客流量及客流強度較大的線路主要為城市骨干線路,日均客流量最高可達58.29萬人次(10號線),日客流強度最高可達1.62萬人/km(4號線);而外圍線路的客流量均在15萬人次之內,日客流強度均小于0.6萬人/km。

圖1 北京市軌道交通各線路的日均客流量及客流強度
Figure 1 Daily passenger capacity and passenger flow intensity of each line of Beijing Rail Transit
1.2.1 時間分布
圖2是以5 min為間隔統計的北京市軌道交通工作日分時段進出站客流量。統計結果顯示,城市軌道交通網絡客流時間分布具有明顯的不均衡性。工作日的進、出站客流量呈雙峰分布,早高峰(7:00-9:00)和晚高峰(17:00-19:00)的進、出客流量相對高于全日其他時段。表1為北京市軌道交通網絡工作日高峰進站量排名前五的車站,其高峰時段的進、出站客流量均在全日客流總量的50%以上。由圖2和表1可得,刷卡數據能有效呈現北京市軌道交通線網主要服務通勤出行的特點。

圖2 北京市軌道交通網絡分時進出站客流量統計
Figure 2 Passenger flow of Beijing Rail Transit network

表1 北京市軌道交通網絡工作日高峰進站量排名前5位車站
從乘客的角度分析,不同線路以及工作日、雙休日的出行時間也具有不同的特征。
圖3是以5 min為間隔統計的北京市軌道交通網絡單日進站客流曲線圖。工作日進站時間呈現雙峰特性,反映出北京居民對軌道交通的通勤依賴性,6:30- 10:00出行的乘客占全天出行量的35.95%,16:00- 19:30乘客出行量占全天出行量的29.61%,而周末則沒有如此明顯的規律性。對比圖3和圖4,各線路進站客流與全網客流呈相同的分布趨勢。通過比較發現,所有線路的進站時間分布都呈雙峰形,全網客流高峰較集中。
1.2.2 空間分布
在城市軌道交通網絡中,由于線路的位置、輻射范圍、沿線交通走廊等各不相同,不同線路的客流量差異很大,網絡客流分布呈現不均衡狀態。
連接北京近郊和內環的市區中心線路承擔較大客流量,吸引了大量的通勤客流。如圖5所示,10號線、4號線、1號線、5號線、6號線是工作日全天進站客流量排名前五的線路。10號線、4號線、1號線3條線路工作日全天進站客流總量160.96萬人次,占全網進站客流總量的36.2%;3條線路工作日全天出站客流總量162.82萬人次,占全網出站客流總量的36.0%。相對中心線路而言,郊區支線如燕房線等線路進出站客流量較小,主要原因是支線線路大部分位于城市邊緣,線路里程比中心線路短。

圖3 北京地鐵進站客流時間分布曲線
Figure 3 Time distribution curve of inbound passenger flow in Beijing Metro

圖4 北京地鐵不同線路工作日分時流量比
Figure 4 Time distribution of passenger flow ratio on different lines of Beijing Metro on weekdays

圖5 全網進出站客流量統計
Figure 5 Statistics of inbound and outbound passenger flow
通過ARCGIS對各車站的工作日早高峰進出站客流量進行可視化處理,如圖6、7所示。在圖6、7中可觀測到北京地鐵工作日早高峰時進出站客流的特征為從市郊地區向城市中心遷移。
對北京市軌道交通客流的時空分布分析發現,北京市軌道交通客流呈不均衡分布。軌道交通客流受沿線居住及工作等用地類型的影響。在早高峰時段,周圍居住用地較集中的車站一般為主要的客流發生點,而辦公用地較集中的車站成為主要客流的吸引點。由于地鐵站點周邊用地性質的差異性,不同類型站點的客流時變特征也存在較大的差異,周邊用地性質相似的車站其客流時變特征具有一定的相似性。因此現基于軌道交通客流分布,對軌道交通站點進行用地性質的劃分。
聚類是將數據集劃分為若干相似對象組成的多個組或簇的過程,使得同一組中對象間的相似度最大化,常用的聚類方法有K-Means算法和DBSCAN算法。而K-Means算法是基于點與點距離的相似度來計算最佳類別歸屬,適用于軌道交通客流數據,且收斂速度快。因此采用K-Means聚類算法,算法過程如下:
STEP1:給出個數據樣本,令=1,隨機選擇個初始聚類中心Z(),=1, 2, 3, …,;


圖6 北京地鐵工作日早高峰進站客流量可視化
Figure 6 Visualization of inbound passenger flow in the morning peak of Beijing Metro

圖7 北京地鐵工作日早高峰出站客流量可視化
Figure 7 Visualization of outbound passenger flow in the morning peak of Beijing Metro

根據不同站點的早晚高峰及平峰進出站客流特征,選取早高峰、晚高峰、平峰的進出站不均衡系數為特征指標,對北京市軌道交通站點進行聚類分析。不均衡系數的計算公式如下:

基于上述客流時空分布分析結果,選取早高峰時段為7:00-9:00,平峰時段為13:00-15:00,晚高峰時段為17:00-19:00。以小時為單位,對北京地鐵所有站點某工作日的進、出站量進行統計并計算不均衡系數。計算時,早、晚高峰進出站客流量分別選取該時段的最大值,平峰進出站客流量選取該時段的平均值。得到各時段的進出站不均衡系數共6項指標。
由于指標數量較多,直接聚類會影響計算精度和效果,因此運用主成分分析法對6項指標進行降維,降維結果見表2,共提取2項主成分指標進行聚類分析。
以2項主成分指標作為特征指標,運用 K-Means算法實現北京市軌道交通站點類型的聚類分析。聚類結果見表3。
選取Inertias、輪廓系數與Calinski-Harabaz得分作為評價指標。
Inertias是K-Means模型對象的屬性,表示樣本到最近的聚類中心的距離總和,數值越小表示樣本在類間的分布越集中。輪廓系數是所有樣本輪廓系數的平均值,分數越高說明聚類效果越佳。Calinski-Harabaz得分為群內離散與簇間離散的比值,比值越大聚類效果越好。
聚類程序輸出結果中Inertias為83,輪廓系數為0.42,Calinski-Harabaz得分為379,因此聚類結果準確性較高。

表2 主成分分析法降維結果分析

表3 北京地鐵站點聚類分析結果
興趣點數據包括地點名稱以及其經緯度、地點類型等數據。圖8為POI數據及第一類站點的可視化,彩色分別為不同種類的興趣點,黑色為分類1站點(居住密集型)。以天通苑站為例,該站點2 km半徑范圍內存在九臺莊園、都市芳園、合木山莊、鑫利達公寓、天通西苑等共25個住宅小區,僅天通偉業、布拉格、可喜安大廈、華聯商廈4個寫字樓,因此依據天通苑站點周圍用地類型認為其為居住密集型站點。通過圖8可看出,居住密集型站點均分布在北京市四環以外的市郊地區。圖9為POI數據及第二類站點的可視化,彩色為不同類型興趣點,黑色為分類2站點(就業密集型)。該類型站點大多分布在北京市四環內的辦公用地周圍,少數分布于北京市望京地區、豐臺科技園地區以及亦莊地區產業園周邊,因此認為該類型站點為就業密集型站點。同理,根據各類地鐵站周邊用地類型,將上述6類地鐵站分為居住密集型(分類1)、就業密集型(分類2)、居住主導型(分類3)、就業主導型(分類4)、職住混合型(分類5)、商旅文娛型(分類6)。

圖8 居住密集型地鐵站點及興趣點類型可視化
Figure 8 Visualization of residentially centralization subway stations and POI

圖9 就業密集型地鐵站點及興趣點類型可視化
Figure 9 Visualization of employment centralization subway stations and POI
2.4.1 居住密集型
此類型站點主要分布在連接中心城區與市郊地區的線路上,所屬行政區為昌平區、房山區、通州區以及大興區。該類型站點周圍分布著大量的居住用地,早高峰進站及晚高峰出站客流很大,潮汐現象明顯,平峰時段客流很少。
以天通苑站為例,某工作日客流分布如圖10(a)所示。
2.4.2 就業密集型
該類型站點分布在北京市中心城區,且大多集中在四環內。站點周圍主要為辦公用地,早高峰出站客流及晚高峰進站客流很大,高峰潮汐現象突出,平峰時段客流量很小。以東大橋站為例,某工作日客流分布如圖10(b)所示。
2.4.3 居住主導型
該類型站點大多分布在北京城區南部的豐臺區,周圍居住用地占比較大,存在少量辦公用地。相比居住集中型,其早高峰進站及晚高峰出站客流量較低。以劉家窯站為例,某工作日客流分布如圖10(c)所示。
2.4.4 就業主導型
該類型站點大多分布于北京市中心城區北部及東部,周邊用地類型以商務為主,相比就業集中型,早晚高峰的進出站量相對較低,平峰進出站量略高。以五道口站為例,某工作日客流分布如圖10(d)所示。
2.4.5 職住混合型
此類車站大多位于北京市四環附近,周圍居住人口及就業崗位相對均衡,以望京西站為例,某工作日客流分布如圖10(e)所示。
2.4.6 商旅文娛型
該類車站位于北京市的對外港站及旅游景點周邊,主要服務商旅類型乘客,全日客流相對均衡。以北京西站為例,某工作日客流分布如圖10(f)所示。
結合圖10可得出如下結論:
1) 在居住密集型和就業密集型的站點中,工作日早、晚高峰時段客流量最大值近3 000人次/15 min,平峰時則在500人次/15 min左右。結合不均衡系數指標,居住密集型站點的早高峰進站不均衡系數與晚高峰出站不均衡系數波動范圍為3.5~6.5,就業密集型站點的早高峰出站不均衡系數與晚高峰進站不均衡系數范圍為3.0~7.5。
2) 對于居住主導型及就業主導型站點,工作日早、晚高峰時段客流量均小于居住密集型和就業密集型站點,且呈不均衡的雙峰分布。結合不均衡系數指標,居住主導型站點的早高峰進站不均衡系數與晚高峰出站不均衡系數波動范圍為2.0~4.5,就業主導型站點的早高峰出站不均衡系數與晚高峰進站不均衡系數范圍為2.5~5.0。
3) 職住混合型站點的客流分布曲線呈較均勻的雙峰分布。
4) 商旅文娛型站點的全日客流分布曲線較均勻。
因此,通過對北京市軌道交通站點聚類及客流量時間分布分析可發現,不同類站點的客流時空分布存在較大差異,該差異的產生原因與城市的職住空間結構相關。

Figure 10 Time distribution curves of different types of sites
以北京市軌道交通進出站刷卡數據為基礎,分析了北京市軌道交通的時空分布特征,選取了站點客流特征指標,通過K-Means聚類分析,將北京地鐵的站點劃分為居住密集型、就業密集型、居住主導型、就業主導型、職住混合型以及商旅文娛型6類。
研究表明,北京市軌道交通客流分布極不均勻,城市職住失衡現象明顯:就業崗位多集中于北京市主城區內,包括四環內的CBD、中關村等就業中心,以及五環邊緣的望京、清河地區。而隨著通州城市副中心以及昌平、房山等新城區的建立,在主城區外圍出現了大批居住用地。在工作日的早晚高峰時段,存在大量往返于北京近郊居住小區至主城區就業中心的通勤客流。通過對軌道交通刷卡數據的分析發現,站點客流時間分布特征與其周圍用地性質緊密相關,用地性質決定了居民出行目的及出行特征。通勤客流往往集中在早晚高峰,彈性客流分散在全日各時段。根據客流特征將城市軌道交通站點進行分類,有助于地鐵運營公司對車站進行差異化管理,制定靈活的運營組織模式。
[1] MA X, WU Y, WANG Y, et al. Mining smart card data for transit riders’ travel patterns[J]. Transportation Research Part C-Emerging Technologies, 2013, 36: 1-12.
[2] KIEU L, BHASKAR A, CHUNG E. A modified density- based scanning algorithm with noise for spatial travel pattern analysis from smart card AFC data[J]. Transportation research part C-emerging technologies, 2015, 58: 193-207.
[3] WANG Z, HU Y, ZHU P, et al. Ring aggregation pattern of metro passenger trips: a study using smart card data[J]. Physica A, 2018(491): 471-479.
[4] BRIAND A, C?ME E, TRéPANIER M, et al. Analyzing year-to-year changes in public transport passenger beha-viour using smart card data[J]. Transportation research part C-emerging technologies, 2017(79): 274-289.
[5] DEVILAINE F, MUNIZAGA M, TREPANIER M. Dete-ction of activities of public transport users by analyzing smart card data[J]. Transportation research record, 2012(2276): 48-55.
[6] JANG W. Travel time and transfer analysis using transit smart card data[J]. Transportation research record, 2010(2144): 142-149.
[7] TAKAHIKO K, YASUO A. Behavioural data mining of transit smart card data: a data fusion approach[J]. Tran-spor-tation research Part C-emerging technologies, 2014(46): 179-191.
[8] 唐超. 基于客流特征的城市軌道交通站點類型分類: 以南京地鐵為例.創新驅動與智慧發展[C]//2018年中國城市交通規劃年會論文集. 北京: 中國建筑工業出版社, 2018: 1596-1605.
[9] 冷彪, 趙文遠. 基于客流數據的區域出行特征聚類[J]. 計算機研究與發展, 2014(12): 2653-2662.LENG Biao, Zhao Wenyuan. Region ridership characteristicclustering using passenger flow data[J]. Journal of computer research and development, 2014(12): 2653-2662.
[10] 陳學武, 戴霄, 陳茜. 公交IC卡信息采集、分析與應用研究[J]. 土木工程學報, 2004(2): 105-110. CHEN Xuewu, DAI Xiao, CHEN Qian. Approach on the information collection analysis and application of bus intelligent card[J]. China civil engineering journal, 2004(2): 105-110.
[11]戴霄, 陳學武. 單條公交線路的IC卡數據分析處理方法[J]. 城市交通, 2005(4): 77-80. DAI Xiao, CHEN Xuewu. The method of intellengent card data analysis for one public transportation route[J]. Urban transport of China, 2005(4): 77-80.
Passenger Flow Characteristics and Analysis of Urban Functional Structure Based on Rail Transit Data
CAO Jinghan, XU Yan, SUN Lishan, ZHAO Shenghui, WANG Yan
(College of Metropolitan Transportation, Beijing University of Technology, Beijing 100124)
With the rapid development of China’s economy and urbanization, the spatial relationship of urban residents is constantly changing. In the context of the increasing traffic congestion caused by an imbalance of an urban functional structure, the demand for resident travel is also increasing. With Beijing taken as an example, based on the automatic fare collection (AFC) card data, the network passenger volume, passenger flow space-time distribution, and other aspects of passenger travel characteristics are analyzed. Using k-means clustering, the subway stations of Beijing are clustered with unbalanced coefficients to study the unbalanced relationship between regular travel patterns and functional urban structures, whereby theoretical support for the study of an urban rail transit operation organization strategy is provided.
urban rail transit; AFC data; passenger flow characteristics; station features
U231.4
A
1672-6073(2021)02-0071-08
10.3969/j.issn.1672-6073.2021.02.012
2020-01-15
2020-04-09
曹敬浛,女,碩士研究生,從事軌道交通運營優化研究,609159925@qq.ocm
孫立山,男,教授,博士生導師,lssun@bjut.edu.cn
北京市科委項目(Z191100002519002),北京市教委項目(KM202010005001)
曹敬浛,許琰,孫立山,等. 基于軌道交通數據的客流特征與城市功能結構分析[J]. 都市快軌交通,2021,34(2):71-78.
CAO Jinghan, XU Yan, SUN Lishan, et al. Passenger flow characteristics and analysis of urban functional structure based on rail transit data[J]. Urban rapid rail transit, 2021, 34(2): 71-78.
(編輯:郝京紅)