魏海濤 肖天聰 胡寶生 王 薇 王晨曦 WEI Haitao, XIAO Tiancong, HU Baosheng, WANG Wei, WANG Chenxi
出行行為是個人行為建模、交通管控等方面的重要研究議題。出行行為模式是空間相互作用、城市空間結構與功能的映射。Bourne[1]基于城市形態與城市相互作用的概念,提出城市空間結構以一套組織規則,影響城市形態和城市子系統內部的行為,并將這些子系統連接成一個城市系統。改革開放以來,我國城市發展動力經歷了巨大的變化,許多大城市由過去的以向心集聚為主導動力的階段轉而進入以離心擴散為主導動力的發展階段(即郊區化階段)[2],20世紀90年代后這些大城市紛紛提出多中心的城市發展戰略。近年來,許多學者對這一現象進行了實證研究,發現北京、上海、廣州等大城市在發展中具有明顯的郊區化特征,人口和就業分布呈現多中心的空間結構,并在不同程度上出現了居住—就業的空間錯位[3-6]。隨著行為地理學相關研究的興起,越來越多的學者從個人行為角度研究城市空間相互作用與空間結構。孟慶艷[7]研究了上海市居民通勤行為的基本特征,總結了上海市通勤的空間結構模式,探討了通勤現象的距離變化特性。周素紅[8]研究了廣州市居民就業—居住空間的特征,通過通勤格局及其演變透視了城市實體空間的變化。
隨著信息和通信技術(ICT)的發展,大數據在研究中得以應用,如交通預測[9-10]、出行行為研究[11-12]、土地利用分析[13]和空間模型校準[14]等。由于出租車GPS軌跡具有準確的位置和時間標記,能相對準確地揭示人員群體流動的模式,國內學者以出租車GPS軌跡作為數據源,進行了相關研究,如LIANG等[15]2137采用北京市的出租車GPS軌跡,應用模型研究了出租車流動的位移分布,LIU等[16]利用上海市出租車GPS軌跡的大數據,采用社區發現的方法,發現了15個時間穩定區域,刻畫了上海的城市空間結構。SI等[17]采用北京出租車GPS數據,基于多源數據分析模型,運用語意推理方法將出行分成3種類型,并分析其相應特征。LIU等[18]基于深圳2014年出租車GPS軌跡的大數據,提取城市活躍區,用以研究城市結構和居民生活方式。
隨著城市化的推進,北京市的空間格局變化特征明顯。2000年以前,城市擴展圍繞中心城近地域圈層式蔓延態勢明顯。自2000年開始,北京的建設呈現多中心集聚趨勢[19]383。但是,由于城市規劃建設區均鑲嵌在城市環路之間,規劃建設的多個職能中心并沒有形成真正意義的疏散中心城區人口與功能的城市次中心。“圈層式”空間規劃固化了城市單中心的蔓延發展模式[20]。
本文以北京市出租車GPS數據為基礎,采用社區發現來探索居民出行模式,并結合相關的土地利用狀況,揭示北京市城市空間結構特征。

圖1 研究區域(北京六環以內)
北京是典型的世界級城市,2015年末常住人口為2 170.5萬人,行政轄區面積為16 411 km2。北京的城市空間體現為“一主、一副、兩軸、多點”的結構①,其中,“一主”為中心城區(包括作為核心區的東、西城區),“一副”即通州,“兩軸”是長安街與中軸線,“多點”則是順義、亦莊、大興、昌平、房山、懷柔、密云、平谷、延慶、門頭溝10個新城,還有海淀山后、豐臺河西、北京新機場地區3個重要的城鎮組團。城市內部呈現多中心結構,包括中關村科技園區核心區、奧林匹克中心區、中心商務區(CBD)、海淀山后地區科技創新中心、順義現代制造業基地、通州綜合服務中心、亦莊高新技術產業發展中心和石景山綜合服務中心。綜合考慮研究目的和數據的可行性,本文的研究區域界定為北京六環以內,面積為2 267 km2,占全市總面積的13.81%,是人口出行的主要區域(見圖1)。
北京城市道路網為典型的“方格網+環形放射”混合狀,兩大主要機場(首都國際機場和南苑機場)和四大火車站(北京南站、北京北站、北京西站和北京站)是重要的對外交通樞紐。
根據《第五次北京城市交通綜合調查總報告(2016)》,2014年出租車出行約占總體出行結構的6%,在公共交通服務中占據了重要地位。出租車服務具有獨立性、隨機性、便利性、區域性和舒適性等特點,是公共汽車和地鐵的重要補充。相較而言,出租車能更精準地定位出行的軌跡。本文采用北京市運營的出租車24 h的GPS數據,每輛車的GPS數據作為一條記錄,包括上車時間、上車地點、下車時間、下車地點、行程持續時間和行程長度等信息。選取從周一(2015年9月14日)到周日(2015年9月20日)的記錄組成數據集。刪除其中行程不完整、乘車距離大于100 km和小于100 m、乘車時間大于6 h和小于1 min、速度大于33 m/s的數據,進而得到2 896 609次出行記錄。同時,將出租車軌跡簡化為由起點和目的地構成的向量,以兩地之間的歐氏距離作為行程長度,忽視路線細節,并將GPS數據同北京空間坐標底圖相匹配,以便進行空間分析。
出行距離分布是研究人口遷移時的一個重要統計特性。本文研究區域內出租車出行歐氏距離的平均值是3.44 km,出租車出行數據的分布形態(見圖2a)顯示,出租車出行的距離—頻數遵循指數分布:

3 km以內出租車出行頻數處于高水平,3—9 km范圍內頻數快速下降,9 km以上距離頻數逐漸趨近于0。基于此,本文以3 km與9 km為門檻值對數據進行分組,并將這3組分別命名為短距離出行組(1 779 664次)、中距離出行組(887 738次)和長距離出行組(229 207次)。
圖2b顯示,把距離頻數進行對數變換后的分布符合線性分布:

隨著距離增加,出租車出行頻數降低。長距離分布仍然是長尾分布,這表明在長途出行時選擇出租車的人對費用的敏感度較低,原因可能在于商務出行、公務出行或非工作性出行中的特定需求,如旅游、就醫、娛樂、處理突發事件等。
不同組的變化差異證明將出租車出行按照出行距離分組是合理的(見圖3)。圖3a和圖3b顯示的3組出行頻數的波動區間不同,由短至長分別是(10 000,30 000)、(0,10 000)和(0,5 000)。1天內,短距離出行頻數波動幅度最大,長距離出行頻數波動幅度最小,長距離出行變化較小,更為穩定。此外,3組出行變化的時間段也是不同的。1天內,短距離出行組出現早、午2個波峰,中距離出行組在早、中、晚均出現波峰,而長距離出行組在白天略有波動,只有晚上1個波峰。
工作日期間出行變化的情況與休息日有明顯差別,如圖3c和圖3d所示,工作日期間0:00—6:00的3組出行情況基本一致,6:00以后3組出行情況存在明顯差異。短距離出行組上下車次數在8:00—19:00一直處于高頻區間,其中15:00出現波峰;中距離出行組上下車次數在8:00—23:00處于較高水平,無明顯波峰;長距離出行組1天之內變化較小。如圖3e和圖3f所示,休息日期間在0:00—5:00的3組出行的頻數均下降但幅度不同,5:00以后3組出行情況存在明顯差異。短距離出行組 存 在3個 波 峰(10:00—12:00、14:00—16:00和21:00—22:00)和2個波谷(12:00—13:00和20:00—21:00);中 距 離 出 行 組 在8:00—24:00處于較高出行水平,但在19:00—20:00出現1個小的波谷;長距離出行組無明顯變化。與工作日相比,雙休日期間短距離和中距離整體頻數下降且比工作日多1個波谷(20:00左右)。長距離出行在工作日和雙休日無明顯變化,這可能是因為長距離出行是由特定的出行目的所決定的,不會受工作和休息的影響。

圖2 出租車出行距離—頻數分布的曲線估計

圖3 不同長度出行組的時間變化圖
從方位上看(見圖4),短距離出行和中距離出行的方向分布基本一致,具有明顯的波峰,而長距離出行的方向分布更均勻。短距離出行的方向分布具有3個較高的波峰(正東、正北和正南)和1個較低的波峰(正西),中距離出行方向分布具有2個較高的波峰(正東和正南)和2個較低的波峰(正西和正北)。這與通過遙感數據觀測到的1986年以來的北京市城市空間拓展方向(北面、東面和南面)是一致的[19]377。這可能是由于城市空間的拓展方向影響了城市的功能結構,進而對人員流動和出行行為產生影響,因此人員流動可以反映城市空間結構特征。長距離出行的方向分布波動較小,在東北和西南方向存在2個較小的波峰,這與市中心到首都國際機場、北京南站、北京西站的方向相同,表明長途出行更多地受到城市交通節點的影響。
本文將研究區域劃分為1 km×1 km的單元,計算每個單元中3組距離的上下車點數,發現上下車點主要分布于六環以內,在遠郊區縣的經濟活動中心也有零散分布,其中通州的分布規模較大。短距離出行的上下車熱點主要集中在CBD和金融街一帶。中距離出行的上下車熱點主要集中在北京南站、北京西站、國貿、首都國際機場以及北二環、三元橋—首都國際機場一帶。長距離出行的上下車熱點主要集中在北京西站、北京南站和首都國際機場,可以推斷長距離出行是由居民特殊類型的交通產生的,例如目的地為火車站、機場,或外地游客前往陌生地點等。由此可見,不同距離的出租車出行因不同目的而具有不同的模式[15]2142。

圖4 不同長度出行組的出行方向分布

表1 由不同長度的出行構建的網絡的基本統計
本文將1 km×1 km網格單元作為網絡的節點。如果出租車出行從一個單元開始并在另一個單元結束,則存在兩個單元的邊緣且邊緣方向為從起始單元指向目的地單元,兩個單元之間的出租車出行次數是邊緣的權重,從而形成定向和加權的網絡。在構建網絡時,刪除在同一單元中開始和結束的出行。
基于3組出行數據分別建立3個網絡。表1顯示了網絡的基本統計結果。短距離出行組的出行次數和節點數最多,但邊緣數最少,說明短距離出行路線較中長距離出行更穩定,具有更規律的空間模式,短距離出行的空間相互作用更強;長距離出行包含最少的出行次數和節點數,平均邊緣權重遠低于其他兩組,說明長距離出行往往具有特定的出行目的和地點,發生頻率較低;中距離出行作為短距離出行和長距離出行的過渡類型,結合了二者的特性。
總體來看,不同組的出租車出行在時間、空間方面具有不同的特征。從出行流量來看,短距離和中距離出行都遠高于長距離出行。從時間變化來看,短距離和中距離出行具有明顯變化,而長距離出行則基本無變化。從出行方位來看,短距離和中距離出行具有明顯的方向性,而長距離出行的方向分布更均勻。結合短、中、長距離網絡基本統計結果,可以發現長距離出行是由特殊的出行目的引發的,不體現居民出行的日常行為特征。相反,短距離和中距離出行具有更規律的時空特征,更適宜用來揭示城市的空間結構。
社區結構是網絡中的一個普遍特征。給定一個網絡圖,并找出其社區結構的過程叫做社區發現(Community detection)。同一社區中的節點之間的連接多于與其他社區中的節點的連接[21],[22]167-171。因本文將研究重點放在短距離和中距離的分析上,考慮到加權和定向的網絡,采用凝聚子群分析,用以發現短距離和中距離網絡中的社區。凝聚子群分析(Cohesive subgroup analysis)是社會網絡分析中的重要方法,強調凝聚性在社會網絡中的重要性。當網絡中某些行動者之間的關系緊密,以至于結合成一個次級群體時,即成為凝聚子群。分析的目的是為了揭示社會行動者之間實際存在的或者潛在的關系[22]148。本文主要通過分析節點間的聯系來研究網絡結構特征。
本文從短距離網絡中發現了16個區域,在中距離網絡中發現了24個區域(見圖5)。這些區域同北京圈層結構基本吻合,具有一定的等級性,呈現從中心向外圍輻射的“圈層+片狀”的分布形態。中心城區的社區通常是空間連續的大面積區域,直徑從5 km到10 km不等。郊區的大多數社區由很少的網格構成,這些小社區是由于出租車流量較低而形成的。所有的社區圍繞城市中心呈圈層結構分布,空間連續性體現了距離衰減效應,這與現有的一些結論[23]一致。大多數社區形態與行政區不同,行政邊界對城市內部出行的影響較小。社區發現反映了人們的出行特征,是研究城市結構與功能的基礎單元,本文將發現的社區命名為居民出行區(Residential travel zone,RTZ)。通過聚焦分析RTZ,探究城市結構與功能。
RTZ的內部特征對于研究城市結構具有重要的意義。為使RTZ格局更加清晰簡潔,且便于統計,本文去除了RTZ內部的零星異塊。如圖6所示,短距離的RTZ共有16個,根據凝聚子群密度的大小,將其劃分為5個層級。RTZ1和RTZ2屬于第1級,位于北京市中心,涵蓋了三環以內絕大多數地區,包含最多的出租車出行次數。第2級包括從3到5的RTZ,集中了北京市主要的就業中心。RTZ6到RTZ8相對較分散,屬于第3級,主要是近郊的一些核心地區;其中RTZ7位于通州地區,是城市副中心的核心地區,近年來發展較為迅猛。RTZ9至RTZ11屬于第4層級,位于石景山區、豐臺區和大興區,屬于城市功能拓展區。RTZ12至RTZ16屬于第5層級,出租車流量較低,均位于六環以內的邊緣區域。其中,RTZ16的子群密度近乎為0,主要是香山地區。除了RTZ12和RTZ13外,同一級的RTZ基本位于相同的圈層。整體上反映了“北強南弱不均衡”的城市出行特征,與北京市“一主、一副、兩軸、多點”的空間布局特征具有一致性。
如圖7所示,中距離的RTZ共有24個,可以分為3個層級。RTZ1至RTZ4屬于第1級,位于北京市中心,基本與四環的區域重合,子群密度非常高,社區內部聯系非常緊密。第2級包括從5到16的RTZ,基本位于第1級的外圍,面積較小,行政區劃上位于城市功能拓展區。RTZ17到RTZ24,屬于第3級,位于六環以內的邊緣區域,出租車流量低。除了RTZ10和RTZ15外,同一級的RTZ基本位于相同的圈層。RTZ10位于空港經濟區,RTZ15位于城市副中心通州的核心地區。從整體上看,中距離的RTZ反映了“內強外弱的圈層式”的出行格局,這與北京市早期圈層式蔓延發展的路徑具有一致性,同時可以看出,與所屬圈層不匹配的子群是由特定的發展基礎、功能分工來影響和決定的。
為了進一步探索每個RTZ內的出行結構,本文分析了短距離網絡和中距離網絡的40個RTZ所對應的子網絡屬性。每個子網絡包含開始和結束于對應RTZ的所有短距離(或中距離)出行。在計算統計時,選擇忽略網絡邊緣的方向,因為非定向指標更容易理解,并且可以足夠清楚地描述空間交互關系。

圖5 基于短、中距離出行網絡的社區發現結果

圖6 北京市16個短距離RTZ

圖7 北京市24個中距離的RTZ

表2 短距離RTZ統計表

圖8 RTZ的土地利用情況分析圖
表2顯示了16個短距離子網絡的總體特性。節點的度被定義為連接到它的節點的數量,是節點的拓撲中心性的基本衡量指標;網絡的平均度表示不同節點之間的交互強度;圖密度是指網絡邊緣數量與其可能的邊緣數量最大值的比率,用于衡量完全連接的網絡之間的連接程度;聚類系數被定義為連接到同一節點的兩個節點連接并且量化為局部聚類的可能性。
如表2所示,16個短距離的RTZ網絡的平均度和圖密度高,表明RTZ中節點間的聯系比較強,進而說明了居民在RTZ內部出行的多樣性及RTZ中節點相互作用的廣泛性。此外,隨著層級的提高,RTZ的平均度、平均邊緣權重和圖密度減弱,即隨著出行次數的減少,RTZ內部節點間的聯系也減弱。由于16個RTZ的連接性都較好,與節點數相比,平均聚類系數的值比較均勻。一般來說,16個子網絡具有類似的拓撲結構,但是城市區域中的子網絡包含更大的交通流量,并且節點之間的連接范圍比郊區子網絡更廣泛。
由于交通流量的差異,在中距離網絡中1、2和3級RTZ的平均度(分別為182.4268、135.7500和145.6883),平均邊緣權重和圖密度的值逐漸降低。由于24個中距離RTZ②的連接性較好,與節點數相比,平均聚類系數的值比較均勻。24個子網絡具有類似的拓撲結構,但是中心城區的子網絡包含更大的交通流量,并且節點之間的連接范圍比郊區子網絡更廣泛。中距離RTZ的平均度(42.0578)和圖密度的平均值(0.3443)均高于短距離RTZ,說明中距離RTZ內節點之間的聯系更加緊密。相反,中距離RTZ的平均聚類系數的平均值(0.1422)低于短距離RTZ(0.2141),說明中距離RTZ內部節點間的聯系更加均勻,而短距離RTZ中存在少數聯系較強的節點,發揮了中樞的作用。
城市出行與特定的土地利用有關。本文利用POI(Point of information)數據進一步研究不同RTZ的土地利用狀況,選取餐飲服務、公司企業、交通出行、科研教育、休閑娛樂、醫療服務和住宅小區7類POI數據來反映不同的土地利用類型。由于出租車的上下車位置不一定是出行的目的,本文使用泰森多邊形對POI點進行處理,得到每一個POI點的服務范圍,規定上下車點位置所對應的POI點功能即為出行目的。同一個上(下)車位置可能對應多個POI點的泰森多邊形,此時采取該多邊形中功能比重最高者作為出行目的類型。對每一個RTZ中的出行目的進行匯總,并分別把16個短距離RTZ和24個中距離RTZ中每個POI類型的最大值標準化(見圖8)。顯而易見,短距離的RTZ前3層(RTZ1—RTZ8)包含更多類型及數量的POI,并且住宅小區、餐飲服務以及公司企業的POI數據在不同的RTZ中比率相近;后2層(RTZ9—RTZ16)中的POI則主要集中在公司企業及住宅小區兩類,其他功能較弱。中距離的RTZ情況與短距離的RTZ相似,外層的突出功能為公司企業,其他功能較弱。這些差異反映了不同層級RTZ的不同功能,從土地利用情況可見北京城市功能的分層結構明顯。
事實上,城市空間結構可能與所有長度的出行狀況密切相關。本文對所有長度的出行流進行分析。出租車流量以及出行距離差異水平的時間變化可以描述一個地區的交通狀況,與土地利用狀況密切相關,能夠在一定程度上反映該地區的功能。
選取與上文相同的1 km×1 km的單元,然后基于出行流量和差異水平將這些單元聚集成類。在1天中界定5個時間間隔,每個間隔都有足夠的出行數據支持分析。這5個 間隔分別是:“清晨”(5:00—9:00),“上午和 中 午”(9:00—13:00),“下 午”(13:00—17:00),“傍 晚”(17:00—21:00)以 及“晚上”(21:00—次日1:00)。根據在相關研究中被成功應用的香農熵[24],將每個網格D(i)的差異水平定義為:

其中Vd(i)是在一定距離范圍類別d內同網格單元i聯系的出租車流量,k是根據出行長度劃分的出行組編號。本文選擇3 km作為這里的分組間隔,V1代表距離小于3 km的出租車流量,V2代表距離位于3 km到6 km之間的出租車流量,以此類推。由于上車點和下車點有不同的模式,計算5個時間段中每個網格單元的上車點數量、下車點數量、上車出行的差異水平和下車出行的差異水平,即每個單元有20個特性。本文忽略那些在這5個時間段中沒有出租車流動的單元格并應用k均值聚類的方法對所有單元格分類。
這些網格單元被分為3類(見圖9)。類別1、2的單元格具有很大的交通流量和相似的時間變化水平,類別3的單元格交通流量較低且沒有明顯的時間變化。中心地區的上車出行差異水平大于邊緣地區,而就下車出行的差異水平而言,除清晨外,所有類別的差異水平基本一致。
這3類網格的空間分布清晰地描繪了北京的同心層結構。類別1的單元覆蓋了城市的多個中心及火車站、機場。類別2基本覆蓋了四環以內大部分區域,并包含了機場線及通州副中心。除特殊地形的地域外,類別3基本涵蓋了六環以內的所有區域。將這3類網格的分布與短距離及中距離的RTZ分布相比較,可以發現具有相似的規律——較為明顯的同心層結構,與RTZ單元所描繪的城市結構有一致性,證明前文基于RTZ分析的結論是合理的。

圖9 3類網格單元中5個時間段的交通流特征分析
出租車在公共交通服務中占據了重要地位,研究出租車軌跡及其空間特征對探究居民出行規律、城市結構與功能,以及城市規劃具有一定的啟示意義。本文首先對出租車出行按距離進行分組研究,發現不同組的出租車出行在時間、空間方面具有不同的特征,與長距離出行相比,短距離和中距離出行具有更規律的時空特征,更適宜用來揭示城市的空間結構。
本文運用社區發現的方法研究了由短距離和中距離出行構建的網絡,將其分區并命名為RTZ。根據凝聚子群密度將RTZ進行層級劃分,發現北京市具有“北強南弱不均衡”和“內強外弱圈層式”的出行特征。進一步研究RTZ內部的出行結構,可以發現在每個RTZ內部大多數節點的出租車流量較低,出租車流量最大的節點在RTZ內部發揮了中樞的作用,將其命名為“居民出行區中心”并進行分析。位于城市核心區的“居民出行區中心”,其土地利用類型更綜合,出租車流量處于較高水平;而一些位于城市拓展區的“居民出行區中心”,其土地利用類型過于單一,引發了城市內部職住分離、潮汐車流等問題。最后,本文探討所有長度的出租車出行的交通流量屬性,交通單元的空間分布也揭示了北京的圈層式分布。
結合其他學者的研究,本文認為北京市目前圈層式的空間布局的原因,在于北京市2000年之前圍繞中心城近地域圈層式的發展模式固化了城市單中心的蔓延態勢[19]382。在這樣的空間慣性下,要使城市向多中心轉變任重而道遠。因此,城市規劃導向上應進一步完善城市次中心的功能,提升次中心土地利用類型的綜合性,構建功能協調、優勢互補的多中心城市網絡結構。
出租車作為公共交通的一種類型,存在一定的價格門檻,難以涵蓋所有人群及目的的出行,進一步的研究可以擴大數據來源,整合私家車、公共汽車和地鐵等多種交通方式,而不同數據的組合可以從更多維度研究居民出行特點和城市空間結構。
注釋
① 本文的研究時點為2015年,同分析相關的城市空間、路網結構以及交通設施等情況與彼時相應。
② 限于篇幅,中距離24個子網絡的統計表格省略。