管娜娜 田 苗
(成都市規劃設計研究院,四川 成都 610041)
近年來,成都市致力于探索數據和模型驅動的交通規劃理念,依靠構建交通數據庫和多層次綜合交通模型技術,能夠極大地提高交通規劃決策的科學化水平。2016~2017年,成都市開展了新一輪綜合交通調查和交通模型體系構建工作,并將手機信令數據、車載GPS數據、視頻監測數據、交通運營數據等多源交通大數據納入規劃決策支持體系。本次以雙流區為例,闡述大數據對交通規劃技術創新、交通需求分析的支撐作用。
交通與城市的土地利用、人口構成、經濟收入、車輛保有、交通條件等有著密切的關系。交通規劃的理論基礎是基于綜合交通調查建立“四階段”交通需求模型,調查的門類包括居民出行調查、公共交通調查、道路流量調查、專項調查等,傳統交通調查采用人工方法,每一項調查都涉及極大的工作范疇和工作量,比如居民出行調查需要通過入戶詢問進行信息采集,數據獲取成本高、時耗長、時效性短。在大數據蓬勃發展的背景下,大數據為研究者提供了針對城市交通的一種多角度、多層次、多測度的大樣本連續觀察能力[1],借助交通大數據的“大樣本”“連續追蹤”優勢,使得整體把握交通態勢與趨勢成為可能。
基于交通大數據的空間的聯系與活力、居民的出行特征、交通與居民活動空間的關系等研究成果逐漸涌現。北京、上海、天津等城市在最近的城市綜合交通調查中均充分挖掘交通大數據資源,主要包括遙感影像數據、移動通信信令數據、車載GPS數據、公交IC卡數據、RFID監測數據等。交通大數據為交通模式提供了更加全面的原始數據[2],上海、廣州、重慶等城市不斷探索通過挖掘大數據改進交通模型技術,比如遙感影像數據用以挖掘城市用地特征,移動通信信令數據用以分析人口分布、通勤特征,公交IC卡數據用以分析軌道和常規公交出行特征,RFID監測數據用以分析小汽車總量和運行分布[3]。大數據技術將會越來越廣泛地應用于城市交通規劃和決策,特別是模型的構建和維護中[4]。
(1) 元數據。
手機信令數據為依托運營商建立的信令監測平臺,采集手機與基站之間信令數據交換。觸發數據交換有兩種方式,一是通話、短信、上網、區間切換等主動行為;二是基站定期掃描其覆蓋范圍內手機的在線情況,形成一條被動信息記錄。基站分布情況如圖1所示。手機信令數據記錄內容如表1所示。

圖1 基站分布情況

表1 手機信令數據記錄內容
本次研究采用中國移動通信運營商提供的2016年3月14日~3月20日為期一周的雙流區境內所有基站采集到的全量數據,總記錄條數8249萬條,有效日均信令數據1 178萬條。
(2) 數據處理。
對手機信令數據的處理分為兩部分,第一部分為靜態分析,通常以停留時長作為判定原則識別手機用戶類型;第二部分為動態分析,根據經緯度信息生成居民出行鏈,進一步分析出行OD。
①靜態分析處理過程:
數據清理:以用戶ID為唯一標識,統計每個ID一周總記錄條數,剔除一周記錄條數不足7條的用戶ID對應的所有記錄。
數據排序:以用戶ID為唯一標識,按時間排序,提取其記錄時間在每天22:00~次日6:00時間段內的所有手機信令記錄,用于判定常住人口;提取其記錄時間在9:00~18:00時間段內的所有手機信令記錄,用于判定通勤人士。
用戶類型識別:將一周7天內至少有4天從22:00~次日6:00在同一位置停留6小時作為常住人口判定原則;將一周7天內至少有4天從9:00~18:00在同一位置停留4小時作為工作人口判定原則。
②動態分析處理過程:
數據清理:一次出行至少應有3條記錄,為此預先剔除一天記錄條數不足3條的手機記錄。
出行記錄識別:首先,以手機號為索引,按照時間先后順序,生成某人全天行動軌跡,并計算上下兩條記錄的間隔時間和平面距離;然后,以20 min為閾值,將全天出行軌跡截斷為多條出行記錄;然后根據每條出行記錄,匯總出行距離、單次出行OD等信息。
(1) 元數據。
本次研究采用成都網闊信息有限公司平臺提供的貨運車載GPS數據,車載GPS每條記錄涵蓋信息包括:序號,車牌號碼,GPS時間,經度,緯度,隸屬公司,車輛速度,車輛方向等信息。車載GPS數據記錄內容如圖2所示。

圖2 車載GPS數據記錄內容
(2) 數據處理。
首先采用網絡爬蟲技術,從網闊信息GPS企業平臺頁面上爬取了雙流區境內482輛貨車的GPS定位信息;然后在eclipse開發平臺上,對貨運GPS原始數據進行處理,生成每輛車每次出行軌跡。
傳統獲取居民出行特征的方法為居民出行調查,采用調查問卷的方式進行抽樣調查,抽樣率通常為1%-5%。在分析居民出行特征時,需要對調查數據進行擴樣和校核,在擴樣的過程中數據難免存在一定程度的“失真”,因此,校核工作對準確反映全體居民出行特征是至關重要的。手機信令數據具備“大樣本”“連續追蹤”的優勢,能夠更為精準地反映城市居民出行特征,起到對居民出行調查的補充和校核作用,本次研究通過手機信令數據識別出雙流區現狀居民的出行總量與出行率、出行距離等特征,有效地對居民出行調查的數據進行了校核。
(1) 出行總量與出行率。
通過手機信令數據分析居民出行OD,得到雙流區現狀居民日均出行總量為80.6 萬人次/日,人均出行次數為2.37 次/日。通過居民出行調查測算的人居出行次數是2.16 次/日,可以看出手機信令數據測得的人均出行次數略高于居民出行調查的結果。因此,本次研究采用了兩者的平均值2.27 次/日。雙流區出行量與出行次數分布圖如圖3所示。
(2) 出行距離。
居民總體平均出行距離為5.4 km。其中,約66 %的居民出行距離在5 km以內,說明雙流目前平均出行距離較短,中長距離的跨區出行量較低。還有約34%的居民出行距離超過5 km。雙流區居民出行距離分布圖如圖4所示。

圖4 雙流區居民出行距離分布圖
(3) 對外交通分布。
對外機動車OD調查通常需要采集高快速路、國省干道、主次干路的全天雙向的交通量,通常采用傳統的人工調查法結合固定檢測器采集法進行調查,固定檢測器需要埋放在道路下方,且容易損壞,數據獲取成本高。
通過手機信令數據對雙流區的客流OD進行分析(見圖5),能夠更為準確客觀得出雙流區與成都市中心城區、天府新區成都直管區、溫江區、新津等周邊城市片區之間的現狀交通聯系客流量。其中,雙流和中心城區的客流交換量最大,達到51 065 人次/日;其次是高新區,達到29 450 人次/日;與直管區的客流交換量為25 574 人次/日。上述對外交通分布為分析現狀區域交通運行狀態提供了支撐,結合現狀區域聯系通道的建設情況,聯系成都主城區的雙楠大道、成雙大道、大件路高峰期較為擁堵;而聯系高新區的通道數量不足、通道等級低,因此,為確定區域交通通道方案奠定了基礎。

圖5 雙流區現狀OD分布圖
大城市的居民出行調查往往5年才開展一次,中小城市的調查數據更是極為匱乏。而手機信令能夠獲得“當前的”“連續的”數據,從而對交通需求模型中的參數確定起到校核和驗證的作用。本次研究采用面積原單位法來測算交通生成量,即通過不同用途的土地和開發強度下的交通吸引率和發生率來計算交通區的生成量。首先,通過手機信令數據可以快速統計出各個交通區的生成量,然后通過回歸分析,可以得到各類用地的交通吸引率和發生率。結合規劃年的用地布局和開發強度,進而可以測算出規劃年的各個交通區交通生成量。規劃年各交通中區交通發生量與吸引量如圖6所示。

圖6 規劃年各交通中區交通發生量與吸引量
傳統的調查方法很難區分特定人群的出行行為,而手機信令數據在分析特定人群的出行特征方面具有較好的適用性,特別是通勤出行的研究,通過定位到用戶的居住地和工作地,能夠有效地對通勤特征展開研究,從而較好地把握整個區域的職住分布和主要的通勤方向等特征,這對通道的規劃布局和城市空間結構都有很強的指導意義。
本次研究通過手機信令數據對雙流區居住人口和就業人口進行識別,按照一周內有4天于夜間22:00~6:00出現在同一個坐標的為常住人口,分析表明,雙流區有44萬常住人口(使用移動通信的人口),主要集中于東升老城區6.6 萬人(東升街辦12.1 萬人)、蛟龍港片區和西航港北片區9.5 萬人(含6萬在校學生)。按照一周內有4天于白天9:00~18:00出現在同一個坐標的為就業人口,分析表明,分析得到區內就業(就學)人口約20萬,主要集中于東升老城區、蛟龍港片區和西航港北片區。雙流區常住人口分布圖如圖7所示,雙流區就業崗位分布圖如圖8所示。

圖7 雙流區常住人口分布圖

圖8 雙流區就業崗位分布圖
交通規劃需要掌握區域內重要的客流吸發點,手機信令數據在分析特定區域(交通樞紐、大型公共設施、商圈等)的客流來源及目的地方面具有優勢。
本次研究對雙流國際機場、東升核心區的客流分布進行分析挖掘,可以看出,雙流國際機場的客流主要來自區外的成都主城區和高新區;東升核心區的客流主要集中于內部出行,占60%左右。從而對重要集散點的集散通道規劃、進出交通組織等提供了依據。雙流機場客流分布圖如圖9所示,東升核心區客流分布圖如圖10所示。

圖9 雙流機場客流分布圖

圖10 東升核心區客流分布圖
在傳統的交通調查中,貨運車輛出行特征調查通常與對外交通調查同時進行,在對外的主要通道設置觀測點,進行停車問詢,數據采集成本高、工作量大。大數據為貨運車輛出行特征提供了更加高效精準的采集方法,通過車載GPS定位信息獲取貨運車輛停靠點、貨運OD數據、貨運熱門通道,能夠識別各個方向的貨運聯系強度,及現狀貨運通道存在的問題。
(1) 貨運聯系強度分布。
通過車載GPS定位信息獲取貨運車輛停靠點、貨運OD數據,得到雙流對外貨運比例約占總貨運量的82%,雙流與天府新區、龍泉、主城方向聯系較強,溫郫方向所占比例較低。基于現狀貨運OD分布,結合市域“4+N”產業聯系將加強,與主城區貨運聯系將在現狀基礎上減弱,與龍泉、直管區、簡陽等方向聯系將不斷加強,從而主要增加向東、東南方向的貨運通道。雙流區對外貨運分布比例圖如圖11所示。

圖11 雙流區對外貨運分布比例圖
(2) 貨運通道識別。
基于貨車出行軌跡識別出貨運熱門通道主要包括,大件路、雙楠大道、成新蒲大道、長城路、劍南大道、珠江路、S108等。從而識別出貨運交通組織的問題,主要的貨運通道穿越西航港城區,貨車對該片區交通組織影響較大,容易帶來安全隱患。因此,建議對長城路、珠江路等采取分時段禁行措施,并規劃引導客貨分離。現狀貨運熱門通道分布圖如圖12所示。

圖12 現狀貨運熱門通道分布圖
本文通過將手機信令數據、車載GPS數據等多源數據應用于統一的交通規劃體系,實現了傳統交通規劃理論下的交通大數據的應用實踐。大數據充分體現出大樣本、連續性、獲取方便的優勢,使得研究者能夠更準確地把握居民出行特性、各區域的人口分布等,并能夠與居民出行調查形成良好的校核關系,成為構建交通模型重要的組成部分。同時,大數據也有其局限性,比如數據本身的處理挖掘技術、基于大數據的交通規劃理論等方面都存在極大的提升空間。
大數據技術已經廣泛地應用于交通規劃和交通管理中,隨著交通大數據更加多元、集成、智能,交通大數據在交通規劃、交通管理、交通決策中的應用是必然趨勢。在交通大數據技術的推動下,交通規劃理念和管理體系正在經歷一場變革,城市交通規劃將轉向一個適時響應的過程管控平臺。