張琳 白云慶
天津市市政工程設計研究院 天津 300000
交通小區的劃分是開展交通調查、交通預測、交通規劃等工作的基礎。傳統的交通小區常以城市道路為邊界,將研究區域劃分為若干個等大的分區。蔣萌露等學者以馬德里市為研究對象,研究結果表明基本單元面積越小,得到的數據精度越高,越能反映出細節問題。宋小冬、易嘉對城市交通分區合理性進行了探究,發現分區越多,結果偏差越小。 同時,如果研究區域過大,那么傳統的手段將面臨巨大的數據處理壓力,數據精度也難以保證[1]。
以現狀城市道路圍合而成的封閉區域作為初始小區。
采用POI點樣方密度法描述各小區特征。利用TF-IDF算法辨別各區的主導功能。
采用二階聚類分析,對各小區進行分類分組。
對同組且相鄰的小區進行合并,對個別小區進行人為修正。
以現狀道路為基礎,道路圍合而成的區域即為一個初始小區,共計490個。
POI興趣點是現實情況在地圖上的反饋,包含信息有行業類別、地理位置、名稱等,是分析城市功能的有效數據。
因各小區大小不同,分布的POI種類、數量不同,無法直接描述各初始小區內POI分布特征。故采用點樣方密度法來量化各小區的POI分布特征。
考慮到各類POI對城市功能的影響程度不同,對其進行權重賦值。首先將POI根據功能劃分為大、中、小三類。針對大類的權重系數,采用專家打分和模糊評價的方法確定[2]。
針對中類的權重系數,采用因素兩兩比較法。各因子所有得分的平均值則為其權重。

針對小類的權重系數,采取層次分析法進行權重賦值,采用百分制。
將POI的大類、中類、小類權重系數綜合起來即為綜合權重系數:


表1 POI分類及權重系數一覽表
為避免數據描述過于復雜,選取中類數據為統計對象,來描述各初始小區的POI分布特征,則:

得到各類POI的綜合權重系數后,可進行各小區的POI點密度分數計算:


各小區內的POI種類、數量都各不相同,故不能采用傳統的描述統計判別其主導功能。因此引入TF-IDF模型算法,來識別各區的主要功能。
TF-IDF具有良好的分類能力,趙家瑤等學者采用TF-IDF算法,對北京重要交通樞紐空間的城市功能進行識別。
研究方法是將區域內某類POI的分值看作一個詞語,全部POI分值總和看作整篇文章[4]。
計算各小區內各類POI分值所占的權重,權重最高的POI類別則為該小區的主要功能。若權重最高的值小于0.1,則認為該小區為無明顯主導功能。
其計算公式如下:



圖1

圖2 交通小區的初步劃分
根據POI功能識別結果,研究區域內配套功能為主導的初始小區占大多數,如果將這些初始小區合并為一個交通小區,得到的交通小區面積過大,違背此次研究的初衷,即盡可能將交通小區劃分得精細,以得到準確的交通預測結果[5]。
故此引入聚類分析的概念,聚類分析法是將特征相似的對象劃分為一個族群,各個族群之間差異明顯。本次分析基于SPSS軟件,采用二階聚類算法。二階段聚類算法可以同時處理連續變量和分類變量,快速處理大數據集并自動得到最佳分類結果。對不同功能小區的POI點密度分數進行二階聚類計算。
根據聚類結果將同一功能的小區分為不同的組別,將同功能同組別且相鄰的交通小區進行合并。為保證交通小區的唯一性和完整性,不能發生重疊或遺漏,且不能產生 “回”字形的形狀,對分區進行人為修正。最終得到交通小區187個,削減了303個,此方案為最終交通小區的劃分方案[6]。

表2 聚類分組一覽表

圖3 最終交通小區劃分方案
基于POI功能識別和聚類分析來劃分交通小區的方法,考慮了城市空間的實際功能和特點。在互聯網飛速發展的時代,大數據能為決策提供更為科學、合理的支撐。對比傳統劃分交通小區的方法,本文的研究方法突破了人為工作的局限。基于GIS平臺和SPSS軟件分析,便于大數據處理。分析結果更加科學合理,分析手段具有普適性,易于推廣。