曾月


摘要:隨著信息化的發展和數據源的增多,越來越多的大數據被應用于城市規劃研究中,但由于大多數數據具有難獲取,不易分析等特點,使得相關的技術方法在實際項目中運用較少。本文采用較易獲得POI數據對成都市五城區的空間布局進行聚類分析,描繪各類功能分布,并提取城市空間結構,用POI的城市規劃研究能夠提供一種新的方法和角度對城市進行認知,在城市規劃前期幫助、中期分析、后期跟蹤等方面有一定的應用前景[1]。
關鍵詞:POI數據;成都市五城區;空間布局;聚類分析
1.引言
隨著信息化的發展和大數據時代的到來,城市規劃研究中不再滿足于傳統數據的分析應用,運用大數據進行的城市分析逐漸增多,主要集中在手機信令、微博數據、出租車、地鐵或公交車刷卡數據等,從城市人群的動態分布反映真實的城市運行狀態。龍贏等[2](2012)利用公交刷卡數據,對北京市公交持卡人的居住地、就業地和通勤出行的識別結果在公交站點和交通分析小區(TAZ)尺度上進行匯總。陳映雪等[3](2014)以南京為例,借助新浪微博獲取海量簽到數據,從居民活動這一社會化的視角,再探究舊有的城市空間功能組織方式。鈕心毅等[4](2014)以上海中心城為例,提出了利用手機定位數據識別城市空間結構的方法,并對上海市手機用戶密度、城市公共中心等級職能、功能區進行識別。這些研究對大數據在城市研究中的運用進行了嘗試,提供了更多新的技術方法。但由于以上研究的數據獲得門檻較高,在城市規劃實際工作中應用較少。
本文以成都市的部分POI 數據為支撐,采用聚類算法,借助ArcGIS 軟件,全面對成都市五城區的總體及各行業空間布局進行研究,以克服傳統官方數據的弊端,拓寬了城市空間格局研究的視野;提煉數據的特征,以期為更多種類的大數據在城市規劃中的實際應用提供思路與借鑒。
2.研究方法與數據來源
2.1 研究區概況
2017年8月31日舉行的“成都國家中心城市產業發展大會”上,成都打破圈層結構,將中心城區范圍擴大至原一二圈層的11個行政區加高新區、天府新區,形成“老中心城區+郊區新城”的空間層次。將成都市城區大致劃分為三個類別:老中心城區(主城五區)、功能經濟區、新中心城區。本文選取老中心城區,即錦江區、青羊區、金牛區、武侯區、成華區五城區為研究對象,具有相對豐富健全的公共服務空間,具有較大的研究價值。
2.2 數據來源
POl數據泛指一切可以被抽象為點的地理實體,尤其是與人們生活密切相關的設施,是電子地圖上的某個地標,并包含經緯度、地址、名稱、類型等屬性信息。電子地圖中每一個地名、建筑、公園、學校、醫院、公司、商場等都是一個興趣點。本研究參照相關文獻分析、《城市居住區規劃設計規范》GB 50180-93(2016年版)以及居民的日常需求,將生活設施分為七類,分別是餐飲、交通設施服務、科教文化服務、生活服務、體育休閑服務、醫療保健服務、政府機構機關及社會團體。本研究通過城市數據團獲得成都市生活設施POI數據,每條POI數據至少包括名稱、經度、緯度、地址等4個屬性信息。經過去重、糾偏與空間匹配,得到生活設施現狀數據量共114726條
2.3 研究方法
2.3.1 方法原理
K-means 算法屬于聚類方法中一種典型的劃分方法,以數據劃分的類別數作為數據聚類的依據,同類間相似性高,不同類間相似度低。K-means 算法的基本假設為:對于一個簇,選出一個中心點,使簇中的所有點到該中心點的距離小于到其他簇中心的距離。給定一組n個樣本X,將其分成K個不相交的簇C,每個簇由樣本均值uj描述,即使同一簇內和平方最小。[5]
本文提出的空間聚類方法包括3個步驟:①對位置數據進行預處理;②利用聚類分析探索空間分布;③根據聚類結果分析空間分布特征。具體操作為:將poi數據導入Arcgis中,進行坐標轉換,并篩選數據,再將關聯到地圖中劃分為562個漁網格。最后進行聚類分析,并配合相關性進行整體特征分析。
3.空間布局分析
3.1數據格網化
基于十五分鐘生活圈的原理,即居民十五分鐘步行可達范圍約為一平方公里,將成都市五城區范圍劃分為562個漁網格,再將poi數據關聯到漁網格上。并基于此開展后續分析。
3.2迭代聚類分析
由于格網數據在空間具有連續性,可通過聚類分析探索格網的空間分布模式,以反映格網屬性在空間的分布規律。為了使K-means 算法的聚類結果能更真實反映聚類特征的空間劃分,以下式中目標函數為迭代依據,將聚類數K作為自適應參數,迭代確定聚類中心數。自適應迭代聚類的思想為:假設數據集合為(x1,x2,…,xn),每個xi為多維的向量,K-means聚類的目的是在給定分類組數k(k ≤ n) 的條件下,將原始數據分成k 類:S={S1,S2,…,Sk},K-means所要最小化的目標函數為:
式中,n為樣本數;xn為第n個樣本;μk為第k個中心點。將樣本分為k類,若第n個樣本點屬于第k類,則rnk=1 ;若第n個樣本點不屬于第k類,則rnk=0.
3.3 聚類結果空間分布分析
通過對各類POI進行相關性分析,探索同一類中聚類特征與各類POI 之間的關系,并采用spss計算得到各類POI之間相關系數均為0.7以上,具有相關性。且這表明在聚類區域內,某一類POI的數目與其他具有顯著的正相關性,利用某一類公共服務設施能探測不同種類的POI在空間上的大致分布情況。因此,結合格網中空間特征的聚類方法,有利于探索人們行為活動在城市空間中的規律。
本文結合POI 數據和位置數據,采用聚類方法挖掘了公共服務設施空間分布特征信息。首先,通過聚類方法探索各類POI在空間的聚類模式;然后,探索各類POI之間的相關關系,以反映POI在城市生活中的吸引程度,為城市布局的合理規劃提供幫助。然而,該方法只考慮單一時間段的POI情況,沒有考慮隨著時間變化各類POI在空間中分分布變化情況,對數據的時空挖掘還不夠深。且在對現有數據進行分析時,還不夠深入。
參考文獻
[1]索超, 丁志剛. POI在城市規劃研究中的應用探索[C]// 新常態:傳承與變革——2015中國城市規劃年會論文集(04城市規劃新技術應用). 2015.
[2]龍贏,張宇,崔承印.利用公交刷卡數據分析北京職住關系和職勤出行[J].地理學報,2012,10(67):1339-1352.
[3]陳映雪,甄峰.基于居民活動數據的城市空間功能組織再探究—以南京市為例[J].城市規劃學刊,2014,(05):72-78.
[4]鈕心毅,丁亮,宋小冬.基于手機數據識別上海中心城區的城市空結構[J].城市規劃學刊,2014, (06): 61-67.
[5]劉輝, 黃新, 王京晶. 基于位置數據和POI的聚類方法[J]. 地理空間信息, 2017, 15(11):46-49.
基金項目:成都市哲學社會科學規劃項目,項目題目:基于大數據的成都市公共空間發展均衡性問題研究,項目編號:2018R53