黎海波,陳通利
(1. 東莞市地理信息與規劃編制研究中心,廣東 東莞 523129; 2. 中山大學地理科學與規劃學院,廣東 廣州 510275)
出租車GPS大數據在東莞市“小山小湖”社區公園選址中的應用
黎海波1,2,陳通利1
(1. 東莞市地理信息與規劃編制研究中心,廣東 東莞 523129; 2. 中山大學地理科學與規劃學院,廣東 廣州 510275)
選址問題是GIS最基本的任務之一。選址通常是考慮一定條件下的空間位置優化,很難將人類的活動情況作為優化因素考慮進來。本文結合東莞市小山小湖社區公園的選址工作,通過分析海量出租車的OD(上下車)記錄數據,在選址任務中引入居民實際居住與出行情況作為參考。通過提高人口分布密度這一重要選址影響因素的精度,進而改進小山小湖社區公園的選址情況,這種方法是對傳統分析方法的有效補充和創新。基于出租車軌跡數據的選址方法與傳統的選址方法相結合,更有效、合理地提高了選址的可靠度。
出租車GPS;小山小湖;社區公園;選址;GIS
2008年,東莞市劃定了生態控制線,對控制線內建設情況進行嚴格管控,實現了對大山大水的保護[1]。為打造山水東莞、生態東莞、美麗東莞,建成一批方便市民休閑活動的社區公園,2014年,東莞市發布了《東莞市“小山小湖”保護利用工作方案》,對全市小山小湖進行摸底調查、登記造冊,切實加強城市生態本底的保護,并從中選出100個建成社區公園,為市民提供優良的公共開放空間和休閑活動場所,提升城市空間品質和宜居水平。如何結合市民的活動情況,合理對100個小山小湖進行選址,建成更加貼近群眾的生活的社區公園,是本文研究的主要內容。
選址問題是GIS中最常見的問題,常規的選址問題是找出研究區域中最優的點。黎夏等將遺傳算法、蟻群算法、粒子群算法等人工智能算法應用到多點選址問題中[2];黎海波等利用多目標粒子群優化算法和區域形狀變異算法相結合來解決復雜的空間選址問題[3],取得了較好的效果。但這些實際應用都沒有考慮人類活動的因素,造成選址結果與人們真實需要往往存在一定差距。隨著信息技術的飛速增長,人類活動逐漸被記錄下來,出租車GPS數據、手機信令數據、社交網絡數據等大數據漸漸發揮出重要的作用,大數據技術就是將原本看起來很難利用的數據抽絲剝繭,發現其中的真正內涵[4]。出租車GPS數據[5-6]是目前使用比較廣的一種大數據類型,目前有不少學者[7]將其應用到地理學研究當中,如Kong[8-9]等使用浮動車數據進行交通擁堵評估和預測,陳世莉[10]等將其應用到城市功能區劃分,譚詳爽[11]等從浮動車數據中探測路口并分析出轉向規則,周素紅等使用浮動車數據驗證了商業中心吸引力衰減效應[12]。目前將出租車GPS數據應用于規劃選址中的研究較少,本文提出基于出租車GPS數據的選址方法,對傳統的選址方法進行優化補充,在選址中有效地考慮了人類活動因素,取得了較好的效果。
1.1 小山小湖概況
依據《東莞市“小山小湖”保護利用工作(登記造冊)實施細則》,小山小湖是指生態控制線及基本農田保護線范圍以外,城市建設區內具有生態、景觀、休閑利用價值的自然山體、河涌水體,劃定標準如下:
(1) 小山指山體特征明顯,現狀植被良好的自然山體。
(2) 小湖指所有河涌和常水位水面面積為1000 m2以上的基塘、湖,水質達到V類水標準(適用于農業用水及一般景觀要求)。
(3) 小山小湖周邊的地塊需要進行新建或改擴建,應通過建筑紅線退讓的方式留出一定面積的平緩地帶作為緩沖區。緩沖區可環繞小山小湖布置或集中布置。面積大于10 000 m2的小山小湖,緩沖區面積不小于沿其邊界后退10 m所圍合的面積數;面積等于或小于10 000 km2的小山小湖,緩沖區面積不得小于小山小湖面積的30%。緩沖區用于設置方便市民使用的體育場地、停車場、公廁等公共配套設施,但配套建設項目不得占用耕地;如需占地建設的,須完善用地審批手續才能動工建設;同時在緩沖區內的建設項目需滿足國家相關規定的建設要求。
通過對東莞市遙感影像進行目視解譯,得到全市小山小湖3533處,其中小山1123處,占小山小湖總面積的61.25%;小湖2410處,占小山小湖總面積的38.75%(如圖1所示)。

圖1 東莞市小山小湖分布
1.2 社區公園選址
從3500多處的小山小湖中選取100處建設社區公園,需要遵循以人為本的原則,考慮適宜的服務半徑和慢行可達性,方便居民就近使用。具體考慮因素如下:
1.2.1 選址原則
社區公園主要為居民服務,為居民提供優良的公共開放空間和休閑活動場所,因此小山小湖社區公園選址的最重要原則就是居民就近原則。在選址的過程中,為了使社區公園發揮最大效用,需要找出居住人口密度最大的小山小湖區域,即計算出社區公園服務半徑范圍內居民人數最多的區域。
1.2.2 影響因素
為了充分發揮社區公園效用,切實提高居民生活品質,選址時需要考慮很多因素。通常情況下,小山小湖主要以居住地密集的地方為優先考慮點;同時又要考慮居住步行距離,一般步行距離在500~800 m可接受;此外還需要考慮土地權屬、地塊規劃等其他影響因素。
1.2.2.1 居住地密度對選址的影響
居住密度是指居住區內的人口數或住房套數與居住區面積之比。為了讓社區公園發揮最大價值,最根本的是選擇那些服務范圍內的居住密度最大的小山小湖建設社區公園。因此,社區公園選址中,居住密度是最重要的因素。
1.2.2.2 城市規劃建設對選址的影響
城市規劃是為了使城市在發展過程中維持公共生活的空間秩序而提出的,它是保證城市合理建設、城市土地合理開發利用及其他正常經營活動的前提和基礎。地塊規劃和權屬情況很大程度上制約著用地的開發,一定程度上影響著小山小湖的選址。
1.2.2.3 實際步行距離對選址的影響
居民居住地到社區公園的步行距離影響著公園的實際使用情況,距離太遠居民不愿意步行到社區公園,根據景觀設計尺度相關規范,一般步行適宜距離為50 m,因此居住在小山小湖服務半徑500 m以內的居民對小山小湖的使用效率最高。
2.1 研究數據
2.1.1 用地分類數據
用地分類數據是根據2014年底快鳥影像進行人工解譯得到的分類數據,按照解譯標準共分為9個一級類,其中包括居民地矢量數據。
2.1.2 出租車GPS數據
本文中所用的出租車GPS數據來源于東莞市出租車運營管理公司的管理信息系統,每隔15 s采集一次,記錄的基本信息包括出租車的車牌號碼、時間、經緯度、速度、方向、里程和車輛狀態等(見表1)。本文采用2015-5-14(周四)—2015-5-17(周日)的GPS數據,計算出出租車GPS數據的OD(上下車)點(見表2)。所選數據兩天是工作日,兩天是周末,基本能夠反映東莞市出租車的運營情況。本文4天OD數據總共659 254條記錄。

表1 車輛狀態定義

表2 東莞市出租車OD統計
2.2 傳統選址分析方法
傳統的選址方法原理較簡單,僅考慮小山小湖對居民地的覆蓋范圍,認為小山小湖步行服務半徑范圍內覆蓋居民地面積最多的小山小湖最佳。具體方法為:①對小山小湖建立緩沖區,緩沖區距離為500 m;②對小山小湖緩沖區和居民地作疊置分析,計算出每個緩沖區內居住的地的面積大小;③覆蓋居民地面積越大的緩沖區越佳,根據緩沖區內居民地面積大小排序,選取服務居民最大的小山小湖作為候選社區公園選址地點;④根據小山小湖的規劃情況和權屬情況,作為選址的進一步依據。圖2是通過該方法提取的500 m緩沖區內居住地面積排在前100位的小山小湖分布情況。

圖2 半徑500 m緩沖區內居住地面積前100的小山小湖分布
從選址的分布情況可看出,小山小湖主要分布在中心組團、西南組團等居民地密集的地區。
2.3 基于出租車GPS數據的選址分析
2.3.1 數據處理
根據居民的生活習慣,通常可認為7:00—9:30時段內的上車地點、17:00—19:30時段內的下車地點是居民的居住地或活動頻繁的目的地,即距離這些地點較近的小山小湖被使用的頻率最高,可視為最優因此,首先要在所有的OD記錄中篩選出這兩個時間段的記錄(如圖3所示),作為小山小湖選址的基礎數據。可見OD數據密度分布較高的地方分布在市區、中心組團、西南組團、東南組團等地區,與居民地的分布類似。
2.3.2 基于出租車GPS數據的選址分析方法
(1) 準備數據:對出租車GPS數據進行處理,得到2015-5-14—2015-5-17出租車7:00—9:30上車點、17:00—19:30下車點的數據。
(2) 對小山小湖建立緩沖區,緩沖區距離為500 m。

圖3 上下班時間段出租車OD記錄數據
(3) 對小山小湖緩沖區和出租車OD點作疊置分析,計算出每個緩沖區內OD點的個數。
(4) OD點個數越多,說明此處上下班時間居民活動越頻繁,選擇該處小山小湖作為社區公園較佳。根據緩沖區內OD點的多少排序,選取落在緩沖區內OD點多的小山小湖作為候選社區公園選址地點。
圖4為上下班時間段OD記錄數前100的小山小湖,可見這種選址方法更注重的是考慮居民的活動影像因素,選址結果較為集中分布在市區、常平、虎門、清溪、鳳崗等地區。

圖4 上下班時間段OD記錄數前100的小山小湖
圖5為兩種選址方法的結果,深色的小山小湖緩沖區是基于傳統選址分析方法的結果,淺色的小山小湖緩沖區是基于出租車GPS數據分析出來的結果。傳統方法得出的結果主要分布在鎮中心地區,其中厚街、松山湖、大朗、大嶺山、樟木頭等鎮的結果在基于出租車GPS數據的選址結果中沒有出現;而萬江中部、東城北部、石龍、清溪、常平北部等地區出現在基于出租車GPS數據的選址結果中,但傳統的選址結果中反而沒有。

圖5 兩種選址方法結果對比
通過對兩種選址方法的公共結果進行統計(如圖6所示),一共有15個小山小湖同時出現在兩種選址方法結果中,分布在市區、寮步、常平、虎門、長安等鎮區,而這些鎮區正是東莞市經濟最發達、人口最密集的區域。因此,這15個小山小湖是最佳的選址結果。

圖6 兩種選址方法的公共結果
可見,兩種選址方法各有側重,各有優劣。傳統的方法側重考慮居民地的分布而沒有考慮實際居民活動情況的影響,而基于出租車GPS的方法恰好相反。造成結果差異的原因主要有兩點:①東莞市是一個以外來人口為主的城市,根據2010年第六次人口普查的數據,常住人口達820萬,但戶籍人口只有180萬左右,流動人口占了大多數。由于人口的流動性,不排除大量居住區人口的流動性也較大,居住區面積只能在一定程度映射出人口的密度;②本文僅考慮了居住區面積,并沒有考慮居住區的層數,因此僅通過居住區面積難以真實反映人口分布情況。基于出租車GPS數據的選址分析方法是通過客觀的出租車上下車數據頻率來反映居民活動情況的,從而推斷人口居住分布的概率情況,這是傳統方法所欠缺的。很大程度上,出租車GPS數據的選址方法可作為傳統選址方法的有效補充。從兩種方法的選址結果上也可看到,兩種方法既有共同點,又有差異,可相互補充、互補不足。小山小湖的選址應綜合兩種方法的結果,再進一步結合地塊的規劃條件進行分析和論證,最終選取更加合適的選址地點。
本文提出了使用出租車GPS數據進行規劃選址的方法,這種基于大數據的方法與傳統選址方法相結合,可得到更合理、更科學的選址結果。該方法考慮了人類活動的影響因素,作為傳統選址方法的有效補充,能得到更好的效果。但出租車只是人們出行方式的一種,僅以出租車GPS數據代表人們的日常出行行為存在一定的局限性,今后擬結合公交數據、地鐵數據等公共交通數據開展進一步研究。同時,還可考慮將手機信令數據引入,更加準確全面地分析居民移動行為模式,開展更深入的研究。
[1] 陳明輝,陳穎彪,郭冠華,等.快速城市化地區生態資產遙感定量評估——以廣東省東莞市為例[J]. 自然資源學報, 2012,27(4):601-613.
[2] 黎夏,葉嘉安.遺傳算法和GIS結合進行空間優化決策[J]. 地理學報, 2004,59(5):745-753.
[3] 黎海波,黎夏,劉小平,等.多目標粒子群算法與選址中的形狀優化[J].遙感學報, 2008,12(5):724-733.
[4] 吳志峰,柴彥威,黨安榮,等.地理學碰上“大數據”:熱反應與冷思考[J].地理研究, 2015,34(12):2207-2221.
[5] 牟乃夏,張恒才,陳潔,等.軌跡數據挖掘城市應用研究綜述[J]. 地球信息科學學報, 2015,17(10):1136-1142.
[6] 莊立堅,宋家驊,段仲淵,等.基于浮動車數據挖掘的出租汽車運營特征研究[J]. 城市交通, 2016(1):59-64.
[7] 劉瑜.社會感知視角下的若干人文地理學基本問題再思考[J].地理學報, 2016,71(4):564-575.
[8] ZHAN H,LEE Z,SHI P, et al. Retrieval of Water Optical Prosperities for Optically Deep Waters Using Genetic Algorithms [J]. Transactions on Geoscience & Remote Sensing, 2003, 41(5):1123-1128.
[9] KONG X, XU Z, SHEN G, et al. Urban Traffic Congestion Estimation and Prediction Based on Floating Car Trajectory Data[J]. Future Generation Computer Systems, 2016,61:97-107.
[10] 陳世莉,陶海燕,李旭亮,等.基于潛在語義信息的城市功能區識別——廣州市浮動車 GPS 時空數據挖掘[J].地理學報, 2016,71(3):471-483.
[11] 譚祥爽,王靜,宋現鋒,等.基于浮動車數據的路口探測方法[J]. 地理與地理信息科學, 2015,31(5):34-38.
[12] 周素紅,郝新華,柳林.多中心化下的城市商業中心空間吸引衰減率驗證——深圳市浮動車GPS時空數據挖掘[J].地理學報, 2014,69(12):1810-1820.
[13] 曹瑞,涂偉,巢佰崇,等.基于智能卡數據的地鐵周邊職住用地識別與分析[J].測繪地理信息, 2016,41(3):74-78.
[14] 馬曉磊,劉從從,劉劍鋒,等.基于公交IC卡數據的上車站點推算研究[J].交通運輸系統工程與信息, 2015,15(4):78-84.
[15] 王德,鐘煒菁,謝棟燦,等.手機信令數據在城市建成環境評價中的應用——以上海市寶山區為例[J].城市規劃學刊, 2015(5):82-90.
HillandlakeCommunity Park Location Analysis in Dongguan Based on Taxi GPS Data
LI Haibo1,2,CHEN Tongli1
(1. Research Center of Geographic Information System & Planning of Dongguan, Dongguan 523129, China; 2. School of Geography and Planning, Sun Yat-sen University, Guangzhou 510275,China)
Location selection issue is one of the most basic tasks in GIS. The general location selection is considered under certain conditions of space optimization, it is difficult to take human activity as the optimization factors into account. This paper proposed a method to improve the community park location selection result by improving the accuracy of population density which is an important factor in community park location selection. We get the population density by analyzing taxi OD (origin and destination) data. Compared with traditional method, this method is innovative and complementory. Combining the traditional location selection method and taxi OD data, we can improve the reliability of the location result more effective and more rational.
taxi GPS; small hill and lake; community park; location analysis; GIS
黎海波,陳通利.出租車GPS大數據在東莞市“小山小湖”社區公園選址中的應用[J].測繪通報,2017(5):95-99.
10.13474/j.cnki.11-2246.2017.0163.
2016-09-06
住房和城鄉建設部2015年科學計劃(2015-K8-026)
黎海波(1982—),男,博士,高級工程師,主要從事GIS、遙感,以及城市規劃勘測的研究與應用工作。 E-mail:21238038@qq.com
P208
A
0494-0911(2017)05-0095-05