周宏文 侯偉 周健



【摘要】批而未供近年來逐漸受到重視,該存量一直持續增加,嚴重制約了土地利用效率與土地的節約集約。本文建立了批而未供的計算流程,通過該流程,同時結合大數據平臺(GeoAnalytics Server),進行批而未供計算。在計算過程中發現,基于大數據平臺的計算可以節約大量的時間,較傳統GIS平臺對數據的處理效率上,有巨大的提升。
【關鍵詞】批而未供;大數據;GeoAnalytics Server
1、前言
批而未供是指政府批準征用或農轉用而并未供應的土地,對用地主體不明確,但已使用的城市基礎設施等用地按已供地備案[1]。
批而未供是城市存量土地的一種,其余還包括供而未用和低效利用土地[2]。目前,新增建設用地審批后,存在未供應的情況,導致批而未供土地不斷積累、增加。批而未供土地的成因主要包括征地拆遷未完成,招商引資項目失敗,存在難以供應土地[2][3]。
目前,全國陸續進行了批而未供數據的核算,如浙江省[4],對處置批而未供也出臺了許多政策。
大多研究主要是從成因和對策等方面進行研究[2][3][5],對于批而未供里面具體能供多少地的研究甚少,本文在前人研究的基礎上,對批而未供土地數據的深入研究建立了一個計算流程,并進行計算。
本文主要是為了摸清批而未供土地總量,土地類型結構,并引入大數據提高計算效率。批而未供計算結果可以為相關部門對目前狀況有較深了解,明白可供與不可供土地的類型與面積,為接下來的批而未供消耗提供數據支撐。
2、存在問題
批而未供的數據計算涉及到多數據源的空間運算,GIS平臺是目前實現計算的最優選擇。盡管GIS工具優勢明顯,但也存在一定的不足之處,主要體現在數據計算的效率上。
傳統GIS工具,如ArcGIS,在面對數據量大、拓撲復雜的數據,并進行空間計算時,需要消耗大量的時間和計算資源,而對于決策部門來說,一旦急需數據時,往往并不能滿足其基本需求。
3、技術框架
3.1 空間大數據計算環境
隨著大數據計算的發展,同時結合分布式計算,可以對GIS的計算效率上有極大的提升。通過ESRI的大數據平臺(ArcGIS GeoAnalytics Server)進行空間大數據分析,可用于時空數據快速的分布式計算,并將分析結果存儲于數據庫中,供后續數據可視化等工作的調用。該平臺可以在不同終端上隨時進行時空數據的處理,其數據源與分析結果與傳統GIS軟件可相輔相成。
GeoAnalytics Server(GA)中包含Spark、ZooKeeper、RabbitMQ等開源工具。Spark用于分布式計算,ZooKeeper用于程序協調,RabbitMQ用于存儲轉發消息。
依托GA平臺搭建了大數據計算環境,主要配置如圖1。目前,整個大數據環境包括兩個集群(Cluster),每個集群中有3臺GA計算服務器,利用Spark計算框架進行分布式計算。
3.2 計算工具
GA平臺提供的主要工具如圖2。同時,GA平臺提供Python API,計算過程是在Spark中,所以,也可以利用PySpark的語法進行對DataFrame的操作。
4、批而未供中的建設用地
4.1 主要計算流程
建設用地是新增建設用地審批中可進行建設的土地,對于城市的規劃建設尤為重要。理清批而未供中的建設用地,有助于相關決策部門將來的土地審批規劃,是一項十分有意義的數據。
批而未供中建設用地計算主要以多空間數據的運算(圖3),主要包括如下步驟:
(1)計算批而未供
根據批而未供的含義,將新增建設用地中的土地供應去掉后,剩下的即為批而未供土地。新增建設用地包括單獨選址與批次用地,土地供應包括土地出讓與劃撥。
(2)不能供土地
不能供土地主要是批而未供分別在生態紅線、基本農田和自然保護區中的土地,盡管是已經審批的土地,但不可供應。
(3)可供應土地
在批而未供中,去除在生態紅線、基本農田和自然保護區中的土地后,剩下部分即為批而未供可供應土地。可供應土地按照其是否在控規內分為控規范圍內的批而未供土地與控規范圍外的批而未供土地。
(4)城鎮控規內可供地
批而未供土地在城鎮控規范圍覆蓋范圍內需按照已有控規執行,劃定的非建設用地(E)也屬于不可供土地。控規范圍內的可供建設用地類型主要包括居住用地(R)、公共管理與公共服務設施用地(A)、商業商務用地(B)、道路與交通設施用地(S)、綠地與廣場用地(G)、公用設施用地(U)、其他建設用地(H9)、物流倉儲用地(W)和工業用地(M)。
同時,由于土地供應后也會存在一些不適合再單獨開發的邊角地,中心城區地塊面積小于3000平方米為邊角地,其余區縣小于1500平方米為邊角地。邊角地為不可供土地,去除邊角地后即為可供地。
(5)城鎮控規范圍外
城鎮控規范圍外是在批而未供中去除城鎮控規范圍后,剩下的即為控規范圍外的批而未供土地,該部分使用土地利用三調數據進行統計。
4.2 主要過程代碼
通過GA平臺提供的Python API將圖3的過程實現,用到的主要工具為擦除(Erase)、裁剪(Clip)、相交(Intersect)和匯總(Summarize)等工具,在GA中,擦除和相交整合到疊加圖層工具(overlay_layers)中,裁剪為裁剪圖層工具(clip_layer),匯總為匯總屬性工具(summarize_atrributes),同時還需要Spark中的相關工具,如filter,可等價于屬性檢索。