







摘要:國土空間分區是進行國土空間用途管控的基礎,分析京杭大運河核心監控區國土空間及產業分布格局,并對其進行空間分段可以有效地制定基于空間格局差異化的管控策略。基于可獲得的多源公開數據,綜合應用文本分析、核密度分析以及聚類分析方法探究京杭大運河核心監控區國土空間與產業分布格局特征,并據此進行國土空間分段。結果表明,機械設備、紡織服裝、食品、養殖、建材類領域相關公司企業為大運河核心監控區范圍內最常見的產業類型,化工、金屬、餐飲、混凝土、鋼鐵等易產生環境污染的相關公司企業分布數量也較高。整體上看,監控區范圍內公司企業集中分布于運河南北兩端,并呈現出典型的密集型分布特征。養殖、化工、水泥砂漿混凝土、石化、煤電等部分易產生環境污染或損害風險的產業呈現差異化空間分布特征。國土空間分段結果顯示,低強度鄉村主導區段為大運河核心監控區國土空間分段的主導類型,包括除河北省滄州市、江蘇省常州市、江蘇省無錫市、浙江省杭州市、浙江省嘉興市、江蘇省蘇州市以外的其他15個城市區段;低污染低生態功能區段包括滄州段和常州段,高強度低耕地區段主要為無錫段,旅游主導區段包括杭州段與嘉興段,高強度產業密集區段為蘇州段。
關鍵詞:京杭大運河;國土空間分段;多源數據;文本分析法;核密度分析法;聚類分析法
中圖分類號:TU984.18" 文獻標志碼:A
文章編號:1002-1302(2024)23-0214-07
胡" 蘇,翁艷美,潘杰華,等. 基于多源數據的京杭大運河核心監控區國土空間分段研究[J]. 江蘇農業科學,2024,52(23):214-221.
doi:10.15889/j.issn.1002-1302.2024.23.029
收稿日期:2024-01-16
基金項目:自然資源部國土空間規劃與開發保護重點實驗室-中規院(北京)規劃設計有限公司聯合開放基金(編號:TSPDP24/05);江蘇省社會科學基金(編號:22GLB028);中央高校基本科研業務重大項目培育專項基金(編號:2022ZDPYSK08)。
作者簡介:胡" 蘇(1981—),男,江蘇宿遷人,高級城市規劃師,主要從事城鄉土地利用與規劃研究。E-mail:30560739@qq.com。
通信作者:陳龍高,博士,教授,主要從事城鄉土地利用與規劃研究。E-mail:chenlonggao@163.com。
京杭大運河全長2 700多km,是中國古代經濟文化的重要廊道,也是長江下游地區近代民族工業交流與合作的渠道,蘊含了重要的教育科普與休閑旅游等功能,2014年被列入《世界文化遺產名錄》。2017年6月,習近平總書記指出要統籌保護好、傳承好、利用好大運河。隨后我國出臺了《大運河文化保護傳承利用規劃綱要》,要求將大運河河道兩側2 km范圍內的區域劃為核心監控區,以加強該區域內的國土空間管控[1-4]。國土空間分區是國土空間管控規則制定的基本依據。盡管大運河沿岸的省份分別制定了相應管控辦法或細則,但由于大運河核心監控區在空間分布式呈典型的線形,基于傳統方法較難完成該區域國土空間分區,且難以體現其國土空間分段特征。然而,梳理國內外公開發表成果時發現,目前尚缺乏大運河核心監控區國土空間分段方法或實證應用研究。現有的國土空間管控相關研究主要涉及國土空間分區方法、實證應用與相應管控政策策略的制定等。盡管空間分段研究中多位學者提出了基于粒子群優化、核密度估計與空間聚類等方法,并應用于具有典型線狀特征的道路路面、航線軌跡或河流河道等領域,對于呈線狀特征的國土空間區域進行分段研究卻缺乏關注[5-16]。本研究基于高德地圖興趣點(POI)中的產業數據與河流、土地利用類型等多源數據,構建基于文本分析、核密度估計及聚類分析相結合的方法,進而實現大運河核心監控區的國土空間分段,以便從整體上認識我國大運河核心監控區內的分段國土空間格局與特征,從而為提出國土空間管控政策措施提供依據和數據支持。
1" 數據來源與研究方法
1.1" 數據來源處理
本研究主要使用高德地圖的POI數據和基礎地理信息數據開展分析,其中基礎地理信息數據來源于全國地理信息資源目錄服務系統提供的1 ∶100萬公眾版基礎地理信息數據,主要包括水系、交通、境界與政區、地名及注記等9個數據集;2022年POI數據來源于高德地圖開放平臺,包括POI數據點名稱、所屬行政區域以及經緯度坐標等字段。土地利用數據來源于美國環境系統研究所公司(Environmental Systems Research Institute,簡稱ESRI公司)基于 10 m 哨兵影像數據使用深度學習方法制作的全球土地覆蓋數據,該數據集共分為水體、林地、草地、淹沒植被、耕地、建筑、裸地、雪/冰、云等類型。
對于POI數據,在完成數據清洗的前提下保留研究區范圍內的公司企業數據,再基于各產業對生態環境和國土空間格局的影響,依據文本分析法獲取的高頻詞匯并結合其對可能產生的環境污染程度,根據公司企業名稱劃分不同產業類型(表1),隨后基于坐標信息實現數據空間化并將其導入空間數據庫;大運河核心監控區范圍則應用緩沖區分析方法進行提取;研究區范圍內的公司企業空間分布數據以及土地覆蓋數據通過大運河核心監控區分別與其進行疊加分析后獲取。
1.2" 研究方法
1.2.1" 文本分析方法
文本分析法主要通過對待分析文本內容中詞匯出現的頻數進行客觀、系統、量化分析的一種科學研究方法,這是一種定量定性相結合的內容分析方法。本研究基于微詞云平臺,首先利用其在線分詞功能實現文本內容的自動分詞,再將與產業類型特征無關的地名等進行剔除后完成詞頻統計分析和制圖功能,最后以與研究主題相關的高頻詞作為后續分析和數據處理的依據[17-18]。
1.2.2" 核密度分析方法
核密度估計是一種估計隨機變量空間分布概率密度的周應非參數估計方法,能夠在一定程度上避免因函數設定而造成的估計誤差。在核密度估計法中,距離較近的對象相關性關系較大,在計算概率時所占權重也較大。假設n個數據xi(i=1,2,…,n)取自連續分布P(x),在任一點x處的一種核密度估計P^為
P^(x)=1nh∑ni=1Kx-xih。(1)
式中:K(.)表示核函數;h表示搜索半徑[13,19]。
本研究應用Silverman提出的4次核函數基于ArcGIS平臺實現。
1.2.3" K均值聚類分析方法
K均值聚類法通過預先確定形成的簇的數量(K值)來進行數據分組,從而使結果中每個簇內樣本與其聚類中心之間的距離的平方和最小。該方法具有理論可靠、算法簡單、收斂速度快、能有效處理大數據集等優點[20-21]。
本研究基于大運河核心管控區各城市范圍,分區統計不同城市的各類土地利用/覆被占比以及各產業類型公司企業數量,然后將其作為各城市的分析變量進行聚類分析,在分析各組數據主要特征的基礎上確定為5種類型并進行分析,最后應用屬性數據關聯方法實現基于城市單元的大運河核心監控區空間分段。
2" "結果與分析
2.1" 大運河核心監控區公司企業名稱分詞分析
基于公司企業名稱進行文本內容分析的詞匯頻數及詞匯網絡關系結果見表2、圖1。其中,詞云圖中字體大小及詞匯網絡關系圖中節點大小表明詞匯出現的頻數(簡稱詞頻),線條長短反映詞匯間的強弱關系,線條越遠代表關系越疏遠。整體上來看,(1)機械、設備、紡織、服飾、食品、科技、金屬制
品、養殖、服裝、建材為前10個高頻詞,表明機械設備、紡織服裝、食品、養殖、建材類領域相關公司企業為大運河核心監控區范圍內最常見的產業類型;(2)考慮到對生態環境的影響,化工、金屬、餐飲、混凝土、鋼鐵等相關公司企業的分布數量也較高(其詞頻數排序為前50名),因此需對上述相關產業可能產生的生態環境影響進行系統分析,為國土空間管控策略的制定提供支持;(3)從網絡關系圖(圖1)來看,科技與機械、紡織、金屬、機電等詞匯關系密切,表明這4類相關行業類型中新技術應用相對其他行業更加普遍。
2.2" 大運河核心監控區公司企業分類型分布分析
2.2.1" 基于全部產業類型的公司企業分布
基于文本分析方法和可能的生態環境影響劃分的產業類型及公司企業數量見表1。總體來看,大運河核心監控區范圍內機電設備制造、服裝紡織、其他設備制造、金屬加工、食品加工、養殖、化工、倉儲物流、生物科技、家具制造等10類公司企業數量較多,其中服裝紡織、金屬加工、養殖、化工等行業易產生多種環境污染,需進行深入系統的分析。此外,醫藥化工、印刷、餐飲飯店、石化、煤電、印染、水產養殖、沙場、油漆等易污染或影響河道生態的公司企業數量也不相同。
從空間分布來看,公司企業在大運河核心監控區范圍內均有不同數量的分布;反映點要素分布密度的核密度分析結果則可以看出,全部產業類型公司企業重點分布于運河南北兩端的京津地區、江蘇省蘇錫常地區以及浙江省杭州市,呈現出典型的密集型分布特征,而河北、山東、安徽等省以及江蘇省徐州市、宿遷市、淮安市、揚州市、鎮江市等城市區域內分布相對稀疏(圖2)。
2.2.2" 基于不同產業類型的公司企業分布
基于不同產業類型公司企業在各城市的比重統計數據
表明,江蘇蘇州、浙江杭州和天津3個城市大部分產業類型的公司企業個數均位于全部城市前5名;機電設備制造類作為公司企業數量最多的產業類型,除上述3個城市外,河北省滄州市和江蘇省常州市占比最大。在易產生污染的產業類型中,養殖類主要分布于山東省濟寧市和聊城市、天津市、江蘇省徐州市與河北省滄州市,江蘇省蘇州市和浙江省杭州市并未進入前5名;化工類分布于蘇州市、無錫市、杭州市、常州市、嘉興市等南部地區;煤電類主要分布于山東省濟寧市、北京市、江蘇省徐州市、安徽省宿州市、河北省邢臺市、天津市等城市;造紙類以浙江省杭州市、安徽省宿州市、河北省邢臺市、天津市、山東省聊城市比重較高;絲織類以浙江省湖州市、嘉興市和江蘇省蘇州市較高。對于易破壞河道穩定的沙場類企業,杭州市和蘇州市占比均超過10%。
分城市不同產業類型公司企業比重在一定程度上可以反映各城市自身的相對優勢產業。綜合來看,服裝紡織、機電設備制造、金屬加工、其他設備制造、食品加工等產業類型在大運河大部分城市中的占比均相對較高,表明制造加工、服裝及食品相關產業是大運河核心監控區范圍內主導的產業類型,這也與我國現階段經濟發展特征一致。
除上述產業類型外,基于不同城市來看,北京市另有醫藥化工、生物科技與倉儲物流產業比重相對較高;江蘇省蘇錫常三市的化工、浙江省杭州市的生物科技、天津市與安徽省宿州市的倉儲物流、江蘇省宿遷市的木材加工、河北省廊坊市的家具制造與木材加工,以及浙江省湖州市的茶種植、家具制造與木材加工等產業在各自城市的比重也相對較高。考慮到生態環境問題,蘇錫常三市尤其須要關注化工類產業可能帶來的大氣、水、土壤等環境污染問題。
基于核密度分析的各產業類型公司企業空間分布結果見圖3。可見大部分產業類型的公司企業分布于研究區北部的京津地區、南部的蘇錫常三市及杭州區域,天津至江蘇常州的中間段部分核密度值相對較低。說明中間段部分經濟產業密集程度與北部京津地區、南部蘇錫常三市及杭州區域相比較低。實際上大運河核心監控區天津至江蘇常州段大部分地區屬于淮海經濟區,該區域一直以來都是我國東部地區的經濟洼地,這也在本研究的核密度分析中得到了驗證。
此外,另有部分產業類型公司企業核密度分析
結果呈現出不同分布特征,特別是易產生環境污染或損害風險的產業,如除南北兩端外,養殖類在中部濟寧聊城段與徐州至淮安段核密度值也相對較高;化工類由北向南在滄州、濟寧、宿遷、淮安段呈離散型點狀分布;水泥砂漿混凝土類易產生大氣污染的公司企業同樣在濟寧、徐州、宿遷段呈離散型點狀分布特征;石化類在滄州、山東省德州與淮安段也有一定分布;煤電類中部濟寧至徐州北端核密度值較高。
基于不同產業類型的公司企業分布同時體現了不同產業類型在大運河核心監控區分布的數量結構特征與空間分布格局,可為大運河核心監控區分段產業管控重點的制定提供有效支撐。
2.3" 基于聚類的大運河核心監控區空間分段分析
基于K均值聚類和GIS技術實現的大運河核心監控區國土空間分段結果見表3、圖4。從分段空間分布結果來看,類型3為整個大運河核心監控區國土空間分段分布的主導類型,主要包括最北端的北京、山東廊坊、天津段,中部河北衡水至揚州段以及南部湖州段;類型1包括北部滄州段和南部常州段;類型2為南部無錫段,類型4為南部杭州與嘉興段,類型5為位于南部的蘇州段。
從5個類型聚類中心結果(表4)來看,類型1中水體、樹木、淹沒植被等具有重要生態功能的土地面積比重最小,大部分產業類型中公司企業數量也最小,化工、煤電、石化、養殖等易污染類行業公司
企業數量也相對較少,總體上具有污染小但生境系統服務功能也較低的特點,可稱之為低污染低生態功能區段,包括滄州和常州2個部分(表3)。盡管常州段化工類公司企業占該城市全部公司企業數量位居第五,但比重僅為3.67,在數量上也處于相對較小的水平,故被劃入該組。
類型2中表征建設用地的建筑比重最高,耕地比重最低,茶種植加工、船舶、鋼鐵、石化和石材加工類公司企業數量最大,可稱之為高強度低耕地段,主要在無錫市,該類型整體而言土地開發強度較大,具體來看無錫市茶種植加工公司企業與數量最多的湖州市相比差距多達1 133家,因此除了茶種植加工的其他產業類型及其可能的環境影響是關注的重點。
類型3中建筑比重最小,其他土地類型中除樹木外比重均最高,因此其建設用地利用強度最低,多屬于鄉村區域,可稱之為低強度鄉村主導區段。在產業類型特征中,煤電、飼料和養殖類公司企業數量最多,該類型包括除上述類型及杭州市、嘉興市、蘇州市外的其他15個城市區域。進一步分城市考察可知,山東省濟寧市、北京市、江蘇省徐州市煤電類公司企業數量最大(需要可向筆者聯系索要),考慮到北京市煤電相關類產業多為總部基地或深加工類產業,而濟寧市和徐州市為我國重要煤炭基地,故將這2個城市相關區域作為煤電產業管控重點。其余13個城市主要為養殖及飼料等農業類相關公司企業,具有典型的農業生產區域特征。
類型4包括杭州與嘉興段,其酒店賓館、農產品加工與沙場類公司企業數量較多,表明其旅游服務相關類行業分布較顯著,其對于生態環境的壓力應加以關注,可稱之為旅游主導區段。此外,農產品加工雖然在上述2市中數量最大,但其對生態環境的影響并不突出。值得注意的是杭州市的沙場數量較多,需特別關注其對河道產生的威脅。
類型5僅包括蘇州段,該段絕大部分產業類型公司企業數量均處于最高水平,包括餐飲飯店、化工、水泥混凝土砂漿及印染等多種易產生環境污染的類型;該段表征建設用地規模建筑比重達到69.95%,位居第二。總體來看,蘇州段呈現典型的產業密集型分布特征和土地開發強度較大的特征,可稱之為高強度產業密集區段。該段需關注多類產業可能產生的環境風險。
3" 結論
大運河核心監控區國土空間管控為更好地保護、傳承與利用京杭大運河這一世界文化遺產提供了基本保障。探究大運河核心監控區國土空間及產業分布格局,并對其進行空間分段可以有效地制定基于空間格局差異化的管控策略。
本研究利用高德地圖開放平臺的POI數據,基于公司企業名稱對其進行產業類型劃分。盡管其存在一定程度的誤差,但由于難以從公開渠道獲取不同產業的工業企業相關產業規模及環境影響詳細資料,而公司企業名稱反映了其涉及的核心產業類型。從土地利用來看,土地覆被數據綜合反映了人類活動和自然因素共同作用的結果,其對生態環境影響的指示意義也非常明確,采用的ESRI公司的10 m分辨率土地覆被數據可以滿足本研究的目的,且具有較高空間分辨率的優勢,故本研究結論具有較高的可信度。
由于對于呈線狀特征的國土空間區域進行分段的相關技術與方法尚未有公開報道,從整體尺度對大運河核心監控區國土空間分段實證研究也較為缺乏。本研究基于可獲得的多源公開數據,綜合應用文本分析、核密度分析以及聚類分析方法從整體上揭示了大運河核心監控區的國土空間與產業空間分布格局特征,最終實現了相應的國土空間分段。這為制定差別化的國土空間管控策略奠定了基礎,也為開展基于線性特征的國土空間分段實證應用工作提供了技術參考。
參考文獻:
[1]程中華,鄧義祥,卓小可,等. 京杭大運河中下游段天然水化學變化特征及驅動因素[J]. 環境科學,2021,42(5):2251-2259.
[2]張" 飛,楊林生,石" 勇,等. 大運河文化帶游憩空間范圍及層次研究[J]. 地域研究與開發,2019,38(6):80-84.
[3]Piao H T,Jiao X C,Gai N,et al. Perfluoroalkyl substances in waters along the Grand Canal,China[J]. Chemosphere,2017,179:387-394.
[4]李廣春. 讓大運河文化活起來[J]. 紅旗文稿,2019(8):29-31.
[5]Klein C J,Steinback C,Watts M,et al. Spatial marine zoning for fisheries and conservation[J]. Frontiers in Ecology and the Environment,2010,8(7):349-353.
[6]Bruce E M,Eliot I G. A spatial model for marine park zoning[J]. Coastal Management,2006,34(1):17-38.
[7]王" 鵬,趙" 微. 典型喀斯特地區國土空間生態修復分區研究:以貴州貓跳河流域為例[J]. 自然資源學報,2022,37(9):2403-2417.
[8]朱佩娟,謝雨欣,周國華,等. 基于CiteSpace的國土空間用途分區研究進展[J]. 熱帶地理,2022,42(4):519-532.
[9]鮑鵬宇,陳志強,王建敏,等. 基于粒子群優化的列車制動曲線分段方法研究[J]. 鐵路通信信號工程技術,2021,18(7):8-11.
[10]Brenden T O,Wang L,Seelbach P W,et al. A spatially constrained clustering program for river valley segment delineation from GIS digital river networks[J]. Environmental Modelling amp; Software,2008,23(5):638-649.
[11]Brenden T O,Wang L Z,Seelbach P W. A river valley segment classification of Michigan streams based on fish and physical attributes[J]. Transactions of the American Fisheries Society,2008,137(6):1621-1636.
[12]徐" 影,郭" 楠,茹凱麗,等. 碳中和視角下福建省國土空間分區特征與優化策略[J]. 應用生態學報,2022,33(2):500-508.
[13]許哲譜,楊" 群. 基于核密度估計的瀝青路面狀況動態分段方法[J]. 長安大學學報(自然科學版),2020,40(2):10-20.
[14]王" 建,史景聰,黃冬梅,等. 基于TDD的科考船航跡分段方法研究[J]. 極地研究,2020,32(1):112-120.
[15]董耀華,汪秀麗. 河流5區分段方法與長江干流分段實踐[J]. 長江科學院院報,2017,34(6):1-6.
[16]Gutiérrez J D,Ospina-Torres R,lvarez J P,et al. Segment scale typology for Colombian Andean Rivers[J]. Ecohydrology amp; Hydrobiology,2017,17(2):125-133.
[17]李燕凌,代" 蜜. 我國縣城城鎮化政策的適配性研究:基于政策文本分析的視角[J]. 公共管理與政策評論,2022,11(2):87-100.
[18]趙振斌,黨" 嬌. 基于網絡文本內容分析的太白山背包旅游行為研究[J]. 人文地理,2011,26(1):134-139.
[19]李" 強,高" 威,魏建飛,等. 中國耕地利用凈碳匯時空演進及綜合分區[J]. 農業工程學報,2022,38(11):239-249.
[20]謝智敏,甄" 峰. 基于多源數據的南京市域城鄉融合水平測度研究[J]. 地理科學,2023,43(1):1-10.
[21]賈紫牧,陳" 巖,王慧慧,等. 流域水環境承載力聚類分區方法研究:以湟水流域小峽橋斷面上游為例[J]. 環境科學學報,2017,37(11):4383-4390.