張建英,劉高
(1.嘉興市規(guī)劃管理局,浙江 嘉興 314000; 2.武大吉奧信息技術(shù)有限公司,湖北 武漢 430223)
當(dāng)前,政務(wù)大數(shù)據(jù)建設(shè)在各地方政府中得到空前重視,各地政府紛紛投入巨大資源建設(shè)政務(wù)大數(shù)據(jù)。政務(wù)大數(shù)據(jù)的一個(gè)顯著特征是具有典型的空間特性和時(shí)間特性。因此,如何解決政務(wù)專題與空間信息的關(guān)聯(lián),實(shí)現(xiàn)政務(wù)專題數(shù)據(jù)的實(shí)時(shí)空間化,成為當(dāng)前研究的一個(gè)熱點(diǎn)。
空間信息具有唯一性,是空間信息能夠成為關(guān)聯(lián)和承載其他政務(wù)信息的載體,這個(gè)載體,具體體現(xiàn)為地理實(shí)體數(shù)據(jù)。地理實(shí)體數(shù)據(jù)實(shí)現(xiàn)了地理信息的對(duì)象化,是地理信息能夠像其他信息一樣由當(dāng)代計(jì)算機(jī)技術(shù)進(jìn)行處理和分析,從而推動(dòng)了空間信息和專題信息的融合。使政務(wù)信息的關(guān)聯(lián)和大規(guī)模空間分析和挖掘成為可能。
地理實(shí)體是指現(xiàn)實(shí)世界中具有共同性質(zhì)的自然或人工地物,是具有社會(huì)意義的最小地理單元。地理實(shí)體數(shù)據(jù)是在原有基礎(chǔ)地理數(shù)據(jù)基礎(chǔ)上,按照一定的標(biāo)準(zhǔn)與規(guī)范抽取、轉(zhuǎn)換而獲取,它是專題數(shù)據(jù)進(jìn)行融合掛接的載體,是時(shí)空信息平臺(tái)的時(shí)空地理基礎(chǔ)[1]。

空間特征的描述與表達(dá) 表1
地理實(shí)體數(shù)據(jù)最基本的特征是其空間特征,在空間特征表達(dá)上,采用點(diǎn)、線、面形式來描述和表達(dá)數(shù)據(jù),如表1所示。每一個(gè)地理實(shí)體根據(jù)其在自然環(huán)境中的形態(tài)選擇表現(xiàn)形式,可同時(shí)采用多種表現(xiàn)形式。
(1)點(diǎn)狀數(shù)據(jù)幾何表達(dá)基本規(guī)則
地理實(shí)體的點(diǎn)狀數(shù)據(jù)以地理位置標(biāo)識(shí)點(diǎn)表達(dá),地理位置標(biāo)識(shí)點(diǎn)的定義規(guī)則如下:①區(qū)域?qū)嶓w點(diǎn)狀數(shù)據(jù)的地理位置標(biāo)識(shí):行政區(qū)劃的政治、經(jīng)濟(jì)、文化中心所在地的點(diǎn)位;行政區(qū)劃內(nèi)標(biāo)志性建筑物的點(diǎn)位;面狀區(qū)域的重心點(diǎn)點(diǎn)位。②線狀實(shí)體點(diǎn)狀數(shù)據(jù)的地理位置標(biāo)識(shí):線狀實(shí)體中心點(diǎn)的點(diǎn)位;線狀實(shí)體中心線系列點(diǎn)的點(diǎn)位;線狀地物(河流、山脈等)的標(biāo)志點(diǎn)。③點(diǎn)狀實(shí)體點(diǎn)位數(shù)據(jù)的地理位置標(biāo)識(shí):門(樓)址標(biāo)牌位置或建筑物內(nèi)任意點(diǎn)的點(diǎn)位;標(biāo)志物中心點(diǎn)的點(diǎn)位;自然地物的中心點(diǎn)或標(biāo)志點(diǎn)。
(2)線、面狀數(shù)據(jù)幾何表達(dá)基本規(guī)則
地理實(shí)體數(shù)據(jù)的幾何表達(dá)應(yīng)遵循以下規(guī)則:①以線表達(dá)的水系、交通等要素應(yīng)保證線段的連續(xù)。例如,面狀河流或道路應(yīng)提取骨架線或中軸線,并與相接的線狀河流或道路構(gòu)成連通網(wǎng)絡(luò),遇有橋梁使河流或道路中斷時(shí),應(yīng)在斷開處添加線段使河流或道路保持連通。②以面表達(dá)的政區(qū)、院落、房屋等要素應(yīng)保證面的封閉。例如,表示院落時(shí)應(yīng)提取構(gòu)成院落輪廓的邊線并構(gòu)建封閉面。③正確處理要素間的空間關(guān)系,保證要素間空間關(guān)系的合理與邏輯一致。例如,以河流為界的界線數(shù)據(jù),表示界線的線應(yīng)當(dāng)與表示河流的線在空間上一致。
(3)數(shù)據(jù)一致性處理
地理實(shí)體數(shù)據(jù)可能存在多種幾何圖形表現(xiàn)形式,數(shù)據(jù)之間的一致性,通過實(shí)體標(biāo)識(shí)碼進(jìn)行維護(hù)。凡具有相同實(shí)體標(biāo)識(shí)碼的幾何對(duì)象,均認(rèn)為其是一個(gè)實(shí)體的不同表現(xiàn)形式。
(4)數(shù)據(jù)邏輯組織
地理實(shí)體數(shù)據(jù)以空間連續(xù)、內(nèi)容分層的方式進(jìn)行邏輯組織。地理實(shí)體的圖形數(shù)據(jù)由單個(gè)或多個(gè)點(diǎn)、線、面幾何對(duì)象組合而成,它具有特定的地理意義與空間唯一性,能夠與相關(guān)社會(huì)經(jīng)濟(jì)信息進(jìn)行掛接,滿足信息交換共享的需要。地理實(shí)體數(shù)據(jù)采用標(biāo)識(shí)碼來唯一標(biāo)識(shí)每個(gè)對(duì)象。
4.血矛線蟲病。捻轉(zhuǎn)血矛線蟲宿主的感染主要在溫暖季節(jié),在溫暖季節(jié)血矛線蟲病發(fā)生較多,本次呈慢性經(jīng)過, 直至動(dòng)物死亡。
地理實(shí)體的屬性由基本屬性、擴(kuò)展屬性、專業(yè)屬性三部分組成。
基本屬性:指確定其唯一性而應(yīng)具有的屬性,作為所有地理實(shí)體的必不可少的內(nèi)容存在;基本屬性提供地理實(shí)體與其他擴(kuò)展和專業(yè)屬性關(guān)聯(lián)的信息。擴(kuò)展屬性:指地理實(shí)體所關(guān)聯(lián)的具有共享性質(zhì)的社會(huì)經(jīng)濟(jì)屬性,凡專業(yè)管理部門有明確標(biāo)準(zhǔn)管理的,采用行業(yè)標(biāo)準(zhǔn)。專業(yè)屬性:指專業(yè)部門根據(jù)管理需要賦予實(shí)體的專業(yè)性、行業(yè)性的屬性內(nèi)容。
現(xiàn)狀地理實(shí)體建設(shè)思路為:根據(jù)相關(guān)標(biāo)準(zhǔn),在矢量、三維、地名地址等數(shù)據(jù)的基礎(chǔ)上,細(xì)化包括房屋、道路、水系、院落等在內(nèi)的重要地理單元的劃分顆粒度,以現(xiàn)實(shí)世界中可以獨(dú)立的對(duì)象作為空間單體的最小表達(dá)模型,并賦予唯一的標(biāo)識(shí)ID。
歷史地理實(shí)體建設(shè)思路為:按照地理實(shí)體標(biāo)準(zhǔn)規(guī)定,通過現(xiàn)狀地理實(shí)體數(shù)據(jù)與已收集的多種歷史數(shù)據(jù)比對(duì),將現(xiàn)狀地理實(shí)體數(shù)據(jù)中已采集的數(shù)據(jù)修正其產(chǎn)生和消亡時(shí)間,將已消亡的地理實(shí)體進(jìn)行補(bǔ)充采集,形成具有一定時(shí)間序列、統(tǒng)一時(shí)空基準(zhǔn)的地理實(shí)體數(shù)據(jù)庫,地理實(shí)體數(shù)據(jù)生產(chǎn)和建庫流程如圖1所示。

圖1 地理實(shí)體數(shù)據(jù)生產(chǎn)和建庫流程圖
政務(wù)專題數(shù)據(jù)空間化是通過專題數(shù)據(jù)與地理實(shí)體的關(guān)聯(lián)融合所實(shí)現(xiàn)的,采取“軟件自動(dòng)化+人工干預(yù)”的處理方式,空間化的成果數(shù)據(jù)輸入到政務(wù)專題數(shù)據(jù)庫中。
政務(wù)專題數(shù)據(jù)與地理實(shí)體的關(guān)聯(lián)可采用以下幾種方式:①政務(wù)專題數(shù)據(jù)中含有地址項(xiàng),但地址信息不標(biāo)準(zhǔn),將地址信息標(biāo)準(zhǔn)化之后,根據(jù)標(biāo)準(zhǔn)地址進(jìn)行關(guān)聯(lián)。②政務(wù)專題數(shù)據(jù)中含有位置坐標(biāo)項(xiàng),通過與地理實(shí)體位置信息進(jìn)行空間分析關(guān)聯(lián)匹配。③政務(wù)專題數(shù)據(jù)中含有實(shí)體名稱項(xiàng),通過實(shí)體名稱進(jìn)行關(guān)聯(lián)。④政務(wù)專題數(shù)據(jù)中含有實(shí)體標(biāo)識(shí)碼項(xiàng),通過實(shí)體標(biāo)識(shí)碼進(jìn)行關(guān)聯(lián)[2]。⑤政務(wù)專題數(shù)據(jù)中含有個(gè)人的身份證號(hào)或企業(yè)的統(tǒng)一社會(huì)信用代碼,通過身份證號(hào)或統(tǒng)一社會(huì)信用代碼與其他已空間化的數(shù)據(jù)進(jìn)行關(guān)聯(lián)[3]。
專題數(shù)據(jù)空間化須遵循以下要求:①專題數(shù)據(jù)須檢查拓?fù)潢P(guān)系,與背景要素(道路面、建筑物、植被、水系圖層)拓?fù)潢P(guān)系保持一致。②專題數(shù)據(jù)各信息點(diǎn)要素相對(duì)空間位置關(guān)系正確,無重復(fù)或遺漏。③對(duì)于精確匹配上圖的政務(wù)專題數(shù)據(jù),專題數(shù)據(jù)在底圖上的位置與相應(yīng)POI或地址的位置須保持一致。
政務(wù)專題數(shù)據(jù)空間化包括數(shù)據(jù)清洗整理、地名地址匹配、空間信息掛接三個(gè)部分,具體如圖2所示。

圖2政務(wù)專題數(shù)據(jù)空間化的技術(shù)流程圖
首先進(jìn)行數(shù)據(jù)清洗整理:?jiǎn)挝惶峁┙尤氲恼?wù)數(shù)據(jù)格式、結(jié)構(gòu)均不相同,為了能更準(zhǔn)確地進(jìn)行地名地址匹配,須對(duì)政務(wù)專題數(shù)據(jù)進(jìn)行清洗整理,依照數(shù)據(jù)自身情況,共5種不同的處理方法:①空間數(shù)據(jù):無須處理,可直接用于各類應(yīng)用。②已匯總Excel表格數(shù)據(jù):調(diào)整字段格式,保證其可以在導(dǎo)入GIS軟件后正確顯示。③已匯總文本數(shù)據(jù):導(dǎo)出為Excel表格形式,調(diào)整格式。④未匯總表格或文本數(shù)據(jù):匯總為Excel表格形式,調(diào)整格式。⑤數(shù)據(jù)庫格式數(shù)據(jù):先行在數(shù)據(jù)庫進(jìn)行整理,導(dǎo)出為csv數(shù)據(jù),并轉(zhuǎn)換為Excel表格數(shù)據(jù)。
然后進(jìn)行地名地址匹配:基于地理實(shí)體數(shù)據(jù)庫,利用地名地址建庫工具,創(chuàng)建標(biāo)準(zhǔn)地名地址數(shù)據(jù)庫索引,發(fā)布地名地址匹配服務(wù),提供地名地址匹配的能力。地名地址匹配,支持兩種方式:①地址匹配。將專題數(shù)據(jù)中的地址信息與標(biāo)準(zhǔn)地址進(jìn)行匹配,掛接坐標(biāo)值。②地名匹配。將專題數(shù)據(jù)中的地名信息與地名地址進(jìn)行匹配,掛接坐標(biāo)值。可支持的城區(qū)地址描述結(jié)構(gòu)為:[行政區(qū)劃]+[街路巷]+[門牌號(hào)]+[小區(qū)/單位]+[樓棟號(hào)]。可支持的郊區(qū)地址描述結(jié)構(gòu)為:[行政區(qū)劃]+[鄉(xiāng)鎮(zhèn)]+[村莊名]+[組/隊(duì)]+[門牌號(hào)]。
最后進(jìn)行空間信息掛接:獲取匹配上的地理實(shí)體標(biāo)識(shí)碼信息,并補(bǔ)充到政務(wù)專題數(shù)據(jù)屬性中,即可完成專題數(shù)據(jù)空間化。
政務(wù)專題數(shù)據(jù)和地理實(shí)體數(shù)據(jù)一樣,具有可以唯一標(biāo)識(shí)地理對(duì)象的屬性字段。通過這個(gè)字段,最終實(shí)現(xiàn)政務(wù)專題數(shù)據(jù)的空間化——政務(wù)專題數(shù)據(jù)能夠隨時(shí)根據(jù)這個(gè)唯一標(biāo)識(shí)關(guān)聯(lián)字段找到對(duì)應(yīng)地理實(shí)體,從而獲得它的空間信息。
空間化后的政務(wù)專題信息,納入時(shí)空信息大數(shù)據(jù)管理系統(tǒng)進(jìn)行統(tǒng)一存儲(chǔ)和管理。
對(duì)入庫的政務(wù)專題數(shù)據(jù)按照相應(yīng)的標(biāo)準(zhǔn)進(jìn)行分類存儲(chǔ),可以通過多維度的分類方法對(duì)數(shù)據(jù)進(jìn)行分類,提高數(shù)據(jù)存儲(chǔ)以后的應(yīng)用效率,對(duì)所整合后的數(shù)據(jù)進(jìn)行統(tǒng)一存儲(chǔ)。
通過地理實(shí)體與政務(wù)專題數(shù)據(jù)的關(guān)聯(lián)融合,可以實(shí)現(xiàn)空間展示每棟房子關(guān)鍵的各類專題數(shù)據(jù),通過熱力圖,渲染圖等展示用電用水活躍生活居住區(qū),活躍辦公區(qū),建議停車位規(guī)劃位置等。
空間化后的政務(wù)專題信息,以地理空間為橋梁,可建立數(shù)據(jù)之間廣泛的關(guān)聯(lián)關(guān)系[4,5]。

圖3嘉興市城市脈動(dòng)效果圖
政府測(cè)繪地理信息部門對(duì)本地區(qū)地理實(shí)體數(shù)據(jù)利用主要是滿足國(guó)家、省級(jí)和本地區(qū)的需求。在基于地理實(shí)體數(shù)據(jù)利用的同時(shí),由于政府測(cè)繪地理信息部門和國(guó)土、交通、水利等行業(yè)部門積累的大量基礎(chǔ)地理實(shí)體數(shù)據(jù)或政務(wù)專題數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、形式和內(nèi)容也存在差異,還需要對(duì)測(cè)繪地理實(shí)體數(shù)據(jù)和政務(wù)專題數(shù)據(jù)進(jìn)行整合加工和必要的改造,使其符合地理實(shí)體數(shù)據(jù)認(rèn)知的表達(dá)要求,構(gòu)建通用數(shù)據(jù)庫樣本庫以及本地區(qū)的框架數(shù)據(jù)庫、基本比例尺數(shù)據(jù)庫和專題數(shù)據(jù)庫,生產(chǎn)滿足國(guó)家、省級(jí)和本地區(qū)需要的各類專題產(chǎn)品[6]。
建立共享與交換機(jī)制、時(shí)空大數(shù)據(jù)與政務(wù)信息的融合會(huì)更好地服務(wù)城市空間治理現(xiàn)代化,各類政務(wù)專題數(shù)據(jù)的匯聚和關(guān)聯(lián),是通過地理實(shí)體數(shù)據(jù)實(shí)現(xiàn)的。地理實(shí)體數(shù)據(jù)庫與人口庫、法人庫和經(jīng)濟(jì)庫合稱為城市四大基本庫,作為四大基本庫之一,地理實(shí)體庫提供地理對(duì)象的劃分、標(biāo)識(shí)、唯一性維護(hù)等功能。通過地理實(shí)體庫的建設(shè),建立起具有唯一標(biāo)識(shí)體系的空間地理基礎(chǔ)信息,為各類專業(yè)信息提供空間位置信息和空間定位能力[7]。新型地理實(shí)體是城市大數(shù)據(jù)的核心,為跨部門數(shù)據(jù)融合、智能化應(yīng)用開拓了一條新路徑。