摘 要:本文基于筆者多年從事城市基礎(chǔ)地理信息數(shù)據(jù)處理的相關(guān)研究經(jīng)驗(yàn),以城市地理信息系統(tǒng)多源性為研究對(duì)象,深度探討了城市多源數(shù)據(jù)的概念范疇和多格式轉(zhuǎn)換思路,以AUTOCAD數(shù)據(jù)到SHAPEFILE數(shù)據(jù)格式轉(zhuǎn)換為例,探討了多源數(shù)據(jù)的數(shù)據(jù)轉(zhuǎn)換思路,全文是筆者長期工作實(shí)踐基礎(chǔ)上的理論升華,相信對(duì)從事相關(guān)工作的同行有著重要的參考價(jià)值和借鑒意義。
關(guān)鍵詞:城市地理信息系統(tǒng)多源數(shù)據(jù)數(shù)據(jù)處理矢量柵格
中圖分類號(hào):P2文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1674-098X(2011)01(a)-0092-02
1 地理數(shù)據(jù)的數(shù)據(jù)范疇
GIS所含的數(shù)據(jù)均與地理空間(位置)有關(guān)系,以地理坐標(biāo)的形式在地表進(jìn)行定位,是一種地理參考(geo-referenced)數(shù)據(jù)。按其表達(dá)形式與內(nèi)容性質(zhì)的不同,GIS中所包含的數(shù)據(jù)可劃分如下:
按表達(dá)形式可劃分為空間數(shù)據(jù)和非空間數(shù)據(jù)兩種基本數(shù)據(jù)類型。空間數(shù)據(jù)或稱圖形數(shù)據(jù),可分為幾何數(shù)據(jù)和關(guān)系數(shù)據(jù)兩種。幾何數(shù)據(jù)是描述地理實(shí)體本身的位置和形狀大小的度量信息,其表達(dá)手段是坐標(biāo)值.用數(shù)字形式表示空間實(shí)體,要選擇合適的空間目標(biāo)類型。從幾何角度可把空間目標(biāo)分為點(diǎn)狀、線狀與面狀三種基本類型。
(1)點(diǎn)狀(0維)目標(biāo)—— 在空間有確定位置,但沒有長度和面積的目標(biāo),例如孤立的點(diǎn)(標(biāo)定一個(gè)幾何位置)、拓?fù)浣裹c(diǎn)或端點(diǎn)。
(2)線狀(1維)目標(biāo)—— 在空間有確定位置,并具有長度的目標(biāo),其端點(diǎn)由兩個(gè)點(diǎn)狀目標(biāo)確定 。
(3)面狀(2維)目標(biāo)—— 在空間有確定位置,并具有長度和面積的目標(biāo),它由若干個(gè)線狀目標(biāo)界定。
點(diǎn)狀、面狀、線狀目標(biāo)之間有嚴(yán)格的拓?fù)?鄰接、關(guān)聯(lián)與包含等)關(guān)系。0維目標(biāo)只能是孤立的點(diǎn)、1維目標(biāo)的交點(diǎn)或I維目標(biāo)的端點(diǎn);1維目標(biāo)要終止于兩個(gè)0維目標(biāo);1維目標(biāo)是相鄰兩個(gè)2維目標(biāo)的分界線;位于兩個(gè)0維目標(biāo)間的線段構(gòu)成一個(gè)簡(jiǎn)單的1維目標(biāo);由若干個(gè)1維目標(biāo)組成的任意區(qū)域構(gòu)成一個(gè)簡(jiǎn)單2維目標(biāo)。
關(guān)系數(shù)據(jù)是描述各個(gè)不同地理實(shí)體之間的空間關(guān)系(接近度、鄰接、關(guān)聯(lián)、包含、連通等)的信息,其表達(dá)手段是建立實(shí)體之間的連接信息。連接是一種關(guān)系,“關(guān)系”也是一種數(shù)據(jù),關(guān)系數(shù)據(jù)的存在有助于各種應(yīng)用和空間分析。對(duì)GIS來說,圖形數(shù)據(jù)是基礎(chǔ),是地理實(shí)體的空間定義手段,是專題數(shù)據(jù)的載體,是聯(lián)系地理實(shí)體的各種非圖形信息的紐帶。
非空間數(shù)據(jù)也稱屬性數(shù)據(jù),是各個(gè)地理單元中的社會(huì)、經(jīng)濟(jì)或其他專題數(shù)據(jù)。屬性數(shù)據(jù)是GIS主要處理的對(duì)象,是對(duì)地理實(shí)體更廣泛、更深刻的描述。其表達(dá)手段是字符串或統(tǒng)計(jì)數(shù)值。屬性數(shù)據(jù)是對(duì)空間數(shù)據(jù)(圖形數(shù)據(jù))的強(qiáng)有力的補(bǔ)充。屬性數(shù)據(jù)在GIS中占很大比重,專業(yè)人員利用它可以在地圖圖形基礎(chǔ)上方便的進(jìn)行信息綜合與深層次的專題分析。可以在為管理規(guī)劃與決策者提供各種參考信息的同時(shí),配以關(guān)鍵要素的位置及分布特征的顯示。將地理數(shù)據(jù)劃分為圖形數(shù)據(jù)與屬性數(shù)據(jù)便于在計(jì)算機(jī)上實(shí)現(xiàn),特別是在缺乏融圖形和屬性于一體的非集成式GIS軟件的情況下,利用社會(huì)上現(xiàn)有的圖形軟件和關(guān)系數(shù)據(jù)庫進(jìn)行組合連接,以實(shí)現(xiàn)GIS的基本功能。
按照內(nèi)容特性及主導(dǎo)功能劃分,可將GIS的數(shù)據(jù)劃分為4類:
(1)地理基礎(chǔ)信息
地理基礎(chǔ)信息主要來自地形圖和航空遙感,包括水網(wǎng)、交通、居民地、行政區(qū)劃和河流流域界限等,其作用是為專題地圖圖層提供定位與背景參照。地理背景與專題內(nèi)容雖然分離儲(chǔ)存,但它們是空間相關(guān)的,很多專題內(nèi)容的分布特征與地理背景有著明確的聯(lián)系。因而可以以地理背景內(nèi)容為參數(shù)來檢索與分析評(píng)價(jià)有關(guān)專題內(nèi)容。
(2)數(shù)字地形模型(DTM)信息
數(shù)字地形模型主要來源于地形圖和航空遙感信息。如DTM以及由此導(dǎo)出的其他地形因子(坡度、坡向、地表切割、坡元等),并由于因子組合以及與資源環(huán)境因素相匹配,派生出更多分析地形的因素。由于很多自然或社會(huì)經(jīng)濟(jì)要素的分布和配置與地面高程有著顯著關(guān)系,因此DTM可以看作是一種特殊的地理基礎(chǔ)信息,
(3)資源與環(huán)境信息
資源與環(huán)境信息主要來源于航空和航天遙感與調(diào)查統(tǒng)計(jì),并多以專題地圖形式和地理信息系統(tǒng)連接,也有來自科學(xué)研究的分析結(jié)果,包括土地利用現(xiàn)狀、土壤侵蝕、地貌類型、植被類型、森林分布、草場(chǎng)分布和土地資源。
(4)社會(huì)經(jīng)濟(jì)信息
社會(huì)經(jīng)濟(jì)信息主要來源于政府統(tǒng)計(jì)部門、遙感調(diào)查結(jié)果和社會(huì)研究結(jié)論。例如人口、人口密度、國民收入、文化程度、土地占有量、農(nóng)業(yè)機(jī)械化程度。
2 地理數(shù)據(jù)的多源性及處理方法概述
格式轉(zhuǎn)換是把原格式數(shù)據(jù)經(jīng)過專門的數(shù)據(jù)轉(zhuǎn)換程序轉(zhuǎn)換成目標(biāo)格式的文件并保存下來,并將目標(biāo)格式的數(shù)據(jù)作為系統(tǒng)所使用的直接數(shù)據(jù)源。這是當(dāng)前處理多源數(shù)據(jù)的主要方法。使用格式轉(zhuǎn)換方法的前提是要確知轉(zhuǎn)換前后數(shù)據(jù)的文件格式。地理數(shù)據(jù)由空間信息和屬性信息兩部分組成。空間信息又包括空間定位信息和空間關(guān)系信息。進(jìn)行地理數(shù)據(jù)的格式轉(zhuǎn)換,要確保空間定位信息、空間關(guān)系信息、屬性信息三方面都能正確轉(zhuǎn)換。
數(shù)據(jù)轉(zhuǎn)換的缺點(diǎn)主要是,由于缺乏對(duì)空間對(duì)象統(tǒng)一的描述方法,從而使得不同數(shù)據(jù)格式描述空間對(duì)象時(shí)采用的數(shù)據(jù)模型不同,往往轉(zhuǎn)換后不能完全準(zhǔn)確表達(dá)原數(shù)據(jù)的信息,還需要人工的進(jìn)一步修正和調(diào)整;另外,當(dāng)兩種數(shù)據(jù)之間沒有直接的轉(zhuǎn)換工具時(shí),要借助于多種工具,進(jìn)行多步轉(zhuǎn)換才能完成。
數(shù)據(jù)互操作模式是OGC(OpenGIS Consortium)制定的規(guī)范。OGC是為了發(fā)展開放式地理數(shù)據(jù)系統(tǒng)、研究地學(xué)空間信息標(biāo)準(zhǔn)化以及處理方法的一個(gè)非盈利組織。GIS互操作是指在異構(gòu)數(shù)據(jù)庫和分布計(jì)算的情況下,GIS用戶在相互理解的基礎(chǔ)上,能透明地獲取所需的信息。OGC為數(shù)據(jù)互操作制定了統(tǒng)一的規(guī)范,從而使得一個(gè)系統(tǒng)同時(shí)支持不同的空間數(shù)據(jù)格式成為可能。根據(jù)OGC頒布的規(guī)范,可以把提供數(shù)據(jù)源的軟件稱為數(shù)據(jù)服務(wù)器(Data Servers),把使用數(shù)據(jù)的軟件稱為數(shù)據(jù)客戶(Data Clients),數(shù)據(jù)客戶使用某種數(shù)據(jù)的過程就是發(fā)出數(shù)據(jù)請(qǐng)求,由數(shù)據(jù)服務(wù)器提供服務(wù)的過程,其最終目的是使數(shù)據(jù)客戶能讀取任意數(shù)據(jù)服務(wù)器提供的空間數(shù)據(jù)。但是OGC標(biāo)準(zhǔn)更多考慮到采用了OpenGIS協(xié)議的空間數(shù)據(jù)服務(wù)軟件和空間數(shù)據(jù)客戶軟件,對(duì)于那些歷史存在的大量非OpenGIS標(biāo)準(zhǔn)的空間數(shù)據(jù)格式的處理辦法還缺乏標(biāo)準(zhǔn)的規(guī)范。數(shù)據(jù)互操作規(guī)范為多源數(shù)據(jù)集成帶來了新的模式,但這一模式在應(yīng)用中存在一定局限性:首先,為真正實(shí)現(xiàn)各種格式數(shù)據(jù)之間的互操作,需要每種格式數(shù)據(jù)的宿主軟件都按照著統(tǒng)一的規(guī)范實(shí)現(xiàn)數(shù)據(jù)訪問接口,這在一定時(shí)期內(nèi)還不現(xiàn)實(shí);其次,一個(gè)軟件訪問其他軟件的數(shù)據(jù)格式時(shí)是通過數(shù)據(jù)服務(wù)器實(shí)現(xiàn)的,這個(gè)數(shù)據(jù)服務(wù)器實(shí)際上就是被訪問數(shù)據(jù)格式的宿主軟件,也就是說,用戶必須同時(shí)擁有這兩個(gè)GIS軟件,并且同時(shí)運(yùn)行,才能完成數(shù)據(jù)互操作過程。直接數(shù)據(jù)訪問指在一個(gè)GIS軟件中實(shí)現(xiàn)對(duì)其他軟件數(shù)據(jù)格式的直接訪問,用戶可以使用單個(gè)GIS軟件存取多種數(shù)據(jù)格式。
3 常用地理數(shù)據(jù)存儲(chǔ)格式
地理數(shù)據(jù)存儲(chǔ)格式可分為三類:含有空間位置信息的非地圖文件、各種地圖文件和地圖數(shù)據(jù)庫。
3.1 含有空間位置信息的非地圖文件
這一類存儲(chǔ)方式是使用通用或?qū)S玫奈募袷絹碛涗浀乩硇畔ⅰR话銥楦鞣N勘探、調(diào)查所得到的原始數(shù)據(jù)或現(xiàn)場(chǎng)觀測(cè)儀器記錄下來的數(shù)據(jù)文件。通用文件形式如Excel表格、TXT文本等;專用文件格式如EQT文件。
3.2 各種地圖文件
地圖文件是地理數(shù)據(jù)存儲(chǔ)的重要形式,目前得到公認(rèn)的幾種重要的地圖數(shù)據(jù)格式有:ESRI公司的Arc/Info Coverage, ShapeFile, E00格式;AutoDesk的DXF格式和DWG格式;MapInfo的MIF格式;Intergraph的DGN格式等等。
3.3 地圖數(shù)據(jù)庫形式
地圖數(shù)據(jù)庫普遍采用商用關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(如SQL SERVER,ORACLE等)統(tǒng)一管理圖形和屬性數(shù)據(jù)。用關(guān)系數(shù)據(jù)庫管理圖形和屬性數(shù)據(jù)有兩種主流方案。一種是在商用關(guān)系數(shù)據(jù)庫管理系統(tǒng)之上開發(fā)一個(gè)中間件,使傳統(tǒng)關(guān)系型數(shù)據(jù)庫管理系統(tǒng)擴(kuò)充為能夠管理圖形數(shù)據(jù),如ESRI公司的ArcSDE和MapInfo公司的Spatialware等:另一種是基于數(shù)據(jù)庫管理系統(tǒng)本身的空間數(shù)據(jù)管理功能的擴(kuò)展來實(shí)現(xiàn)的,如國產(chǎn)軟件GeoStar 4.0等。
4 多源數(shù)據(jù)處理方法
本文選擇嘗試將CAD格式的地圖數(shù)據(jù)轉(zhuǎn)換成Shapefile格式的地圖文件。
AutoDesk公司的AutoCAD軟件廣泛應(yīng)用于各個(gè)行業(yè),其數(shù)據(jù)文件格式DWG/DXF已成為工程圖形的工業(yè)標(biāo)準(zhǔn).一些把AutoCAD作為成圖軟件或使用Autodesk Map作為GIS平臺(tái)的地圖制作單位,制作大量的DWO/DXF格式的CAD地圖.CAD地圖本身是一種矢量圖形格式.我們的任務(wù)是把CAD地圖轉(zhuǎn)化為更為流行的Shapefile地圖格式。
對(duì)于CAD地圖的處理,要先使用地圖轉(zhuǎn)換工具,然后還要輔以人工進(jìn)行修正處理。在選擇地圖轉(zhuǎn)換工具時(shí),首先嘗試用ArGIS中的ArcToolbox工具進(jìn)行轉(zhuǎn)換。但是ArcToolbox的轉(zhuǎn)換結(jié)果有的效果很理想,有的則丟失了很多要素。對(duì)于這一現(xiàn)象,筆者從CAD地圖的DWG/DXF格式入手分析,發(fā)現(xiàn)圖形中的一次線條能夠被正確轉(zhuǎn)換,而高次線條則不能被正確轉(zhuǎn)換。之后筆者又嘗試了多個(gè)大型GIS平臺(tái)軟件中提供的格式轉(zhuǎn)換工具,發(fā)現(xiàn)利用Mapinfo軟件中的地圖轉(zhuǎn)換工具不僅可以將圖形中的一次線條轉(zhuǎn)換出來,而且也能將高次線條轉(zhuǎn)換出來。Mapinfo的地圖轉(zhuǎn)換工具將CAD地圖的每一層轉(zhuǎn)換出來保存為一個(gè)shapefile文件。最后處理CAD地圖的格式轉(zhuǎn)換工具就固定為Mapinfo軟件。筆者在發(fā)現(xiàn)Mapinfo軟件對(duì)CAD地圖的優(yōu)良的轉(zhuǎn)換能力之前,曾給出了另一種針對(duì)CAD地圖中高次線條的解決方法。該方法是在AutoCAD軟件環(huán)境中對(duì)圖形中的高次線條進(jìn)行重新矢量化工作,即在高次線條上描出近似的一次線條來取代高次線條。這種解決方法的思路來源于柵格圖到矢量圖轉(zhuǎn)化的矢量化方法,不同點(diǎn)在于將矢量化的操作手法應(yīng)用在矢量圖上。這種解決問題的思路對(duì)于以后類似的問題都有幫助。這種方法雖然能將問題解決,但轉(zhuǎn)換的結(jié)果不精確,而且要耗費(fèi)很大的人工勞動(dòng)。
筆者總結(jié)出的處理CAD地圖的方法如下。
(1)使用Mapinfo軟件中的格式轉(zhuǎn)換工具將CAD圖中的各個(gè)圖層轉(zhuǎn)換為線形的Shapeflle文件。
(2)將生成的Shapefile文件中的線條分三類:表示點(diǎn)的線劃、線形要素、面狀元素的邊界線。
(3)在點(diǎn)的線劃處描點(diǎn),建立點(diǎn)元素。
(4)在面的邊界線圖上進(jìn)行拓?fù)潢P(guān)系生成操作,產(chǎn)生面狀地圖。
(5)三類要素添加屬性表。
(6)為地圖添加投影,或進(jìn)行投影變換。
參考文獻(xiàn)
[1]王家耀.空間信息系統(tǒng)原理.北京:科學(xué)出版社,2001.6-11,314-330.
[2]姚敏,張柏,張樹清.基于構(gòu)件的地理信息系統(tǒng)應(yīng)用軟件開發(fā)模型研究.測(cè)繪工程,2001,10(1):41-45.