胡蝶 趙璞 陳明爽 岑欣童 楊曉彤
摘要:地理信息系統的迅速發展和廣泛應用積累了大量數據資源,空間數據質量已然成為國際地理信息系統領域的研究熱點。作為空間數據產生和更新中的重要數據來源,空間矢量數據的一致性處理問題也更加為人們所關注。本文立足現有的多源空間數據,闡述了多源空間數據不一致性的產生,并對多源空間矢量數據的一致性處理方法進行了探討,介紹多源空間矢量數據在幾何位置、屬性特征和要素關系方面的一致性處理方法,提高空間矢量數據的質量和現勢性。
關鍵詞:多源空間矢量數據;不一致性;幾何位置;屬性特征;要素關系
中圖分類號:TP39 文獻標識碼:A DOI:10.3969/j.issn.1003-6970.2016.04.004
0 引言
隨著各種各樣的地理信息系統的應用,人們對空間數據的需求也越來越大。當前在空間數據生產與更新過程中,國家各個部門從行業應用需求出發生產了大量的空間數據(遙感影像、矢量數據、統計數據、多媒體數據、測量數據等)。然而,對已經獲得了的海量空間數據中所蘊含著的、豐富的地理信息沒有得到充分地利用和挖掘。為了充分地利用好這些豐富的數據資源,就需要有效的技術和方法來對多源空間數據進行相應處理,實現多源空間數據在幾何特征、屬性特征和空間關系等特征上的一致性。
1 多源空間數據概述
1.1 空間數據的定義及其特征
空間數據,也可以稱為地理數據,是地理實體的空間特征和屬性特征的數字描述。地理實體的空間特征表現為地理實體的幾何特征(定位:地理實體的位置、形狀、大小及其分布特征)和實體間的空間關系;地理實體的屬性特征(定性)表現為實體的數量特征、質量特征和時間特征。定位是指一個已知的坐標系里空間目標都具有唯一的空間位置,定性是指空間目標的自然屬性,時間是指空間目標是隨時間的變化而變化。
空間數據具有三個基本特征:
①空間特征描述現象的空間位置或現在所處的地理位置。空間特征又稱為幾何特征或定位特征,一般以坐標數據表示。
②屬性特征描述事物或現象的特征,例如變量、分類、數量特征和名稱等等。
③時間特征指事物或現象隨時間的變化,例如人口數的逐年變化。
1.2 多源空間數據不一致性的成因
造成多源空間數據不一致的因素有很多,可以概括為以下幾個方面:
(1)獲取手段多源
數據的獲取途徑較多如目測及實地勘察、數字地圖、遙感影像、地圖表格、前期數據檔案等。數據的多數據來源就造成了多數據格式、多語義性、多比例尺、多存儲格式等多個層次。同時,地理信息在分類編碼、圖層分層上沒有的統一標準,造成基礎數據共享和跨部門協作的難度。在空間數據的使用過程中,不同操作人員的認知理解及其它一些主觀因素也會導致不確定性出現。
(2)多語義性差異
對于同一個地理信息單元,在現實世界中其幾何特征是一致的,但是卻可能對應著多種語義,如森林的類型、林木的特征等等,按森林的作用可以將其分為分類:防護林、用材林、經濟林、薪炭林、特種用途林。應用于不同問題的側重點也有所不同,因而會存在語義上的分歧。
(3)多時空性和多尺度性
數據具有很強的時空特性。同一個數據源中既有同一時間不同空間的數據,也有同一空間不同時間的數據。不僅如此,根據系統需要而采用不同的尺度對地理空間內的信息進行表達,會用到不同的比例尺和不同的精度。
(4)地圖投影差異
地圖投影是通過數學方法,建立地球面上點的坐標(B,L)與地圖平面上點的坐標(X,Y)之間一一對應的關系。是實現信息定位和信息可視化的基礎。地圖投影的實質是一一對應的函數關系,保證了空間信息在區域上的聯系與完整性。在投影的過程會產生投影變形,變形的大小及性質會因為投影方式的不同而產生一定差異。在調查過程需要對數據進行相應處理,如格式轉換、投影變換、誤差校正等也存在不確定性。
(5)坐標系的差異
不同地區和國家都根據自身情況,選擇適合本國的坐標系統。不同的國家和地區,根據自身情況獲得大地原點的大地起算數據和基準面,建立了適合本國的國家坐標系。我國境內常用的坐標系有:新1954北京坐標系(新BJ54)和WGS-84坐標系。
另外,空間基準是隨時間變化而變化的。例如WGS-84坐標系,這種坐標系的主要參數,每隔一定的時間就會重新測定一次,這就意味著采集到的空間數據即使使用了同樣的大地坐標系,由于使用了不同的時間參數,也會造成空間數據不一致的問題。
1.3 多源空間數據不一致的主要表現形式
根據以上提到的空間數據的三個基本特征:空間特征、屬性特征、時間特征,多源空間矢量數據處理中的不一致主要體現在幾何位置、屬性特征和要素關系三個方面。
(1)幾何位置不一致
遙感技術是現代高科技之一,借助遙感手段獲取信息具有周期短、信息量豐富等優勢。遙感數據正以指數級增長。由于遙感影像因其獲取手段先進、現勢性較好且能提供更為準確的幾何位置信息,一直以來空間數據更新中都是基于影像更新矢量數據中同名要素的幾何位置,但是在許多方面遙感影像、矢量數據和柵格數據都存在差異。如表1所示:
在投影方式層次來看,遙感影像多采用中心投影方式,因為遙感技術采用全景投影和斜距投影會產生較大的變形誤差。數據處理后的矢量數據或柵格數據采用的是高斯一克呂格投影。在表示方法層面,遙感影像僅是只紀錄各種地物電磁波大小的膠片(或相片),是以影像形式表現出來。而矢量數據一般通過地圖符號、坐標、顏色、文字和其它地圖語言等多種形式將實體對象的空間位置表現出來。而柵格數據是按網格單元的行與列排列、具有不同灰度或顏色的陣列數據。在時間層面來看,遙感影像是拍攝的那一固定時間的結果,矢量數據則是一個累計的過程即一段的信息編輯處理后的加工成果,而柵格數據是特定時間的結果。從以上三個層面可以看出,不同格式之間的轉換必然會造成同名要素幾何位置的差異。
(2)屬性特征的不一致性
在實際應用過程中,通過各種方法采集的數據要經過相應的分析與處理。由于不同部門對空間數據的實際需求不同,其分類分級的方式有很大差異,導致屬性特征的表達更是千差萬別。概括起來,多源空間數據屬性特征的不一致主要有以下幾方面內容。
①要素分類分級的不一致
分類是將共同屬性特征的事物劃分到一起,分級是在一類對象的基礎上,按特定差異標準進行分級。常見的分類分級方法有線分類分級法(國家基礎信息數據分類方法)、面分類分級法和混合分類分級法(即線面分類結合)。多源數據的分級不一致主要體現在所采用的分級原則及指標上。如森林資源可以按森林的作用的分類(防護林、用材林、經濟林、薪炭林、特種用途林)、按人為影響的程度分類(原始林、次生林和人工林)、按林木特征的分類、按森林的自然屬性的分類。
②屬性特征表達的不一致性
屬性字段描述的內容主要是由該地理要素在不同數據中的用途決定的,因此不同數據在描述同名實體上,可能存在:屬性字段的數量、屬性字段的類型、屬性字段的含義等方面的不一致。
(3)要素關系不一致
多比例尺地圖中同名對象之間關聯關系的建立和動態維護是多尺度空間數據級聯更新的關鍵技術環節,是更新得以傳遞的橋梁和紐帶。在多源空間矢量數據的加工處理過程中,同名實體要素關系之間可能會產生許多沖突。如小比例尺數據的更新操作往往以大比例尺的數據作為基礎,在進行縮編過程的中,大比例尺地圖上的各種元素之間的距離會按不斷地相對縮近,達到某種程度時,相離的元素可能變成相接或重疊的,這就造成了不同元素間拓撲關系的變化。
2 多源空間數據的一致性處理方法
2.1 幾何位置的一致性處理方法
幾何特征更新主要有兩個研究方向:一是多尺度矢量數據之間通過幾何匹配來實現同名實體的幾何特征更新;二是基于影像實現矢量數據中同名實體的幾何特征更新。
(1)幾何位置一致性處理的基本方法
多源空間數據的幾何位置一致性處理的基本方法主要有空間基準轉換、數學基礎變換和幾何位置的配準與糾正。國內外許多專家對不同空間直角坐標系之間的坐標轉換作了大量研究,成熟的轉換模型有三參數坐標轉換模型、七參數坐標轉換模型等。數學基礎變換主要是指地圖投影變換,主要解決多源空間數據的地圖投影不一致問題,研究并實現多種地圖投影的正反解變換。幾何位置配準與糾正的實質是根據原始數據的幾何畸變特點,采用一種幾何變換將原始數據歸化到目標數據的坐標系中。其中空間基準轉換和數學基礎變換是消除幾何特征差異的前提,主要包括大地坐標系統變換、地圖投影解析變換、地圖投影數值變換、常用諱度函數正反解變換、等高線制式轉換等方法。
(2)基于影像的矢量數據幾何位置一致性處理
矢量數據更新中通常是基于影像更新矢量數據,這種更新模式在應用過程中的關鍵,就是基于影像實現矢量數據中同名實體的幾何位置一致性處理,消除它們之間的幾何位置不一致。由于對影像和矢量數據進行幾何位置一致性處理比較困難,從而提出了一種通過構建影像與矢量之間的控制點集,利用三角剖分實現兩種數據的幾何位置一致性處理的方法。
(3)幾何位置一致性基本流程
對于處理幾何位置一致性基本流程為:先進行空間基準轉換與數學基礎變換,然后進行影像與矢量數據的控制點識別匹配,最后通過基于同名點三角剖分的幾何位置變換來實現幾何位置一致,并通過實例分析去驗證針對幾何位置一致性處理技術方法的可行性。
2.2 屬性特征的一致性處理方法
針對導致數據屬性特征不一致的兩個方面,提出如下兩類處理方法:
(1)分類分級“化繁為簡”
雖然不同區域、不同部門的要素分類分級存在多樣性與多變性,但是數據的分類分級主要表現為兩種關系:從屬關系和并列關系。通過要素關系分類分級的映射,將不同來源數據的諸多繁雜分類分級,最終簡化抽象為從屬關系和并列關系兩種。映射的實現首先要全面細致的分析不同來源數據各自的分類分級方法,然后理清要素分類分級之間的聯系,依據相應的原則實現映射。對于分類分級映射的具體操作要注意:對于分類分級的標準的合理性、在整個映射內部的系統性、整個體系的完備性。
(2)屬性特征項抽取與轉換
在屬性特征項的抽取和轉換的過程中,主要應用三大類規則文件:轉換控制文件、對應控制文件、結構定義文件。
①轉換控制文件:該文件定義源數據中每個層級要素是否需要轉換,以及轉換時所調用的層要素對應控制文件。
②層要素對應控制文件:每層要素對應一類控制文件,該類文件有著重要的作用,文件中抽取了源數據及目標數據的相應屬性特征項,同時描述了源數據的屬性與轉換數據屬性,以及屬性項的概念映射關系。為了提高準確性應采用多對一或多對多的對應關系,最大限度的保留源數據的屬性信息,采用多個字段對應轉換數據的一個屬性以及若干屬性項。層要素對應控制文件結構如圖1所示。
③結構定義文件:定義了轉換數據中每一類要素的:屬性字段及其長度、類型、默認值等信息,此文件的結構往往是多變的,它會根據目標數據的情況(要素分類、屬性特征)加以組織定義。
多源空間數據中屬性信息一致性處理方法的研究屬性特征的一致性處理流程
2.3 要素關系一致性處理
(1)要素關系的描述
空間要素主要分為點、線、面三種要素。空間關系信息主要涉及幾何關系的“相接”、“相鄰”、“包含”等信息,它通常用拓撲關系或拓撲結構的方法來分析。(拓撲關系是明確定義空間關系的一種數學方法,與圖、要素關系是相通的。)從拓撲的角度出發,側重的是空間的點、線、面之間的位置關系,而不管實際圖形的幾何形狀。因此,即使圖形的幾何形狀相差很大,它們的拓撲結構卻可能相同。按照拓撲學的原理,拓撲元素主要有三種基本類型:結點、弧段和面域。
要素關系一致性處理算法的復雜度和拓撲關系劃分的詳細程度成正比。所以需要對拓撲關系進行了適當合理的簡化,主要處理要素關系處理中常用到的點一線、線一線和線一面拓撲關系。
(2)要素關系處理的基本方法
根據實際情況對于不同類型的要素關系,其一系列處理方法也各不相同,對于要素關系的基本處理方法有位移、合并與分割、刪除、化簡等。
①位移 涉及到地圖比例尺的縮小時,用符號表示的各個物體之間位置關系變得模糊甚至覆蓋到一起。通過圖解位移來保證各要素總體結構的完整性、適應性,相似性,此操作應用最為廣泛。
②合并與分割 涉及到比例尺縮小時,為了反映其主要特征,當某些物體的圖形面積或間隔小于分界尺度時,可采用合并同類物體的碎部。分割與合并恰恰相反,它是分割次要實體來達到消除沖突的目的。
③刪除 刪除的目的是減少要素種類;同類要素中刪除對是減少同類要素的數量。對整體空間的分布不會產生影響的無關實體常常作為刪除的對象。
④化簡 為了減少彎曲,主要應用于線狀地物,如單線河、等高線等,對于面狀地物主要是化簡其邊緣輪廓。通過化簡一些次要的實體特征,避免與重要實體之間的沖突。
3 結束語
多源空間數據一致性處理技術是提高生產與更新數據質量和效率的重要途徑,可以促進空間數據的共享和集成,快速持續的更新地理空間數據庫,提高地理空間數據的現勢性,充分挖掘并利用海量空間數據中所蘊含著的、豐富的地理信息。鑒于多源空間數據一致性處理的復雜性,多源空間數據間不一致性智能化檢測和處理方法是今后研究發展的趨勢。