摘要本文介紹了分布式空間數據庫的概念、特點和體系結構,并闡述了GIS與其結合所具有的優勢,以及一些研究者基于GIS的分布式空間數據庫設計的方法。
關鍵詞分布式空間數據庫 空間數據 GIS
文章編號1008-5807(2011)05-100-02
一、前言
在地理信息領域,由于統一采用GML和開放地理數據模型描述空間信息,使得傳統的GIS正在向新型的GIS轉變。傳統的GIS大多面向個人電腦和集中式計算平臺,采用各自的空間信息模型和管理模式。新型的GIS面向Intemet和分布式計算平臺,采用開放的空間信息模型和統一的空間信息描述語言。面對傳統GIS與新型GIS如何轉化和接軌的問題,必須在分布式空間數據庫的體系結構上給予理論回答。同時海量的空間信息的存儲對信息共享和避免信息重復提出了要求。
二、分布式空間數據庫
(一)定義
分布式空間數據庫(DistributedGeo一SPatialDataBase,DSDB)分布式空間數據庫系統由若干個站點集合而成,這些站點又稱為節點,它們通過網絡連接在一起。每個節點都是一個獨立的空間數據庫系統,它們都擁有各自的數據庫和相應的管理系統及分析工具。整個數據庫在物理上存儲于不同的設備上,而在邏輯上則是一個統一的數據庫。
(二)特點
分布式空間數據庫的特點:
(1)物理分布性:分布式空間數據庫中的數據不是存儲在一個節點上,而是分散存儲在由計算機網絡連接起來的多個節點上;
(2)邏輯整體性和訪問透明性:分布式空間數據庫系統中的數據物理上分散在各個節點上,但這些分散的數據邏輯上卻是一個整體,能夠被所有用戶透明訪問;
(3)節點自治性:各節點上的數據由本節點的空間數據庫管理系統管理,具有自治處理能力,完成本節點的應用;
(4)適當的數據冗余:分布式空間數據庫系統通過一定的冗余機制來提高局部的應用性、系統的可靠性、可用性和改善系統的性能。
(三)分布式空間數據庫的體系結構
體系結構特點:(葉圣濤、張新長提出了一種體系結構如下)
(1)基于傳統的空間數據庫上做空間數據存取擴展,并且使其適應分布式系統的需要。
利用元數據技術實現分布式數據庫的構架。空間元數據被認為是空間信息共享的關鍵技術。個異構的空間數據模型采用同樣的空間元數據模型,則可以開發出相同的空間數據庫訪問接口。
(2)利用統一的空間數據模型、統一的空間數據標準來實現分布式空間數據的構架。這是一種非常理想的情況。在這種情況下,由于不同節點使用的模型相同、并且遵守相同的標準,所以空間數據之間的交互和共享問題就自然獲得解決。但是,從目前的情況來看,要實現這個目標還需要一定的時間。一方面是這種技術本身還不成熟,另一方面大量以前已有的系統推翻重來的代價太大。
(3)許多在理論上提出的分布式體系結構難以在實際中應用。雖然在概念上是很先進的,但往往趨于理想化,有許多技術上和體制上的問題使得體系結構的實施面臨許多挑戰性的難點,必須一個一個被攻克才能使理論上的體系結構付諸實踐。
三、 GIS與分布式空間數據庫
空間數據是任何GIS系統的血液,如何管理這些數據并能高效快速實現GIS的各種查詢分析功能是一個關鍵。GIS數據庫不僅有與一般數據庫數據性質相似的地理要素的屬性數據,還有大量的空間數據,即描述地理要素空間分布位置的數據,并且這兩種數據之間具有不可分割的聯系,分布式空間數據庫的提出與應用為它提供了方向。
(一)優越性
GIS與分布式空間數據庫結合具有許多優勢:
(1)由于數據庫采用的客戶/服務器結構,數據可以在更大范圍內共享,只要指定網絡地址就可訪問數據,由于數據庫的記錄鎖定技術,不會像文件系統一樣產生共享沖突現象。
(2)支持并發訪問。在現代計算機系統中,為有效利用計算機資源,一般允許多個應用程序并發進行。現代大型數據庫都已解決并發問題,提供不同類型用戶的多種用戶界面和保證并發訪問時的數據一致性的并發控制。同時,由于分布式數據庫的適當冗余性,每個節點都會存儲一定的數據,這也降低了不同用戶同時訪問同一數據的概率。
(3)采用數據庫的強大的查詢機制可以更快速高效地訪問數據。在一個數據集中存儲的數據量不再受到限制,可以存儲無縫的連續地理數據,不需要分塊管理地理數據,可以存儲海量的地理數據。
(4)數據保護。數據庫提供了多種安全機制,如定義視圖,訪問控制,數據加密以及跟蹤審查等。數據庫所提供的安全基本能滿足地理數據管理的要求。
(二)基于GIS分布式空間數據庫的設計
分布式空間數據設計的一個重要原則是使數據與應用程序實現最大程度的本地化。這樣應用程序使用的數據大多數來自本地節點,只有少量的數據來自遠程節點,減少了數據傳輸,加快了系統的速度。
(1)空間數據的分割和分布設計
空間數據分布是指分布式空問數據庫中的數據按照某種邏輯劃分分散存儲在各個相關場地上,而不是存儲在同一場地的存儲沒備上。
1)鄔倫,張毅,提出了一種空間數據的分布設計方法
由于GIS資源的分布具有地理特性、專題性和面向對象性,所以提出了將GIS系統的空間數據庫構件分為三種類型分片:區域分片、專題分片和面向對象分片。
區域分片,是空間數據的水平分布,這是由GIS資源的區域性所決定的。在區域分片中空間數據按照地理范圍進行分割。
專題分片,是空間數據庫的垂直分布.這是空間數據庫的專題性所決定的。專題分片通常區分于同一地理區域內各個不同部門的專業數據。
面向對象分片,是指空間數據按照本身的屬性進行分類.它通常分為零維對象、一維對象、二維對象和三維對象(零維對象指點對象,一維對象指線對象,二維對象指面對象)。
2)宋海朝,楊枉,周儉也提出了另一種設計方法
空間數據的分割方式:①按照空間數據的表示方式,劃分為矢量數據和柵格數據兩部分:②按照地理范圍,劃分為多個圖幅;③按照專題,劃分為多個專題部分;④每一個專題對應于一個圖層。針對空間數據按照①一④的次序進行劃分,最后把空間數據劃分為圖層(碎片)。其中圖幅的大小可以根據具體應用來定,并且各個圖幅的大小既可以相等也可以不相等。
空間數據的分布:把圖層作為空間數據的分布單位;然后,根據各個節點的應用情況,把圖層分布到各個節點上(如把某一個專題的所有圖層放在一個節點上)。同時,對于關系比較密切的專題采用部分復制機制,以實現系統的高可靠性和效率。
(2)分布式查詢設計
根據分布式查詢的最終目的——最小的效應時間,宋海朝,楊枉,周儉提出將查詢分為3種類型:局部的、遠程的和復合的。對于局部和遠程查詢,由于能在單一的節點上進行,所以提出采用直接應用單一空間數據庫的查詢處理算法。而對于復合查詢,側重考慮減少節點間的數據傳輸量和增加操作的并行性。為此,結合上述空間數據的描述規范,參考有限搜索方法,他們設計了一個分布式查詢處理算法。基本思想是檢查各種不同的分解方法,選擇通信費用最低的分解方法處理查詢,在估算一個分解方法的費用上,采用不完全分解的方法。
四、結束語
廣義范圍內的GIS數據資源共享的問題一直是制約GIS發展的瓶頹問題,分布式空間數據庫的設計還不是很成熟,涉及到很多問題,比如并發控制和安全性問題。對于這些問題,在分布式系統中有很多解決方法,然而都不能很好的顧及方方面面,尋找一個適合分布式空間數據庫的算法還有待研究。
參考文獻:
[l]葉圣濤,張新長.分布式空間數據庫的體系研究.地理信息世界,2004(11).
[2]鄔倫,張毅. 分布式多空間數據庫系統的集成技術.地理學與國土研究,2002(1).
[3]宋海朝,楊枉,周儉.分布式空間數據庫的研究與設計.計算機工程與設計,2004(11).
[4]喬彥友,趙健. 分布式空間數據管理技術研究.中國圖像圖形學報,2001(9).
[5]杜金鳳. GIS與空間數據庫技術.中國地名,2009(12).
[6]盧峰,劉翰,胡少華. 基于分布式空間數據庫的WebGIS系統.計算機時代,2003(9).