董晶
(遼寧省自然資源事務服務中心,遼寧 沈陽 110032)
2013至2015年,國務院開展了第一次全國地理國情普查工作,要求各省基于地理國情普查成果數據,依據統一的規范和標準建立完整的、空間連續、主要要素時點統一的省級地理國情普查數據庫,并設計開發地理國情普查數據庫管理和應用服務系統。
根據遼寧省地理國情普查工作的實際情況,論述省級地理國情普查數據庫的建設目標、關鍵技術、邏輯設計、功能設計、數據庫運行環境等幾個方面。
地理國情普查數據由各省和國家分別建庫,各省完成的普查數據在開展初步建庫(主要是數據預處理)工作后匯交到國普辦進一步構建全國數據庫。因此,在設計省級地理國情普查數據庫時,要滿足國家的一些基本要求。
(1)省級地理國情普查數據建庫應參考《第一次全國地理國情普查數據庫建設技術設計》,并根據本省普查實際情況制定相應的地理國情普查數據庫設計方案。
(2)省級地理國情普查數據庫僅覆蓋本省范圍。除包含全國數據庫規定的數據集、數據層和數據表外,還應包含各省擴展的省情普查數據成果和相關專題數據。
(3)省級地理國情普查數據庫應設計各要素層的增量格式,同時設計數據庫的生成增量功能以實現地表覆蓋和地理國情要素數據從省級數據庫到全國數據庫的增量更新。
(4)省級地理國情普查數據庫管理與分析系統、數據庫運行環境等根據本省實際情況、參考全國數據庫進行設計和選擇。
(5)各省數據庫與全國庫保持數據一致,因此,應統一下發或開發數據入庫檢查工具和預處理工具。
利用數據庫、地理信息系統、虛擬化、云存儲和并行計算等技術,設計地理國情普查數據建庫與更新的技術路線與工藝流程,完成地理國情普查各類成果數據的對象化建模與集成建庫,并構建地理國情普查數據庫管理與應用服務系統,在涉密生產網絡環境下,實現地理國情普查成果數據集成管理、快速制圖、成果應用服務、數據庫更新維護、綜合統計分析等方面的功能。
矢量數據如地表覆蓋矢量數據、地理國情要素數據以要素為單位進行更新。為提高數據庫統計分析的效率,當前數據與歷史數據分開存放,即分為當前空間數據庫和歷史空間數據庫。在當前數據庫中存儲圖層的最新基態數據,而在歷史數據庫中則保存圖層的歷史基態數據序列。
數據更新插件安裝在內業作業人員的機器上,基于ArcMap開發,操作對象為從數據庫更新維護子系統中提取出來用于更新的數據包。具體的更新操作依靠ArcMap的現有編輯功能完成,插件只做對變更狀態(增、刪、改)進行監控和保存,同時提供導出增量更新包的功能。
云存儲架構可以針對非結構化數據提供專有的數據存儲和數據保護機制??梢詫崿F數據量和性能成正比增長,并針對海量地理信息數據無法備份保護的特點,提供節點間的RAID保護功能,實現節點損壞業務不停、數據不丟失。
在實際工作中,遼寧省地理國情普查數據庫基于ORACLE 11g與ArcSDE環境下的GeoDatabase模型進行邏輯設計,數據庫中數據分矢量數據集、柵格數據集、普通表格、文檔數據等幾種形式進行管理??臻g數據以ST-Geometry格式保存在Oracle數據庫中,統計分析采用Hadoop+Hive分布式計算框架,文檔數據采用NAS形式存儲(圖1)。
為方便數據庫更新維護,系統需要具備數據入庫、路網與水網構建、數據分發處理、數據交換、歷史數據管理、變化發現與對比分析和發布數據處理等功能。
系統最基本的需求是各種成果數據集成管理與顯示,為此需要在建庫環境下開發對地理國情空間數據和非空間數據的資源管理、集成顯示與查詢檢索等方面功能。
地理國情普查的重要應用之一就是以專題圖圖件的形式對外展示成果,需要一套以普查成果數據庫為核心的圖庫一體化的方法,快速批量生產出符合普查成果制圖要求的系統,形成省、市、縣各級區域范圍的制圖成果。
基于地理國情普查數據,深度融合其它專業部門普查(調查)數據和經濟社會統計數據,從資源分布與利用、生態協調性、基本服務均等化、區域經濟潛能、城鎮發展等5個方面進行統計分析。
該系統基于天地圖·遼寧地圖網站,提供地理國情普查成果數據的展示以及統計成果的在線服務,包括普查成果及統計成果數據的無縫、快速瀏覽顯示、查詢檢索、統計成果下載等方面的在線服務功能。系統采用B/S結構開發,要求反應速度快,操作方便。

圖1 數據庫總體邏輯結構
省級地理國情普查數據庫系統平臺應采用基于虛擬化的GIS部署模式,通過虛擬化管理軟件將計算資源、網絡資源、存儲資源等虛擬化,構建數據庫服務器集群、GIS服務器集群等提供系統運行所需服務器和存儲環境,具有高性能、高可靠性、高可靠擴展力等特點(圖2)。

圖2 物理連接拓撲示意圖
兩臺數據庫服務器雙機部署數據庫軟件(Oracle),以增加普查數據庫的容災能力。利用備份一體機的備份機制定期備份普查數據庫和歷史數據庫,保障普查成果安全。基于涉密生產網絡,GIS服務器通過ArcGIS Server提供普查數據訪問接口,三臺GIS服務器負載均衡,確保各個部門對數據的訪問得到及時快速的響應。
采用FC-SAN結構存儲,滿足基于關系型數據庫的結構化數據存儲、Oracle高可用性部署的需要,采用云架構NAS存儲,滿足基于文件系統的非結構化數據的訪問需求。
地理國情普查數據真實反映地表植被覆蓋、地形地貌、水域分布、交通網絡、居民地與設施等,以及國情要素的分布情況。但是與基礎地理信息數據庫相比,地理國情普查數據庫有幾個特點,一是國家庫與省級庫要保持一致,相互之間要設計數據接口,并且強制進行增量更新,這也要求數據生產和質檢單位今后要改變作業方式和質檢方式;二是基于普查數據庫開展統計分析工作,目前設計的統計分析功能只是粗淺的嘗試,需要進一步地研究提煉;三是要將當前數據與歷史數據分開存放,形成當前空間數據庫和歷史空間數據庫;四是如果有條件,運行環境可采用云存儲方式。目前,遼寧省地理國情普查數據庫建設已進入實施階段,在建設過程中還會遇到設計中沒有考慮到的技術問題,應逐步加以解決。