彭仲秋,向詩強,陳建明,黃顯義,李永華,張鵬
(1.新疆維吾爾自治區地質礦產勘查開發局地球物理地球化學探礦大隊,新疆 昌吉 831100;2.新疆維吾爾自治區地質礦產勘查開發局信息中心,新疆 烏魯木齊 830000)
隨著大數據、云計算、地理信息技術的飛速發展,信息技術在地學數據管理與服務領域得到廣泛應用。中國地質調查局于2016 年啟動“地質云”建設,開展數據資源整合集成,擬解決海量空間數據的分布式存儲、處理、查詢、互操作和虛擬化等問題。2017 年11 月“地質云1.0”正式上線運行,2018 年10月“地質云2.0”正式上線運行,實現了中國地調局“地質云”主數據中心與29 個中國地調局直屬分中心的互聯互通,建立健全“地質云”數據共享技術體系與運行機制,為地質行業信息系統整合與數據資源共享提供了平臺。
地學數據具專業性、多元異構性、時空性、海量性等特點[1]。①地學數據來源于地質調查、地球物理、地球化學、遙感、測繪等方面,涉及多個學科,具很強的專業性;②地學數據種類繁多、形式多樣、內容豐富,涵蓋了地學專業各個領域。如:空間數據、屬性數據、成果文檔等。形式包括文本、文檔、圖件(矢量、柵格)、表格、數據庫、圖片、音頻、視頻等結構化、半結構化和非結構化數據,這些數據具不同存儲格式。如MapGIS(wt wl wp)、Shapefile(shp)、GeoJson、GeoTiff、grid、AutoCAD(dxf dwg)、gml、xml、txt、csv、mdb、xlsxlsx、tiff、jpeg、docdocx、pdf 等,具多元異構性;③地學數據描述對象是地球,空間屬性為固有屬性,脫離空間位置的地學數據無意義。任何觀測數據均在某一時間點獲取,地學數據具明顯時空特性[1];④地學數據體量巨大。包括野外調查、勘探、遙感、文獻數據等。隨著時間推移及數據采集技術的發展,地學數據將呈爆發式海量增長[2]。
新疆地礦局具有較規范和全面的基礎地理、遙感影像、基礎地質、災害地質、水文地質、工程地質、地球化學、地球物理、礦產地、探礦權、采礦權、工作程度、成礦區帶、自然保護區、整裝勘查區、潛力評價、地熱資源等地學數據資源。通過2007—2013 年實施的礦產資源潛力評價項目,基本摸清了新疆礦產資源現狀,為礦產資源保障能力和勘查部署提供了依據,形成海量地質信息成果。
(1)數據資源分散,缺乏統一管理和共享機制,數據長期處于孤島狀態,利用率低[3]。
(2)數據間聯系較弱,不同專業間數據尚未整合,不利于綜合展示、分析和利用。
(3)紙質、光盤等存儲數據資料,使用過程中常出現原件磨損、丟失、損毀等問題。
(4)電子數據資料多采用文件方式進行存儲和管理,易出現數據冗余、版本多、混亂、泄密等問題。
(5)數據查詢檢索、統計分析效率低下。
(1)整合與集成多元、海量地學數據,在數據間建立相互關聯,消除信息孤島,達到綜合成果展示、綜合統計分析、綜合利用的目的。
(2)實現地學數據統一管理、維護、發布,保證數據一致性,消除數據冗余。
(3)實現海量地學數據的高效檢索查詢。
(4)建立有效訪問控制機制,安全存儲機制保障數據安全可靠。
(5)建立地學數據共享協作機制,提高地學數據利用率,盤活數據財富。
中共中央和國務院高度重視大數據的重要意義和作用,《促進大數據發展行動綱要》、《國土資源信息化“十三五”規劃》、《新疆維吾爾自治區礦產資源總體規劃(2016—2020 年)》、《新疆維吾爾自治區礦產資源勘查開發“十三五”規劃》等政策法規均將大數據作為支撐、引領各行業領域發展水平提升的重要抓手,“新疆地學基礎數據中心”建設完全符合政策要求。
新疆是我國礦產資源大省,新疆地質礦產勘查開發局在長期地質工作中積累了多專業、海量基礎地理、遙感影像、基礎地質、災害地質、水文地質、工程地質、地球化學、地球物理、礦產地、探礦權、采礦權、工作程度、成礦區帶、自然保護區、整裝勘查區、潛力評價、地熱資源等地學數據資源。隨著工作的不斷推進,將持續產生大量新的地學數據,且數據較規范和全面,具有地學基礎數據中心建設的數據基礎。
4.3.1 數據整合技術可行性
首先,以中國地質調查局編制的《地質信息產品發布技術要求(試行)》和全國地質資料館《地質資料核心元數據內容結構和填寫說明》為基礎,從數據內容、數據分級、空間坐標系、數據模型、工作流程、質量監控、數據存儲等方面著手,編制《新疆地學基礎數據中心建設技術要求》,數據整合過程嚴格按技術要求規定執行;其次,利用地學領域專業軟件(Arc-GIS、MapGIS、GeoIPAS、GeoElec、Suffer、QGIS、uDig等)對數據進行標準化處理,聯合關系型數據庫(PostgreSQL)、空間數據庫(PostGIS)、文檔型數據庫(MongoDB)、分布式文件系統(Handoop)、全文檢索數據庫(ElasticSearch)等類型數據庫建立地學數據資源池;最后,建立形式上統一的數據集成及數據訪問接口體系。
4.3.2 平臺建設技術可行性
大數據、云計算、地理信息技術已深入發展到各個領域。利用云計算技術將互聯網的計算、存儲、數據、應用等資源進行有效整合,實現多層次虛擬化與抽象,建立地學數據中心運行所需的基礎設施環境。基于PostgreSQL、MongoDB、Handoop 等分布式數據庫、文件系統建立地學大數據資源池,采用ElasticSearch 全文檢索技術建立關鍵字索引、全文分詞索引、空間索引數據庫,聯合PostGIS、GeoServer、IGServer、OpenLayers等地理信息技術開發遵循OGC標準的地學數據空間信息服務功能,基于JAVA、Spring Cloud 開發微服務架構的分布式地學基礎數據中心平臺。
新疆地學基礎數據中心建設完全符合國家政策要求,順應地質信息化發展趨勢,能對海量多專業地學數據進行集成和綜合,實現地學數據的科學存儲管理、統一更新維護、高效查詢統計、快速成果展示、專業分析應用、專業評價及地學數據多元統計分析等。在推動公共數據資源開放、提高地學成果服務水平、擴大服務范圍、轉變服務方式等方面起到積極作用。