韓坤英,龐健峰,丁孝忠,范本賢,逯永光
1)中國地質大學地球科學與資源學院,北京 100083;
2)中國地質科學院地質研究所,北京 100037
地質圖空間數據庫自動檢查系統的設計
韓坤英1,2),龐健峰2),丁孝忠2),范本賢2),逯永光2)
1)中國地質大學地球科學與資源學院,北京 100083;
2)中國地質科學院地質研究所,北京 100037
地質圖空間數據庫數據量大,內容復雜,為了保證數據庫的質量,在地質圖空間數據庫的建立過程中,對數據的全面系統檢查工作是非常必要的。對于地質圖空間數據庫,檢查屬性數據庫的內容以及屬性數據與空間圖形數據的正確鏈接是難點之一,也是一項最耗時的工作。為了科學、快速地檢查地質圖屬性數據,保證屬性內容的正確性以及非空間數據與空間數據的正確對應,針對這一問題,在進行全國1:100萬地質圖空間數據庫的檢查時,設計開發了屬性數據庫的自動檢查系統。本文以近期完成的全國1:100萬地質圖空間數據庫的檢查系統設計研究為例,主要介紹了地質圖數據庫屬性數據自動檢查系統的設計開發,其中詳細介紹了各模塊可以實現的主要功能。通過此項檢查,能夠提高入庫數據的質量,為數據庫后期的應用與共享提供可靠保障,從而為地質科學研究、礦產勘查及生態環境治理等提供科學的地質圖數據資料。
地質圖;空間數據庫;屬性數據庫;檢查系統
隨著計算機信息技術的發展,在地學領域編制和建立了各種比例尺的數字地質圖,為了有效的管理和應用這些數據資料,需要建立地質圖空間數據庫,實現地學信息的集成服務。眾所周知,地學數據的基本特征賦予地學數據的復雜性,具有內容復雜,數據量大,多源、多維、多尺度等特性(肖克炎等,2000;吳信才等,2009)。地質圖空間數據庫不同于一般的關系型數據庫,一般數據庫只包括非空間數據,是由多個二維表構成,而地質圖數據庫包括空間數據和非空間數據(屬性數據)兩大部分,具有空間特性。無論何種數據庫,數據的質量是數據庫的關鍵,將直接影響數據庫的可用性和精確性,錯誤的或不準確的數據信息將會產生錯誤的處理結果,導致錯誤或不準確的決策(姜作勤,2004)。因此數據的質量控制、數據庫的質量檢查工作非常重要。地質圖數據的質量檢查工作一般是在編制數字地質圖的過程中和數據入庫集成、建立管理系統時進行。數據質量檢查是一項非常復雜和費時的工作。通常情況下,數據的完整性、拓撲關系、空間位置、屬性數據及屬性數據與空間實體的對應關系等需要開發計算機軟件進行檢查,而制圖數據即圖面內容的表示主要通過硬拷貝的紙質圖由人工進行檢查。屬性數據也可以通過輸出屬性表進行人工檢查,但是地質圖的屬性表非常復雜,人工幾乎難以完成這樣巨大的工作量。因此,改變傳統工作方式,開發軟件進行系統檢查是非常必要的。
數據質量問題是普遍存在的,涉及到各行各業的各類數據產品。隨著數據庫技術及GIS技術的不斷發展,為了提高數據的質量,針對某一類特定的數據,不同的部門也開發了不同的質量檢查軟件,如針對國家1:5萬DLG(Digital Line Graphic,數字線畫圖)數據開發的質量檢查軟件,它是基于 ArcGIS平臺開發的,軟件的設計是針對ArcGIS的Personal geodatabase 數據格式,檢查的標準是依據建立該數據庫的數據標準;基于 ECAP規則的測井原始資料質量檢查軟件是一種將事件觸發規則和面向對象、事件驅動的環境相結合的方法,是針對石油測井資料的檢查;有效值法通常是用于屬性數據的有效值檢查,用于檢查離散型數據,例如如果屬性數據是電壓的話,它的有效值應該是 200V,110V,12V等;中國地質環境監測院(2009)的地質數據質量檢查與評價方法軟件是一種基于模板的數據質量檢查方法,主要是對于1:25萬大比例尺地質圖數據庫的空間數據的檢查(左志進等,2008;劉建軍等,2006;張軍等,2008;陳俊等,1998;譚福初等,2007;劉平芝,2005)。每一類數據都有其自己的特點,如數據應用的標準、數據格式、數據組織結構、數據命名等。中國1:100萬地質圖數據庫是在MapGIS6.7平臺上建立的,包含國際標準分幅的地質圖64幅和地理底圖64幅,有空間數據、屬性數據及元數據。每幅圖
根據要素不同分為不同的圖層,每個圖層又根據幾何特征不同分為點、線、面三類幾何實體。每個空間數據圖層對應一個屬性表。全國 1:100萬地質圖數據庫包含1000多個圖層文件,數據量大約2.0G。在進行數字地質圖編制過程中應用了多源數據,又經過了多個處理程序,主要包括空間數據矢量化、空間數據的轉換,空間數據的綜合、圖幅接邊處理、屬性數據與空間數據的聯接等一系列的處理過程。所以,為了保證數據庫的質量,對于1:100萬地質圖空間數據庫必須設計一套檢查方法,才能確保數據的質量。
根據中國地質調查局頒發的“中國地質調查局地質調查技術標準《地質數據質量檢查與評價》(2006.12)”中規定了定量數據質量元素主要包括數據完整性、邏輯一致性、空間定位準確性、專題數據準確性和圖形整飾規范性等內容,在進行中國1:100萬地質圖空間數據檢查時,又結合本數據庫的特點,制定了檢查的內容和檢查的方法。
造成數據質量問題原因很多,其中在地質圖數據庫中常見的原因主要為物理介質的變化、多重數據源、數據輸入、編輯過程中主觀的判斷、過松的輸入規則、數據量大、不同功能領域的編碼數據、數據格式轉化、投影變換、數據抽象等等(李軍等,2006;白玲等,2006;梁國玲等,2007)。地質圖空間數據和屬性數據的錯誤類型主要有:1)空間數據等的不完整或重復,包括點、線、面數據的丟失或重復,數據斷線、多邊形不封閉等;圖層文件、數據表等不完整;2)空間數據位置不準確,點位不準確,線段過長或過短,結點不重合;相鄰圖幅之間要素接邊有誤差;3)拓撲關系錯誤;4)屬性與空間數據聯接錯誤;5)屬性結構、字段類型及長度與規定不符,屬性值數據錯誤或不完整;6)圖面符號表達不清晰、壓蓋關系不合理;圖框外整飾不規范等等。其中,屬性數據的檢查通過人工方法最難實現。
空間數據的質量控制是一項復雜的過程,應該貫穿數據的輸入和空間數據庫建立的每一個環節(陳述彭等,1999)。目前,對于空間數據的檢查一般分為傳統的手工方法檢查和編寫處理軟件進行檢查。
傳統手工方法檢查主要是針對以下幾個方面進行。檢查數據的范圍是否在規定的范圍之內;圖層套合檢查,同一圖層弧段和界線的套合,不同圖層間的套合,主要是水系和地層,斷層和地層,斷層和巖體,地層和巖體界線之間的套合關系;檢查水體、海岸線、雪被與地質體邊界線是否重合,在噴墨圖上或計算機上檢查地層之間、地層與巖體之間的壓蓋關系;檢查地理底圖圖廓的精度;檢查地質體的圖面表示與屬性內容是否一致;檢查相鄰圖幅之間地質、地理內容的接邊關系是否合理,檢查接邊屬性是否正確;數據入庫后檢查按圖幅顯示是否完整;針對每幅圖生成圖例,按圖例、圖層檢查屬性及面元顏色、填充圖案是否正確等。
利用檢查軟件對數據進行檢查,檢查是否存在重復圖元和微小圖元,并判斷其正確性,拓撲關系檢查主要是檢查水系、地層、巖體、地質界線等的拓撲關系,此項檢查主要是應用MapGIS主程序的功能進行檢查。對于檢查圖層、屬性結構、屬性字段的正確性;地質年代代碼與地質代號、色標號、花紋符號一致性;巖石代碼與地質代號、色標號、花紋符號一致等關于屬性數據庫的檢查,僅應用MapGIS主控程序來進行檢查和修改是非常繁雜的,而且也難以實現,在檢查過程中還會有人為的錯誤產生,而且工作量非常大。針對這種情況,因此基于MapGIS平臺,設計開發了屬性數據庫的檢查軟件。
采用 MapGIS6.7作為開發平臺。MapGIS提供了豐富的二次開發手段,主要包括了 API函數庫、MFC(Microsoft Foundation Class)類庫、COM組件和ActiveX控件等四種開發方式。API函數在使用方法上與Windows的API函數一樣,獨立于開發工具的。使用Visual C++,Viusal Basic,Delphi可以直接調用(歐少佳等,2005a,b;覃如府等,2005)。MapGIS 類庫是為基于 MFC類庫的C++開發者提供的多個可重用基類,它將應用程序所需的常見基本功能作了封裝,使用便利,改動靈活。開發者只需從類庫派生即可使自己的程序獲得從窗口顯示控制到圖形查詢編輯的各項功能。MapGIS COM組件是MAPGIS新一代體系結構的表現,功能更加強大,使用更加便利。具有二次開發方便、易于集成、無限擴展等特點。支持多種開發軟件,包括Visual C++,Visual Basic,Delphi,Script,InterDev,Power Builder等,開發者可以多層次的訪問 MapGIS組件的數據層、功能層和界面層。ActiveX 控件是 MapGIS完成組件化改造的成果之一,它們使得二次開發更為快捷便利,代碼的可復用性更高。
地質圖空間數據庫自動檢查系統是選用了Visual Basic6.0和MapGIS6.7的組件式技術結合進行設計和開發的。該程序所用的MapGIS組件和控件有MapGisBasCom1,MapGisDspCom,MapGis-MapCom,MapLayerCom和EditView,除此之外,還用 ADO數據庫訪問組件 Microsoft Active X Data Objects 2.1 Library。
為了實現屬性數據的檢查,判斷地質圖空間信息的屬性數據的結構、字段名稱、數據項是否正確,需要有一套標準的屬性數據庫與其對照,進行衡量,才能判斷該文件的屬性內容是否正確,做出判斷。因此,首先根據《1:100萬地質圖數據庫的編圖細則》,應用Access軟件建立檢查系統的標準屬性數據庫。這些標準屬性信息庫主要根據《1:100萬地質圖數據庫的編圖細則》規定的要求進行建立(圖1)。包括地層的年代代碼、巖石的分類代碼、第四紀成因類型代碼、地質界線、斷層的分類代碼及主要斷層名稱,地質圖用于圖面表達而規定的制圖參數。在MapGIS系統中,空間要素劃分為三種幾何類型:點、線和多邊形,所有的屬性表都對應著空間圖形。圖2和圖3分別列出了部分地層檢查的標準規則、全國重要斷裂檢查的標準規則。這兩個表分別代表了線和多邊形二種類型。

圖1 標準屬性表的構成Fig.1 The content of standard attribute table

圖2 地層的標準規則表Fig.2 The standard stratigraphic table

圖3 全國重要斷裂的標準規則表Fig.3 The standard table of important faults in whole China
系統工作流程首先由文件操作模塊讀取地質圖空間數據庫文件到檢查系統,將空間圖形顯示在基礎操作模塊的視圖中;之后,字段檢查和圖元檢查調用裝入文件的屬性數據和數據標準信息庫的數據,進行校對,把異常圖元記錄并傳遞到修改模塊;操作人員通過修改和基礎操作功能,可以將圖元屬性數據結合圖元空間位置,核定屬性數據的正確性,并進行適當的修改;最后,由文件系統將修改后的屬性數據保存到地質圖數據庫中,或者將檢查的結果輸出到文件中,以便進一步的研究,系統工作流程見圖4。

圖4 系統工作流程圖Fig.4 The flow chart of the system
檢查系統的主要功能模塊包括文件操作、地圖瀏覽、MapGIS文件檢查、屬性字段檢查、屬性修改等五個部分組成,框架結構見圖5。
在進行數據檢查時,首先要進入檢查系統的初始窗口(圖6),操作人員通過這個窗口,可以調用各個功能模塊,進行屬性數據的檢查與修改等。

圖5 系統主要功能模塊框架結構圖Fig.5 The framework of main function module

圖6 檢查系統初始窗口Fig.6 The interface of the checking system
數據檢查人員可以通過此模塊進行文件的讀取與保存,包括打開MapGIS的工程文件,點、線、面文件的分別調入,修改后數據文件的保存以及將檢查結果導出到Access數據表等功能。
與 MapGIS主控程序類似,此模塊用來瀏覽打開的地質圖文件(縮放,復位窗口等);能對選定的圖元進行屬性和參數的查看和修改;設置 MapGIS的系統參數和環境(如:還原顯示,顯示弧段,設置MapGIS系統目錄等)。
屬性字段的正確性是圖元屬性檢查的必要前提。因此,在圖元檢查前,應當保證字段名稱、數據類型、數據長度等的正確性。該模塊檢查內容包括屬性項、字段名稱、數據類型、數據長度等是否與數據庫統一設計要求一致。能夠實現字段的檢查和字段的修改兩部分功能。在裝入被檢查的工程文件之后,首先應用檢查文件模塊進行數據屬性結構的檢查,如果屬性的字段名稱、數據長度等任何一項與標準不一致,系統便在左側的列表框中提示哪一項有錯誤,在圖7中所示,檢查的是1:100萬地質圖數據庫中其中一幅北京市(J-50)圖幅,系統檢測到該幅地質圖中的地層屬性中,地質代號SYMBOL一項數據長度錯誤,與規定的標準值不一致,必須進行修改后系統才能接著檢查每一個圖元。在這個模塊中可以直接修改。

圖7 1:100萬北京幅(J-50)地質圖屬性結構檢查窗口Fig.7 The checking interface of attribute structure for Beijing geological map (J-50)at 1:1M

圖8 1:100萬北京幅(J-50)地質圖圖元檢查結果圖Fig.8 The checking result graph of polygon feature for Beijing geological map (J-50)at 1:1M

圖9 文件統改窗口Fig.9 The interface of unified correction
如果被檢查的文件屬性結構正確,便可應用此模塊進行每個圖元屬性值的檢查。此項功能主要是對讀入的每個圖元的屬性與屬性標準信息庫進行對照,如遇與屬性標準信息庫的值不一致,系統自動把不符合規范的圖元排列出來(系統窗口的左邊列表)。如圖8所示,對所檢查的北京幅(J-50)的地質面文件,所有的問題都在列表中一一列出,由列表中和空間圖形中可以看出,其中有一個紅色的地質體是晚侏羅紀花崗巖 J3γ,它的CODE1代碼應該是103310,但系統檢查的結果是 103311,此時可以在修改窗口下進行修改。對于檢查的每項結果,都可以通過此窗口進行與空間圖形對照修改。
針對相同錯誤類型的圖元,系統提供了根據條件進行統改見圖9;并可以實現對檢查模塊提取出的有問題的圖元進行核對和修改。
應用此軟件對《中國 1:100萬地質圖數據庫》中所有圖幅進行了全部屬性檢查,如果是采用人工檢查將很難完成。通過檢查,保證了所有數據在屬性結構、字段名稱及類型、字段長度等方面的一致性以及數據文件的完整性,為今后數據庫的應用提供了質量保障。
1)數據的質量直接影響到數據的應用、決策的正確性。從數據的生產、數據集成和融合,數據質量問題是不容忽視的,國內外都制定了相應的系列標準,用來衡量和檢查數據的質量。隨著地質領域數據資源的增加,數據質量問題也越來越受到重視。
2)數據庫建設已經成為地質科學研究領域的一項重要任務,中國 1:100萬地質圖數據庫已經建立完成,目前正在編制的新一輪《中國區域地質志》將建立各種尺度的地質圖數據庫、構造圖數據庫、巖漿巖圖數據庫、第四紀地貌地質圖數據庫等,因此,為了確保數據庫的質量,數據庫的檢查工作將是非常必要的,對于如此復雜的地質圖空間數據庫的檢查光靠人工檢查是不科學的,應用 GIS技術,開發程序檢查可以提高檢查速度,保證數據的質量,減少檢查過程中人為的因素產生的錯誤。
3)此項成果是針對新近完成的中國 1:100萬地質圖數據庫的檢查開發的一個應用軟件。在應用該軟件檢查數據的過程中進行了不斷的完善,通過應用此軟件的檢查,將屬性數據庫中的錯誤率降至最低,從而保證了入庫數據的質量。該軟件將根據《中國區域地質志》系列地質圖數據庫的建庫標準及數據結構的特點,在進一步修改的基礎上,將應用于新一輪的《中國區域地質志》系列地質圖數據庫的檢查與修改,對提高數據庫的質量將具有很大的幫助。
白玲,王小平.2006.1:20萬數字水文地質圖空間數據庫建庫的質量控制[J].資源環境與工程,20(4):450-454.
陳俊,宮鵬.1998.實用地理信息系統[M].北京:科學出版社.
陳述彭,魯學軍,周成虎.1999.地理信息系統導論[M].北京:科學出版社.
姜作勤.2004.數據質量研究與實踐的現狀及空間數據質量標準[J].國土資源信息化,(3):23-28.
李軍,姜作勤,童小華.2006.地質數據的抽樣檢查方法研究[J].地理信息世界,(2):8-11.
梁國玲,張永波,張禮中,周小元,張春英.2007.基于GIS的中國地下水資源空間數據庫建設[J].地球學報,28(6):572-578.
劉建軍,王東華,商瑤玲.2006.國家1:50 000 DLG數據庫質量檢查軟件的設計和開發[J].地理信息世界,8(4):23-26.
劉平芝.2005.1:5萬矢量地形數據空間拓撲關系的自動檢查方法[J].測繪技術裝備,7(1):19-21.
歐少佳,許惠平,陳華根,葉娜.2005a.中國巖石圈數據模型總體設計[J].地球學報,26(3):265-270.
歐少佳,許惠平,陳華根.2005b.中國巖石圈三維結構數據庫數據可視化控件的設計與實現[J].地球學報,26(6):577-580.
覃如府,許惠平,歐少佳,葉娜.2005.基于GeoDatabase的中國巖石圈三維結構數據庫設計[J].地球學報,26(6):581-586.
譚福初,裴亞波,李廣蘭.2007.ArcGIS在矢量測繪數據質量控制中的應用[J].北京測繪,(4):45-47.
吳信才,謝忠,周順平,劉修國,鄭貴洲,呂建軍,張發勇,劉福江.2009.空間數據庫[M].北京:科學出版社.
肖克炎,朱裕生,姜作勤,宋國耀.2000.礦產資源評價空間數據庫中的地學數據模型設計問題[J].中國地質,(7):33-35.
張軍,李洪奇.2008.基于ECAP規則的測井原始資料質量檢查軟件建模[J].科技導報,26(12):61-66.
中國地質調查局.2006.中國地質調查局地質調查技術標準《地質數據質量檢查與評價》[S].北京:中國地質調查局.
中國地質環境監測院.2009.地質數據質量檢查與評價方法軟件工具使用手冊[R].北京:中國地質環境監測院.
左志進,方德平,李兆雄.2008.國家1:5萬DLG數據質量檢查軟件的設計與實現[J].四川測繪,31(2):89-92.
BAI Ling,WANG Xiao-ping.2006.Quality Control of the Clonstruction of 1:200000 Digital Hydrogeological Map Spatial Data Bank[J].Resources Environment &Engineering,20(4):450-454(in Chinese with English abstract).
CHEN Jun,GONG Peng.1998.Geographic Information System in Practice[M].Beijing:Science Press(in Chinese).
CHEN Shu-peng,LU Xue-jun,ZHOU Cheng-hu.1999.The Introduction of Geographic Information System[M].Beijing:Science Press(in Chinese).
China Geological survey.2006.Standard for geological survey technology of China geological survey.Quality inspection and evaluation for geological data[S].Beijing:China Geological survey.
China Institute of Geo-Environment Monitoring.2009.Manual for software of quality checking and evaluation on geological data[R].Beijing:China Institute of Geo-Environment Monitoring.
JIANG Zuo-qin.2004.Status for research and practice of data quality and spatial data criterion in quality[J].Land and Resources Information,(3):23-28(in Chinese).
LI Jun,JIANG Zuo-qin,TONG Xiao-hua.2006.Research on Sampling Inspection Method for Geological Data[J].Geomatics World,(2):8-11(in Chinese with English abstract).
LIANG Guo-Ling,ZHANG Yong-Bo,ZHANG Li-Zhong,ZHOU Xiao-Yuan,ZHANG Chun-Ying.2007.The Construction of Spatial Database for Groundwater Resource in China Based on GIS[J].Acta Geoscientica Sinica,28(6):572-578(in Chinese with English abstract).
LIU Jian-jun,WANG Dong-hua,SHANG Yao-ling.2006.Design and Development of Quality Checking Software for National 1:50 000 DLG Database[J].Geomatics World,8(4):23-26(in Chinese with English abstract).
LIU Ping-zhi.2005.The Automatic Checking Method for Topological relation Among the terrain vector data at 1:50000[J].Geomatics Technology and Equipment,7(1):19-21(in Chinese).
OU Shao-jia,XU Hui-ping,Chen Hua-gen.2005b.The Design and Implementaion of Geophysical Data Visualization Controls for Chinese 3D Lithosphere Structure Database[J].Acta Geoscientica Sinica,26(6):577-580(in Chinese with English abstract).
OU Shao-jia,XU Hui-ping,Chen Hua-gen.YE Na.2005a.Framework Design for Chinese Lithosphere Data Model[J].Acta Geoscientica Sinica,26(3):265-270(in Chinese with English abstract).
QIN Ru-fu,XU Hui-ping,OU Shao-jia,YE Na.2005.The Design of Chinese Lithosphere 3D Structure Database on the Base of GeoDatabase[J].Acta Geoscientica Sinica,26(6):581-586 (in Chinese with English abstract).
TAN Fu-chu,PEI Ya-bo,LI Guang-lan.2007.The Application of ArcGIS in Surveying Vector Data Quality Control[J].Beijing Surveying and Mapping,(4):45-47(in Chinese with English abstract).
WU Xin-cai,XIE Zhong,ZHOU Shun-ping,LIU Xiu-guo,ZHENG Gui-zhou,LV Jian-jun,ZHANG Fa-yong,LIU Fu-jiang.2009.Spatial Database[M].Beijing:Science Press(in Chinese).
XIAO Ke-yan,ZHU Yu-sheng,JIANG Zuo-qin,SONG Guo-yao.2000.Design Problems for geoscience data model in Geospatial Database of Mineral Resources Estimating[J].Geology in China,(7):33-35(in Chinese).
ZHANG Jun,LI Hong-qi.2008.Modeling of the Quality Check Software for Log Data Based on ECAP Rules[J].Sciences &Technology Review,26(12):61-66(in Chinese with English abstract).
ZUO Zhi-jin,FANG De-ping,LI Zhao-xiong.2008.Design and Application of Quality Checking Software for National 1:50 000 DLG Data[J].Surveying and Mapping of Sichuan,31(2):89-92(in Chinese with English abstract).
The Design of the Automatic Checking System for Geological Map Spatial Database
HAN Kun-ying1,2),PANG Jian-feng2),DING Xiao-zhong2),FAN Ben-xian2),LU Yong-guang2)
1)Faculty of Geosciences and Resources,China University of Geosciences,Beijing100083;
2)Institute of Geology,Chinese Academy Geology Sciences,Beijing100037
The geological map spatial database is large and complicated.To ensure the quality of the database,it is essential to check the data systematically during the database construction.In design of the geological map spatial database,the check of the content of the attribute database and the proper connection between the attribute data and the spatial map data constitute one of the difficult points and also the most time-consuming work.In order to ensure the correctness of the attribute data and the correct correspondence between space and non-space data,and to check the geological map attribute data quickly,the authors have designed the automatic checking system for attribute database of the national geological map (1:1M).With the recent spatial database of the national geological map (1:1M)as an example,this paper presents the design of automatic checking system for geological map spatial database and describes the function of the modules in detail.This checking system improves the data quality,provides a reliable guarantee for data application and sharing,and also supplies scientific geological map data to geosciences research,mineral exploration and ecological environment renovation.
geological map;spatial database;attribute database;checking system
TP311.131;TP274.3;TP311.1
A
1006-3021(2010)06-885-07
本文由地質大調查項目(編號:1212010511501;1212010911001;1212010811033)聯合資助。
2010-08-20;改回日期:2010-09-16。責任編輯:閆立娟。
韓坤英,女,1966年生。博士,副研究員。主要從事區域地質綜合編圖、GIS及其應用研究。通信地址:100037,北京市西城區百萬莊大街26號。電話:010-68994825。E-mail:kunyinghan@163.com。