劉建軍
(國家基礎地理信息中心,北京100830)
基礎地理信息數據質量檢查軟件的設計探討
劉建軍
(國家基礎地理信息中心,北京100830)
針對當前基礎地理信息數據生產、建庫、更新工程中的數據質量控制需求,研究和探討數據質量檢查軟件設計開發過程中的若干技術問題,并結合具體數據庫建設工程,以地形數據質量檢查軟件為例,介紹其設計思路、技術方法、功能特點。
地理信息;數據;質量控制;軟件設計
地理信息系統(geographic information system,GIS)通常泛指用于獲取、儲存、查詢、綜合、處理、分析、顯示與地球表面位置相關的數據的計算機系統。從技術的角度看,GIS包括硬件條件、軟件條件、GIS數據、GIS基礎設施(技術人員、資金支持)等。
空間數據是GIS的重要組成部分,也是GIS項目中的投資重點。空間數據的質量狀況直接影響到數據的適用性以及GIS應用的成敗。國家及省級基礎地理信息數據庫作為國家空間數據基礎設施(national spatial data infrastructure,NSDI)的重要組成部分,其生產、建庫、更新過程中的數據質量控制更是具有舉足輕重的關鍵作用。在各級基礎地理信息數據庫建設中,由于數據源復雜、作業方法多樣,造成質檢工作技術難度大;由于質檢環節多、圖幅數多、數據量大,造成質檢工作量巨大;由于參與生產單位不同,生產組織方式差異,造成質檢工作質量尺度差異性大。
隨著國家及省級基礎地理信息數據庫建設的不斷推進,數據質量控制技術逐漸成為影響工程進度和建設質量的主要因素,而設計開發先進高效的數據質量檢查軟件則是解決此問題的首選方式。
1.技術現狀
目前技術條件下,空間數據質量檢查工具軟件常用的技術方法和檢查手段主要有以下三種,不同的檢查方法具有各自的適用性:
1)程序自動檢查。通過設計模型算法和編制計算機程序,利用空間數據內部的圖形與屬性、圖形與圖形、屬性與屬性之間存在的邏輯關系,檢查和發現數據中存在的錯誤。
2)人機交互檢查。數據中很多問題僅靠程序檢查不能完全確定其正確與否,但程序檢查能將有疑點的地方搜索出來,縮小范圍或精確定位,再采用人機交互檢查方法,由人工判斷數據問題的正確性。
3)人工對照檢查。通過人工方式檢查核對實物、數據表格或可視化的圖形,從而判斷檢查內容的正確性。
2.存在問題
對于大型、多尺度基礎地理信息數據庫,其數據質量檢查的技術難度大、工作量大、質量尺度差異性大,傳統質檢工具軟件往往難以滿足質量控制需求,普遍存在以下一些欠缺和不足:
1)軟件可重用性差、適用面窄。傳統質檢工具軟件往往是面向特定的工程應用、具體的作業方式、甚至固定的質量參數,其質量標準與質檢功能普遍采用捆綁設計,從而造成軟件系統不可定制、可重用性差,難以滿足大型空間數據庫建設工程中的多種作業方式、多級質檢環節,以及不同質檢標準的質量控制需求。
2)自動化程度低。傳統質檢工具軟件的自動化檢查往往只局限于相對質量檢查(數據內部邏輯關系一致性),而缺少絕對質量檢查(數據外部關系一致性),造成軟件系統的自動化程度不高,大量檢查項仍需要人工對照檢查。
3)質檢功能系統性差。傳統質檢工具軟件的功能系統性往往較差,缺少面向多級質檢環節的錯誤存儲和質量評估功能,也難以在質量檢查軟件平臺上一體化實現質檢方案設計、數據檢查、交互核對、錯誤定位、編輯修改、質量評價的空間數據質量控制流程。
1.設計目標
一套先進高效的基礎地理信息數據質量檢查軟件,應能夠全面應用于基礎地理信息數據庫建設工程,解決傳統作業中自動化程度低、以人工檢查為主的質檢現狀,提高質檢效率,保證成果質量,并實現數據成果的一體化質量控制作業。設計目標應重點考慮以下內容:
1)拓展軟件適用范圍。應采用多層次、結構化的技術設計,提高軟件系統的可定制性和可重用性,滿足數據庫建設工程中的各種作業方法的質檢需求,并能適用于兩級檢查、一級驗收、入庫檢查等多個質檢環節。
2)提高軟件自動化程度。應采用多種先進技術方法,并大力進行技術創新,設計先進高效的質檢算法,使檢查功能項盡量自動化實現,以提高檢查效率,降低人員工作量。
3)建立便捷的質檢環境。應提供便捷的交互環境,以滿足錯誤定位、交互核對、編輯修改等生產需求。
4)提供豐富的系統功能。應能滿足整個質量控制各個環節的生產需求,除質量檢查功能外,還應具有錯誤修改、質量評價等功能。
2.設計內容
基礎地理信息數據質量檢查軟件的技術設計,一般應包括以下幾個層次的設計內容:
1)質檢指標的設計。針對具體的基礎地理信息數據庫建設工程,應結合其數據規定、生產技術規定、質量規定等技術規范,研究確定質量控制工作的檢查內容與指標、技術方法、作業流程等。
2)質檢算法的設計。在質檢指標的基礎上,進行質檢算法的設計,通過質檢算法實現質檢指標的計算機實現。為了提高質量檢查軟件的自動化程度,應在完善內部相對質檢算法的基礎上,大力設計開發外部絕對質檢算法,如基于多源數據空間關系的質檢算法、基于增量要素的質檢算法等。
3)質檢系統的設計開發。在質檢指標和質檢算法的基礎上,進行質量檢查軟件的系統設計,并選擇合適的開發方式、編程環境,設計開發出技術先進、檢查高效、功能全面、性能穩定的質量檢查軟件。
3.技術方法探討
(1)基于“規則—模型—方案”的質檢機制
為了提高軟件的適用范圍和系統可重用性,基于“規則—模型—方案”的質檢機制是一條合適的解決途徑。質檢規則是對檢查對象、檢查參數以及檢查方法的一種抽象和封裝,它執行一個特定的元素級檢查操作。質檢規則的結構如圖1所示。

圖1 質檢規則結構圖
質檢模型是一組質檢規則的邏輯組合,是對檢查內容和過程的一種格式化描述,用于完成一個有特定要求的數據檢查內容。質檢模型的結構如圖2所示。

圖2 質檢模型結構圖
質檢方案記錄質檢相關的模型及參數,具有通用性。一個定義好的質檢方案可重復直接引用或修改后引用。基于“規則—模型—方案”質檢機制的體系架構如圖3所示。

圖3 質檢方案結構圖
采用“規則—模型—方案”的質檢機制,可大大提高檢查軟件的應用靈活性,擴展應用范圍。在規則抽象之上,可以靈活組成檢查模型,進而設計出不同的質檢方案,使得檢查軟件同時滿足多種作業方式的質量控制需求,適用于兩級檢查、一級驗收、入庫檢查等多個質量控制環節。
(2)基于空間運算的多源數據自動參照比較
檢查算法
為了提高質量檢查軟件的自動化程度,應在豐富完善內部相對質檢算法的基礎上,大力設計開發外部絕對質檢算法,而基于空間運算的多源數據自動參照比較檢查算法則是合適的解決途徑。
將用于參照比較的外部數據成果,納入檢查軟件的質檢體系中,通過復雜的空間運算,建立待檢數據和已有成果數據之間的邏輯相關性,進而通過多源數據同名地物要素的比較分析,快速徹底地檢查出數據錯誤,大大提高了軟件的自動化檢查范圍,也提高了檢查效率,降低了人員工作量。算法技術流程如圖4所示。

圖4 基于空間運算的多源數據自動參照比較檢查算法技術流程圖
作為參照比較的外部數據成果,應具有一定的標準性和權威性,一般應是前期建立完成且通過檢查驗收的基礎地理信息數據成果,如其他尺度的基礎地理信息數據成果、相同尺度的更新前數據及數據生產中的資料源數據成果等。
(3)基于數據庫模型的錯誤信息存儲
和定位技術
為了提高軟件系統的交互性,同時便于質檢結果的存儲管理和質量評估,質量檢查軟件可采用基于數據庫模型的錯誤信息存儲和定位技術。采用獨立于成果數據和檢查軟件的數據庫結構,通過圖形或關系表的形式存儲和管理錯誤信息,可實現質檢結果的高效存儲、統一管理和便捷應用。配合檢查軟件的錯誤定位功能,可以快速地進行錯誤定位及回溯,便于交互核對和編輯修改,核對結果可以記錄入錯誤數據庫,便于后續檢驗環節使用。應用錯誤信息數據庫,還可以迅速地對檢驗數據進行質量評價和匯總統計。
(4)一體化實現“方案—檢查—核對—定位—
修改—評價”的空間數據質量控制模式
為了提高質檢軟件的系統性,并豐富完善配套功能,質量檢查軟件應依據質量控制的業務流程進行集成設計,一體化完整實現方案設計、程序檢查、交互核對、錯誤定位、編輯修改、質量評價等質量控制生產流程,大大提高質量管理工作效率。
國家1∶50 000數據庫更新工程中,地形數據質量檢查軟件即采用“規則—模型—方案”的質檢機制,設計了基于空間運算的多源數據自動參照比較檢查算法,實現了基于數據庫模型的錯誤信息存儲和定位,同時一體化實現了“方案—檢查—核對—定位—修改—評價”的空間數據質量控制流程。質量檢查軟件的技術流程如圖5所示。
該質量檢查軟件具有文件管理、顯示瀏覽、查詢檢索等基本功能,具有數據源檢查、完整性和結構一致性檢查、數學基礎檢查、圖形檢查、屬性檢查、接邊檢查、元數據檢查等質量檢查功能,具有方便的錯誤存儲和定位功能,還具有比較豐富的數據編輯功能,操作方便,性能可靠,很好地解決了地形數據質量檢查的生產需求。質量檢查軟件的功能模塊如圖6所示。

圖5 地形數據質量檢查軟件技術流程圖

圖6 地形數據質量檢查軟件功能模塊圖
該質量檢查軟件在全國二十多個省份的生產單位中得到全面應用,廣泛應用于各種生產作業模式下的兩級檢查、一級驗收及入庫檢查工作,為提高數據質檢生產效率,保證成果質量發揮重要作用。
本文針對當前基礎地理信息數據質量控制的技術現狀和存在不足,對質量檢查軟件設計開發中的目標、內容和技術方法等方面進行了探討,重點介紹了一種質檢機制和一類質檢算法,即基于“規則—模型—方案”的質檢機制和基于空間運算的多源數據自動參照比較檢查算法,并將之成功應用于1∶50 000數據庫更新工程的地形數據質量檢查軟件中。實踐證明,本文所設計方法的技術路線可行,應用效果顯著,可大幅提高質量檢查軟件的技術水平和質檢效率,在空間數據質量控制方面具有廣闊的應用前景。
[1] 劉大杰,史文中,童小華,等.GIS空間數據的精度分析與質量控制[M].上海:上海科學技術文獻出版社,1999.
[2] 郭仁忠.空間分析[M].武漢:武漢測繪科技大學出版社,2000.
[3] 陳軍.試論中國NSDI建設的若干問題[J].遙感學報,1999(3):13-16.
[4] 王東華,劉建軍,商瑤玲,等.全國1∶25萬數字高程模型數據庫的設計與建庫[J].測繪通報,2001(10):27-28.
[5] 王東華,劉建軍,商瑤玲,等.國家1∶5萬數字高程模型建庫質量控制的方法和實施[J].測繪科學,2004 (B12):88-91.
[6] 劉建軍,陳軍,王東華,等.高線鄰接關系的表達及應用研究[J].測繪學報,2004,33(2):174-178.
[7] 劉建軍,王東華,商瑤玲.數字化等高線質量的軟件自動檢查方法[J].測繪科學,2001(4):36-38.
[8] 劉建軍,王東華,商瑤玲.國家1∶5萬DLG數據庫質量檢查軟件的設計和開發[J].地理信息世界,2006(4):23-26.
[9] 張政,劉建軍,張元杰,等.基于ArcGIS Engine的可配置數據質檢模型機制設計[C]∥第八屆ESRI中國用戶大會論文集.北京:測繪出版社,2009:24-27.
Study of Software Design for Quality Check of Fundamental Geographic Information Data
LIU Jianjun
0494-0911(2010)11-0018-04
P208
B
2009-12-18
劉建軍(1974—),男,山西晉城人,碩士,高級工程師,主要從事國家基礎地理信息數據庫的設計、質量控制、建庫、應用開發等工作。