方睿紅,謝三五
(1.自然資源部第一地理信息制圖院,陜西 西安 710054)
數字線劃圖是現有地形圖要素的矢量數據集,保存各要素空間關系和屬性[1]?;A測繪地理信息數據產品中,數字線劃圖(DLG)是應用最廣泛、作用最突出的一項。在生產中,涉及多個工序,且技術指標復雜,大量的編輯處理及建庫工作需要人工完成[2],因此也更容易在生產過程中留下質量缺陷和錯誤。當今海量的地理信息數據呈現出大數據的特征,在計算機軟件越來越人工智能化的進程中,如何利用計算機來盡可能最大化地解決DLG這類空間矢量數據的自動質量檢驗問題,是測繪和地理信息領域關注的熱點?,F常用的矢量數據質量檢查類的軟件,基本均能實現拓撲關系、數據層屬性等質量項的檢查,但是很少深入到更為詳細的研究。并且很多質檢類軟件均是以圖幅或者個體作為單位進行單個樣本的檢查,如基于ArcEngine的DLG數據質量檢查系統[3]等,無法在海量圖幅的標準DLG生產中實現批量化的質量 檢查。
根據生產中的這些實際需要,依托陜西省1∶10 000基礎地理信息更新DLG生產和其他一些省級DLG生產與更新項目,設計了從基礎拓撲檢查到根據項目技術要求細化的質量子元素檢查,這樣一套完整的質檢方案,同時也滿足批量化的檢查要求。并根據設計方案開發質量檢查程序,實現DLG數據的自動化質檢,應用于標準DLG數據生產。
DLG成果數據庫均根據項目的要求有統一的分層和屬性設計,數據結構的正確與否是首要的質檢重點。檢查的內容包括幾何類型、完整性、字段屬性、字段名稱和順序。
由于各個項目對于具體內容的要求會存在差異,為方便程序質檢,設計了可更改的配置文件來進行靈活的設置,包括圖層列表、各圖層字段順序表、屬性項定義表。以屬性項定義表為例,其具體可配置內容見表1。

表1 屬性項定義表
DLG各層的數據內容存在一些共有的特點:比如都具有嚴格的拓撲規則,某些屬性具有一樣的填寫約束。同時,即使各個項目生產標準存在差異,但在例如國標值的合理性、等高值高程點的咬合等方面,具有一樣的技術要求。因此,在檢查中,將此類通用性質的質量子元素進行整合封裝,可應用于多個具體生產項目實例。
DLG數據的分層按照地理信息類別有完整的分類,在目視檢查中,檢查人員均習慣于按照類別進行。為了更直觀地體現檢查內容,將計算機自動檢查的子元素進行歸類,部分子元素歸類見表2。

表2 部分子元素歸類表
分層數據自動化檢查時,為了解決各個不同生產項目之間的標準差異,設計按項目進行了區分,程序可根據具體項目進行添加,同時把各個子元素設計為自定義選擇,可根據具體需要進行取舍。
ArcEngine是美國ESRI公司發布的一款 GIS二次開發產品,它是目前GIS業界最為著名的組件式 GIS 開發產品[4]。ArcEngine開發組件提供了嵌入式的GIS組件庫與工具庫來讓用戶在開發中獲得強大的地理信息數據處理功能,設計的DLG質檢方案可以使用該組件來進行軟件上的實現[5-6]。
除了實現基本的要素拓撲關系、通用性的屬性內容等質量項的檢查外,軟件需要設計好針對比如流向與水系方向的正確性、植被層地類界的合理性、特殊地物咬合等更加細化的質量子元素的自動檢查技術方案。軟件編寫中需要設計針對性的算法,由于面向海量數據,不僅效率要高、且誤報情況要少。
在生產中,各個項目的質檢規則并不是一成不變的,可能因數據類型的增加而增加,也可能因數據標準或技術要求的調整而調整[7]。出于可維護性的考慮,應設計完整的配準文件體系,對一些變化性規則進行調整,提高軟件的可維護和可擴展性,同時,針對各個質量子元素也給出圖形界面,使用戶可自行進行組合選擇,針對性地進行全面檢查或重點項檢查。
3.1.1 配 置
開始檢查前,通過配置文件進行數據結構和數據內容兩方面的一些自定義條件設置。數據結構包括圖層、屬性項、字段順序等。數據內容包含諸如坐標精度、拓撲容差、要素關系容差等要求。配置完成以規范化檢查條件,設置界面見圖1。為了方便用戶的選擇,對于各個質量子元素也給出圖形界面可進行自定義選擇,圖形界面見圖2。

圖1 檢查條件配置界面

圖2 質量子元素選擇界面
3.1.2 批量檢查
制定好DLG數據的上層路徑后,即可進行一鍵批量檢查,輸出結果為點、線、面3個shape記錄文件,用以記錄錯誤的空間位置和具體的錯誤說明。檢查界面設計應簡約易操作,界面部分截圖見圖3。

圖3 檢查操作界面
3.2.1 流向方向檢查
流向是DLG數據中數量比較多的地理要素之一。而以往的質檢中大多是依靠符號化處理后進行目視解譯。本軟件設計了一個檢查方法,針對每個流向要素首先計算出方向值,然后設計緩沖方法和距離,在位置對應的水系上取兩個距離靠近的點計算方向值。兩個方向值的較差在限差范圍外即視為流向方向錯誤。部分關鍵代碼如下:

3.2.2 地類界檢查
第一步:篩選出需要地類界的植被面要素;第二步:建立拓撲工作數據集,將植被面要素、地類界要素、替代地類界的各線狀要素導入;第三步:進行拓撲檢查,計算出除開地類界要素以及能替代地類界的各要素外,未組成植被面要素的邊線,即為缺失的地類界。第四步:計算地類界和能替代地類界的各要素的重疊部分,即為多余的地類界。
除了通用性的常規拓撲、屬性檢查外,創新性地設計了根據具體的項目數據產品進行細化的特殊質量子元素的自動化檢查,并針對目前生產中質量檢查的情況,解決了造成的耗費人力、操作重復的問題。目前設計完成的質檢軟件已廣泛應用于多個省級 1∶10 000 DLG生產與更新項目中,可以很好地提高作業和質檢效率。
軟件使用簡易快捷,通過開放的可配置文件形式,給使用者提供了方便的定制途徑,具有良好的需求普遍性和通用性。