米思瑩 蔡建德
(1.浙江臻善科技股份有限公司,浙江 杭州 310005;2.河南省測繪發展研究中心,河南 鄭 州 450008)
隨著國家自然資源國土空間數據整合,數字線劃圖(Digital Line Graphs,通稱DLG)是當前使用最多的地理信息數據格式。作為基礎地理信息數據類型之一,DLG 既保存要素的空間信息,也承載著其屬性信息,是數據庫數據的主要來源。為規范地理信息數據的提取、分析和使用,如何將現有DLG 數據轉換成標準的地理空間數據成為數據入庫的關鍵。本文基于現時背景,結合相關文獻和實踐經驗,探討DLG 數據入庫問題及出現的原因,并提出技術優化建議。
AutoCAD 作為一款較成熟的DLG 數據處理軟件,在自然資源、交通、電力、不動產等領域得到廣泛應用[1]。本文以市場使用最為普遍的兩種數據格式,即AutoCAD 中 的DWG 和Microsoft Access 中 的MDB[2],對DLG 數據入庫問題進行研究,找出格式轉換過程中出現的問題及原因,從而提高DLG 數據入庫速度,優化入庫質量,增加數據可信性。現將DLG 數據轉換過程 中出現的問題歸為以下三類。
(1)要素圖層歸類差異
AutoCAD 數據在對要素進行圖層歸類時缺乏嚴謹性,如點要素“泉”“井”和面要素“池塘”“溝渠”在AutoCAD 中均屬于水系要素(如圖1 所示),這使得原本在GIS 數據中屬于點要素的“井”或屬于面要素的“池塘”,在轉換過程中易歸錯圖層,從而造成點要素信息缺失或面要素無法閉合的現象。
(2)屬性信息不完善
轉換后的數據在屬性信息方面易出 現以下兩種情況:①缺少要素成分,如GIS 數據庫缺 少應該入庫的元素(房屋等);②缺少要素屬性值,如GIS 數據庫中各要素屬性值為空(高壓電力線無高壓伏數)[3]。由于不同屬性道路間無明確的道路鋪裝地類界,致使兩條不同的路在自動構面時被賦予同樣屬性,如圖2所示。

圖1 常規CAD圖層劃分模式

圖2 不同道路之間無明確界限
(3)幾何結構不完整
DLG 數據缺乏規范性,忽略了圖形間的拓撲關系。以居民地為例,易出現房屋線劃圖線條重復、部分房屋邊線不封閉問題,對數據質量、系統負荷量造成一定影響。地類界節點處存在懸掛現象如圖3 所示,居民地未閉合如圖4 所示。

圖3 地類界節點處懸掛現象

圖4 居民地未閉合
DLG 數據整理中,已有的AutoCAD 數字地形圖是以出圖為目的,要想以CAD 數據為GIS 基礎數據源,將CAD 數據規范化入庫,需要滿足以下要求:①注記標準化;②線性要素完整,避免懸掛;③對多邊形進行封閉 ;④對水渠、道路等用線編輯的面要素進行處理;⑤對地理要素編碼和屬性賦值;⑥保證拓撲關系正確;⑦其他特殊情況處理等。
基于上述要求,可以從以下四個技術層面對要素進行處理。
(1)幾何結構檢查與處理
從幾何結構入手,逐一檢查各個圖層,并針對每個圖層特有的情況進行幾何修整和幾何實體規范,以避免線轉面或其他步驟出現問題。大致包括各圖層去除偽節點;水渠、陡坎、圍墻等面狀、現狀地物各圖層線相交檢查、折返線檢查、線懸掛檢查及處理,以及居民地、水系要素面中未封閉面檢查等。
(2)實體屬性檢查與處理
CAD 格式數據中,對于帶狀地物,比如河流、道路等要素,野外調繪并沒有提供寬度,需要內業人員在圖上量距,然后賦值。此外,園地等植被層也應按國家規定對“梨”“桃”等帶有屬性的園地進行賦值。 (3)圖層檢查與處理
圖層檢查主要指對不同要素在數據庫中的位置進行檢查,其中,注記在DLG 數據整理中出現錯誤最為頻繁。如主要道路、次要道路等道路名稱未被歸到“道路注記”層等。此外,還應仔細檢查是否存在未被歸類的要素,核對完后,根據要求對其進行分層。
(4)其他細節檢查與處理
這通常為最后一步,主要用來彌補之前未進行修改和忽略的地方。包括首曲線、計曲線等類似等高線和高程點的“ELEV”不能為空值,居民地、池塘中不能出現高程點等細節問題。
DLG 數據入庫前存在大量問題需要處理,要把控好數據處理時間。DLG 數據庫前處理分為 :DLG 圖形端、“橋梁”軟件下、數據庫端等三種數據格式入庫技術。對這三種模式進行分析,以求找到最合適階段進行數據庫前處理。
(1)DLG 圖形端的數據入庫
在AutoCAD 中地面建筑物的圖 形存在無法完全封閉等一系列問題。GIS 軟件有圖像編輯與處理功能,但這種功能無法和AutoCAD 相比。如果要提高Auto CAD 向GIS 進行數據轉化時的速度與精度,必須從數據源頭——AutoCAD 入手,對這些數字化圖形進行編輯與修改[4]。基于DLG 圖形端的入庫是指對待入庫數據在格式轉換前進行數據加工和處理。數據入庫技術原理如圖5 所示。

圖5 數據入庫技術原理
AutoCAD 的數據編輯和修改比GIS 軟件的編輯功能及精度更高,在CAD 數據轉換前,首先要檢查數據分層是否正確,保證各種地物放置在對應圖層。其次,在檢查處理圖形數據時,要修改不符合GIS 拓撲結構的要素。基于DLG 圖形端的入庫優點是制圖軟件具有強大的圖形編輯功能,便于數據的更新、修改,尤其是大批量的DLG 數據在圖形編輯及修改時比較方便,且精度較高。
(2)“橋梁”軟件的數據入庫
基于“橋梁”軟件的數據入庫特點是大量加工處理的數據都放在其他各種軟件中,要在GIS 軟件平臺完成。數據入庫原理如圖6 所示。
CAD 的數據直接轉換成GIS 軟件格式的數據,會造成數據信息丟失,因而在數據入庫時,可選擇Geoway 軟件作為基礎CAD 數據轉入GIS 數據的“橋梁”軟件,這樣可解決數據信息丟失的現象,滿足GIS 入庫要求。基于其他各種軟件的數據入庫技術的優點是:國產GIS 平臺管理功能強大,作業員在生產作業過程中對圖形編輯功能比較習慣,可以快速對數據進行編輯和處理,提高數據入庫效率。但這種技術方法也存在一定缺點:①數據需要經過兩次轉換,涉及各種軟件的符號庫,存在數據容易丟失、符號錯誤等現象 ;②其他各種軟件端二次開發強度較大;③存在圖庫分離現象。

圖6 “橋梁”軟件的數據入庫原理
(3)數據庫端的數據入庫
基于數據庫端的入庫技術是大批量數據放入數據庫端的GIS 軟件中去完成。入庫技術原理如圖7 所示。

圖7 數據入庫的技術原理
數據入庫中,CAD 數據轉換入庫(GIS)過程中的數據轉換、數據處理,應該先在AutoCAD 中進行,以減少轉換后的處理技術難度,再利用File Geodatabase 中圖層數據及屬性表的相互關系嵌入軟件,提取對應信 息,生成點、線、面、注記四層Shapefile 文件。建立空數據庫,將數據由DWG 格式轉成Shapefile 格式,然后再將數據繼續詳細分層、檢查處理,使數據達到入庫標準規范[5]。數據入庫流程如圖8 所示。

圖8 數據入庫流程
基于數據庫端的入庫數據操作均基于GIS數據庫,優點是多次轉換過程中數據不會丟失。對入庫數據,除要在技術層面加強規范外,理論層面也應加強研究。
① 回避風險比解決問題更有價值。對于DLG 數據入庫過程中出現的問題,部分學者從不同角度進行了歸納和總結,并提出有效的解決方案及措施方法。但在論文撰寫過程中,并未給出數據處理過程中避免此類問題發生的方法。對于內外業處理人員和質量檢查人員來說,避免此類問題的出現比解決問題更具有實際意義。
② 主客觀因素應“一視同仁”。國內學者在研究DLG 數據入庫問題時,均選擇把焦點聚集在“硬件”問題上,即只考慮問題存在的客觀因素,如CAD 數據與GIS 的本質差異、每個軟件不可避免的漏洞和缺點等,而忽略了外業調繪人員和內業處理人員的本身問題。因此,模式的選擇更應基于實踐,結合操作的難易程度、準確度進行判斷。
此外,就DLG 數據入庫目前的發展狀況來看,全要素數據入庫的關鍵是CAD 數據標準化的整理,但目前還沒有一種很好的方法可以將未處理的CAD 數據直接轉入數據庫并滿足生產要求。
近年來,隨著數字經濟的飛速發展,國土空間規劃基礎地理信息平臺和國土空間規劃“一張圖”信息系統建設愈加重要,而DLG 數據入庫前質量則是保證平臺數據可靠性與規范性的基礎。研究發現,DLG 數據入庫問題主要是由CAD 數據與GIS 數據側重點不同造成的,因此,只有就數據格式轉換建立統一的數據標準,才能達到入庫數據的規范要求。