范志堅,付 蓉
(1.云南省基礎地理信息中心,云南昆明650034;2.云南省測繪工程院,云南昆明650033)
不同時期1∶10 000 DLG入庫數據的處理
范志堅1,付 蓉2
(1.云南省基礎地理信息中心,云南昆明650034;2.云南省測繪工程院,云南昆明650033)
不同時期、不同測區的1∶10 000 DLG數據,由于執行不同的生產標準,因此造成數據間的差異,并給數據入庫帶來巨大的困難。為滿足入庫數據標準,探索通過軟件工具與測區數據處理方案相結合的方法來處理入庫數據不一致的數據現狀,以確保入庫數據的一致性和可靠性,并介紹該處理方法的相關技術。
DLG數據;軟件工具;處理方案;數據處理
自2000年以來,作為云南省基礎測繪重要項目的1∶10 000基礎地理信息數據已累計生產3 692幅(截至2009年12月),并以每年500幅左右的生產速度遞增。為了有效管理和應用已生產的1∶10 000數字產品,本著邊生產、邊入庫和邊應用的方針,結合生產進度,對全省1∶10 000基礎地理信息數據進行分批質檢和入庫,并通過空間數據庫管理平臺,實現對全省基礎地理信息數據的統一管理。
2010年應入庫的DLG數據為1 852幅,這些數據是不同測區不同時期生產的數據,如圖1所示。這些數據之間存在的問題是:① 時間跨度長,從2006年5月至2009年12月;② 測區及設計標準多,共有9個測區及相應的設計標準;③ 圖幅數量多,合計1 852幅;④ 不同測區相同地物要素所在層、字段名、GB碼等不一致;⑤各測區相同內容的層命名不一致;⑥生產的數據格式與入庫數據格式不一致等。因此,必須將上述數據按入庫數據標準進行入庫前數據處理。本文闡述了按入庫數據標準進行入庫前數據處理的具體方法和過程。
1.數據處理原則
1)一致性原則:數據中的圖幅分層、要素分類編碼標準、數據拓撲關系、概念和格式必須一致。
2)完整性原則:數據在覆蓋范圍、圖幅總數量、要素、數據層與內部文件等幾個方面要滿足完整性要求。

圖1 入庫數據測區分布及測圖時間
3)正確性原則:數據需要滿足圖形拓撲,以及屬性項名稱、類型、長度、順序和屬性值、分類等內容的正確性要求[1]。
2.數據格式轉換
2009年12月以前生產的數據格式為Coverage格式,入庫數據格式為MDB格式。按入庫數據格式要求,需將DLG數據從Coverage格式轉換到MDB格式。轉換過程如圖2所示。

圖2 數據格式轉換過程
3.對MDB格式數據的處理
1)冗余數據刪除:將每個數據層的Coverage格式轉換為MDB格式后,都有數據層名+_tic層或者面狀要素數據層名+_label層,如圖3所示,這些數據層為冗余數據層,應刪除這些數據層。

圖3 格式轉換前后地物要素的對應關系
2)屬性字段名與屬性處理:由于各測區數據在實際生產過程中的生產標準不統一,從而導致各測區同層數據的屬性字段名規定不同,以及相同屬性內容存儲于不同的屬性字段名中。因此,需要統一到入庫數據標準的屬性字段名中。為了滿足入庫數據標準,應對屬性字段名與屬性進行屬性的映射與內容轉換,并進行屬性字段名的添加、刪除和賦屬性值的工作,如表1所示。

表1 字段名及屬性處理
3)圖層拆分與整合:創建一個新的地物類數據層,針對相同地物類數據層中不同GB值的地物要素,通過GB值的選擇,將其中需要的地物要素提取至新的地物類數據層中。如建立新線層brglk_arc (屬性結構與入庫數據標準相同),將bount_arc層(境界線層)中GB值為610612(國營農林牧場界)、620102(特殊地區界)、620602(自然保護區界)的地物要素通過GB值的提取,放至新創建的brglk_arc層中;或者通過GB值選擇,將同一個地物類數據層中不同GB值的地物要素,放到已有相同地物要素不同的數據層中,如表2所示;或者通過GB值選擇,將相同地物要素不同數據層中的數據整合到相同地物要素同一個數據層中,如表3所示。

表2 數據拆分對應表

表3 數據整合對應表
4)注記層說明注記的提取:在annpt注記層中含有圖廓信息和說明性注記,圖廓信息可以不入庫,但說明性注記不能丟失,應對此層說明性注記數據進行數據的提取。可通過行政區劃面狀要素的形狀以及空間包含關系來選擇落在該區域的說明性注記點狀要素數據。
5)代碼GB值的歸并統計和檢查:不同測區生產的相同地物要素的GB值不一致,應對這些出現不一致的代碼值進行歸并。可根據9個測區設計書中用到的代碼值,按入庫數據的GB碼標準,對9個測區的代碼值進行代碼值歸并整理,形成《新舊GB代碼轉換與數據轉層說明表》,如表2~表4所示。
6)圖層重命名:將各測區相同內容不同層名的數據層,統一到同一種能滿足入庫標準要求的命名方式當中,如表4所示。
1)處理工具的開發:以ArcGIS Engine組件庫為開發平臺,在.NET環境下用C#語言開發。
2)處理方案的形成:依照國家規范,本著盡量精簡庫體容量和最大限度地保留原始數據屬性信息的原則,綜合分析基礎庫建成之后可能的應用方向,來制定數據處理方案,如數據庫制圖、框架庫建立等。筆者根據測區數據情況分別制定了景東景谷測區、鳳慶測區、華坪祿勸祿豐尋甸勐臘測區3種不同的數據處理方案。在這3種不同的方案中已包含原6位GB碼屬性字段名的添加、刪除和賦屬性值,以及新6位GB碼賦值[2]、冗余數據刪除、圖層拆分與整合、注記層說明注記的提取、圖層重命名等處理功能。
3)處理工具和處理方案的技術路線或流程如圖4所示。

圖4 技術路線或流程
處理工具對數據的處理過程如圖5所示。

圖5 數據處理過程
為了在數據處理過程中進行質量控制,以保證處理后的數據符合入庫數據要求,筆者采用了對數據處理的每一步都進行驗證數據的規則。這樣就能在數據處理過程中第一時間發現問題并作出恰當的處理,以避免誤差,保證數據質量。
依據不同測區的處理方案對處理后的數據在ArcMap 9.3環境下進行質量控制,并根據質量控制過程中發現的數據質量問題對測區處理方案進行反復修改,同時也對處理工具進行測試和修改,以確保數據經處理工具處理后數據的可靠性。質量控制的順序一般為重要的數據層先檢查,次要的數據層后檢查,以次類推[3]。質量控制的內容包括[4-5]:①位置精度檢查,將相同圖幅號的Coverage格式數據與通過處理工具處理后的數據進行疊合,檢查要素的位置偏差,是否符合規定要求;②屬性精度檢查,檢查要素的屬性項名稱、類型、長度、順序以及屬性值等內容的正確性;③ 邏輯一致性檢查,檢查數據的點、線、面拓撲關系,要素圖層劃分,要素的相互關系及相鄰圖幅間接邊等內容的正確性;④數據完備性檢查,將相同圖幅號的Coverage格式數據與通過處理工具處理后的數據進行疊合對照,檢查數據覆蓋范圍內要素的完整性、要素圖形與屬性數據是否有遺漏;⑤ 數據文件檢查,檢查通過處理工具處理后的數據文件命名、數據格式等是否符合設計要求。
不同時期、不同測區基礎地理信息數據DLG的入庫數據處理是實現數據集中統一管理、提供應用服務的重要步驟。在進行數據處理過程中,由于各測區執行的標準不一致,造成生產的數據分層與命名、字段名、屬性和GB碼不統一,還有數據格式是Coverage格式,不是MDB格式,這都給數據入庫帶來巨大困難,并且在入庫前數據處理的工作量非常巨大,尤其是在現階段,數據生產部門主要采用Coverage格式進行數據生產。針對這種情況,本次對9個測區的1 852幅數據進行入庫前數據處理,實現了不同時期、不同測區基礎地理信息數據DLG的重構和處理。并通過對數據處理過程的技術總結,形成了可行的不同測區的數據處理方案,探索了通過軟件工具與測區數據處理方案相結合的方法來處理入庫數據不一致的數據現狀,確保了入庫數據的一致性和可靠性。
[1] 國家測繪局.CH/T 9005—2009基礎地理信息數據庫基本規定[S].北京:測繪出版社,2009.
[2] 中國國家標準化管理委員會.GB/T 13923—2006基礎地理信息要素分類與代碼[S].北京:中國標準出版社,2006.
[3] 錢海忠,武芳,郭健,等.基于制圖綜合知識的空間數據檢查[J].測繪學報,2006,35(5):184-190.
[4] 國家測繪局.CH/T 1015.1—2007基礎地理信息數字產品1∶10 000 1∶50 000生產技術規程[S].北京:測繪出版社,2007.
[5] 中國國家標準化管理委員會.GB/T 17941—2008數字測繪成果質量要求[S].北京:中國標準出版社,2008.
Data Processing of 1∶10 000 DLG at Different Times for Database
FAN Zhijian,FU Rong
0494-0911(2011)11-0041-03
P231.5
B
2011-04-15
范志堅(1966—),男,云南羅平人,高級工程師,主要從事空間數據處理和空間數據庫的設計及應用工作。