杜寧 重慶交通大學 重慶 400074
第三次全國國土調查是依法、統一、科學開展,摸清我國自然資源基礎家底的第三次國土調查.本次調查的基本單位為村,匯交的成果單元為縣.此次調查的數據處理主要有數據的預處理、影像矢量化、數據合并、數據接邊處理、屬性檢查5個步驟.其中,數據預處理是重要環節.傳統方法是在數據的屬性表中按屬性選擇選中數據并導出,在對大量空間數據進行處理時,效率就會大大降低且容易出錯.為減少重復勞動,提高工作效率,需要創建能夠自動化、批量化處理數據的工具【1】.
ArcGIS中的ModelBuilder(模型構建器)是一個用來創建、編輯和管理模型的應用程序【2】.在創建模型時,可按照一定的次序將所需的工具和數據連接起來構成一個工作流,通過迭代器可使工作流重復運行.模型能夠實現數據處理的自動化、流程化,將復雜的流程簡化為一個工具【3】.
1ModelBuilder簡介
ModelBuilder為設計和實現空間數據批量處理提供了一個圖形化的建模框架.模型中工作流的基本單元為"輸入數據→工具或腳本→輸出數據",構建單元包括變量、工具和連接符三種模型元素.
(1)變量
變量是模型中用于保存值或對磁盤數據進行引用的元素,包括數據變量和值變量兩種.數據變量是對磁盤中的數據進行表述的一種模型類元素.值變量包括磁盤數據之外的所有信息【5】.
(2)工具
模型中工作流的基本組成部分是地理處理工具.模型中包括內置工具、腳本工具和模型工具三種.迭代器是實現數據批量處理的重要工具,ModelBuilder支持12種迭代器,根據實際問題選擇不同的迭代器.在本次數據分塊提取中,選擇的迭代器是"要素選擇".
(3)連接符
連接符的作用就是將數據與值連接到一起的工具,其箭頭方形表明了地理處理的執行方向.模型構建器中包含數據、環境、前提條件和反饋四種連接符.
本次調查的基礎數據是國家下發的重慶市某區縣空間地理數據,坐標系采用的是CGCS2000大地坐標系.根據重慶地區的特殊情況,數據等級由高到低依次為縣、鎮、村和社.
數據提取就是將整體數據按照要求分成小塊數據.在"三調"中,原始數據是以縣為單位的,在矢量化之前,為了工作人員處理方便,需要將原始數據分割成以村為單位的shape文件.
在ArcGIS中數據的提取主要有兩種方式:一是根據字段名提取,即將屬性表中的字段作為關鍵字,如:權屬單位代碼,權屬單位名稱等,然后將需要的要素通過屬性選擇導出到文件夾中得到各個村的shape文件;二是根據幾何要素裁剪提取,利用已有村界范圍的幾何要素對整體要素進行裁剪,然后將裁剪結果保存到文件夾中.
由于重慶地區的特殊性,數據的最小單元為社,因此在數據提取前需要對數據進行融合,融合的字段為"社",將融合后的數據依據字段名"村"提取出每個村的shp數據.
此次數據提取處理一是要得到各村的shp數據;二是要得到各村緩沖100米的shp數據.模型如圖所示:

數據提取緩沖模型
經過實驗,利用模型提取數據用時大約為14分鐘,用傳統方法提取數據用時大約300分鐘.結果表明,使用模型處理數據縮短了時間,提高了效率,且人工干預少,數據的質量高.
本文以第三次全國國土調查項目中區縣的數據為例,探討了ModelBuilder在數據分塊提取中的應用,實現了數據的批量提取.模型將復雜的數據處理流程一體化,大大簡化了操作步驟;模型中的工具、參數均可修改,能更好地滿足實際要求.