周文鋒
(象山縣測繪與地理信息有限公司, 浙江 寧波 315700)
作為社會經濟發展的基礎,測繪地理信息同時也是整體提升國民信息化程度的重要條件[1],不僅能夠用于維護國家安全,同時也能夠應用于國民大眾的實際生活[2]。近些年,測繪地理信息的相關研究被社會大眾所廣泛關注,因此相關領域的研究發展也較快。測繪地理信息統計數據的質量至關重要,不僅要求其具有較高的完整性與準確性,同時還要確保數據間的邏輯性[3]。因此,研究一種測繪地理信息統計數據質量控制方法也較為重要。
張烴與董樹屏等人在數據質量控制研究中采用分級管理模式[4],通過三級主體、兩級監督的數據質量控制機制提升數據質量。李嬋與范增祿等人在數據質量控制研究中引入格式檢查[5],針對可能存在的錯誤信息,通過格式檢查以及內部一致性檢查等方法進行質量控制。本文在前人研究基礎上,研究基于智慧城市的測繪地理信息統計數據質量控制模型,以此提升測繪地理信息統計數據質量。
智慧城市中的測繪地理信息統計數據是以城市為目標[6],以網絡技術為紐帶,基于計算機技術與多媒體技術,結合遙感測繪以及虛擬現實等技術對目標實施不同分辨率、不同尺度、不同時空以及不同種類的三維統計描述而生成的信息,可以利用這些信息對城市的過去、當前與未來進行虛擬化展示。基于智慧城市的測繪地理信息統計數據質量控制模型整體結構,如圖1所示。

注:①全球定位系統(global positioning system,GPS);②數字高程模型(digital elevation model,DEM)。圖1 基于智慧城市的測繪地理信息統計數據質量控制模型整體結構
該模型主要分為兩個部分,分別是智慧城市客戶端部分與桌面管控端部分,通過兩部分之間的有機結合形成一個有機的整體。通常,管控端部署在內業工作站上,客戶端部署在外業數據采集現場的移動端,通過移動網絡實現指令下達、數據上傳和交換共享。桌面管控端將測繪地理信息采集命令傳輸給智慧城市客戶端,并將城市地理底圖等資源傳輸至智慧城市客戶端;智慧城市客戶端采集測繪地理信息后,測繪地理信息統計數據經由過程質量控制后存儲至一體化存儲區域內。測繪地理信息統計完成后,成果匯交至桌面管控端,利用成果質量控制過程質量管理,并將管理結果存儲至成果庫內。
通過智慧城市客戶端對測繪地理信息的采集與統計進行過程質量控制。
信息質量控制是智慧城市中測繪地理信息統計數據質量控制的主要環節,指的是對測繪數據本身進行質量控制,包括對數字高程模型(digital elevation model,DEM)、數字正射影像(digital orthophoto map,DOM)、數字線劃地圖(digital line graphic,DLG)等數據進行控制,其存在于測繪地理信息統計數據質量控制的整體流程中。在海量智慧城市測繪地理信息采集過程中,不僅要提升相關作業人員與管理人員的責任心,同時還要保障測繪地理信息采集過程的標準化,關注開發生產作業程序,降低測繪地理信息采集的誤差率,需最大限度利用網絡資源,最終確保所采集的測繪地理信息數據的息一致性和唯一性。信息質量控制。
信息質量控制方法主要分為三個環節,此處以DEM數據為例來描述整個過程。
具體描述如下:
(1)原始資源質量檢查。這一環節的目的是確定DEM信息內是否存在系統誤差、粗差或隨機誤差等,從而避免DEM信息精度不合格等問題。
(2)DEM信息處理中的質量檢查。這一環節中最關鍵的內容是確定內插模型[7],并利用逼近度、平滑度以及計算時間等方法來確定合適的模型。大量研究結果表明,雙線性內插的效果更為合適。
(3)最終DEM質量檢查。這一環節中最關鍵的內容是確定內插模型的準確度與可應用性;其次,需要判斷DEM數據高程修正數的起始信息、終止信息、網格間距以及高程值取值范圍是否滿足要求;再次,需要針對非平滑區域實施編輯處理,并進行優化處理。通過DEM得到的同等高線疊加判斷非正常現象,確保最鄰近圖幅DEM緊密接邊。
時空位置信息是測繪地理信息的重要組成部分。測繪數據采集后,為保障所采集信息中時空位置信息的準確性,需對時空位置信息進行質量控制。智慧城市客戶端中時空位置信息的質量控制流程,如圖2所示。

圖2 時空位置信息質量控制流程
可依照不確定傳播理論[8],利用式(1)描述初始時空位置信息的不確定性q1為
(1)
式中,q0和qd分別為初始時空位置信息以及地理數據數字化的不確定性;qs為測繪地理信息統計數據其他存儲導致的不確定性;q0c和f1分別為測繪地理信息統計數據轉換過程中的不確定性和不確定性傳輸函數。
可依照不確定性傳輸理論,利用式(2)描述中間時空位置信息的不確定性q2為
(2)
式中,qr和qg分別為時空位置信息恢復與代數運算導致的不確定性;qb和q1c分別為邏輯運算與時空位置信息轉換導致的不確定性;f2為不確定性傳輸函數。
可依照不確定性傳輸理論,利用式(3)描述終極時空位置信息的不確定性q3為
(3)
式中,q2c和q0分別為時空位置信息與圖形轉換以及輸出設備分辨率導致的不確定性;f3表示不確定性傳輸函數;qr、qg、qb、q1c和qa為q1的函數;q2c和q0為q2的函數。依照式(1)~式(3)能夠判斷測繪地理信息統計數據中不同階段的時空位置信息的數據質量[9]。
通過桌面管控端來對成果質量進行控制,包括數據清洗、交互檢查與智能分析三方面的內容。
1.3.1數據清洗和轉換
數據清洗是根據相應的標準由智慧城市應用端的一體化存儲區域自動提取測繪地理信息統計數據實例,以此提升測繪地理信息統計數據質量的過程。通過智慧城市應用端的一體化存儲區域的前置交換單元來自動檢測測繪地理信息統計數據并實施反饋,包括重復信息檢測、缺失信息檢測、非正常信息檢測、非一致數據檢測以及邏輯錯誤檢測等[10]。
同源測繪地理信息統計數據與其他數據源的測繪地理信息統計數據之間存在相應的業務邏輯。在對測繪地理信息統計數據實施數據清洗過程中需符合相應的業務邏輯標準,對不符合業務邏輯的測繪地理信息統計數據需予以相應的處理。被清洗掉的測繪地理信息統計數據定義將被定義為非標準信息,剩余的測繪地理信息統計數據被定義為標準信息。
數據清洗需符合以下幾點要求:
(1)確保測繪地理信息統計數據存在關鍵字屬性。
(2)最大限度放松清洗標準,確保測繪地理信息統計數據的原樣性。
(3)測繪地理信息統計數據清洗過程中,僅實施數據映射,不會自動糾正測繪地理信息統計數據。
(4)被清洗的測繪地理信息統計數據將進行歸檔保存。
數據轉換是將測繪地理信息統計數據的格式與形式進行統一化處理,先制定測繪地理信息統計數據格式與形式上的統一標準,再依照轉換規則對不同來源的測繪地理信息統計數據實施轉換,在此過程中需保障測繪地理信息統計數據自身意義不變[11]。
通過設計前置交換單元軟件模塊來完成測繪地理信息統計數據的清洗過程,軟件結構(圖3)。其中,前置交換單元包含服務調用、數據倉庫技術(extract transform load,ETL)工具以及測繪地理信息副本庫三個主要部分。

注:①數據工具平臺(data tool platform,DTP)。圖3 前置交換單元結構
1.3.2交互檢查
將所采集的測繪地理信息統計數據裝載在智慧城市系統內,從而完成測繪地理信息統計數據的可視化與查詢等[12],并結合人工判讀的方式確定測繪地理信息統計數據的空間位置與屬性的準確性。這種質量控制方法能夠顯著提升測繪地理信息統計數據表現的直觀性,方便相關檢查人員確定數據的真實性,提升測繪地理信息統計數據質量控制效率。
1.3.3智能分析
基于智慧城市系統,結合測繪地理信息統計數據的相關業務規則,設計專業的測繪地理信息統計數據質量控制軟件,快速、高效地完成測繪地理信息統計數據質檢,充分降低交互檢查過程中存在的漏檢與誤檢的概率[13]。
為驗證本文所提出的測繪地理信息統計數據質量控制模型的實際應用性能,開展以下實驗。
以我國某城市為測試對象,該城市于2016年開始實施智慧城市建設。將該城市區域范圍劃分為8個部分(圖4),并應用本文提出的模型對該城市的測繪地理信息統計數據進行質量控制實驗。

圖4 測試對象區域劃分
在時空位置信息采集過程中,在測試對象內不同區域內分別采集一個地理位置坐標,將所采集的初始坐標數據以及本文模型控制后所得的坐標數據與實際坐標數據相對比,獲取時空位置信息的準確性[14],測試結果如表1所示。

表1 數據準確性統計表 單位:m
從表1可以看出,采用本文模型進行質量控制后所得的地理位置坐標數據與初始坐標數據相比更接近測試對象的實際地理位置坐標數據,誤差幾乎可以忽略。由此說明采用本文提出的模型能夠顯著改善測繪地理信息統計數據的精度[15]。
采用本文模型對測試對象測繪地理信息統計數據進行數據清洗,通過數據清洗去除冗余數據、拆分字段、合并字段、內容替換等,并解決數據重疊和矛盾沖突等問題,數據清理成功的原則是“一數一源”。通過數據清洗統計該城市不同區域中數據清洗的耗時與準確率,測試結果如表2所示。

表2 數據清洗測試結果
分析表2能夠得到,采用本文模型對測試對象的測繪地理信息統計數據實施數據清洗,效率與準確率較高。
為進一步驗證本文模型的數據質量控制性能,以文獻[4]中基于分級管理模式的數據質量控制模型和文獻[5]中基于格式檢查的數據質量控制模型為對比模型,參照國內外相關研究成果,根據空間數據質量評估指標,以數學基礎精度與平面位置精度等為標準,評估本文模型與對比模型的測繪地理信息統計數據質量控制性能,測試結果,如圖5所示。

圖5 數據質量評估結果
經分析,本文模型控制下的測繪地理信息統計數據質量各指標值均高于兩個對比模型,其中數據準確性高達99%;文獻[4]模型控制下的測繪地理信息統計數據的邏輯一致度與完整性均顯著下降,均低于85%;文獻[5]模型控制下的測繪地理信息統計數據質量各項指標值較為均衡,但顯著低于本文模型,由此能夠充分證明本文模型具有較高的數據質量控制性能。
采用柵格仿真器對2號區域內的空間環境進行仿真測試,并分別基于原始測繪地理信息統計數據和本文模型控制下的測繪地理信息統計數據進行路徑規劃,測試結果如圖6所示。其中的圓形與三角形分別表示起點和終點。

(a)原始數據

(b)本文模型質量控制后的數據圖6 路徑規劃結果
分析圖6能夠得到,基于本文模型控制下的測繪地理信息統計數據規劃的出行路徑與基于原始測繪地理信息統計數據規劃的出行路徑相比,路線更為平緩,且整體路徑更短,由此說明本文模型具有較好的實際應用性能。
本文在傳統數據質量控制模型的基礎上,提出了基于智慧城市的測繪地理信息統計數據質量控制模型,并對該模型的整體結構設計,以及過程質量控制、成果質量控制等核心內容進行了詳細的分析;其次,通過真實的實驗數據,驗證了該模型可有效提升測繪地理信息統計數據的精度,具有較好的實際應用性能。本文提出的研究方法能夠為我國智慧城市的規劃建設以及社會大眾生活出行提供更優質的數據基礎。由于時間限制,此次測試樣本較少。在日后的研究中還需擴大測試樣本量,證實該方法的穩定性。