摘 要 對(duì)在線報(bào)送的政務(wù)地理信息常采用隨機(jī)抽樣方式檢查位置準(zhǔn)確性,該方法無法檢查出所有諸如點(diǎn)位跨地市等嚴(yán)重定位錯(cuò)誤。為此,提出一種基于互聯(lián)網(wǎng)地圖地理編碼的政務(wù)地理信息位置準(zhǔn)確性檢查方法,該方法在浙江政務(wù)服務(wù)網(wǎng)報(bào)送政務(wù)地理信息檢查工作中得到了實(shí)際應(yīng)用。
【關(guān)鍵詞】地理編碼 互聯(lián)網(wǎng)地圖 抽樣 質(zhì)量檢查 在線報(bào)送 浙江政務(wù)服務(wù)網(wǎng)
浙江政務(wù)服務(wù)網(wǎng)是全省統(tǒng)一架構(gòu),為社會(huì)公眾提供綜合性、一站式在線政務(wù)服務(wù)的新型電子政務(wù)平臺(tái),被喻為“政務(wù)淘寶”。作為其重要組成部分,浙江政務(wù)地理信息資源采集共享平臺(tái)(簡(jiǎn)稱“報(bào)送系統(tǒng)”)是全省政務(wù)地理信息資源的在線報(bào)送、審核和發(fā)布的重要系統(tǒng)。目前,報(bào)送系統(tǒng)中包括有15個(gè)類別,104個(gè)政務(wù)地理信息圖層。填報(bào)內(nèi)容除名稱、地址、聯(lián)系電話等屬性信息外,還包括空間位置坐標(biāo)。傳統(tǒng)測(cè)繪產(chǎn)品的“二級(jí)檢查一級(jí)驗(yàn)收”中,過程檢查和最終檢查一般采用全數(shù)檢查,效率較低;驗(yàn)收檢查采用隨機(jī)抽樣方式檢查,缺少位置問題的針對(duì)性。為此,本文采用基于互聯(lián)網(wǎng)地圖的地理編碼服務(wù)接口,將政務(wù)地理信息自動(dòng)定位,再根據(jù)自動(dòng)定位坐標(biāo)與報(bào)送坐標(biāo)的間距大小,判斷出政務(wù)地理信息位置準(zhǔn)確性程度,為后續(xù)的政務(wù)地理信息的位置檢查提供參考,提高位置檢查的針對(duì)性。
1 利用互聯(lián)網(wǎng)地圖進(jìn)行地理編碼
為能有效對(duì)政務(wù)地理信息位置準(zhǔn)確性進(jìn)行判斷,首先需利用互聯(lián)網(wǎng)地圖對(duì)從報(bào)送系統(tǒng)中導(dǎo)出的政務(wù)地理信息進(jìn)行地理編碼。地理編碼(Geocoding)是指將文本的通訊地址數(shù)據(jù)轉(zhuǎn)化為數(shù)字地理坐標(biāo),一般為經(jīng)度和緯度。它提供了一種把描述成地址的地理位置信息,轉(zhuǎn)換成可被用于地理信息系統(tǒng)的地理坐標(biāo)方式。目前,主流的互聯(lián)網(wǎng)地圖均提供有地理編碼Web服務(wù)API,例如百度地圖的“Geocoding API”,高德地圖的“地理編碼/逆地理編碼API”,騰訊地圖的“地址解析(地址轉(zhuǎn)坐標(biāo))”。利用這3種互聯(lián)網(wǎng)地圖的地理編碼Web服務(wù)API,根據(jù)政務(wù)地理信息記錄中的地址屬性,逐條獲取記錄對(duì)應(yīng)的百度地圖坐標(biāo)、高德地圖坐標(biāo)和騰訊地圖坐標(biāo)。
2 坐標(biāo)轉(zhuǎn)換
上述獲取到的互聯(lián)網(wǎng)地圖經(jīng)緯度坐標(biāo)與報(bào)送坐標(biāo)的坐標(biāo)系不同。報(bào)送坐標(biāo)的坐標(biāo)系是CGCS2000,而百度地圖、高德地圖、騰訊地圖坐標(biāo)基于GCJ-02坐標(biāo)系,并且百度地圖還在其基礎(chǔ)上增加了自己的偏移量。為能在統(tǒng)一尺度下度量位置準(zhǔn)確性,報(bào)送坐標(biāo)與相應(yīng)的互聯(lián)網(wǎng)地圖坐標(biāo)應(yīng)統(tǒng)一坐標(biāo)系。各互聯(lián)網(wǎng)地圖一般只提供WGS84坐標(biāo)系到互聯(lián)網(wǎng)地圖自身坐標(biāo)系的轉(zhuǎn)換。由于CGCS2000坐標(biāo)系下坐標(biāo)與WGS84坐標(biāo)系下坐標(biāo)差別不大,本文將報(bào)送坐標(biāo)視作WGS84坐標(biāo)系下坐標(biāo)。通過調(diào)用相應(yīng)的坐標(biāo)轉(zhuǎn)換API,實(shí)現(xiàn)報(bào)送坐標(biāo)到互聯(lián)網(wǎng)地圖坐標(biāo)系下坐標(biāo)的轉(zhuǎn)換。
3 位置準(zhǔn)確性判斷
在得到統(tǒng)一坐標(biāo)系下的報(bào)送坐標(biāo)和自動(dòng)定位坐標(biāo)后,計(jì)算二者間距,并進(jìn)行位置準(zhǔn)確性判斷。
3.1 間距計(jì)算
精確計(jì)算地球橢球體上2個(gè)經(jīng)緯度點(diǎn)的間距較復(fù)雜,而本文目的是找出位置準(zhǔn)確性相對(duì)較差的記錄,對(duì)距離計(jì)算的精度可適當(dāng)放寬。本文將地球橢球體簡(jiǎn)化為球體,球體半徑R取地球的平均半徑6371.004km,則2點(diǎn)間距d=F(λ1, φ1, λ2,φ2),其中λ1, λ2表示兩點(diǎn)的經(jīng)度,φ1, φ2表示兩點(diǎn)的緯度。函數(shù)F具體計(jì)算公式如下:
(1)
根據(jù)公式(1)分別計(jì)算出百度坐標(biāo)系、高德坐標(biāo)系、騰訊坐標(biāo)系下自動(dòng)定位坐標(biāo)與報(bào)送坐標(biāo)間距。
3.2 位置準(zhǔn)確性判斷
假設(shè)互聯(lián)網(wǎng)地圖自動(dòng)定位坐標(biāo)的準(zhǔn)確性比報(bào)送坐標(biāo)高,據(jù)此便可進(jìn)行位置準(zhǔn)確性判斷。該假設(shè)雖然不一定對(duì)每條政務(wù)地理信息都成立(偶爾會(huì)造成誤判),但是可確保報(bào)送坐標(biāo)中定位偏移大的記錄全部可以篩選出來。取3個(gè)坐標(biāo)系下的間距中的最大值作為自動(dòng)定位坐標(biāo)與報(bào)送坐標(biāo)的總體間距。對(duì)總體間距按照距離的長(zhǎng)短進(jìn)行準(zhǔn)確性等級(jí)的劃分,本文采用的劃分標(biāo)準(zhǔn)見表1。
根據(jù)該劃分標(biāo)準(zhǔn),將政務(wù)地理信息記錄的報(bào)送位置準(zhǔn)確性分4個(gè)等級(jí),對(duì)于其中的錯(cuò)誤和不準(zhǔn)確等級(jí)的記錄篩選出來,進(jìn)行重點(diǎn)的人工核實(shí)檢查,對(duì)于準(zhǔn)確和較準(zhǔn)確等級(jí)的記錄可采用傳統(tǒng)的隨機(jī)抽樣方式檢查,提高檢查效率。
4 結(jié)束語
本方法已實(shí)際應(yīng)用于浙江政務(wù)服務(wù)網(wǎng)報(bào)送系統(tǒng)中的政務(wù)地理信息的檢查工作中。截至2017年6月,報(bào)送系統(tǒng)中已有政務(wù)地理信息記錄30多萬條。針對(duì)這些記錄,通過運(yùn)用該方法迅速篩選出疑似位置準(zhǔn)確性不高的記錄(約占總記錄的20%),對(duì)這部分記錄進(jìn)一步進(jìn)行人工檢查,最終檢查出諸如點(diǎn)位落在省外、點(diǎn)位落水、點(diǎn)位跨地市、點(diǎn)位跨區(qū)縣等等類型錯(cuò)誤以及大量的位置不準(zhǔn)問題。該方法的應(yīng)用,提高了政務(wù)地理信息位置檢查的效率和檢查質(zhì)量,同時(shí)也為互聯(lián)網(wǎng)地圖與政務(wù)應(yīng)用的結(jié)合進(jìn)行了有益的嘗試。
參考文獻(xiàn)
[1]王凌云,李琦,江洲.國(guó)內(nèi)地理編碼數(shù)據(jù)庫(kù)系統(tǒng)開發(fā)與研究[J].計(jì)算機(jī)工程與應(yīng)用,2004(21):167-212.
[2]田沁,鞏玥,亢孟軍等.國(guó)內(nèi)主流在線地理編碼服務(wù)質(zhì)量評(píng)價(jià)[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2016,41(10):1351-1358.
[3]馬照亭,李志剛,孫偉等.一種基于地址分詞的自動(dòng)地理編碼算法[J].測(cè)繪通報(bào),2011(02):59-62.
[4]江洲,李琦.地理編碼(Geocoding)的應(yīng)用研究[J].地理與地理信息科學(xué),2003,19(03):22-25.
作者簡(jiǎn)介
徐紅波(1985-),男,碩士研究生,工程師,主要從事地理空間數(shù)據(jù)處理與分析工作。
作者單位
浙江省地理信息中心 浙江省杭州市 310012endprint