摘要:通過對基于盤古分詞的地址匹配研究,結合重慶市地址名稱的特殊性,對盤古分詞功能進行了擴展,并進行了詞庫的建設和索引的優化,并以此為基礎在警用地理信息系統中進行了成功的應用。
關鍵詞:盤古分詞 地址匹配 警用地理信息系統
中圖分類號:TP391.1 文獻標識碼:A 文章編號:1674-098X(2013)01(b)-00-03
地址匹配也稱地理編碼,是指將地址映射成地理坐標的過程,是用戶輸入一個地址串,即可返回其空間坐標,從而在可以將這個地址在地圖上進行定位。計算機無法通過文字敘述直接找到目標位置經緯度坐標。
例如,用“重慶市江北區電測村231號”來表示重慶市勘測院的位置,計算機無法從“重慶市江北區電測村231號”獲得重慶市勘測院的具體坐標位置。在使用地址匹配時,首先要建立一個標準地址庫作為基礎,標準地址庫包含了門牌地址、地名點等大量地址信息,并按照相應的標準規范進行了整理。地址匹配可以利用該標準地址數據庫來建立地址與地理坐標空間的對應關系,將各種興趣點或文本地址與標準地址數據庫進行匹配。
在公安信息化多年的建設過程中,各公安業務單位已經建立了大量的業務應用數據庫管理系統,業務數據量非常龐大,以重慶市為例,僅常住人口、重點單位、案發地點、POI等都有上百萬甚至于千萬條的信息,要將這些信息在地圖上進行空間定位,若采用人工手段直接將一條條信息按地址在電子地圖上進行標定,將耗費大量的人力、物力而且效果不準確。……