褚雪梅
(國家測繪局地圖技術審查中心,北京100830)
網上地圖監管的技術設計與研究
褚雪梅
(國家測繪局地圖技術審查中心,北京100830)
針對監管網上地圖的實際工作需求,設計并研發出圖像識別技術,解決了圖片采集、圖像識別等問題,并提出網上地圖監管的技術途徑。
網上地圖;搜索;監管
隨著社會需求的不斷擴大,以互聯網為基礎的網上地圖開發和應用越來越廣泛。據不完全統計,在互聯網中涉及地圖內容的網站有3~5萬個,并且每個網站中的地圖網頁鏈接十分復雜,但在網上地圖內容的表示方面也不同程度地出現了一些問題,例如:錯繪我國國界線和省級行政區域界線;漏繪屬于我國領土的重要島嶼及歸屬范圍線;標注涉及國家安全的涉密信息等。網上問題地圖不僅使國家安全、領土主權、民族尊嚴受到影響,而且損害地圖消費者權益。為此,地圖監管部門高度重視并采取相應措施,以強化對網上地圖的監管。
利用公共搜索引擎搜索網上地圖,會搜索到監管中并不需要的海量信息,大量非地圖圖片的干擾,使得對圖片的分析和剔除工作量陡增。所以采用人工傳統方式搜索網上地圖,不僅遍歷周期長,而且網上圖片更新速度比判別速率高,因此無法有效地定位地圖圖片。為了實現對網上地圖的監管,首先是要把網上地圖適時、快速地自動識別出來,為此,組織研發了圖像識別技術,解決了圖片采集、圖像識別等關鍵問題,同時,提出網上地圖監管的技術途徑。
網上地圖監管的技術平臺采用J2EE規范設計和開發,其架構圖如圖1所示。主要包括:Spring、WebWork2、Hibernate3、QuartZ等。

圖1 網上地圖監管技術平臺架構圖
實現的主要功能:
1.網上地圖搜索
(1)圖片采集
采用Heritrix實現圖片采集。這是基于Java技術的網絡爬蟲組件,可對指定站點的圖片進行初次定向采集。就是在基于關鍵字搜索的同時,利用百度(Baidu)和谷歌(Google)這些搜索服務商的龐大資源抓取其所獲取的網上圖片,以實現網上圖片的初始獲取。在搜索獲取到海量圖片的基礎上,再二次過濾出網上地圖。
采用這種組合式的搜索模式對網上圖片進行采集,不僅節省了大量的軟、硬件投入,而且大大提高了網上地圖的搜索效率、深度和廣度。
(2)圖像識別算法
針對樣本庫中地圖、非地圖類目錄,使用SVM算法,按照選定的特征值,分別計算出地圖和非地圖的重心。該重心是由各特征值組合而成的多維特征向量加權得到。通過設定參數,設置地圖和非地圖之間的閾值,計算每個圖片的特征參數,與閾值比較。靠近地圖重心的,則被識別為地圖;靠近非地圖重心的,則被識別為非地圖。判斷圖片是否為地圖的主要依據:①圖像塊區域平滑程度。地圖中一般都是邊緣包裹著大片行政區域,用一種顏色表示這個區域,該區域在灰度分布上是平滑的。地圖的整個圖片區域平滑程度都很高,而在非地圖圖片上就不具有這些特征,例如風景圖片或是人物圖片上。②圖像邊緣和區域的比例。地圖通常是長邊緣圈出一塊區域,非地圖圖片由于紋理、立體等因素就不具備這些特性。③圖像強邊緣和弱邊緣的比例。地圖圖片的邊緣大多是強邊緣,非地圖圖片的邊緣都比較短,斷斷續續,屬于弱邊緣。④ 圖像顏色種數。用不同的顏色表示不同的圖像屬性,這是地圖表示的典型特征之一。非地圖圖片則用很少的顏色表示區域屬性。⑤ 圖像顏色離散度。圖像顏色離散度跟顏色種數相結合時,種類越少,離散度越高。⑥共生矩陣(12維)。共生矩陣主要是在地圖旋轉和縮放時起作用。⑦ DCT變換(三維)。DCT變換是檢測圖像頻率變換。非常復雜的圖片(地圖一般比較簡單),邊緣和顏色會頻繁變換,高頻占主要部分,地圖不具備這個特征。
(3)地圖識別處理
用研發的圖片識別算法,對抓取回來的網上圖片進行過濾篩選。通過比對樣本庫的地圖數據,剔除不屬于地圖類的其他信息,最終將地圖圖片挑選出來,其流程如圖2所示。

圖2 地圖識別處理流程
通過實踐,圖片識別技術對地圖圖片的識別精度達到90%以上,虛警率、漏報率均低于10%,每日處理的網上圖片數量可達2~3萬張。對網上地圖的遍歷周期從以前人工模式的幾個月,縮短為3天,提高了網上地圖搜索及監管工作效率和質量。
2.網上地圖監管
(1)網上地圖信息傳輸
選擇中國聯通線路作為網上地圖搜索及監管的信息傳輸主干網線。為避免網絡帶寬影響信息傳輸,選定了10 MB獨享網絡專線,其網絡、設備架構如圖3所示。隨著網上地圖搜索及監管的逐步展開和需求的不斷增大,可對網絡帶寬做適當調整。

圖3 網上地圖信息傳輸網絡、設備架構示意圖
(2)網上地圖監管系統
國家級地圖監管部門將問題地圖搜索出來并直接定位到相關網站。按照屬地分類管理原則,各省級地圖監管部門根據口令登錄該系統,查詢到屬于自己管轄范圍內的問題地圖網站并進行處理和反饋,構成對網上地圖的搜索、檢查、處理的動態聯合監管系統,其流程如圖4所示。

圖4 網上地圖搜索和監管系統示意圖
采用自主研發的圖像識別算法,選擇一定的特征值進行篩選過濾,有效地解決了圖片采集、圖像識別等問題,大幅度提高了搜索網上地圖的效率和質量。通過對圖片網站的不斷搜索和篩選,將發現的網上問題地圖,直接地定位到其所發布問題地圖的網站上,為各級地圖監管部門及時檢查和處理提供了可靠的第一手資料。
網上地圖監管技術的設計與研發,為網上地圖監管提供了有效的技術手段,尤其是網上地圖自動搜索技術具有獨創性,在網上地圖監管中發揮了重要的作用。
[1] 郭從良.信號的數據獲取與信息處理基礎[M].北京:清華大學出版社,2009.
[2] 張亮.現代通信技術與應用[M].北京:清華大學出版社,2009.
[3] 陳永奇.現代測量數據處理理論與方法[M].北京:測繪出版社,2009.
[4] 廖克.現代地圖學[M].北京:科學出版社,2003.
Technical Design and Research of Supervision of Online Map
CHU Xuemei
0494-0911(2010)11-0025-03
P20
B
2010-09-08
褚雪梅(1969—),女,山東青島人,工程師,主要從事地圖市場檢查和互聯網地圖的搜索、檢查及監督方面的工作。