□ 張海泉孟慶來
(1.國家測繪地理信息局第二大地測量隊,黑龍江哈爾濱150025;2.黑龍江第一測繪工程院,黑龍江哈爾濱150025)
淺談地圖掃描影像自動識別系統設計思路
□ 張海泉1孟慶來2
(1.國家測繪地理信息局第二大地測量隊,黑龍江哈爾濱150025;2.黑龍江第一測繪工程院,黑龍江哈爾濱150025)
地形圖矢量化是地理信息系統重要的組成環節。伴隨著各種學科技術的不斷發展以及高速計算機和大容量存儲設備的出現,使地形圖自動矢量化開始變為可能。本論文的目的是參考人類視覺系統的信息提取原理給予計算機一雙智慧的眼睛,提出一種設計思路,讓計算機自動識別地形圖中的符號與注記,實現地形圖的智能輸入。
地形圖矢量化;計算機自動識別技術;智能輸入
地形圖是最常用的表示地球表面自然地理和人文地理信息的圖紙,它是以一定的規則,用線狀、點狀和面狀三種要素符號組成的,上面包含著豐富的信息[1]。但是,一張紙質圖紙信息再豐富總還是個“啞巴”,比如問某村的詳細地址,紙質地圖將無言以答。假如我們將全部地圖都數字化輸入到計算機中形成數字地圖,數字地圖將會回答這個問題。所以說紙質地圖數字化已經成為當今GIS技術應用發展的一個重要環節,研究高精度、高效率的地形圖數字化方法勢在必行。
人類在繪制地形圖的過程中,逐步分析了使用對圖像的心理因素和地圖的感受的效果,提出了地圖感受理論。這套理論認為,閱讀地形圖的過程有以下四個階段(如圖1所示):

圖1 人類識別地形圖步驟Fig.1 Human identification topographic maps step diagram
(1)察覺:人類用眼睛發現圖上搜索目標,發現目標的存在,這個過程是地圖閱讀的最基本形態。
(2)辨別:通過心理和生理的影響區分幾種不同的符號,形成地形圖要素的分類體系。
(3)識別:經過辨別之后,給出地形圖上不同符號和圖形的含義。
(4)解譯:讀者根據符號和圖形獲得地理符號所包含實體內容。
從上述人工讀圖的過程來看,察覺和辨別是視覺感受的基礎,它為識別和解譯提供了對象和對象差異。
人機協同就是研究人和計算機的協作,以人機作為研究對象[2]。即:利用人自頂向下的和計算機從低向下的解譯目標特征,采用人工引導技術,屬性編碼等目標信息賦值由人工完成,符號基元線段的提取和符號的構建在人工引導下由計算機完成。對于不同的符號人工引導的方式不同,計算機根據不同的輸入信息選擇不同的算法計算描述,提取語義目標。
引用人類讀圖的特點,提出一套地形圖識別輸入的人機協處理系統,具體系統設計流程如下(如圖2所示):

圖2 地形圖識別處理系統Fig.2 Topographic recognition processing systems
3.1 預處理系統
首先預處理系統是一套圖像處理系統,整個系統所包含的功能為:
(1)圖紙掃描:顧名思義就是對紙質地形圖進行掃描,將紙質地形圖數字化。
(2)影像的幾何糾正和拼接:對地形圖影像由于圖紙本身和掃描時產生的誤差進行糾正,由于受到CCD相機掃面范圍的限制,一幅地形圖常常被劃分為數塊進行掃描,因此還得將影像進行拼接。
(3)掃描影像進行數字圖像處理:其中包括圖像增強、平滑、濾波、二值化、彩色圖像分層、細化、矢量化、圖文分離、矢量數據自動拓撲等,其目的是為下一步的識別做準備。
該系統主要完成對影像的低級處理和部分的中級處理,即人類的察覺和辨別。
3.2 識別處理子系統
整個系統的核心部分,它實現了對目標的識別和構建處理,是系統的最高級部分。其中功能包括兩項,既點狀目標識別和線狀目標識別。在此引入一個名為三庫結構的概念[3]:三庫既算法庫、目標知識庫、算法知識庫通過將這三種數據庫結構進行整合,達到識別的目的。具體實現過程如下:由于地形圖上各種地物特征各不相同,顯然用一種或幾種算法去提取地物信息是不可能的,為此就需要設計多種特征地物提取算法,儲存在算法庫中。例如,在提取房屋信息的時候,既可以用房屋四角的特征點來提取信息,又可以用多邊形內部的點進行目標提取。因此,系統在設計的初期就應該根據輸入目標的不同,設計與其對應的算法,以提高目標提取的準確性。目標識別庫的設計主要是避免在目標提取的過程中存在總體特征相同,只有一些局部特征不同,設計算法重復的問題。例如,地物符號堤,就存在干堤依比例尺和不依比例尺兩種情況(如圖3所示),此時的符號只存在線劃長度上的區別。目標識別庫用于存儲目標線劃寬帶,長度等信息,它采用參數表集合的方式表示,以隨機存儲數據。目標的符號序號為目標類型的代號,參數類型是指類型的線寬和線長。

圖3 局部特征相似的地物符號Fig.3 Local features similar feature symbols
在處理時,輸入的目標信息與算法知識庫的規則條件進行匹配,同時根據輸入的目標類調用目標知識中的相應參數。其中輸入目標信息中,人工通過目標類型給予識別目標賦予屬性,在目標提取時采用何種算法必須根據目標類型來確定,因此輸入的目標必須給予其目標屬性。
算法知識庫是存儲關于算法的相關知識的,即在什么情況下使用何種算法。算法知識庫使用以下的規則組成,即IF條件THEN動作。條件作為操作員輸入的信息,是激活算法的前提條件;動作即為啟動相應算法,具體可以使用以下式表示:
IF目標類型THEN激活算法或者IF目標類型^目標形狀^……THEN激活算法
三庫調用結構可用以下(如圖4表示)來表示:

圖4 三庫結構調用圖Fig.4 Three call graph database structure
3.3 人工編輯子系統
在預處理和識別處理系統處理階段,可能存在一些錯誤需要人工進行改正,因此人工編輯不可或缺。由于數據包含矢量數據和柵格數據,為此人工編輯系統同時也需要圖像編輯和圖形編輯兩部分。圖像編輯是圖像處理的一部分,包括對圖像進行放縮、旋轉、裁剪等操作。對圖像的編輯方法有:除噪聲(臟點、毛刺)、連接斷線、分割連線、擦除等方法。除噪聲,是指將圖像在產生過程中多余的點(類似于“噪聲”)除去,使圖像更加清晰。連接斷線和分割連線,一般是指在等高線圖中,等高線斷裂或者連在一起,采用一系列手段將其連接或者分割,使等高線更加清晰。圖形編輯是糾正數據采集錯誤的重要手段,其基本功能要求是:具有友好的人機界面,即操作靈活、易于理解、響應迅速等;具有對幾何數據和屬性編碼的修改功能;具有分層顯示和窗口功能,便于用戶的使用。圖形編輯的關鍵是點、線、面的捕捉,即如何根據光標的位置找到需要編輯的要素以及圖形編輯的數據組織。圖形編輯包括用鼠標增加一個點、線、面實體,刪除一個點、線、面實體,移動、拷貝、旋轉一個點、線、面實體。人工編輯的功能的強弱,直接關系到人工操作的方便與否和系統的作業效率。
3.4 數據庫系統
數據庫系統主要包括存貯、管理影像、中間處理結果、識別結果以及目標參數信息等,是整個系統中的紐帶,與前三部分相互獨立的系統通過數據庫聯系成一個整體系統。這套系統的數據庫中存儲著矢量和柵格兩種數據,矢量數據是由點文件、線文件、面文件、坐標串文件、屬性文件、目標文件和索引文件組成的二維表結構的文件,其屬性是相對應的關系。柵格數據是影像陣列,根據數據處理階段的不同,把點文件、線文件和面文件對應存儲為點狀符號、線狀符號和面狀符號等信息目標。在地形圖人工編輯處理時,操作對象是一個符號,鑒于柵格數據操作目標和矢量數據目標查詢存在的不利,為此還需要加入一個柵格矢量相結合目標捕捉方法,引入和建立索引文件和目標文件。在處理過程中,整幅影像被分為若干個相互重疊的子塊。索引文件對應于影像塊,并將其讀入內存中,并將每一格網的目標存儲在目標文件的對應位置。當光標移動時,程序采用螺旋搜索方式自動捕捉最接近的目標點,并通過索引文件從目標文件中查詢到目標點所在格網內的候選目標群,然后通過目標點坐標與候選目標坐標串匹配,判斷此處光標所要選擇的目標。由于一個索引格網內的目標極小,坐標匹配速度很快,大大地減少了索引計算機的工作量。捕捉過程如下(如圖5所示):

圖5 數據庫結構圖Fig.5 Database structure diagram
地形圖是根據地表起伏形態和地物位置、形狀在水平面上的投影圖,并按照一定比例尺縮繪到圖紙上[4]。這就說明,如果自然界的環境千變萬化,可能會導致地形圖目標特征出現極大的不穩定性。這種不穩定性一般出在依比例尺和不依比例尺的目標之上。而且,自然界的目標通常都是以三維坐標形式表達其位置關系,但是,圖紙表示的關系都是二維關系。這就很可能出現目標重疊、相連、交叉、包含等關系,這樣的話,復雜的自然景觀會被表達的更加錯綜復雜。有時候制圖員為了表達清楚地圖內容,常常運用一些手段,例如,當一條閉合的等高線穿過梯田坎時候,往往會在相交處斷開,這樣使原本系統中認為應該是一根閉合曲線造成識別困難,使目標特征更加復雜化。還有就是,地形圖圖面除了少數的點狀符號和面狀符號以外,還存在大量的線劃符號,這些線劃符號具有不同的線寬和類型,它們代表著不同意義,但是這些不同的線劃個體差異很小,這使得在錯綜復雜的DLG中識別符號是一件非常困難的事情。其次就是在地形圖進行掃描過后,目標的拓撲關系和幾何結構都被單一綜合成一種單一的影像像元灰度值,從單一灰度值提取如此復雜的目標難度非常大。最后就是受到技術條件的限制,AI(人工智能系統)無疑是眾多領域最富挑戰性的一門學科,計算機自動識別系統實質上就是具有人類處理這類問題能力的AI系統。系統通過設計人員告訴計算機如何利用類似于人類的歸納、演繹、推理、分析、綜合等思維方式自動識別。但是在實際中還存在以下的問題,首先,這套系統存在缺乏強有力的推理機制,靈活性和適應能力比較差;然后就是計算量非常大;最后是知識的獲取,表達,描述困難。綜上所述,以目前的條件實現地形圖全自動化是不現實的,以現有的技術條件,只有人機相互配合達到工作效率的最高化。
本文從系統工程的觀點介紹地形圖圖紙掃描影像全自動識別系統。介紹了這套系統的組成設計思路和技術過程,并結合人機各自的優勢,構成了人機協同處理策略[5]。這套系統的獨特之處在于由計算機完成對目標的提取,由人工進行目標語義的識別。這樣的好處是既使用了計算機圖像處理技術,又能避開計算機自動識別的弱點,充分發揮兩者的優勢,進一步提高工作效率。通過引入人工識別結果,同時基于知識的控制算法、調用手段,有利于實現算法的集成度,加強系統的處理能力。雖然當前的這項技術還處于半自動化的狀態,但是我相信隨著日后AI技術的不斷完善,這套系統必然會迎來全自動化的那一天。
【1】顧孝烈,鮑峰,程效軍.測量學[M].上海:同濟大學出版社,2011.
【2】呂杰鋒,陳建新,徐進波.人機工程學[M].北京:清華大學出版社.2012.
【3】林宗堅,付仲良.地形圖圖紙識別的人機協同處理策略:1995年3S技術與應用討論文集.杭州.1995:235-240.
【4】祝國瑞.地圖學[M].武漢:武漢大學出版社,2012.
【5】[美]拉塞爾(Stuart J.Russell),[美]諾維格(Peter Norvig)人工智能:一種現代的方法(第3版)(影印版)[M].北京:清華大學出版社,2011.
【6】楊安妮,張瑩彤,徐志遠等.基于WebGIS的公共地圖服務系統評價體系[J].測繪與空間地理信息,2013,36(10):75-78.
張海泉(1975年——),男,黑龍江哈爾濱人。工程師,本科學歷,主要從事地理信息系統的應用開發及工程測量工作。
P231.5
B
2095-7319(2014)04-0015-05