


摘 要:在CAD 水深測量成果圖中,水深往往以分離的文本方式標注,其整數、小數、小數點、負號等各部分相互分離且形式多樣,這給水深信息提取工作帶來了很大的困難。本文基于空間數據關聯規則挖掘思想,建立空間布局拓撲表,采用人工神經網絡學習和分類識別方法,智能識別和提取水深數據。此方法無需預先指定格式及其他參數,創新性實現了多種混合格式水深數據的自動化、智能化識別提取,且準確率高、速度快,在工程領域具有一定應用前景和推廣價值。
關鍵詞:水深數據識別;模式識別;BP 神經網絡;CAD 水深測圖;海圖水深
中圖分類號:P209; TP391.1 文獻標志碼:A 文章編號:2095-1329(2024)02-0157-04
水下地形圖作為基礎地理信息數據,在水運和水利工程建設、海洋資源開發、海洋環境監測與保護、軍事應用和科學研究等領域具有廣泛的應用價值。在工程領域,水深或水下地形圖等產品通常以CAD 電子格式提供。在開展水下地形沖淤演變、疏浚方量精確計算、海底三維地形構建等工程應用時,往往需要先從CAD 水深圖中精確獲取水深點XYZ 數據。
不同地區、不同行業對于CAD 水深點的標注樣式及標注位置規定不一樣,如海圖注記法規定以分離式文本標注水深,點位位于整數米的中間位置;一般注記法規定以單一文本標識水深,點位位于小數點所在位置。另外,不同的CAD 水深圖小數點除了用文本(Text) 表達,還有點實體(Point)、圓(Circle)、帶厚度的短線(Line Polyline)等圖形表達方式;負號表達形式同樣多樣。再加上基于特殊應用需求而人為將部分水深點標注設置為不同大小字體、不同旋轉角度等因素,導致CAD 水深數據自動識別和提取較為困難。因而,如何高效準確識別提取CAD水深數據已成為涉水行業工程人員研究的熱點問題。麥苗等[1] 應用VBA 技術實現了水深數據的自動化提取,但其未考慮標準海圖分離式注記法CAD,并且需要預先對CAD 水深圖中一些易混淆物件進行處理。徐俊杰等[2] 借助ArCGIS 軟件對CAD 分離式標注水深提取做了嘗試,但其需要人工輔助判讀有效組合距離。崔永勝等[3] 利用VBA 技術編程,實現了單一格式分離式標注水深數據的自動化識別提取,提高了水深提取效率,但其需要預先確定整數和小數的字體大小。袁鵬等[4] 在總結前人的經驗基礎上,利用DCL 和AutoLISP 技術,對多元文本開展了自動化提取。王昊宇[5] 等則更多關注CAD 水深識別后水深點坐標位置的精確推算。隨著人工神經網絡理論技術的發展,越來越多的學者開始使用神經網絡技術對CAD 模型和文本進行分類和識別[6-8]。
基于上述問題,本文提出一種基于BP 神經網絡的CAD 混合格式水深數據的智能識別提取方法,該方法基于空間數據關聯規則挖掘思想[9],通過建立空間布局拓撲表,采用BP 神經網絡學習和分類識別,無需預先指定CAD 水深圖格式及其他參數,實現了多種常見及混合格式水深的智能提取,自動化處理程度高。
1 CAD 水深標注布局拓撲分析
1.1 布局特征分析
國標中國海圖圖式[10] 規定,水深采用整數部分和小數部分分離的方式標注,不標識小數點,其中小數部分字高較整數部分要小,位置要低,如水深值為負,則在整數部分下添加下劃線。從布局角度分析,水深標注通常有四種基本格式:①整數和小數在同一文本;②整數和小數分離,中間用小數點分隔,整數小數大小等高,位置齊平;③海圖格式,整數的小數分離,一大一小、一高一低;④用屬性塊表示水深,塊內可能包含上述① - ③各種情況(見表1)。