蘇桂昌,張瑞坤,劉祥鵬
(青島科技大學 數理學院,山東 青島 266061)
電離層垂測數據是各觀測站點通過垂直探測技術觀測的電離層物理特性參數,對衛星導航、通信、雷達定位等[1-2]諸多無線電信息系統有重要影響。目前,中國電波傳播研究所留存了自上世紀40年代以來國內外諸多觀測站點的電離層垂測數據,分為印刷體、手寫體、針式打印字體等。這些資料現已經實現了紙質數據的電子化掃描,但如何提取掃描圖片中的數據來保護這一戰略性資源是一項迫在眉睫的工作,這對電磁環境大數據前端數據提取與挖掘分析有重要的支撐作用。傳統的數據提取方式需要人工逐一輸入,而通過研究相關算法自動識別提取這些垂測數據可以極大減輕工作量,提高數據錄入效率。該類型的算法研究屬于計算機文字識別領域,即光學字符識別[3](optical character recognition,OCR),是計算機視覺的重要研究方向之一。近年來,深度學習的研究推動了OCR 技術的發展,在自然場景文本識別、交通物流、卡證表格識別等[4]多個領域都有了成功應用。
基于深度學習的OCR 技術本質上是圖像識別,其包含文本檢測和文本識別兩大關鍵技術。在文本檢測方面,SHI等[5]在檢測到圖像中的最大穩定極值區域(MSER)后,通過最大流/最小割算法將MSER 標記為文本區域或非文本區域,實現文本檢測。TIAN 等[6]提出CTPN 算法,將文本檢測任務轉化為一連串小尺度文本框的檢測。TANG 等[7]提出的SegLink++算法在檢測小矩形區域的同時,將同屬于一個文本區域的矩形相連,完成若干矩形區域的合并。……