摘 要:本文提到的系統首先對圖片進行預處理,消除水印等圖片噪聲,將圖像二值化。CTPN利用同一文本線的字符可以互用上下文的特點,降低了檢測難度。DenseNet在ResNet的基礎上進行改進,減少了參數,改善了神經網絡的性能。使用CTPN進行文本檢測,使用DenseNet和CTC進行文本識別,獲得了較高的準確率。
關鍵詞:文本檢測;文本識別;CTPN
中圖分類號:TP393.09;TP311.13 文獻標識碼:A 文章編號:2096-4706(2018)11-0027-02
Research and Implementation of Online Business Information Extraction System
Based on CTPN
JIN Zhenwei
(Ningxia University,School of Information Engineering,Yinchuan 750021,China)
Abstract:The system mentioned in this paper firstly preprocesses the image,eliminates the image noise such as watermark,and binarizes the image. CTPN can reduce the difficulty of detection by using the characters of the same text line. DenseNet is improved on the basis of ResNet,which reduces parameters and improves the performance of neural network. CTPN is used for text detection DenseNet and CTC are used for text recognition,and higher accuracy is obtained.
Keywords:detect text;recognize text;CTPN
0 引 言
深度學習最廣泛的應用之一是文檔的文字檢測和識別。文字檢測的主要功能為從圖像中找到文字區域、并將文字區域分離出來;文字識別的主要功能為從分離出來的圖像進行文字識別。處理流程一般分為預處理和識別。圖片的文字往往攜帶重要信息,網店工商執照包含該網店的企業注冊號和類別等信息。網店營業執照要以圖片形式在店鋪進行公示,本系統致力于讀取不同形式營業執照的有用信息,為利用深度學習完成其他場景的任務提供參考。
1 預處理
網店營業執照的特點是文字排列整齊、噪聲小,但要提取的有用部分位置不固定,并且中文、數字多形式混雜排列,水印位置不固定,因此需要通過預處理提高圖像質量。
1.1 關閉圖像Alpha通道
圖像為含有Alpha通道的PNG格式,Alpha值默認為0,即圖片“透明”,如果用Opencv打開圖片,會丟失Alpha通道,導致圖像質量降低。以RGBA圖像格式打開圖像并添加同等大小的白色背景能避免這一問題。水印處理的常用策略有圖像降噪、拷貝攻擊等[1],對應的算法如快速最近鄰匹配、模板匹配都已十分成熟。……