999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

灰度文本圖像的扭曲文本行信息檢測提取

2017-05-17 12:44:48王景中王兆亮
數字技術與應用 2017年3期

王景中++王兆亮

摘要:文本行的檢測提取是文本圖像分析的支柱。這里提出一種新的扭曲文本行信息檢測提取方法,直接從灰度圖像進行文本行的檢測。首先用高斯平滑濾波增強文本行的結構,然后用脊線檢測找出文本行的中心線,在脊線的基礎上用自適應主動輪廓模型來估算出文本行的邊緣線。理論分析和實驗結果表明,該算法檢測文本行邊緣線的精確度較好,而且具有一定的魯棒性和較好的適應性。

關鍵詞:灰度文本圖像;扭曲圖像;高斯平滑濾波;脊線;主動輪廓模型

中圖分類號:TP391 文獻標識碼:A 文章編號:1007-9416(2017)03-0130-03

近十幾年以來,一直都是用掃描儀來采集文本圖像。現如今已是數字化時代,數碼相機以其高質量和低成本正在逐漸替代掃描儀,此外相機還具有遠距離、非接觸、快速采集等特點,這些特性使得相機適用于多功能的OCR相關應用,如移動OCR、數字化厚書、數字化歷史文獻等。但也出現了如運動模糊、低分辨率、光照不均、曝光不足或曝光過度以及扭曲和透視變形等影響因素,這給傳統的OCR系統帶來了新的問題。因此在文字識別之前需要做二值化和扭曲校正這樣的預處理。扭曲文本行檢測和文本線的估算是校正處理非常重要的步驟。之前的扭曲文本行檢測方法都是基于二值圖像的,這些方法可以分為兩類:(1)基于連通域處理[1-3]和(2)基于文本線處理[4-5]?;谶B通域方法是從單個連通域開始并搜索鄰域區域中的其他連通域,而且需要使用某些復雜的標準規則來進行文本行搜索,這種方法由于處理單個連通域導致速度比較慢,但優點是處理較為細致;基于文本線方法優點在于處理速度快,這主要得益于以文本行為單位處理的,但因此也會對精準度造成一定偏差。此外,這些方法大多數是處理英文文本圖像的,由于中英文字符的結構差異,應用到中文文本圖像上效果較差,難以適用。

通常,基于連通域處理和基于文本線處理的方法都依賴于自適應閾值處理的二值化方法作為文本行檢測之前的預處理步驟,在存在諸如不均勻陰影、低分辨率、運動模糊、曝光不足或曝光過度等情況下,二值化可能會產生不良的結果。如圖1所示,因此二值化可以對文本行檢測結果產生不利影響。本文提出一種直接從灰度文本圖像進行扭曲文本行信息檢測提取的方法。我們用基于匹配濾波器組方法的多方向多尺度各向異性高斯平滑來增強扭曲文本行的結構,然后從平滑的圖像中檢測到脊線,其中脊線定義為通過文本行中心的未破壞的中心線結構,然后用自適應主動輪廓模型作用在脊線上估計出文本行的邊緣線。

1 扭曲中文文本圖像的特征分析

在獲得圖像的過程中,由于書本的擺放以及相機的位置,或者書的厚度等都會導致圖像出現扭曲,如圖2所示,這些都會使得OCR識別率大大降低。扭曲一般分為兩種情況:行扭曲和字扭曲。從識別處理的思維來說,扭曲文本行的信息更容易檢測提取出來。本文提出的方法是基于灰度圖的,因此需要對拍攝的文本圖像作灰度化處理。圖像灰度化是數字圖像處理中一種經典的處理方法,目的在于將彩色圖像轉換成灰度圖像。常用的灰度化算法是加權平均法,即對原始圖像像素數據中的RGB分量代入權重求其均值,式(1)是該方法的常見加權均值公式:

其中,R(i,j),G(i,j),B(i,j)分別是原始圖像中像素(i,j)的R、G、B分量值,Gray(i,j)為計算得到的灰度值,也就是新圖像中像素(i,j)的值。

2 扭曲文本行信息檢測提取方法

我們的扭曲文本行信息檢測提取方法包括三個步驟:(1)使用多方向多尺度各向異性高斯平滑增強灰度文本行的結構;(2)使用脊線檢測扭曲文本行的中心線;(3)自適應主動輪廓模型作用在脊線上估算出文本行的邊緣線。

2.1 增強文本行結構

3 實驗結果分析

之前的方法都是基于二值圖像的,沒有針對灰度圖的文本行信息檢測的直接評估方法,為了檢驗效果,同時選取針對外文的文本行檢測方法進行對比,通過和外文的檢測正確精度對比可以看出,本文的算法正確度較高,而且相對于傳統的需要二值化處理的方法,本方法對諸如光照不均,低分辨率,運動模糊等魯棒性較好,對扭曲程度較高的情況也能得到穩定的保證。

4 結語

本文針對扭曲文本行信息的檢測提取提出了一種新方法,此方法獨立于二值化算法,文本行檢測精度高達93%以上,針對低分辨率,運動模糊,過度曝光等問題魯棒性較好,能準確的在這些情況下檢測出文本行。對扭曲度較高的文本行也不需要后續處理,該方法可以直接從灰度圖像提取文本行信息,對傳統的通過影響二值化導致文本行提取不精確的情況提出了挑戰。

參考文獻

[1]Liu Hong, Ye Lu, A method restore Chinese warped document images based on binding characters and building curved lines [C]// International Conference on Systems, Man and Cybernetics(ICSMC),2009:984-990.

[2]Gatos B, Pratikakis I, Ntirogiannis K. Segmentation based recovery of arbitrarily warped document images[C]//9th International Conference on Document Analysis and Recognition, 2007:989-993.

[3]宋麗麗,吳亞東,孫波.改進的文檔圖像扭曲校正方法[J].計算機工程,2011,37(1):204-206.

[4]張偉業,趙群飛.讀書機器人的版面分析及文字圖像預處理算法.[J].微型電腦應用,2011, 27(1):58-61.

[5]Liu Hong, Ding Run-wei. International Conference on Systems Man and Cybernetics: ICSMC 2009: Restoring Chinese warped document images based on text boundary lines, [C].2009:571-576.

主站蜘蛛池模板: 欧美另类精品一区二区三区| 国产成人一区二区| 三上悠亚精品二区在线观看| 91九色国产在线| 在线观看无码av五月花| 国产v精品成人免费视频71pao| 最新精品国偷自产在线| 啪啪免费视频一区二区| 黄色片中文字幕| 91无码人妻精品一区二区蜜桃| 伊人无码视屏| 国产人碰人摸人爱免费视频| 精品久久综合1区2区3区激情| 亚洲男人的天堂久久香蕉网| 91精品国产自产91精品资源| 日韩经典精品无码一区二区| www.99在线观看| 曰韩免费无码AV一区二区| 国产成人夜色91| 国产精鲁鲁网在线视频| 中文无码精品a∨在线观看| 精品日韩亚洲欧美高清a| 亚洲成aⅴ人在线观看| 久一在线视频| 永久天堂网Av| 色播五月婷婷| 亚洲成人网在线观看| 久久精品人人做人人| 亚洲人成电影在线播放| 国产噜噜噜视频在线观看| 性欧美久久| 99这里只有精品免费视频| 丁香五月激情图片| 日本在线亚洲| 国产精品青青| 日韩国产黄色网站| 无码中字出轨中文人妻中文中| 精品伊人久久大香线蕉网站| 99精品视频九九精品| 国产流白浆视频| 欧美成人午夜视频免看| jizz在线观看| 国产亚洲视频播放9000| 国产一区二区色淫影院| 国产亚洲精| 日韩欧美国产三级| 久久永久精品免费视频| 国产精品亚洲精品爽爽| 国产日韩欧美中文| 日本免费一级视频| 国产日韩精品一区在线不卡| 在线亚洲天堂| 夜夜拍夜夜爽| 在线观看精品自拍视频| 婷婷色婷婷| 一级毛片不卡片免费观看| 亚洲国产日韩在线观看| 中文字幕在线看| 91偷拍一区| 91午夜福利在线观看| 在线免费亚洲无码视频| 在线人成精品免费视频| 亚洲天堂久久新| 在线亚洲小视频| 久草美女视频| 凹凸国产分类在线观看| 久久精品国产电影| 九九久久精品国产av片囯产区| 99成人在线观看| 91久久精品日日躁夜夜躁欧美 | 国产欧美日韩资源在线观看| 88av在线播放| P尤物久久99国产综合精品| 香蕉伊思人视频| 色悠久久久| аⅴ资源中文在线天堂| 国产亚洲视频播放9000| 无码乱人伦一区二区亚洲一| 国产最爽的乱婬视频国语对白| 亚洲午夜福利精品无码| 91丨九色丨首页在线播放| 18禁影院亚洲专区|