999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于區域對比度增強的二值化算法

2017-10-13 11:04:42柳長源張華玉
電子與信息學報 2017年1期
關鍵詞:區域

盧 迪 黃 鑫 柳長源 林 雪 張華玉 嚴 俊

?

基于區域對比度增強的二值化算法

盧 迪 黃 鑫*柳長源 林 雪 張華玉 嚴 俊

(哈爾濱理工大學電氣與電子工程學院 哈爾濱 150080)

降質文檔圖像二值化問題是圖像處理領域的一個難點。該文通過分析圖像不同區域灰度對比度的差異,為降質文檔圖像提出了新的二值化算法。首先利用四叉樹原理自適應劃分區域,再對不同灰度對比度區域采用不同對比度增強法以調整局部區域內的灰度對比度,最后根據灰度值出現的頻率確定局部閾值。該文測試了隨機拍攝的降質圖像及DIBCO(Document Image Binarization COntest)圖像集中的50幅圖像。與4種經典算法比較,所提算法處理的降質圖像具有最高F-measure值和峰值信噪比(PSNR值)。

圖像處理;二值化;區域對比度增強;局部閾值;四叉樹法

1 引言

光學字符識別技術(Optical Character Recognition, OCR)是將紙質文字信息錄入計算機的最高效方法,但其主要不足表現為無法從降質文檔圖像中提取清晰字符,即降質文檔圖像二值化過程存在問題。目前圖像二值化方法主要為基于閾值的二值化方法,又可分為全局閾值法和局部閾值法。全局閾值法(如Otsu 法[1])對處理目標和背景灰度分布均勻且類偏差不大的圖像有良好效果,但對降質文檔圖像,全局閾值法會出現大量的誤分割[2]。局部閾值法是根據局部像素點信息確定閾值,更適用于二值化降質文檔圖像。1986年,文獻[3]提出利用局部均值和標準差計算閾值的自適應二值化算法,該算法二值化的圖像字符筆畫較完整,但圖像背景會產生連續大塊非目標黑色區域。2000年,文獻[4]在文獻[3]算法基礎上進行改進,引入標準方差動態范圍參數R降低文獻[3]算法中對修正參數K的依賴。該算法對大部分降質文檔圖像有較好的處理效果,但對背景特別亮或特別暗的圖像,處理效果較差。2007年,文獻[5]提出的改進FCM算法利用偏移場有效地降低了非均勻光照干擾, 但分割結果目標丟失嚴重。2010年,文獻[6]提出基于圖像區域的二值化算法,根據預先設定的分塊數將圖像分塊,再采用Otsu法全局分割,由于其需事先指定分塊數, 所以自適應性受到了很大程度限制[7]。2014年,文獻[8]提出一種自適應二值化算法,分4步對圖像進行處理,依次是:局部對比分析、對比度擴展、閾值選取和噪聲移除。文獻[8]算法對文檔填充充實的降質圖像分割效果好,但處理圖像中只有少量字符的文檔圖像,會產生大量的噪點。

當前技術大多是針對某一特定降質原因的圖像有較好的二值化效果[9],但降質原因多種多樣,好的二值化算法應能處理多種原因形成的降質圖像。降質文檔圖像的特點是部分區域目標和背景的灰度對比較明顯,部分對比不明顯或整體對比均不明顯[10]。基于此,本文設計了一種基于區域對比度增強的二值化算法,可解決受多類原因影響的降質文檔圖像的二值化問題。

2 本文工作

2.1區域劃分

區域劃分的好壞直接影響著不同對比度增強法能否在相應區域發揮最大效用,灰度對比度可作為劃分依據。設是一幅的灰度圖像,定義像素點處灰度對比度為

(2)

(3)

2.1.1區域粗劃分 本文利用四叉樹原理,根據灰度對比度對圖像進行區域劃分如圖1。第1次四分將待處理圖像分為A, B, C, D 4個子區域,若子區域C內的最大灰度對比度小于倍整體區域的最大灰度對比度(如式(4)),說明該區域灰度變化不顯著,認為該子區域不含字符均為背景,直接輸出該子區域。

2.1.2區域細劃分 粗劃分后不滿足式(4)的區域均被認為是含字符的目標區域,本文假設圖1中A, B,

圖1 區域劃分原理示意圖

D為目標區域。對降質文檔圖像,粗劃分后的剩余區域間的灰度對比度也可能存在明顯差異,因此需要對剩余區域再次細分。以區域D為例(A, B區域的細分同D區域),若第2次四分后子區域DD的最大灰度對比度小于倍四分前區域的最大灰度對比度(如式(5)),直接輸出該區域。

(6)

2.2區域對比度增強

2.1節將圖像劃分成灰度變化不顯著區域、非常顯著區域及較顯著區域。文檔圖像通常為黑色目標及白色背景,因此對灰度變化不顯著區域,將區域內各像素點灰度值調整為

對于灰度變化非常顯著區域,采用弱灰度對比度增強方式[11],將區域內各像素點灰度值調整為

(9)

對于灰度變化較顯著區域,本文基于弱灰度對比度增強方式提出了強灰度對比度增強方式,其目的是更大程度地拉大區域內各像素點間的灰度對比度。此時區域內各像素點灰度值調整為

本文的灰度增強法可有效調整非均勻光照圖像、透背圖像及變化背景圖像像素點的灰度值,進而解決這3類圖像的二值化問題。對由字跡透背或受非均勻光照引起的降質文檔圖像,圖像中字跡透背、光照太亮或太暗區域,其前景與背景間對比度相差不大,可歸為對比度較顯著區域,采用式(10)強對比度增強法可分離出清晰字符。對文檔降質不嚴重的區域,其前景與背景間灰度對比度存在明顯差異,此時采用式(9)弱對比度增強法可減少噪聲。對存在變化背景的降質文檔圖像,其背景間的對比度變化遠比不上前景與背景之間的對比度變化。因此,若區域中不存在字符只存在對比度變化相對較大的背景時,通過式(8)即可將它剔除;若區域中既存在字符又存在變化背景,則可以通過兩類對比度增強法,拉大像素點間的對比度,進而從背景中分離出前景。圖2為強、弱灰度對比度增強法的二值化效果對比圖。通過圖2可以看出,對灰度變化程度不同的區域,應用不同灰度對比度增強法可取得較好的分割效果。

2.3 區域閾值選取

經對比度增強法調整后的灰度圖像直觀上可明顯地區分出目標和背景。分析文檔圖像特點可知,通常情況下,文檔圖像字符像素點數目小于背景像素點數目,極少數可能存在大于的情況。因此可通過累加灰度直方圖中灰度值所對應的像素點數來確定代表前背景的灰度值。對于經灰度對比度增強法處理后的子區域圖像(其大小為),尋找累加值最接近時所對應的灰度值,在中出現頻率最高的灰度值即為前景點的灰度值,在中出現頻率最高的灰度值即為背景點的灰度值。若在(或)中存在多個頻率最高的灰度值,則選取最小(或最大)的灰度值來代表前景(或背景灰度值)。子區域的閾值為和的均值,即:。最終,可獲得子區域的二值化圖像為

3 實驗結果分析

3.1實驗環境和測試圖像庫

本文采用如下仿真實驗環境:Intel(R) Core(TM)i3-3240 CPU, 4G 內存,Matlab(R2011a)編譯環境。本文測試了隨機拍攝的手寫體圖像和印刷體圖像以及來自DIBCO圖像集[12]的50幅圖像。

3.2分割效果測試

分別應用Otsu算法,Niblack算法,Sauvola算法和Singh算法與本文算法進行對比實驗。圖3~圖5為各算法處理后的二值圖像。除Otsu算法外均存在參數選取問題,因此本文結合參考文獻[2,3,6],對Niblack算法、Sauvola算法選取窗口大小為5 × 5, 15 × 15, 25 × 25, 35 × 35和 50 × 50做5組實驗,對Singh算法選取子塊大小為32 × 32, 64 × 64, 128 × 128, 256 × 256和512 × 512做5組實驗,本文算法以0.1為步長,隨機在,中選取5組,值測試,以上實驗均選取具有最佳值的二值圖像作為最終實驗結果。

圖3~圖5分別為受光照不均勻、字跡透背及字跡模糊影響的降質文檔圖像。由圖3~圖5可以看出,無論是傳統的Otsu算法、Niblack算法或Sauvola算法還是先進的Singh算法,經它們處理后降質文檔圖像的二值圖像,或存在筆畫斷裂、模糊不清的現象,或存在大塊黑色非目標區域的現象,或存在筆畫濃度不一致的現象。針對降質文檔圖像,本文算法可智能地篩選目標區域及非目標背景區域,避免噪聲干擾。經本文算法處理后的二值圖像,保留了字符的完整性,分離出清晰的字符,大大地方便了后續計算機的識別。

圖2 強、弱灰度對比度增強法的二值化效果對比圖

圖3 隨機拍攝印刷體文字圖像二值化結果

圖4 隨機拍攝手寫體文字圖像二值化結果

圖5 H-DIBCO2012 H08二值化結果

3.3評估指標

(13)

由表1可以看出,在5種算法處理降質文檔圖像的測試結果中,應用本文算法處理的二值圖像,具有最高的值(高于次高Otsu法4%)、最高的值(高于次高Sauvola法5%),說明本文算法可最好地還原目標像素點,同時說明應用本文算法輸出的二值圖像最接近實際未降質文檔的二值圖像。

表1不同算法對DIBCO圖像集的測試結果

方法Otsu算法Niblack算法Sauvola算法Singh算法本文算法 77.8148.9772.9370.5080.94 (dB)15.078.0915.1413.7415.90

3.4基于OCR評估

測試各算法二值圖像在OCR(識別正確率)上的識別效果可作為評價各算法二值效果好壞的重要依據。因此,本文利用圖3,測試各算法處理的二值化圖像在ABBYY Fine Reader 12上的識別正確率(具體數據見表2)。本文定義OCR識別正確率為

結合圖3及表2可知,雖然原灰度圖像受非均勻光照影響,但在ABBYY Fine Reader上仍有88.94%的識別正確率。經Otsu算法及Sauvola算法處理后的二值圖像,由于圖像右下角區域字符筆畫斷裂,因此在ABBYY Fine Reader上識別效率較低。經Niblack算法處理后的二值圖像,雖然圖像中存在黑色噪聲塊,但由于帶字符的前景區域字符筆畫連續,因此識別率可達到90%以上。經Singh算法處理后的二值圖像,大部分字符保留較完整,因此識別率也可達到90%以上。經本文算法處理后的二值圖像,字符清晰、完整、易于識別,在ABBYY Fine Reader上可達到98%以上的識別正確率,說明了本文二值化算法的有效性。

表2 圖3中各圖像在ABBYY FineReader上的識別正確率

4 總結

本文根據區域間灰度對比度的差異,為降質文檔圖像提出新的二值化算法。該算法自適應地劃分灰度對比度顯著與較顯著區域,對灰度對比度顯著區域,本文采用弱對比度增強法調整前景與背景間的灰度差異,有效地抑制了噪聲的干擾。對灰度對比度較顯著區域,本文提出強對比度增強法來調整灰度差異,進而分離出清晰字符。因此不論任何區域(包括變化背景、非均勻光照、透背等區域),總有適合的方法去處理。且本文算法對由嚴重非均勻光照及透背引起的降質文檔圖像尤為有效。實驗結果表明,在5種算法處理DIBCO圖像集得到的結果中,本文算法得到的二值圖像,字符筆畫清晰、完整,背景極少出現噪聲,且具有最高的F-measure值及PSNR值。將各種算法得到的二值圖像應用到ABBYY FineReader12,本文算法具有最高的識別正確率。

[1] OTSU N. A threshold selection method from gray level histograms[J]., 1979, 9(1): 62-66. doi: 10.1109/TSMC.1979. 4310076.

[2] 申鉉京, 龍建武, 陳海鵬, 等. 三維直方圖重建和降維的Otsu閾值分割算法[J]. 電子學報, 2011, 39(5): 1108-1114.

SHEN Xuanjing, LONG Jianwu, CHEN Haipeng,. Otsu thresholding algorithm based on rebuilding and dimension reduction of the 3-dimensional histogram[J]., 2011, 39(5): 1108-1114.

[3] NIBLACK W. An Introduction to Digital Image Processing [M]. Englewood Cliffs, NJ, US, Prentice-Hall, Inc., 1986: 115-116.

[4] SAUVOLA J and PIETIKAINEN M. Adaptive document image binarization[J]., 2000, 33(2): 225-236. doi: 10.1016/S0031-3203(99)00055-2.

[5] MA L and STAUNTON R C. A modified fuzzy C-means image segmentation algorithm for use with uneven illumination patterns[J]., 2007, 40(11): 3005-3011. doi: 10.1016/j.patcog.2007.02.005.

[6] CHOU C H, and LIN W H, and CHANG F. A binarization method with learning-build rules for document images produced by cameras[J]., 2010, 43(4): 1518-1530. doi: 10.1016/j.patcog.2009.10.016.

[7] 龍建武, 申鉉京, 臧慧, 等. 高斯尺度空間下估計背景的自適應閾值分割算法[J]. 自動化學報, 2014, 40(8): 1773-1782. doi: 10.3724/SP.J.1004.2014.01773.

LONG Jianwu, SHEN Xuanjing, ZANG Hui,. An adaptive thresholding algorithm by background estimation in Gaussian scale space[J]., 2014, 40(8): 1773-1782. doi: 10.3724/SP.J.1004.2014.01773.

[8] SINGH B M, SHARMA R, GHOSH D,. Adaptive binarization of severely degraded and non-uniformly illuminated documents[J]., 2014, 17(4): 393-412. doi: 10.1007/ s10032-014-0219-6.

[9] MESQUITA R G, MELLO C A B, and ALMEIDA L H E V. A new thresholding algorithm for document images based on the perception of objects by distance[J].-, 2014, 21(2): 133-146. doi: 10.3233/ICA-130453.

[10] MILYAEV S, BARINOVA O, NOVIKOVA T,. Fast and accurate scene text understanding with image binarization and off-the-shelf OCR[J]., 2015, 18(2): 169-182. doi: 10.1007/ s10032-015-0240-4.

[11] ROSENFELD A and KAK A C. Digital Picture Processing [M]. 2nd ed. New York, Morgan Kaufmann: Academic Press, 1982: 92-95.

[12] PRATIKAKIS I, GATOS B, and NTIROGIANNIS K. DIBCO 2013-Document Image Binarization Contest [EB/ OL]. http://utopia.duth.gr/~ipratika/DIBCO2013/, 2013.

盧 迪: 女,1971年生,教授,研究方向為數據融合、故障檢測、圖像處理、智能交通系統.

黃 鑫: 女,1991年生,碩士生,研究方向為圖像處理.

柳長源: 男,1971年生,副教授,研究方向為模式識別與智能信息處理技術、機器學習與人工智能、數字圖像處理.

Binarization Method Based on Local Contrast Enhancement

LU Di HUANG Xin LIU Changyuan LIN Xue ZHANG Huayu YAN Jun

(,y,150080,)

Binarization for degraded document images is a difficult point in image processing. This paper presents a new binarization method for the degraded document images by analyzing the differences of image grayscale contrast in different areas. Firstly, theory of quadtree is used to divide areas adaptively. Secondly, various contrast enhancements are selected to adjust local grayscale contrast for different contrast areas. Lastly, the frequency of gray value is utilized to calculate threshold. The proposed algorithm is tested on random shooting degraded images and datasets of Document Image Binarization COntest (DIBCO). Compared with other four classical algorithms, the binaried images using the proposed algorithm gain the highest F-measure and PSNR (Peak Signal-to-Noise Ratio).

Image processing; Binarization;Local contrast enhancement; Local threshold; Quadtree

TN911.73

A

1009-5896(2017)01-0240-05

10.11999/JEIT160197

2016-03-03;改回日期:2016-07-12;

2016-09-30

黃鑫 scorpion_hx@163.com

哈爾濱市科技創新人才項目(2014RFQXJ163)

The Science and Technology Innovation Talents Project of Harbin (2014RFQXJ163)

猜你喜歡
區域
分割區域
探尋區域創新的密碼
科學(2020年5期)2020-11-26 08:19:22
基于BM3D的復雜紋理區域圖像去噪
軟件(2020年3期)2020-04-20 01:45:18
小區域、大發展
商周刊(2018年15期)2018-07-27 01:41:20
論“戎”的活動區域
敦煌學輯刊(2018年1期)2018-07-09 05:46:42
區域發展篇
區域經濟
關于四色猜想
分區域
公司治理與技術創新:分區域比較
主站蜘蛛池模板: 成人免费网站久久久| 久久香蕉国产线| 成人午夜网址| 久久精品人人做人人爽97| 无码专区在线观看| h视频在线播放| 亚洲V日韩V无码一区二区| 永久免费av网站可以直接看的| 亚洲国产看片基地久久1024| 99九九成人免费视频精品| 日韩久草视频| 精品国产三级在线观看| 国产精女同一区二区三区久| 狠狠色噜噜狠狠狠狠奇米777| 成人在线第一页| 99热这里只有精品久久免费| 综合色亚洲| 人妻无码AⅤ中文字| 黄色网站在线观看无码| 国产综合精品一区二区| 欧美三级不卡在线观看视频| 亚洲av成人无码网站在线观看| 又黄又湿又爽的视频| AV色爱天堂网| 午夜无码一区二区三区在线app| 五月激激激综合网色播免费| 欧美精品成人一区二区在线观看| 97在线视频免费观看| 国产精品无码制服丝袜| 亚洲人成影院在线观看| 强奷白丝美女在线观看| 久久久久久久蜜桃| 国产精品蜜芽在线观看| 国产9191精品免费观看| 无码福利视频| 噜噜噜久久| 午夜丁香婷婷| 亚洲综合第一区| 亚洲黄网在线| 99精品久久精品| 最近最新中文字幕免费的一页| 久久亚洲综合伊人| 国产夜色视频| 爱爱影院18禁免费| 成人国产精品一级毛片天堂 | 人妻一本久道久久综合久久鬼色| 青青网在线国产| 中文字幕1区2区| 国产极品美女在线播放| 免费高清毛片| 韩国福利一区| 成人日韩视频| 天堂成人在线| 精品91视频| 国内精品久久久久久久久久影视| 精品无码国产自产野外拍在线| 国模粉嫩小泬视频在线观看| 国产国产人成免费视频77777| 国产精品无码久久久久AV| 日本欧美在线观看| 久久青青草原亚洲av无码| 亚洲精品视频免费| 老色鬼久久亚洲AV综合| 国产一在线| 免费毛片a| 久久久国产精品无码专区| 国产 日韩 欧美 第二页| 亚洲国产天堂久久综合226114| 亚洲另类色| 亚洲国产天堂在线观看| 欧美成a人片在线观看| 在线观看国产精品一区| 精品天海翼一区二区| 精品一区国产精品| 天堂成人在线视频| a天堂视频| 久久久噜噜噜久久中文字幕色伊伊 | 男人天堂亚洲天堂| 国产区91| 色成人亚洲| 亚洲高清国产拍精品26u| 免费人欧美成又黄又爽的视频|