999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于雙向投影的文本圖像字符分割方法

2017-09-07 02:00:24王莉麗于印

王莉麗+于印

摘要:針對(duì)目前主流文本圖像字符分割方法面臨的問題,考慮投影法及改進(jìn)方法容易實(shí)現(xiàn)之優(yōu)點(diǎn),提出了一種行與列投影的文本圖像字符分割新方法,以通過雙向掃描分割字符。首先對(duì)文本圖像進(jìn)行行投影,接著,實(shí)施列投影操作,最后,根據(jù)投影譜圖統(tǒng)計(jì)字符內(nèi)、外間距,分割單個(gè)字符。試驗(yàn)表明,提出的方法能快速準(zhǔn)確分割文本圖像字符。

關(guān)鍵詞:文本圖像處理;字符分割;投影法

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2017)05-0074-02

傳統(tǒng)的數(shù)據(jù)主要以紙質(zhì)文件為載體,但紙張文件存在不易保存、不易共享等缺點(diǎn)。隨著信息化與數(shù)字化技術(shù)的飛速發(fā)展, 越來越多的文檔以電子格式存儲(chǔ)。電子文本具有空間占用小,易于保存等優(yōu)點(diǎn),受到了公眾廣泛的歡迎。為了充分利用以往的海量紙質(zhì)版文檔數(shù)據(jù),對(duì)其數(shù)字化成為信息化建設(shè)領(lǐng)域亟待解決的主要問題之一。

文本圖像字符分割是紙質(zhì)文檔數(shù)字化的關(guān)鍵問題之一。自上世紀(jì) 70 年代起,從圖像中自動(dòng)提取文字的技術(shù)研究逐漸開展,到了上世紀(jì)90 年代末,受益于多媒體技術(shù)日新月異發(fā)展,圖像文字獲取逐漸成為研究熱點(diǎn),許多學(xué)者在上述領(lǐng)域做了積極的研究與嘗試,提出了諸多字符分割方法[1-6]。字符分割操作一般分為兩個(gè)步驟,首先定位與檢測(cè)圖像主要信息區(qū)域,即文字區(qū)域,一般使用矩形框來標(biāo)記,原圖像被分離多個(gè)子圖像。然后分別從子圖像中提取像素(提取)。但這兩個(gè)步驟沒有嚴(yán)格的界限,某些算法在進(jìn)行字符檢測(cè)時(shí)同時(shí)字符提取的功能也得到實(shí)現(xiàn),一些算法在不進(jìn)行字符區(qū)域檢測(cè)的情況下也能夠直接實(shí)現(xiàn)提取。目前的字符分割算法有很多,大體來說,現(xiàn)有主要的字符分割方法可以被分為五類: 基于連通分析、基于灰度以及基于邊緣的方法、基于紋理的方法、基于垂直投影的方法。目前字符分割方法面臨的主要問題有:(1)分割效率較低;(2)對(duì)字符大小、語言特征要求高;(3)復(fù)雜背景適應(yīng)性差。為此,本文提出了一種新的有效文字圖像字符分割方法。

1 提出的分割方法

觀察眾多文本圖像,發(fā)現(xiàn)文本圖像一般內(nèi)容規(guī)整,多數(shù)以行與列的形式存在。基于此觀察,提出本文方法,其基本思想是:將文本圖像進(jìn)行行與列掃描投影,行投影分割出文本圖像每行;而后進(jìn)一步做列掃描與投影,得到對(duì)應(yīng)的投影譜圖,根據(jù)字符列間距完成字符分割。具體流程圖與實(shí)施步驟見圖1。

首先將輸入待分割的圖像,若為特殊圖像,則需要將其轉(zhuǎn)化為matlab所能識(shí)別的格式,如tif,bmp,jpg等;然后提取有效區(qū)域。對(duì)行與列上的像素值進(jìn)行統(tǒng)計(jì),繼而求得行與列均值,進(jìn)而統(tǒng)計(jì)像素值為0的行與列;再者,找到行/列的始末跳變點(diǎn),以區(qū)分開字符區(qū)域及非字符區(qū)域,舍去上下及左右純空白區(qū)域之后,獲得出有效區(qū)域。

基于有效區(qū)域段落分割。采用行投影方法,標(biāo)記出間隔區(qū)域;接著,分析行特征,將文本以行形式提取出來。基于文本均以段落的形式存在這一特征,根據(jù)段落內(nèi)與外行間隔有差異特性,完成分段操作。

最后實(shí)施字符分割。首先對(duì)段內(nèi)圖像做行投影,分割出段內(nèi)每行。接著,對(duì)行內(nèi)字符進(jìn)行列投影,標(biāo)記出間隔區(qū)域。為解決字符內(nèi)空隙、標(biāo)點(diǎn)符號(hào)等對(duì)字符提取造成的偏差,需要后期處理步驟,具體為比較求得的列間距與平均列間距,將兩者區(qū)分,實(shí)現(xiàn)單個(gè)字符分割。試驗(yàn)舉例見圖2。

2 結(jié)語

字符分割是文本圖像信息化的關(guān)鍵問題之一。針對(duì)該問題,本文分析了文本圖像以行列形式存在的特征,將該特性引入到傳統(tǒng)的投影法中,提出了基于行與列雙向掃描投影的文本圖像字符分割新方法,通過實(shí)驗(yàn)驗(yàn)證了所提方法的有效性。實(shí)驗(yàn)結(jié)果表明,新方法字符分割效率高,運(yùn)算速度快。

參考文獻(xiàn)

[1]李文舉,梁德群,王新年.質(zhì)量退化的車牌字符分割方法.計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào)[J].2004,16(5):697-700.

[2]王俊杰,黃心漢.一種對(duì)圖像進(jìn)行快速二值化處理的方[J]電子技術(shù)應(yīng)用,1998,24(10):16-17.

[3]M. Elad. Why simple shrinkage is till relevant for redundant representations. IEEE Transactions on Information Theory,2006,52(12): 5559-5569.

[4]胡小峰,周勇,葉慶泰.復(fù)雜背景彩色圖像中的文字分割[J].光學(xué)技術(shù),2006,32(1):141-147

[5]王勇,鄭輝,胡德文.圖像和視頻中的文字獲取技術(shù)[J].中國(guó)圖象圖報(bào),2004,9(5):532-538.

[6]Lia C L,Hui K C.Feature recognition by template matching.Computers and Graphics,2000(24):569-582.endprint

主站蜘蛛池模板: 欧美中文字幕第一页线路一| 91色爱欧美精品www| 99热这里只有免费国产精品 | 日韩在线播放中文字幕| 91青草视频| 国产91透明丝袜美腿在线| 中国国产一级毛片| 99热国产在线精品99| 福利小视频在线播放| 久久精品一品道久久精品| 国产一区二区人大臿蕉香蕉| 成人福利在线看| 亚洲中文字幕日产无码2021 | 成人在线不卡| 亚洲,国产,日韩,综合一区| 美女无遮挡被啪啪到高潮免费| 亚洲综合色婷婷| 日本妇乱子伦视频| 欧美日韩中文国产| 日韩小视频在线播放| 精品久久高清| 97综合久久| 伊人蕉久影院| 国产欧美日韩va另类在线播放| 国产SUV精品一区二区| 国产喷水视频| 亚洲日韩精品伊甸| 国产精品漂亮美女在线观看| 精品一区二区三区无码视频无码| 亚洲男人的天堂在线| 国产人前露出系列视频| 日韩一级毛一欧美一国产| 中文字幕亚洲精品2页| 在线五月婷婷| 欧美激情,国产精品| 中文字幕不卡免费高清视频| 免费看a毛片| 日韩黄色大片免费看| 国产精品午夜福利麻豆| 精品撒尿视频一区二区三区| 午夜福利在线观看入口| 无码区日韩专区免费系列| 天天综合亚洲| 四虎影视永久在线精品| 精品一區二區久久久久久久網站 | 伊人成色综合网| 中文字幕在线不卡视频| 伊人丁香五月天久久综合| 国产亚洲精品91| 欧美日韩高清| 无码精品国产dvd在线观看9久| 中文字幕日韩丝袜一区| AⅤ色综合久久天堂AV色综合| 午夜国产精品视频黄| 91啦中文字幕| 波多野结衣一级毛片| 99热国产在线精品99| 欧美19综合中文字幕| 欧美不卡二区| 中文字幕在线免费看| 91久久国产热精品免费| 亚洲国产精品无码久久一线| 国产成人禁片在线观看| 亚洲无码电影| 欧美国产在线一区| 亚洲欧美激情小说另类| 免费在线国产一区二区三区精品| 91精品久久久久久无码人妻| 高清视频一区| 91精品啪在线观看国产| 黄色网页在线播放| 婷婷色一二三区波多野衣| 久久久久免费看成人影片 | 91精品免费高清在线| 国产xxxxx免费视频| 成人综合网址| 精品人妻AV区| 2021国产v亚洲v天堂无码| 毛片a级毛片免费观看免下载| 久久精品波多野结衣| Aⅴ无码专区在线观看| AV老司机AV天堂|