999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于稀疏編碼和嶺回歸的文本圖像復原算法

2017-11-15 06:12:01王之毅畢篤彥凡遵林張曉瑜
計算機應用 2017年9期
關鍵詞:圖像復原文本

王之毅,畢篤彥,熊 磊,凡遵林,張曉瑜

(1.空軍工程大學 航空航天工程學院,西安 710038; 2.新疆軍區 自動化站,烏魯木齊 830042)(*通信作者電子郵箱1970696669@qq.com)

基于稀疏編碼和嶺回歸的文本圖像復原算法

王之毅1*,畢篤彥1,熊 磊1,凡遵林1,張曉瑜2

(1.空軍工程大學 航空航天工程學院,西安 710038; 2.新疆軍區 自動化站,烏魯木齊 830042)(*通信作者電子郵箱1970696669@qq.com)

為解決現有稀疏編碼方法在文本圖像復原中存在的編碼碼元表述空間有限和計算時間長的問題,提出了一種基于嶺回歸的稀疏編碼文本圖像復原方法。首先,該方法在訓練階段使用樣本圖像塊訓練出用于稀疏表達的字典,并根據樣本圖像塊和編碼碼元之間的歐氏距離對樣本圖像塊進行聚類;其次,在局部流形空間構建低質量文本圖像塊和清晰文本圖像塊之間的嶺回歸,實現對編碼碼元表述空間的局部多線性擴展和快速計算;最后,在測試階段搜索和低質量文本圖像最相近的編碼碼元,計算出近似的清晰文本圖像塊,從而避免計算耗時的低質量文本圖像塊的稀疏編碼。實驗結果表明,所提算法在恢復的圖像質量上相比現有的基于稀疏編碼的算法在峰值信噪比上高0.3~1.1 dB,耗時降低了1~2個數量級,為提高文本圖像復原質量和提升算法運算速度提供了一種解決方案。

文本圖像復原;稀疏編碼;流形空間;嶺回歸;聚類

0 引言

隨著科學技術的進步,獲得圖像和視頻的設備在日常生活中隨處可見,處理圖像和視頻的計算機和移動終端無論是在處理速度還是內存容量上都有了很大的提升,這就催生了光學字符識別(Optical Character Recognition,OCR)、自然場景文本識別、基于文本內容的圖像檢索等一批應用。在自然場景下獲取的含有文本的圖像或者視頻往往因為光照、運動、視角、獲取圖像或者視頻的設備性能等因素的影響導致圖像變形、含有噪聲、運動模糊、分辨率較低,通過掃描舊文件獲得的圖像會有老化、侵蝕、污點等退化現象,有必要對含有文本的圖像進行去除噪聲、消除模糊、超分辨率、消除變形等圖像復原處理。

近年來,文獻[1-4]試圖從不同的角度解決圖像復原的難題,取得了一定的效果。Chiang等[1]統計整理了文本圖像的邊緣信息,融合到該圖像中;該算法對邊緣清晰的圖像效果明顯。Bertalmio等[2]使用基于高階偏微分方程的數字圖像復原算法對圖像受損區域依據邊緣的特點各向異性地向區域內修復,取得了較好的復原效果,但是對含有噪聲、模糊的圖像效果不理想。Thouin等[3]針對單幅文本圖像使用非線性最大化雙峰優化技術,對舊文件中由于老化,油污等產生的退化現象能夠獲得較清晰的圖像。Donaldson等[4]也使用了該技術對文本圖像的分辨率進行增強。

文獻[5-11]是使用稀疏編碼的方法對自然圖像進行復原,該方法基于壓縮感知理論。文獻[12]提出的壓縮感知理論認為由高分辨率圖像經過下采樣得到的低分辨率圖像在一定條件下可以以高概率復原。Sen等[13]利用壓縮感知理論對低分辨率圖像進行超分辨率復原,但自然圖像紋理細節復雜,很難獲得最優的高分辨率圖像。文獻[14-15]將成對的低分辨率圖像和高分辨率圖像以一定的重疊分割成對應的圖像塊,用圖像塊稀疏表示圖像,對高分辨率輸出圖像進行重構,取得了較好的圖像質量,但是算法計算復雜度大。Yang等[16-17]僅利用高分辨率圖像塊訓練字典,降低了該類算法的時間復雜度。

Zeyde等[18]使用最優化方法通過低質量圖像塊訓練出一個稀疏字典,然后通過使低質量圖像塊在低質量圖像塊字典上的稀疏編碼和對應的清晰圖像塊在高分辨率字典上的分解有相同的系數來構建高分辨率字典。對輸入的低質量圖像塊,計算在低質量圖像塊字典上的稀疏編碼,使用該稀疏編碼在在清晰圖像塊字典上構建出近似的清晰圖像塊。該方法利用稀疏編碼計算獲得的少量碼元對整個圖像塊空間進行描述,有效降低了表征空間維數,具有較低的搜索計算復雜度;但同時存在圖像細節損失多,對測試樣本重構計算時間長的缺點。

針對上述問題,本文提出一種碼元嶺回歸方法,利用稀疏編碼獲得的碼元,在每個碼元局部流形空間使用樣本圖像塊構建嶺回歸,從而將整個空間劃分為各個碼元的嶺回歸模型,有效地提高了復原細節,并顯著降低了測試階段的時間復雜度。

1 碼元嶺回歸算法

1.1 稀疏編碼部分

這一步的目的是獲得低質量文本圖像稀疏編碼和字典Db。將每一幅樣本圖像都重疊分割成圖像塊,使用最優化方法對低質量文本圖像塊訓練出一個稀疏字典Db。然后通過使低質量文本圖像塊在該字典上的稀疏表示和對應的清晰圖像塊在相應的字典上的分解有相同的稀疏編碼來構建清晰圖像塊字典Do。訓練低質量圖像塊字典Db的過程可以用式(1)表示:

s.t.‖αk‖0≤L; ?k

(1)

構建好了低質量文本圖像塊字典后,就需要以此為基礎構建清晰文本圖像塊字典,目標是對于清晰文本圖像塊可以通過式(2)得到近似值:

(2)

這樣的清晰文本圖像塊字典需要用以下的優化過程求解來減少恢復出的圖像塊與原始清晰圖像塊之間的誤差:

(3)

Do=PoA+=PoAT(AAT)-1

(4)

1.2 局部碼元回歸

在訓練字典的過程中也將帶噪聲、模糊的圖像塊按照跟字典Db中碼元的歐氏距離進行聚類。由此,字典Db中每個碼元都對應一個帶噪聲、模糊的圖像塊簇。利用帶噪聲、模糊的圖像塊簇和與之對應的清晰圖像簇之間的關系,通過嶺回歸算法訓練出回歸。這個過程可以用式(5)表示:

(5)

這個最優化過程可以得到一個閉合形式的解:

(6)

(7)

完整形式可表示為:

(8)

(9)

1.3 重疊處理

為了消除經過運算得到的近似清晰文本圖像塊邊緣的差異,在訓練階段低質量的文本圖像塊和清晰文本都有重疊,由下式可以得到近似清晰文本圖像:

(10)

1.4 算法步驟

本文算法的步驟可以總結為:

訓練階段(可以離線完成):

步驟5 對每一個低質量文本圖像塊簇和對應的清晰文本圖像塊簇,利用嶺回歸算法,訓練出一個回歸。

測試階段:

2 本文算法實驗結果與分析

正文內容該算法的實驗環境為Inter Core 2 Duo CPU E7200 2.53 GHz,內存4 GB,WIN7 SP1 64位操作系統,仿真軟件為Matlab R2016a。

在字典訓練階段選擇100對樣本圖像,低質量文本圖像由清晰文本圖像經過動感模糊、加噪聲、斷筆處理。圖像塊的大小選取為8×8,從切割好的圖像塊中隨機抽取n(n=5 000 000)塊圖像作為訓練塊,K-SVD的迭代次數設置為60,編碼的稀疏度設置為3,字典碼元數本文中采用1 024,迭代共軛梯度算法的迭代次數設置為50。訓練低質量文本圖像塊字典時正則項的平衡因子設置為0.1,更新迭代次數設置為10。

在訓練回歸階段,利用已經訓練好的字典碼元作為中心,依據歐氏距離對低質量文本圖像塊進行聚類,每一簇的個數是2 048個,使用每一簇中的低質量文本圖像塊和與之對應的清晰文本圖像塊的關系訓練回歸。

在圖像復原質量上除了主觀評價外,還采取了峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)。峰值信噪比和均方誤差(Mean Squared Error, MSE)的關系如式(11)所示:

PSNR=10 lg(2552/MSE);

(11)

在時間復雜度上,采用了算法在測試階段的運行時間。

在本文的實驗中,測試圖像選取10幅不同字體不同字號的低質量文本圖像進行復原,字典采用相同的碼元數量,均為1 024個。將本文實驗結果跟文獻[5]、文獻[14]和文獻[18]方法在復原的圖像質量和時間復雜度上作了比較,實驗結果如表1和圖1所示。其中圖1是從10幅圖中選擇了1幅對復原結果進行了比較。

表1 各種方法對10幅低質量文本圖像復原結果的PSNR和測試階段耗時對比(1 024碼元)

圖1 幾種算法復原圖對比(1 024碼元)

從復原的文本圖像來看,文獻[5]、文獻[14]、文獻[18]的復原圖有偽影,文獻[5]復原圖還有明顯的振鈴現象。這幾種算法對噪聲的消除作用不強,字體與背景的對比不明顯。本文算法能夠有效消除噪聲、偽影,得到比較清楚的圖像;對于降質圖中出現的斷筆現象能夠較好恢復,能從主觀上較好地識別出字符的內容,存在的問題是恢復圖像字符的邊緣不夠清晰。從實驗數據來看,本文算法在恢復文本圖像的質量上更接近原圖(比其他算法高0.3~1.1 dB),在測試階段消耗的時間更短。

以上實驗是將所有算法中訓練的字典碼元數目設定為1 024,本文算法中用于訓練碼元回歸的圖像塊每一簇的個數為2 048,改變參數,會對恢復的文本圖像的質量和算法的運行時間產生影響。圖2、圖3分別顯示了字典碼元數目與恢復的文本圖像質量、測試階段的運行時間的關系。從圖2可以看出本文算法復原圖的質量隨著字典碼元數目的增加逐漸提高,增長速度則逐漸減緩,同時比文中介紹的其他幾種算法有明顯優勢。從圖3可以看出本文算法在測試階段的運行時間比其他幾種算法低一個或者兩個數量級,并且隨著字典碼元數目的增加測試階段的運行時間增加緩慢,而文中介紹的其他幾種算法的運行時間則隨著字典碼元數目的增加變化較快,主要原因是本文算法計算嶺回歸是一種線性運算,求解線性轉換的時間要遠低于求解稀疏編碼所需要的時間。

3 結語

本文針對運動模糊,含有噪聲且有斷筆的低質量文本圖像提出了一種基于碼元嶺回歸的文本圖像復原算法,通過實驗,本文算法對由于模糊,噪聲斷筆等原因退化的低質量文本圖像能夠有效復原,在時間復雜度上有了很大提升。該算法所采取的訓練文本圖像塊以字典碼元為中心進行聚類,更準確地描述了文本圖像塊之間的關系,通過對聚類的文本圖像塊訓練回歸,提升了算法的運算速度。

圖2 字典碼元數目對峰值信噪比的影響

圖3 字典碼元數目對運行時間的影響

References)

[1] CHIANG M C, BOULT T E. Imaging-consistent super-resolution [EB/OL]. [2016- 11- 08]. http://innovation.uccs.edu/~tboult/PAPERS/IUW97-Imaging-Consistent-Super-Resolution-Chiang-Boult.pdf.

[2] BERTALMIO M, SAPIRO G, CASELLES V, et al. Image inpainting [C]// Proceedings of the 27th Annual Conference on Computer Graphics and Interactive Techniques. New York: ACM, 2000: 417-424.

[3] THOUIN P D, CHANG C I. A method for restoration of low-resolution document images [J]. International Journal on Document Analysis and Recognition, 2000, 2(4): 200-210.

[4] DONALDSON K, MYERS G K. Bayesian super-resolution of text in video with a text-specific bimodal prior [J]. International Journal of Document Analysis and Recognition, 2005, 7(2): 159-167.

[5] ZORAN D, WEISS Y. From learning models of natural image patches to whole image restoration [C] // Proceedings of the 2011 International Conference on Computer Vision. Washington, DC: IEEE Computer Society, 2011: 479-486.

[6] CHANTAS G, GALATSANOS N P, MOLINA R, et al. Variational Bayesian image restoration with a product of spatially weighted total variation image priors [J]. IEEE Transactions on Image Processing, 2010, 19(2): 351-362.

[7] 王璐,胡晰遠,彭思龍.基于分塊的空間變化抖動模糊圖像的全局模糊去除[J].計算機輔助設計與圖形學學報,2012,24(6):766-774.(WANG L, HU X Y, PENG S L. Partition-based global deblurring of space-variant shake-blurred image [J]. Journal of Computer-Aided Design & Computer Graphics, 2012, 24(6): 766-774. )

[8] AHARON M, ELAD M, BRUCKSTEIN A. K-SVD: an algorithm for designing overcomplete dictionaries for sparse representation [J]. IEEE Transactions on Signal Processing, 2006, 54(11): 4311-4322.

[9] 陳柘,陳海.基于稀疏表達的圖像去噪方法研究 [J].電子設計工程,2014,22(2):168-170.(CHEN Z,CHEN H. Research on image denoising based on sparse representation [J]. Eletronic Design Engineering, 2014, 22(2): 168-170.)

[10] 姜鵬飛.基于稀疏表示與字典學習的圖像去噪算法研究[D].西安:西安電子科技大學,2011:35-48.(JIANG P F. Image denoising based on sparse representation and dictionary learning [D]. Xi’an: Xidian University, 2011: 35-48.)

[11] 浦劍,張軍平.基于詞典學習和稀疏表示的超分辨率方法[J].模式識別與人工智能,2010,23(3):335-340.(PU J, ZHANG J P. Super-resolution through dictionary learning and sparse representation [J]. Pattern Recognition and Artificial Intelligence, 2010, 23(3): 335-340.)

[12] DONOHO D L. Compressed sensing [J]. IEEE Transactions on Information Theory, 2006, 52(4): 1289-1306.

[13] SEN P, DARABI S. Compressive image super-resolution [C]// Proceedings of the 43rd Asilomar Conference on Signals, Systems and Computers. Piscataway, NJ: IEEE, 2009: 1235-1242.

[14] YANG J, WRIGHT J, HUANG T S, et al. Image super-resolution via sparse representation [J]. IEEE Transactions on Image Processing, 2010, 19(11): 2861-2873.

[15] LU J, ZHANG Q, XU Z, et al. Image super-resolution by dictionary concatenation and sparse representation with approximate L0 norm minimization [J]. Computers & Electrical Engineering, 2012, 38(5): 1336-1345.

[16] YANG S, SUN F, WANG M, et al. Novel super resolution restoration of remote sensing images based on compressive sensing and example patches-aided dictionary learning [C]// Proceedings of the 2011 International Workshop on Multi-Platform/Multi-Sensor Remote Sensing and Mapping. Piscataway, NJ: IEEE, 2011: 1-6.

[17] YANG S, WANG M, SUN Y, et al. Compressive sampling based single-image super-resolution reconstruction by dual-sparsity and non-local similarity regularizer [J]. Pattern Recognition Letters, 2012, 33(9): 1049-1059.

[18] ZEYDE R, ELAD M, PROTTER M. On single image scale-up using sparse-representations [C]// Internet Conference on Curves and Surfaces, LNCS 6920. Berlin: Springer, 2010: 711-730.

Textimagerestorationalgorithmbasedonsparsecodingandridgeregression

WANG Zhiyi1*, BI Duyan1, XIONG Lei1, FAN Zunlin1, ZHANG Xiaoyu2

(1.CollegeofAeronauticsandAstronauticsEngineering,AirForceEngineeringUniversity,Xi’anShaanxi710038,China;2.CommandAutomationStation,XinjiangMilitaryArea,UrumqiXinjiang830042,China)

To solve the problem that sparse coding in text image restoration has the shortcomings of limited expression of dictionary atoms and high computation complexity, a novel text image restoration algorithm was proposed based on sparse coding and ridge regression. Firstly, patches were used to train the dictionary for sparse representation at training stage and the sampled image were clustered based on the Euclidean distances between the sampled image patches and the dictionary atoms. Then, the ridge regressors between low-quality text image patches and clear text image patches were constructed in local manifold space to achieve the local multi-linear expansion of dictionary atoms and fast calculation. At last, the clear text image patches were directly calculated at testing stage by searching for the most similar dictionary atoms with low-quality text image patches without calculating the sparse coding of low-quality text image patches. The experimental results show that compared with the existing sparse coding algorithm, the proposed algorithm has improved Peak Signal-to-Noise Ratio (PSNR) by 0.3 to 1.1 dB and reduced computing time at one or two orders of magnitude. Therefore, this method provides a good and fast solution for text image restoration.

text image restoration; sparse coding; manifold space; ridge regression; clustering

2017- 03- 09;

2017- 03- 21。

國家自然科學基金資助項目(61372167, 61379104)。

王之毅(1982—),男,河南鄲城人,助理工程師,碩士研究生,主要研究方向:圖像處理; 畢篤彥(1962—),男,陜西扶風人,教授,博士,主要研究方向:圖像處理、模式識別; 熊磊(1976—),男,江西南昌人,副教授,博士,主要研究方向:圖像處理、計算機視覺; 凡遵林(1991—),男,湖南郴州人,博士研究生,主要研究方向:圖像處理、模式識別; 張曉瑜(1983—),男,河南鎮平人,助理工程師,碩士,主要研究方向:機器學習、人工智能。

時間 2017- 08- 09 10:36:06 。 網絡出版地址 http://kns.cnki.net/kcms/detail/51.1307.TP.20170809.1036.002.html。

1001- 9081(2017)09- 2648- 04

10.11772/j.issn.1001- 9081.2017.09.2648

TN911.73

A

This work is partially supported by the National Natural Science Foundation of China (61372167,61379104).

WANGZhiyi, born in 1982, M.S.candidate, assistant engineer. His research interests include image processing.

BIDuyan, born in 1962, Ph.D., professor. His research interests include image processing, pattern recognition.

XIONGLei, born in 1976, Ph.D., associate professor. His research interests include image processing, computer vision.

FANZunlin, born in 1991, Ph.D. candidate. His research interests include image processing, pattern recognition.

ZHANGXiaoyu, born in 1983, M. S., assistant engineer. His research interests include machine learning, artificial intelligence.

猜你喜歡
圖像復原文本
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
基于MTF的實踐九號衛星圖像復原方法研究
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
一種基于顯著性邊緣的運動模糊圖像復原方法
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
論《柳毅傳》對前代文本的繼承與轉化
人間(2015年20期)2016-01-04 12:47:10
基于MTFC的遙感圖像復原方法
模糊圖像復原的高階全變差正則化模型構建
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 国产h视频免费观看| 综合色天天| 亚洲精品国产成人7777| 天堂av综合网| 国产免费一级精品视频| 久久人妻系列无码一区| 亚洲成人一区二区| av一区二区人妻无码| 日韩乱码免费一区二区三区| 国产成人精品无码一区二| 国产美女在线免费观看| 国产1区2区在线观看| 人妻丰满熟妇啪啪| 久久99国产精品成人欧美| 99这里只有精品在线| 亚洲综合18p| a欧美在线| yjizz国产在线视频网| 国产69精品久久| 国产乱子伦一区二区=| 性网站在线观看| 欧美成人二区| 韩国自拍偷自拍亚洲精品| 黄色成年视频| 国产亚洲欧美在线专区| 91精品视频在线播放| 亚洲伊人电影| 免费无码AV片在线观看中文| 亚洲国产理论片在线播放| 九九九精品成人免费视频7| 国产成人精品一区二区三区| 丝袜久久剧情精品国产| 熟妇丰满人妻av无码区| 1769国产精品视频免费观看| 亚洲视频三级| 国产精品第页| 亚洲AV免费一区二区三区| 日本高清成本人视频一区| 久久亚洲日本不卡一区二区| 久久婷婷色综合老司机| 日韩欧美国产中文| 97成人在线视频| 国产成人亚洲无吗淙合青草| 国产成人1024精品| 国产乱子伦精品视频| 久久久久夜色精品波多野结衣| AV在线麻免费观看网站| 在线观看国产黄色| 久久久久久尹人网香蕉| 青青操视频免费观看| 国产九九精品视频| 欧美色伊人| 亚洲欧美成aⅴ人在线观看| 高清免费毛片| 久久人午夜亚洲精品无码区| 国产91九色在线播放| 国产乱子精品一区二区在线观看| 国产18在线播放| 国产乱子伦手机在线| 91精品视频在线播放| 成年女人18毛片毛片免费| 香蕉精品在线| 日韩欧美国产成人| 国产欧美在线观看一区| 日韩在线欧美在线| 国产欧美视频在线| 国产成人福利在线视老湿机| 久久国产亚洲偷自| 99re视频在线| 真实国产精品vr专区| 国产青青草视频| 成人中文字幕在线| 在线日韩一区二区| 久久五月视频| 欧美性久久久久| 亚洲精品视频免费观看| 99re在线视频观看| 中日无码在线观看| 国产一级α片| 国外欧美一区另类中文字幕| 老司国产精品视频| 国产91精品久久|