董屹晨,張嚴嚴,趙鵬飛
(江蘇大學 計算機科學與通信工程學院,江蘇 鎮江 212013)
隨著科技的飛速發展,各種圖像信息也在辦公、學習方面得到了廣泛的應用。我們一般會將紙質文本拍照或掃描成圖像,經過計算機處理得到相應的電子材料。然而,拍照得到的紙質文本往往會出現大量問題。例如,由于光線環境的不同,文本往往會出現大量的陰影。若重新打印該文本圖像,會使得陰影嚴重影響文本的觀感。由于手機的角度與文本的角度都存在傾斜,會導致圖像出現透視的問題。印刷紙張存在一定的質量問題,也會導致文本圖像中產生大量的噪點,文字本身也會顯得粗糙,能夠明顯看到紙張本身出現的痕跡,從而進一步影響文本圖像的觀感。由于書本較厚,書本的頁面會彎曲,導致拍攝的文本也變得扭曲。因此,在對文本圖像進行進一步處理(如光學字符識別(Optical Character Recognition, OCR))之前,需要消除文本的失真感。
在目前,針對文本出現的陰影現象的解決方法漸漸趨于成熟,市面上出現了大量軟件能夠實現自適應二值化。在背景灰度漸變情況下,各類自適應二值化的算法能夠很好地將文本前景與圖像背景分離,從而實現陰影的去除。針對圖像的出現傾斜與透視的問題,其解決方案也較為容易,利用透視變換也能很好地將文本圖像進行校正。然而,針對印刷紙張粗糙的文本圖像,部分文本掃描類軟件可能會產生誤識別的行為,將紙面的粗糙處與噪點錯誤地認作文本前景并進行銳化與增強。……