馮志昕,楊景皓,李鑫龍,周翔,王震
(中國礦業大學(北京),北京 100083)
隨著科技的迅速發展,人們對電子文檔的使用不斷增加。如何從文檔圖像中準確地提取出文本信息成為一個亟待解決的問題。近幾十年來,國內外科研工作者不斷探索、不斷開發,從最早的光學字符識別器,到如今利用手機便可提取圖像中的文字,文檔圖像識別技術已日益成熟。在文字識別的過程中,圖像本身因素和外界因素,如反光、局部遮擋、圖像污損、傾斜拍攝等,都會對文字識別的精確度帶來很大的誤差。因此,在文檔識別之前,對圖像進行預處理和傾斜校正便顯得十分重要。
灰度化處理、二值化處理、去噪處理和傾斜校正是圖像預處理操作當中一些基本的步驟。本文通過對現有的幾種常用的預處理算法進行對比實驗,得到了一套完整的圖像預處理方法。
目前絕大多數拍攝的圖像采用的顏色模式都是RGB模式,考慮到文本識別的特性,冗余顏色信息的去除一定程度上可以增加識別準確率和運算速度,為此對圖像進行灰度化,并進行后續的二值處理。常見的灰度化處理方法包括伽瑪矯正法、平均值法和加權均值法。
(1)伽瑪校正法。伽瑪校正是為了使輸出圖像的灰度值與輸入圖像的灰度值呈指數性關系,對輸入圖像計算出的灰度值進行非線性操作。伽瑪校正由以下冪律表達式定義:

其中:表示一個常量,通常取值為1,一般[0,1]為輸入輸出范圍;……