毛晚堆 劉海敬 孔偌琳


摘要:將考生試卷掃描成圖像的過程中,難免會出現試卷圖像的傾斜,繼而影響后續試卷信息的識別結果的準確度以及識別精度。為提高試卷處理的工作效率,通過對試卷圖像進行傾斜校正,以節省返工時間或手動處理時間。為此本文結合具體環境,通過初次檢測與深度檢測相結合的方法,在確保時間效率的情況下提高檢測的準確度,實驗表明,該方法能快速準確測量出試卷圖像的傾斜角度。
Abstract: In the process of scanning the test paper into images, it is inevitable that the image of the test paper will be tilted, which will affect the accuracy and recognition accuracy of the subsequent information of the test paper. In order to improve the efficiency of paper processing, by tilting the paper image to save rework time or manual processing time. For this reason, in combination with the specific environment and through the combination of initial detection and depth detection, the paper improves the detection accuracy in consideration of the time efficiency. Experiments show that this method can quickly and accurately measure the tilt angle of examination paper images.
關鍵詞:傾斜校正;Hough變換;網上閱卷
Key words: tilt correction;Hough transformation;online marking
中圖分類號:TP391? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2018)35-0230-02
0? 引言
網上閱卷系統中文本圖像的自動識別與處理技術的發展越來越成熟,而對文本圖像識別的準確率和效率的要求也越來越高。在考生試卷的掃描過程中,不可避免地會出現試卷圖像的傾斜,而試卷圖像的傾斜給后續試題分割帶來困難,影響閱卷老師評閱試卷。
目前圖像傾斜檢測方法有Hough變換法、基于投影的方法、最近鄰聚類的方法、基于小波變換的方法。其中基于Hough變換的方法通過檢測圖像中直線從而估計出傾斜角,取得了很好的精度[1]。
1? Hough變換
Hough變換利用圖像空間和參數空間點-線對偶性質,將共線的點變換為相交于同一點的曲線,將直線提取問題轉化為計數問題[2]。
Hough變換不僅抗噪能力較強,而且具有較強的魯棒性,在較低的信噪比下也能得到較好的效果,但其較高的時間復雜度和空間復雜度影響了它的使用。
一些科研工作者根據具體的應用環境,提出基于Hough變換算法的改進方法以適應環境要求。邱力為等人提出基于兩點組合原理的Hough變換直線檢測算法,能夠有效克服參數空間的量化誤差,具有較高的檢測精度以及較低的內存消耗等優點,但在信噪比較高的情況下檢測精度較低[3];瞿洋等人使用了變分辨率金字塔的策略,不僅減少了算法的計算量,而且也提高了算法的抗噪能力[4];芮挺等提出采用輪廓跟蹤方法去除牌照圖像中和校正無關的所有冗余信息并采用分級檢測的策略,最大程度減少校正過程的運算量,提高算法運行速度[5];梁添才等人提出對圖像進行水平軌跡線平滑處理后再采用分級Hough變換的思想實現傾角的檢測[6]。
2? 試卷傾斜校正算法
考生試卷中存在大量的文本信息和邊框線,其中文本走向或表格線的方向則反映出整個文本圖像的傾斜角度。在本文所涉及的環境下,只需檢測出傾斜角度信息,則可對傾斜試卷進行校正處理。根據圖像數據,圖像出現倒置或90°傾斜,通過其他方法處理即可。
本文在Hough變換檢測直線原理的基礎上,結合研究環境,采用初次與深度相結合的方法進行傾角的檢測。傾斜校正方法如下:
①計數變量n的初始值為0。將標準試卷圖像兩者分別在x軸和y軸進行投影,可得到圖像分別在x軸和y軸的投影分布區間;將標準試卷圖像投影在x軸左起第一個大于閾值Rs的坐標記為x1,并將最后一個小于閾值R0坐標記為x2。將標準試卷圖像投影在y軸左起第一個大于閾值R0的坐標記為y1,并將最后一個小于閾值R0坐標記為y2。
②若計數變量n的值小于等于1,轉③,否則轉⑨;
⑦)利用傾斜校正算法計算圖像的傾斜角度,并將計數變量n的值增1,并對圖像進行旋轉處理,然后轉②;
⑧傾斜校正程序結束;
⑨將考生試卷作為特殊試卷手動處理,結束。
在待檢測區域中每隔t個長度選取一個點作為待檢測點,并將待檢測點的坐標存入數組pos中。定義兩個數組angArr和graArr,變量i初始值為1。
①如果i ④i=i+1,轉②; ⑤遍歷angArr和graArr兩個數組,找出出現次數最多的數值,若存在多個值出現次數相同,將多個值從小到大進行排序,計算相鄰兩個值之間的差距a,若a小于等于閾值m,則取這多個值的中間值為傾斜角度,否則t=t/2,轉①; ⑥結束。 3? 實驗結果與總結 為檢測算法效果,本文對1385份考生試卷進行了總體測試,在實際環境下檢測準確率在98%以上,優于目前若干個商業軟件。 本文提出的基于改進Hough變換的試卷圖像校正方法,通過初次檢測與深度檢測相結合的方法,在追求高準確度的要求下也達到節省時間的目的。實驗結果表明,該算法實現了試卷傾斜角度的檢測和校正。 參考文獻: [1]劉侃.基于分層隨機Hough變換的文本圖像傾斜檢測[J].中國體視學與圖像分析,2010,15(4):382-386. [2]謝忠紅.采摘機器人圖像處理系統中的關鍵算法研究[D].南京:南京農業大學,2013. [3]邱力為.直線參數檢測的快速哈夫變換[J].北京航空航天大學學報,2003,29(8):741-744. [4]瞿洋.Hough變換OCR圖象傾斜矯正方法[J].中國圖象圖形學報,2001,6(2):178-181. [5]芮挺.車牌識別中傾斜牌照的快速矯正算法[J].計算機工程,2004,30(13):122-123. [6]梁添才.基于Hough變換的列車客運票圖像傾斜校正[J].華南理工大學學報,2007,35(5):35-40.