張一飛
(北京工業(yè)大學(xué),北京 100124)
網(wǎng)絡(luò)閱卷中的圖像偏移校正研究
張一飛
(北京工業(yè)大學(xué),北京 100124)
網(wǎng)絡(luò)閱卷模式隨著教育信息化的發(fā)展和相關(guān)技術(shù)水平的進步,已經(jīng)成為一種非常流行的考試信息化解決方案。在網(wǎng)絡(luò)閱卷中,掃描圖像的校正是所有工作的最基礎(chǔ)一環(huán),校正算法的準(zhǔn)確性和效率直接影響整個網(wǎng)上閱卷系統(tǒng)的質(zhì)量。該文主要研究了圖像校正的幾種方法,并提出了一種基于霍夫變化的圖像偏移校正方法。
霍夫變換 圖像校正 網(wǎng)絡(luò)閱卷
具體來說,網(wǎng)絡(luò)閱卷主要指的是學(xué)生參加紙質(zhì)考試后,通過獲取圖像、圖像識別、客觀題判分、主觀題閱卷、成績匯總幾個步驟,實現(xiàn)公平、公正判分,并生成成績統(tǒng)計分析結(jié)果的過程。
在上述步驟中,圖像獲取和識別是整個網(wǎng)絡(luò)閱卷中最基礎(chǔ)也是最重要的一環(huán),因為圖像識別的結(jié)果直接影響到是否能正確獲取數(shù)據(jù),以及后續(xù)處理的效率和準(zhǔn)確率。具體來說,主要是通過掃描儀獲取試卷圖像,對原始圖像進行校正,并通過一定的識別算法獲取考生的客觀題填涂信息和主觀題答題圖像信息。
由于圖像在獲取時可能會產(chǎn)生不同程度的偏移,需要對這種偏移先進行校正,才可以進行后續(xù)的識別操作。本文主要對圖像偏移校正所需要采用的方法進行了研究,并提出了一種基于霍夫變換的偏移校正方法。
2.1 圖像的來源
本文討論的算法所針對的圖像來源為從掃描儀掃描紙質(zhì)試卷,獲取到的試卷原始圖像。掃描時采用的分辨率為150dpi,顏色模式為RGB色彩空間,顏色級別為256級灰度。
2.2 圖像的特征
由于掃描圖像的來源都是紙質(zhì)試卷,因此其內(nèi)容具有一般試卷的基本特征:圖像印刷一般為黑色字體,背景為純白色。圖像內(nèi)容為試卷提示文字(標(biāo)題、考試信息、題干等),以及各個答題區(qū)域的框線。其中,主觀題區(qū)域一般是矩形或圓角矩形區(qū)域框線,客觀題區(qū)域則由多個小題填涂區(qū)組成。
2.3 圖像偏移的原因
造成圖像偏移主要有兩個原因:(1)試卷在印刷時,由于印刷廠采取的印刷方式都是整版印刷,一版包含多張試卷,印刷部門在試卷整體剪裁時會產(chǎn)生誤差,導(dǎo)致剪裁后試卷上的內(nèi)容相對于紙張有不同程度的偏移。(2)試卷在進入掃描儀掃描時,由于無法保證試卷在被掃描時一定垂直或水平于掃描儀的掃描方向,因此掃描獲取的圖像可能存在一定角度的傾斜。
3.1 常見傾斜校正方法的研究
對于圖像的傾斜校正,常見的方法有以下幾種:
(1)投影變換法。投影變換法主要原理就是計算圖像在水平方向和垂直方向的兩個投影,對于原始圖像來說,是一個二維函數(shù),而變換投影以后,就轉(zhuǎn)化為一個一維函數(shù)。這種方法需要對每個傾斜角做原始圖像的投影變換,并分析變換后的圖像性質(zhì)。
(2)傅立葉變換法。傅立葉變換法就是對原圖上的像素點全部做傅立葉變換,如果原始圖像在時域上有較強的方向性,則其在頻域空間上,存在一個密度最大的方向,這個方向?qū)?yīng)的就是原始圖像的傾斜角度。
(3)霍夫變換法。霍夫變換主要原理是利用了直線方程的對稱性,將原始圖像上一條直線,轉(zhuǎn)化為參數(shù)平面上的一個點。通過對整個區(qū)域的變換,實現(xiàn)從原始平面到參數(shù)平面的轉(zhuǎn)換。而根據(jù)直線方程,在參數(shù)平面上直線相交的點的坐標(biāo)就是原圖像中的直線參數(shù),從而對整個區(qū)域中的直線的統(tǒng)計,就可以知道圖像的方向性。
3.2 基于霍夫變換的偏移校正
由于傅立葉變換法和投影變換在實際運用中需要的計算量過大,對于網(wǎng)絡(luò)閱卷來說無法滿足時效性要求;而霍夫變換對于圖像的處理具有非常好的魯棒性,即對圖像本身的內(nèi)容沒有過多的限制和要求,而且對于有污損和部分殘缺的圖像,仍然可以計算出傾斜角度,因此選擇霍夫變換進行傾斜校正是非常合理的。
同時,由于在霍夫變換的過程中,我們可以獲取圖像中所有直線的信息,而對于試卷圖像,其中主要存在的直線就是各個答題區(qū)域的框線。而這些框線,一般都是以矩形形式,平行于紙面存在的。在對圖像進行傾斜校正結(jié)束后,通過確定直線的方程,也同樣可以確定這些直線相對于紙面(坐標(biāo)系)的距離。因此,直線的二維特性就被轉(zhuǎn)化為特殊直線與坐標(biāo)軸的一維距離信息。通過獲取這個信息,也就獲取到了圖像的水平偏移。
3.3 校正區(qū)域的選取
對于霍夫變換來說,雖然其算法的魯棒性非常高,但是其運算效率并不能令人滿意。因為其需要對整個校正區(qū)域做霍夫變換,因此該算法的時間復(fù)雜度完全取決于校正區(qū)域的大小。所以,選取正確的校正區(qū)域?qū)τ趦A斜校正至關(guān)重要。選取的區(qū)域過大,則計算的時間則會相應(yīng)延長;選取的區(qū)域過小,則計算可能不夠準(zhǔn)確,因為試卷上一個局部的方向性特性和整體的方向性特性往往存在很大差距。
在實際應(yīng)用中,可選取試卷正面長寬各1/4的區(qū)域作為校正區(qū)域。對于該區(qū)域來說,已經(jīng)完全可以滿足識別出圖像方向性特性的要求,同時計算所需的時間在可以接受的范圍內(nèi)。
3.4 水平偏移的校正
由于掃描儀獲取的試卷圖像的最終用途是客觀題識別和主觀題切割,在具體應(yīng)用時,會事先設(shè)計一個識別/切割模板,選取一張試卷圖像作為樣卷,在樣卷上制定模板的參數(shù)。具體參數(shù)的內(nèi)容主要標(biāo)示了各個識別區(qū)域的位置,大小,也就是識別矩形的橫向和縱向坐標(biāo),以及矩形的長度和寬度信息。而這就要求試卷上的圖像相對于坐標(biāo)系的位置是固定的,這樣對于每一張考生的試卷,同樣的試卷模板才可以對應(yīng)到正確的識別區(qū)域上。所以,需要對原始圖像做水平校正。
在對校正區(qū)域做霍夫變換后,可以得到原始圖像的斜率,并進行傾斜校正;同時,利用已經(jīng)獲得的圖像中直線的信息,可以進行水平校正。
文章介紹了網(wǎng)絡(luò)閱卷中圖像偏移的主要原因和具體特征,并對圖像的傾斜校正和水平校正方法進行了研究和分析,并提出了一種基于霍夫變換的偏移校正方法。這種方法利用了霍夫變換的高精度特性,同時實現(xiàn)了圖像傾斜角度的校正和水平偏移的校正。經(jīng)過偏移校正后的圖像為后續(xù)處理打下了良好基礎(chǔ),也是文章研究的意義所在。
[1]韋凱.基于城域網(wǎng)架構(gòu)的網(wǎng)絡(luò)閱卷系統(tǒng)的分析與設(shè)計[J].中國教育信息化,2014.
[2]賈曉丹.一種新的基于Radon變換的車牌傾斜校正方法[J].計算機工程與應(yīng)用,2008.