中國(guó)民航大學(xué)電子信息工程學(xué)院 韓圣潔
一般來(lái)說(shuō),一體化攝像機(jī)是指可以自動(dòng)聚焦、鏡頭內(nèi)建的小型攝像機(jī)。外觀上,具有美觀、小巧。應(yīng)用上,其電源、視頻、控制信號(hào)均有直接插口,安裝方便。功能上可自動(dòng)聚焦,近些年,一體化攝像機(jī)在視頻會(huì)議、安防監(jiān)控、高速公路監(jiān)控等場(chǎng)合的應(yīng)用越來(lái)越廣泛。
自動(dòng)聚焦技術(shù)的發(fā)展對(duì)一體化攝像機(jī)的廣泛應(yīng)用也起著非常重要的作用。傳統(tǒng)的聚焦方法基本屬于測(cè)距法,利用超聲波或者紅外線測(cè)量目標(biāo)與攝像機(jī)之間的距離從而調(diào)整焦距以實(shí)現(xiàn)自動(dòng)聚焦。由于要有發(fā)射和接收裝置,提高了成本,并且會(huì)使得攝像機(jī)顯得笨重。
隨著數(shù)字圖像處理理論的不斷成熟,越來(lái)越多的自動(dòng)聚焦算法是基于圖像處理理論的。數(shù)字圖像處理理論認(rèn)為,信號(hào)或圖像的大部分能量集中在幅度譜的低頻段和中頻段,但是圖像細(xì)節(jié)的豐富度和輪廓的銳度取決于圖像的高頻成分。因此,各種檢驗(yàn)圖像邊緣信息或計(jì)算圖像高頻分量的自動(dòng)聚焦算法應(yīng)運(yùn)而生。一幀圖像中的高頻成分值被稱(chēng)為清晰度評(píng)價(jià)函數(shù),自動(dòng)聚焦的過(guò)程就是求取清晰度評(píng)價(jià)函數(shù)最大值的過(guò)程。當(dāng)圖像清晰時(shí),圖像細(xì)節(jié)豐富,在空域表現(xiàn)為相鄰像素的特征值,如灰度、顏色等變化較大,在頻域表現(xiàn)為頻譜的高頻分量多。可以評(píng)判圖像中高頻分量的大小,并判斷對(duì)焦正確與否。
確定合適的清晰度評(píng)價(jià)函數(shù)是自動(dòng)調(diào)焦的核心問(wèn)題。理想的自動(dòng)調(diào)焦評(píng)價(jià)函數(shù)必須具備以下幾個(gè)特征[1]:
a.無(wú)偏性。計(jì)算出來(lái)的曲線要和圖像的清晰度變化事實(shí)相吻合;
b.單峰性。在成像系統(tǒng)的正焦位置取得單一的極值,不能出現(xiàn)其他局部極值;
c.靈敏度。是指對(duì)不同程度的離焦圖片,清晰度評(píng)價(jià)值要求有一定的差別;
d.具有足夠的信噪比。在一定的噪聲干擾條件下,保證系統(tǒng)正確地檢測(cè)到離焦信號(hào),完成自動(dòng)調(diào)焦;
e.高效性。計(jì)算能夠滿足實(shí)時(shí)性要求,保證迅速完成自動(dòng)調(diào)焦過(guò)程。
圖1是圖像高頻成分含量與聚焦鏡頭位置之間的關(guān)系。

圖1 圖像高頻成分含量與鏡頭位置的關(guān)系
圖像清晰度評(píng)價(jià)函數(shù)在基于圖像處理的自動(dòng)調(diào)焦技術(shù)中起著關(guān)鍵的作用。圖像清晰度識(shí)別技術(shù)近年來(lái)已引起國(guó)內(nèi)外學(xué)者的重視,其中最流行的是時(shí)域?qū)Ρ榷仍u(píng)價(jià)函數(shù),常用的有Brenner函數(shù)、Tenengrad函數(shù)、Robert函數(shù)、Laplace函數(shù)、方差函數(shù)和平方梯度等[2][3][4];還有頻域的頻譜評(píng)價(jià)函數(shù)[5];小波變換評(píng)價(jià)函數(shù)[6];基于DCT變換的評(píng)價(jià)函數(shù)[7];神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)函數(shù)[8]。其中頻域類(lèi)、統(tǒng)計(jì)學(xué)類(lèi)等調(diào)焦函數(shù)由于在調(diào)焦過(guò)程中對(duì)環(huán)境的穩(wěn)定性要求較高,并且其調(diào)焦曲線非常不理想,大多數(shù)都不能正確的表達(dá)焦點(diǎn)的位置,同時(shí)考慮到聚焦速度和準(zhǔn)確性的要求,因此沒(méi)有列入,我們選擇常用的時(shí)域?qū)Ρ榷仍u(píng)價(jià)函數(shù)進(jìn)行分析。
Brenner函數(shù),是最簡(jiǎn)單的與梯度有關(guān)的評(píng)價(jià)函數(shù)[9][10][11],它只是計(jì)算相差兩個(gè)單位的兩個(gè)像素的灰度差,該函數(shù)的優(yōu)點(diǎn)是具有較高的靈敏度且計(jì)算量較小,其表達(dá)式為:

式中,I(x,y)表示圖像中第x行第y列像素的灰度值。當(dāng)調(diào)焦評(píng)價(jià)函數(shù)F(I)數(shù)值最大時(shí),圖像最清晰。
Robert梯度評(píng)價(jià)函數(shù),是在灰度差分絕對(duì)值之和算法基礎(chǔ)上考慮I(x,y)和I(x+1,y+1),灰度差的像元位置關(guān)系后,采用的一種評(píng)價(jià)函數(shù),其表達(dá)式如下:

表1 光學(xué)系統(tǒng)參照表

式中I(x,y)表示圖像中第x行第y列像素的灰度值。
方差函數(shù),清晰聚焦的圖像應(yīng)有比模糊的圖像具有更大的灰度級(jí)差異,所以方差函數(shù)也可以作為一個(gè)對(duì)焦清晰的評(píng)價(jià)標(biāo)準(zhǔn)[9][12]。方差函數(shù)定義為:

式中μ為平均灰度級(jí),

I(x,y)表示圖像中第x行第y列像素的灰度值。
平方梯度函數(shù),它用相鄰點(diǎn)的差分計(jì)算一個(gè)點(diǎn)的梯度值[12],其算法如下:

其中I(x,y)為一幅圖像在點(diǎn)(x,y)的灰度值。
Tenengrad函數(shù),它使用Sobel算子來(lái)算圖像在水平方向和垂直方向的梯度,為了使圖像邊緣的梯度最大,對(duì)梯度進(jìn)行平方運(yùn)算,其表達(dá)式如下所示:

Laplace函數(shù),使用Laplace算子和圖像進(jìn)行卷積得到圖像的二階微分,其微分平方和作為最后評(píng)價(jià)結(jié)果,其表達(dá)式如下:

為了便于比較這六種算法的性能和特點(diǎn),按照清晰度評(píng)價(jià)函數(shù)應(yīng)具備的特性,我們從三個(gè)角度對(duì)這六種清晰度評(píng)價(jià)函數(shù)的性能進(jìn)行分析。本文采用小龍電器公司自主研制生產(chǎn)的一體化攝像機(jī)SMC-480,其光學(xué)系統(tǒng)參數(shù)表如表1所示。

圖2 實(shí)際調(diào)焦過(guò)程采集到的12張圖像序列

圖3 不同程度離焦圖像各函數(shù)歸一化后的清晰度評(píng)價(jià)值

圖4 不同程度離焦圖像各函數(shù)的敏度測(cè)試
本文為研究清晰度評(píng)價(jià)函數(shù),其數(shù)據(jù)源都是針對(duì)同一組圖像進(jìn)行處理,同時(shí)該組圖像是對(duì)同一平面目標(biāo),通過(guò)控制一體化攝像機(jī)調(diào)焦鏡頭的前后縱向位置來(lái)實(shí)現(xiàn)圖像的調(diào)焦,前后縱向移動(dòng)的步進(jìn)間隔距離為0.004mm。在聚焦點(diǎn)位置前后分別采集24個(gè)欠焦和24個(gè)過(guò)焦圖像。加上聚焦良好圖像,共得到50幅圖像。采集的圖像大小為640 pixel×480 pixel。本文的數(shù)據(jù)分析是以采集到的圖像數(shù)據(jù)為依據(jù),并將圖像序號(hào)按由最遠(yuǎn)的欠焦?fàn)顟B(tài)經(jīng)過(guò)聚焦?fàn)顟B(tài)后,再到過(guò)焦?fàn)顟B(tài)編排,共采集了50張圖片,如圖2給出了其中的12幅示意圖。
為了便于比較各種算法的性能和特點(diǎn),本文將上述六種算法的仿真結(jié)果描繪出來(lái),如圖3所示。它的縱坐標(biāo)表示各種算法的歸一化圖像清晰度評(píng)價(jià)值,橫坐標(biāo)表示不同程度的離焦圖片的序號(hào),共50張。圖4是對(duì)圖3函數(shù)極值的局部放大。
從圖3和圖4中可以得出如下結(jié)論:1)對(duì)圖像的單峰性來(lái)說(shuō),Brenner函數(shù)、Tenengrad函數(shù)、Robert函數(shù)、Laplace函數(shù)和平方梯度等能得到比較一致的結(jié)果,并且只有一個(gè)極值點(diǎn),具有單峰性,符合要求,而方差函數(shù)的極值點(diǎn)不夠突出,容易產(chǎn)生誤調(diào)焦,因此不能使用。2)從圖像的無(wú)偏性來(lái)說(shuō),Brenner函數(shù)、Tenengrad函數(shù)、Robert函數(shù)、Laplace函數(shù)和平方梯度等的清晰度評(píng)價(jià)值都隨著圖像的離焦或者變焦程度變化而變化,都在第25幅圖像位置取得最大值,這和肉眼看到的事實(shí)是相符合的。3)從圖像的靈敏度角度來(lái)看,Laplace函數(shù)和Brenner函數(shù)的峰頂寬度相對(duì)較窄,相對(duì)而言,Laplace函數(shù)更為尖銳,靈敏度高,因此適合于小范圍精確調(diào)焦。也就是說(shuō),對(duì)微小焦距的改變更為敏感,性能上更加優(yōu)良。Tenengrad函數(shù)、Robert函數(shù)和平方梯度的靈敏度居中,在焦點(diǎn)附近具有比較高的靈敏度,同時(shí)也有一定的調(diào)焦范圍,適于中等范圍的自動(dòng)調(diào)焦。

圖5 標(biāo)準(zhǔn)圖像和模糊加噪圖像對(duì)比

圖6 圖像清晰度判別函數(shù)比較

圖7 模擬實(shí)驗(yàn)拍攝到的圖片示意圖

圖8 圖像清晰度判別函數(shù)比較
我們對(duì)標(biāo)準(zhǔn)圖像加入噪聲,根據(jù)模糊成像原理,可以用高斯函數(shù)對(duì)標(biāo)準(zhǔn)圖像進(jìn)行處理。高斯模糊的基本思路是根據(jù)二維正態(tài)分布公式生成一個(gè)高斯矩陣,求新圖像中的每一點(diǎn)時(shí),將高斯矩陣的中心對(duì)準(zhǔn)舊圖像的這一點(diǎn),并將所有點(diǎn)根據(jù)高斯矩陣上對(duì)應(yīng)的點(diǎn)加權(quán)平均。二維正態(tài)分布公式如下:

u,v分別為水平、豎直距離。高斯模糊的標(biāo)準(zhǔn)差σ,表示模糊的延伸距離,它的缺省值一般設(shè)為1。當(dāng)時(shí),高斯矩陣上對(duì)應(yīng)的權(quán)值已經(jīng)小得可以忽略,因此可以只計(jì)算一個(gè)大小為的矩陣。通過(guò)設(shè)置不同的模糊半徑(radius)參數(shù)即需要移位的像素?cái)?shù),達(dá)到不同程度的高斯模糊效果。圖像數(shù)據(jù)源仍是圖二所示中采集到的圖像,現(xiàn)在我們對(duì)標(biāo)準(zhǔn)圖像分別進(jìn)行1×1-6×6半徑的高斯模糊,同時(shí)添加方差為20的高斯噪聲,得到6幅圖像,圖5給出了其中一幅聚焦清晰和一幅清晰圖像的加噪圖像。
實(shí)驗(yàn)結(jié)果如圖6所示,縱坐標(biāo)是每個(gè)清晰度評(píng)價(jià)函數(shù)的歸一化值,橫坐標(biāo)是受不同噪聲影響的6幅不同圖像,從圖中可以看出,Laplace函數(shù)和Brenner函數(shù)在峰值附近變化明顯,在一定的噪聲干擾條件下,能識(shí)別出噪聲影響的程度,該函數(shù)性能靈敏度高,具有足夠的信噪比,其聚焦分辨力和抗噪性能明顯優(yōu)于其他方法。而Tenengrad函數(shù)、Robert函數(shù)和平方梯度的信噪比居中,方差函數(shù)的抗干擾性能則最差。
上述中本文對(duì)清晰度評(píng)價(jià)函數(shù)的性能和特點(diǎn)進(jìn)行了分析,不過(guò)為了進(jìn)一步驗(yàn)證Laplace函數(shù)、Brenner函數(shù)、Tenengrad函數(shù)、Robert函數(shù)和平方梯度函數(shù)的性能,本文采集了另外圖像進(jìn)行驗(yàn)證。通過(guò)控制一體化攝像機(jī)調(diào)焦鏡頭的前后縱向位置來(lái)實(shí)現(xiàn)圖像的調(diào)焦,前后縱向移動(dòng)的步進(jìn)間隔距離為0.008mm。在聚焦點(diǎn)位置前后分別采集14個(gè)欠焦和14個(gè)過(guò)焦圖像。加上聚焦良好圖像,即第15幅,共得到29幅圖像。采集的圖像大小為630 pixel×490 pixel。
通過(guò)matlab仿真,本文得到如下結(jié)論,如圖8所示。
在圖7中,Laplace函數(shù)、Brenner函數(shù)、Tenengrad函數(shù)、Robert函數(shù)和平方梯度函數(shù)的歸一化清晰度評(píng)價(jià)函數(shù)值的最大值都在圖像序號(hào)為15的位置,也剛好是最佳聚焦圖像。這和實(shí)際圖像采集中是相對(duì)應(yīng)的。同時(shí),就Laplace函數(shù)和Brenner函數(shù)相比較而言,他們都滿足單峰性,不過(guò)Laplace函數(shù)更為尖銳,靈敏度高。Tenengrad函數(shù)、Robert函數(shù)和平方梯度和圖3及圖4的結(jié)論相一致。
清晰度評(píng)價(jià)函數(shù)是數(shù)字圖象處理的一個(gè)重要內(nèi)容之一,對(duì)于實(shí)現(xiàn)一體化攝像機(jī)自動(dòng)對(duì)焦具有重要的意義。本文在小龍電器公司生產(chǎn)的一體化攝像機(jī)SMC-480研究的基礎(chǔ)上,針對(duì)目前常用的清晰度評(píng)價(jià)函數(shù)的實(shí)用性能加以評(píng)價(jià),對(duì)比實(shí)驗(yàn)證明,Laplace函數(shù)和Brenner函數(shù)的峰頂寬度相對(duì)較窄,靈敏度高,因此適合于小范圍精確調(diào)焦。Tenengrad函數(shù)、Robert函數(shù)和平方梯度的靈敏度居中,在焦點(diǎn)附近具有比較高的靈敏度,同時(shí)也有一定的調(diào)焦范圍,適于中等范圍的自動(dòng)調(diào)焦。
[1]屈玉福.視覺(jué)瞄準(zhǔn)測(cè)頭的研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2001:20-24.
[2]沈庭芳,方子文.數(shù)字圖像處理及模式識(shí)別[M].北京:北京理工大學(xué)出版社,1998.
[3]夏德深,傅德盛.現(xiàn)代圖像處理技術(shù)與應(yīng)用[M].南京:東南大學(xué)出版社,1997.
[4]Castleman K R.數(shù)字圖像處理[M].北京:電子工業(yè)出版社,1998.
[5]李奇,馮華君,徐之海,等.數(shù)字圖像清晰度評(píng)價(jià)函數(shù)研究[J].光子學(xué)報(bào),2002,31(6):736-738.
[6]謝攀,張利,康宗明,等.一種基于尺度變化的DCT自動(dòng)聚焦算法[J].清華大學(xué)學(xué)報(bào),2003,43(1):55-58.
[7]陳國(guó)金,朱妙芬,施滸立等.基于最小各向同性小波濾波的圖像清晰度識(shí)別[J].光子學(xué)報(bào),2008,37(2):395-399.
[8]陳國(guó)金,朱妙芬,施滸立.小波變換與神經(jīng)網(wǎng)絡(luò)復(fù)合的圖象清晰度識(shí)別研究[J].紅外技術(shù),2007,29(11):670-674.
[9]TTE Yeo,S H Ong,Jayasooriah and R Sinniah.Autofocusing for Tissue Microscope.Image and Vision Computing.1993,11(10):629-639.
[10]Lawrence Firestone,Kitty Cook,Kevin Culp,Neil Talsania,and Kendall,Preston,Jr.Comparison of Autofocus Methods for Automated Microscopy.1991(12):195-206.
[11]Brenner,J F,Dew,B S,Horton,J B,King,T,Neirath,P W and Sellers,W D.An Automated Microscope for Cytologic Research.1971(24):100-110.
[12]H.Harms and H.M.Aus.Compaison of Digital Focus Criteria for a TV Microscope Systeml.Cytometry.1984:236-243.