陳虹宇
在采用計(jì)算機(jī)視覺對駕駛員進(jìn)行駕駛行為監(jiān)測時(shí),面部定位是關(guān)鍵技術(shù)之一[1]。由于駕駛員所處的駕駛室內(nèi)環(huán)境復(fù)雜,不確定性物件較多,給圖像處理帶來了極大的困難。同時(shí)駕駛員各種姿態(tài)問題涉及頭部在三維垂直坐標(biāo)系中繞三個(gè)軸的旋轉(zhuǎn)造成的面部變化,給頭部定位增添了難度。
由于人臉類似橢圓的特性,HS Kim[2]等提出橢圓模版匹配的方法進(jìn)行橢圓擬合。常用的橢圓擬合方法有:一類是基于Hough變換的橢圓擬合方法[3]。廣義霍夫變換可以針對任意曲線的檢測,但參數(shù)空間的維數(shù)高,耗費(fèi)大量的存儲(chǔ)空間和處理器時(shí)間。另一類是基于最小二乘法的方法[4],其適用范圍廣、精度高、最為常用。但最小二乘法橢圓擬合時(shí),對于矩陣的求逆,同樣使運(yùn)算量大、魯棒性差,不適合圖像適時(shí)的跟蹤,并且包含誤差較大的所有樣本邊界點(diǎn)都參與運(yùn)算,會(huì)對橢圓擬合的最后結(jié)果產(chǎn)生偏差。
本文主要針對駕駛員特定的背景環(huán)境,提出一種基于圖像矩和橢圓擬合的駕駛員姿態(tài)定位算法。在膚色的彩色圖像快速分割的基礎(chǔ)上,結(jié)合圖像幾何矩特性擬合駕駛員面部橢圓,實(shí)現(xiàn)了駕駛員面部檢測與定位,有效的降低了駕駛室的復(fù)雜背景、駕駛員各種面部姿態(tài)、表情對人臉檢測定位的影響。
膚色是人臉的重要信息,具有相對的穩(wěn)定性并能和大多數(shù)背景物體的顏色相區(qū)別,且有不依賴于面部的細(xì)節(jié)特征,對于旋轉(zhuǎn)、表情等變化都適用的特性[6]。對于復(fù)雜環(huán)境下的應(yīng)用,利用人體膚色特征可以大幅度減小搜索空間,加速檢測結(jié)果。
設(shè) X (x,y)表示圖像I中的點(diǎn) I(x,y)在YCbCr顏色空間中X維的值。 XJ(x,y)是任一選中的代表膚色的點(diǎn) I(x,y)在 CIE XYZ顏色空間中X維的值。則有:(x,y) ∈ I, 如 果X(x,y) ∈ [ XJ(x,y)(1-k),XJ(x,y)(1+k)]則N=N+1,其中:k為計(jì)算的寬容度k∈ [ 0,1];N是記數(shù)器,計(jì)算符合條件的點(diǎn)數(shù)。重復(fù)上述計(jì)算,可得人臉表面顏色分布的直方圖,見圖1。
將駕駛室采集的圖2、圖 3,根據(jù)圖1直方圖設(shè)置自動(dòng)閾值進(jìn)行顏色分割,得到初步分割結(jié)果為圖 2a、圖 3a,提取屬于膚色的顏色部分置為白色,將非膚色部分置位黑色。如果光線變化時(shí),駕駛室頂棚上可能會(huì)出現(xiàn)一部分顏色區(qū)接近膚色,出現(xiàn)一些非連續(xù)噪聲,這種區(qū)域并不像人臉區(qū)域連通,采用形態(tài)學(xué)方法的腐蝕和膨脹運(yùn)算來去除圖像部分噪聲,去噪結(jié)果如圖2b、圖3b。

圖1 膚色彩色直方圖

圖2 駕駛員采集圖

圖3 駕駛員采集圖

圖2 a顏色分割結(jié)果

圖3 a顏色分割結(jié)果

圖2 b去噪結(jié)果

圖3 b 去噪結(jié)果
經(jīng)過膚色分割算法得到的二值圖像的白色象素區(qū)域進(jìn)行基于8連通的區(qū)域標(biāo)記,對相同連接成分的所有象素分配相同的標(biāo)號,對不同的連接成分分配不同的標(biāo)號。直觀地說在標(biāo)記前圖像是二值的,象素值是 0(黑),255(白),標(biāo)記之后每個(gè)白象素的值是所屬區(qū)域的標(biāo)號(1,2,…,L),其中 L是二值圖像中白象素區(qū)域的數(shù)目,即膚色區(qū)域的數(shù)目。
為了研究候選區(qū)域,首先需要測定區(qū)域的面積和中心。由于在二值圖像中區(qū)域的中心等同與質(zhì)心,所以計(jì)算區(qū)域的質(zhì)心就是檢測區(qū)域中心的有效方法,主要通過下面的公式得到:
對于一幅M×N的人臉圖像f(x,y)有:


對于一幅 M×N的人臉圖像 ),(yxf ,其圖像的p+ q 階矩定義為:

其中(x,y)為目標(biāo)圖像中心。U02表示橢圓各點(diǎn)(xi, yi)縱坐標(biāo) yi與中心點(diǎn)(x,y)縱坐標(biāo)y的統(tǒng)計(jì)值,可表示橢圓在垂直方向的伸展度;U20表示橢圓各點(diǎn)(xi, yi)縱坐標(biāo) x i與中心點(diǎn)(x,y)縱坐標(biāo)x的統(tǒng)計(jì)值,表示在水平方向的伸展度; U11表示圖像的傾斜度,U11>0時(shí)表示圖像向左傾斜,當(dāng) U11<0時(shí)表示圖像向右傾斜。

圖4 橢圓幾何特性
在實(shí)際人臉圖像中,不可避免地存在一些傾斜的人臉圖像。這時(shí),我們得到候選區(qū)域的傾斜度將有利于檢測和定位。傾斜角計(jì)算公式如下:


寫成極坐標(biāo)方程為

當(dāng) a = b 時(shí),此時(shí)橢圓變成了一個(gè)圓,圓作為一種特殊的橢圓,我們把它歸并在橢圓中進(jìn)行擬合。由圖像矩可知,人臉圖像的目標(biāo)區(qū)域質(zhì)心(x,y)決定了人臉外接橢圓的的平移,目標(biāo)區(qū)域定向θ決定了外接橢圓的旋轉(zhuǎn)角度θ,而水平方向和垂直方向的伸展度U02、 U20就是外接橢圓的長短軸。綜上所述,擬合人臉橢圓具體步驟如下:○1 由(2)式估算人臉的重心位置(h,k);○2 由(5)式計(jì)算此時(shí)閉合曲線部分的外接橢圓的長、短軸 a,b;○3 由(6)式計(jì)算旋轉(zhuǎn)角度θ;○4 將橢圓繞重心位置旋轉(zhuǎn)θ角度;○5 輸出橢圓 ellipse(θ,a,b,h,k)。
本文針對駕駛室特定的背景環(huán)境,采樣駕駛員頭部不同角度、姿態(tài)的圖像,以及包括嘴的多種狀態(tài)和表情的圖像上千幅。在VC6.0軟件環(huán)境下,用該方法對駕駛員面部進(jìn)行橢圓擬合,均能成功地定位跟蹤面部位置,從而調(diào)整跟蹤窗的大小和跟蹤方向等,并得到了滿意的效果。實(shí)驗(yàn)部分?jǐn)M合定位結(jié)果見圖5。橢圓擬合中偶爾出現(xiàn)孤立點(diǎn)的干擾,如視頻圖像中人臉深度旋轉(zhuǎn)角度過大,目標(biāo)自身或目標(biāo)之間的相互遮攔等原因?qū)е旅娌磕w色特征幾乎全部丟失,膚色區(qū)域小于類膚色區(qū)域,誤判其他類膚色區(qū)域?yàn)槿四樐w色區(qū)域,導(dǎo)致定位位置偏離面部,但這種少部分誤定位會(huì)被下一幀圖像的定位結(jié)果及時(shí)糾正。
本文通過膚色在YCbCr顏色空間進(jìn)行快速分割,由駕駛員面部類似橢圓的特性,結(jié)合圖像矩,擬合駕駛員面部橢圓,實(shí)現(xiàn)了駕駛員面部檢測與定位,有效的降低了駕駛室的復(fù)雜背景、駕駛員各種面部姿態(tài)、表情對人臉檢測定位的影響。實(shí)驗(yàn)表明,本算法對于人臉大小、姿態(tài)、表情的變化,具有實(shí)時(shí)性好、旋轉(zhuǎn)不變性及較強(qiáng)的適應(yīng)能力。

圖5 基于圖像矩的面部橢圓定位結(jié)果
[1] 王榮本,郭克友等.駕駛員駕駛行為監(jiān)測中的面部定位方法的研究[J].公路交通科技,2003,20(2):96
[2] HS Kim, WS Kang, JI Shin. Face detection using template matching and ellipse fitting. IEICE Trans. Inf. & Syst.,2000(11):2008-2011
[3] Nair P S,Saunders Jr A T.Hough transform based ellipse detection algorithm[J].Pattern Recognition Letters,1996,17:777-784
[4] Gander W ,Golub G H, Strebel R, et al. Least-squares fitting of circles and ellipses [ J ]. BIT Numerical Mathematics, 1994,34(4) :558 -578
[5] 陳虹宇.駕駛員面部檢測與定位方法研究,重慶大學(xué)碩士論文[D].2005
[6] 艾海舟,梁路宏,徐光佑等.基于膚色和模板的人臉檢測[J].軟件學(xué)報(bào),2001,12(12):1784-1792
[7] Rad R S,Smith K C,Benhabib B,et al.Application of moment andFourier descriptors to the accurate estimation of elliptical shapeparameters[J].Pattern Recognition Letters,1992,3:497-508