摘 要:為了提高活動形狀模型算法在圖像配準中的魯棒性,設計了兩種基于Fisher變換的局部外觀模型,并基于改進的模型提出了一種人臉圖像配準算法。新算法結合了改進的模型和傳統外觀模型,可以較好地抵抗噪聲干擾。關鍵詞:配準;活動形狀模型;代價函數
中圖法分類號:TP391.4文獻標識碼:A
文章編號:1001—3695(2007)02—0176—02
活動輪廓模型(Active Shape Models,ASMs/ASM)是由Cootes 和Taylor [1]提出的一種利用形狀先驗進行非剛體對象配準的算法。ASM建立一個對象形狀模型,并為每個標定點分別建立局部外觀模型,然后在待搜索區域中搜索與局部外觀模型最匹配的位置,同時保證候選形狀在已知形狀空間中[7]。雖然ASM 在很多視覺對象提取的應用中都非常有效,但該方法存在兩個缺陷:①傳統的ASM 使用的局部外觀模型只能反映正確邊界的外觀,要求對象邊界處的梯度值較大而對象邊界附近區域的梯度值較小,否則搜索過程很容易陷入局部極優;②大多數ASM算法都是基于灰度信息的,它沒有考慮彩色信息[6]。 有些學者將ASM擴展到彩色空間,如Tanveer[5]用一個簡單的顏色擴展ASM 進行唇的配準;A.Koschan[6]比較了一些基于不同顏色適應代價函數的ASM算法。這些方法都有一個共同之處,即分別為紅、綠、藍三種顏色分量建立了單獨的局部外觀模型,總體代價函數由這三個局部外觀模型計算結果的加權和組成,或選擇三種分量最小值的平均位置[6]。
本文利用Fisher變換對ASM算法中的局部外觀模型進行了改進,設計了兩種基于Fisher變換的局部外觀模型:基于Fisher變換的局部外觀模型(簡稱FTS)和基于Fisher變換的邊緣方向局部外觀模型(簡稱FTSEO)。由于Fisher變換可以增大對象內部和外部顏色向量之間的差異,從而優化圖像梯度,所以新算法大大提高了配準的準確性。
1 活動形狀模型
Cootes 和Taylor[7]描述了如何建立統計形狀模型。這個模型從手工標注過的訓練圖像中學習得到。首先校準訓練圖像中的對象形狀,然后計算平均形狀向量x,最后在得到的集合上應用Principal Component Analysis以得到統計形狀模型。這個形狀模型可以用式(1)來生成新的形狀。
通過從訓練圖像中每個標定點沿著輪廓法向方向采樣灰度信息來得到每個標定點附近的典型紋理特征,即局部外觀模型。在建立形狀模型和局部外觀模型之后,可以利用文獻[7]中描述的搜索算法在一幅新圖像中搜索對象。
2 局部外觀模型
由于基于原始亮度信息使局部外觀模型對光照變化敏感,所以在原始ASM和顏色擴展ASM中,局部外觀模型一般選用規格化導數外觀( Normalized Derivative Profiles,NDP) 模型 [7],或邊緣方向(Edge Orientation,EO) 模型 [10]以減少亮度變化的影響力。EO模型比NDP模型更具魯棒性且高效[10]。為了加強傳統局部外觀模型的抗干擾性,本文設計了兩種基于Fisher變換的局部外觀模型。
3 基于Fisher變換的局部外觀模型
輪廓配準的實質是找到位于對象內和對象外之間的邊界。為了加強邊界顯著性,必須要做到兩點:加強對象邊界附近的對象內顏色和對象外顏色之間的差異,即加強弱梯度邊界的梯度強度;弱化除搜索對象邊界外其他對象邊界的梯度。這樣做是為了防止對象標定點被噪聲吸引到錯誤位置。一般來說,噪聲主要來自那些具有強梯度的區域。在人臉圖像中,強梯度區域主要集中在人臉器官如眼睛、鼻子、嘴巴的邊界附近。所以如果為每個人臉器官建立單獨的搜索空間,在每個搜索空間中加強對應人臉器官邊界梯度強度,弱化其他人臉器官邊界的梯度強度,則搜索過程中被噪聲干擾的概率會大大降低。為了達到這些目標,本文使用Fisher變換[2]為每個人臉器官建立一個獨立的Fisher分類器,把從訓練集得到的各器官邊界附近顏色向量分為兩類,即對象內顏色類和對象外顏色類。這個分類器是通過最大化兩類顏色向量間的類間距,并且最小化類內距的方式建立的。
用式(4)對人臉圖像中所有像素進行Fisher變換,可得到五幅Fisher變換圖,分別對應j=1,…,5(嘴巴、臉部輪廓、眼睛、鼻子和眉毛)。從圖1可看出,Fisher變換圖上的目標顯著性明顯高于原始圖像。接下來可以計算訓練集位于標定點i處的基于Fisher變換的平均外觀特征fi和協方差Sfi,這兩個量組成標定點i的基于Fisher變換的局部外觀模型(FTS模型)。
4 基于Fisher變換的邊緣方向局部外觀模型
基于Fisher變換的邊緣方向局部外觀模型(FISEO)建立過程的前幾步與FTS模型相同。在計算得到五個最優Fisher分類向量和Fisher變換圖像后,按照文獻[10]中的方法,計算灰度圖中像素的邊緣方向
5 人臉圖像配準中代價函數的構造過程
在人臉圖像配準階段,必須計算每個標定點的最佳候選位置。要找到這個最佳位置,必須計算所有候選區域的局部外觀特征和目標標定點的局部外觀模型的Mahadobis距離,標定點i的代價函數可以通過式(6)計算。
如果選用FTS模型,則其中egi表示標定點 i處的規格化導數灰度特征與建立的規格化導數灰度模型的匹配度;efi表示標定點 i處基于Fisher變換的局部外觀特征與基于Fisher變換的局部外觀模型的匹配度。wg,wf為egi,efi對應的權值。egi,efi可通過式(7)和式(8)分別計算得到。
如果選用FTSEO模型,則egi,efi分別測量測試圖像K上像素處的EO局部外觀以及FTSEO局部外觀以及標定點i處建立的EO局部外觀模型和FTSEO局部外觀模型的匹配度。
其中c>0 是一個閾值。由于基于梯度信息的egi對噪聲(邊界)敏感,在當前標定點位置離真實輪廓很遠時,基于Fisher變換的局部外觀特征進行配準可以有效地防止噪聲的干擾(設置wg=0)。而基于Fisher變換信息的efi雖然對噪聲不敏感,但是由于Fisher變換同時也減小了類內差異,所以efi并不適合進行精確的標定點定位。所以在當前標定點位置離真實輪廓很近時,將egi項加入,以區分不同的標定點。
6 實驗和結論
從自錄數據集(測試集Ⅰ)和一個標注過的數據集 [3] (測試集Ⅱ)中選取出90幅正面人臉圖像,圖像為 640×480 BMP格式。每個人臉器官如嘴、臉輪廓、眼睛、鼻子和眉毛均被手工標注,共有58個標注點。從數據集中選取了13幅圖像來訓練形狀模型和規格化導數灰度模型,又從13幅圖像中選擇10幅用來訓練Fisher分類器,剩下77幅圖像用來測試。
表1為用不同局部外觀模型進行ASM搜索的結果比較,包括規格化導數外觀模型(NDP)、加權RGB模型(WRGB)[5]、基于FTS模型和加權RGB模型的混合搜索策略(FTS+WRGB)、邊緣方向模型(EO)、FTSEO模型、基于FTSEO模型和邊緣方向模型的混合搜索策略(FTSEO+EO)。文獻[5]中定義了如何界定Good, Adequate和Miss 。 可以看出與其他算法相比,本文算法大大提高了配準的準確性。
在本文算法中大多數的Miss結果都由于對象邊界處的對象內和對象外顏色差異不明顯而產生低效的Fisher變換圖像(如臉輪廓、眉毛和鼻子)。為了加強配準的準確度,如果被搜索的標注點屬于臉輪廓、眉毛或鼻子,就在代價函數中去掉efi項。
本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。