摘要:針對目前數字圖像目標識別方法中存在識別精度和實時性的問題,該文提出一種結合Gabor小波和神經網絡的圖像目標識別方法。該方法首先對圖像進行預處理、用Canny算子進行邊緣提取,然后通過神經網絡獲取最優的雙Gabor小波復合濾波器參數,再采用參數優化過的濾波器組提取目標的特征向量,最后進行目標的分類和識別。實驗表明這種方法魯棒性好、識別率高,具有較廣泛的實際應用價值。
關鍵詞:Gabor小波濾波器;神經網絡;目標識別
中圖分類號:TP391文獻標識碼:A文章編號:1009-3044(2009)36-10328-02
Image Target Recognition Based on Gabor Wavelet and Neural Network
YE Miao1, ZHOU Ai-jun1, YUAN Feng2
(1.Nanjing Normal University, Taizhou College, Taizhou 225300, China; 2.Yangzhou Branch of China Telecom, Yangzhou 225009, China)
Abstract: At present, many algorithms for object recognition have a narrow applicability and a low effectiveness. To address this issue, this paper presents an image recognition method which based on Gabor wavelet and neural network. First of all, the images are pre-processed and the edges of objects are extracted with Canny operator. And then, the combination of Gabor wavelet and neural network is used to obtain the best parameters of dual-compound Gabor wavelet filters. At last, the filter of which parameters had been optimized is applied to extract the eigenvector of the target for object classification and identification. Experiments show that this approach is robust, with high recognition rate, and thereafter with a wide range of practical application.
Key words: gabor wavelet filter; neural networks; target recognition
數字圖像目標的自動識別是目前國內外研究的熱點。它在智能交通系統,工業生產自動化和機器人視覺等諸多領域有極高的應用價值[1], 由于Gabor小波變換在分析數字圖像的局部區域頻率和方向信息方面具有優異的性能,故在計算機視覺及紋理分析中已經得到廣泛應用。而神經網絡又具有自學習性、自適應性、強魯棒性和推廣能力。因此在本文提出一種基于雙Gabor小波復合濾波器提取圖像目標特征向量。并結合神經網絡得到最優化濾波器參數值的方法,以此對圖像目標進行識別。
1 圖像預處理
本研究以車型圖像為例進行目標識別。采用低誤判率和高定位精度的Canny算子[2]進行邊緣檢測,檢測結果如圖1所示。
a) 3個典型樣本 b) 邊緣檢測后的樣本
圖1 3個典型樣本和預處理結果
2 Gabor小波濾波器
二維的Gabor小波濾波器因可以同時獲取空間和頻率域的最小不確定性而常用于信號處理,并且它和人眼視網膜神經細胞的感受非常相似,從而應用于圖像處理、理解、識別等領域,在人臉和特征識別領域[3]也已成功地應用。
二維Gabor小波濾波器定義為,其極坐標形式定義為
(1)
其中,δ為高斯函數的標準差,ω0為復平面波的空間頻率,φ=arctan(ν/μ)是方向角, r=,θ=arctan(y/x)。
本文用兩組實Gabor小波濾波器線性組合成復合濾波器ΣnwnGn(n=1,2)。可以根據圖像目標的特點初始化w1G1+w2G2的參數值,其中w為列向量,其包含復合濾波器的線性組合系數wn,G為矩陣,每一列包含復合濾波器的一個Gn。為了獲取目標的局部特征,可以假定目標的尺寸在一定的范圍之內,因此參數α,b應小于目標的尺寸,一般取這個范圍的下限。復合濾波器參數的選擇要使濾波器窗口中心位于目標頭部時的相關輸出區別于濾波器窗口中心位于目標尾部時的相關輸出,其中J是標準函數。
標準函數的選擇:假設兩類待識別目標的特征矢量分別為f1,f2,在一般情況下,為了準確地區分兩類目標,特征矢量f1、f2應當分屬于特征空間中的兩個不同的區域。最常用的衡量兩類目標特征矢量分離和聚合程度的標準函數是:
(2)
式中,式中s表示輸入圖像的平移,zi表示所有屬于類別i的s的平均值。E,F只與輸入圖像有關,對識別問題而言是固定的;由(2)式可知J與G,w有關,可以用神經網絡選擇G,w的參數以活得最大的J值。
神經網絡的結構如圖2所示。它由3層神經元(輸入,輸出和隱含層)和兩個連接權重集合(G,w)組成。輸入層神經元的數據是不同的供訓練神經網絡用的圖像像素數據。輸入層和隱含層之間的連接權重集合是矩陣G。在隱含層神經網絡計算輸入訓練圖像和矩陣G中的Gn的矢量內積。隱含層和輸出層之間的連接權重集合是ω。輸出層的結果用來計算J,再根據J值修改G,w以期得到最大的J值。
設A=GTEG, B=GTFG,由(2)式可知,J=(wTAw)/(wTBw)。為了找到使J最大的ω,可以采用以下的梯度迭代公式:
(3)
式中λw為收斂速度的步長。本文中,每一步迭代使ω改變大約1%。同理也可以得到使 最大的G。G包含α,b,ω,φ四個參數,于是有下列迭代公式:
(4)
式中,等同。
式中,λa,λb,λω,λφ是迭代步長。每一步迭代使α,b,ω,φ分別改變大約1%。G包含兩個實Gabor小波濾波器,a,b,ω,φ都是矢量;diag是取對角線上的元素。
4 實驗結果
實驗中輸入圖像是3類典型的汽車圖像(小汽車、卡車和客車),參見圖1。特征矢量由20個分量組成,即在輸入圖像與復合濾波器相關運算結果中沿其過中心的水平線上均勻取20點組成。結果選取80×60的小汽車圖像為例。
首先用(3)式迭代100次,再用(4)式迭代1次,最后重復上述過程300次。標準函數J隨迭代次數的變化情況參見圖3,從中可以看出,標準函數J隨迭代次數增加到峰值后,再下降到一個穩定值3.80,而且穩定值約為J初始值的4倍。這反應了本文算法的有效性和高效性。圖4是濾波器G的連接權重w復合濾波器參數隨迭代次數的變化情況,圖中上線對應于濾波器G1的連接權重w1,下線對應于濾波器G2的連接權重w2。
圖3 J隨迭代次數的變化曲線 圖4 隨迭代次數的變化曲線
圖5給出a,b,ω,φ隨迭代次數變化的曲線圖。a)中,最下面與橫坐標重疊的線是ω;水平線是φ,大小為π/2;最上面曲線是b,最后穩定于3.45;第二條曲線是a,穩定于2.00。b)中,最下面一條曲線ω與橫坐標重疊;b線急劇下降,最后穩定在0.25;a線穩定在1.95。
a) 濾波器G1b) 濾波器G2
圖5 a,b,ω,φ迭代次數的變化曲線
測試樣本是訓練樣本時,當使用表1的復合濾波器來提取特征時識別率為81%,當使用表2時識別率為99.5%;當測試樣本不是訓練樣本時,識別率分別為70.3%和93.4%。可見本文算法對復合濾波器參數的選擇是有效的。
以上的仿真實驗是針對同三種目標的同一方位的圖像進行的,該算法具有較強的魯棒性,取得了較好的識別結果。
參考文獻:
[1] 杜宇人,高浩軍.基于車輛輪廓定位匹配的車型識別方法[J].揚州大學學報:自然科學版,2007,10(2):62-65.
[2] WANG Li-wei, ZHANG Yan, FENG Ju-fu, et al. On the Euclidean distance of images [J].IEEE Trans. on Pattern Analysis and Machine Intelligence(S0162-8828),2005,27(8):1334-1339.
[3] 趙英男,楊靜宇.一種改進的Gabor濾波器特征抽取算法及其應用[J].系統仿真學報,2005,17(9):2236-2238.