摘要:該文提出了一種基于HSV顏色直方圖、一二三階顏色矩、Gabor小波和SIFT特征描述子的多特征融合方法,以實現防空戰爭的提前預警和及時打擊功能。在目標分類過程,針對SIFT特征描述子,該文使用最新的金子塔匹配核,通過在Caltech 101數據庫的實驗,采用SVM分類器,證明該方法在目標識別方面性能有很大的提高。
關鍵詞:目標識別;SVM;SIFT;金字塔匹配核
中圖分類號:TP18文獻標識碼:A文章編號:1009-3044(2009)36-10534-04
Enemy Target Recognition Based on Multi-Feature Fusion
MA Xiang1, PENG Jin-ye2
(1.PianZhuan Group Information Center, XianYang 712000, China; 2.Northwestern Polytechnical University, Faculty of Electronics, Xi'an 710072, China)
Abstract: This paper presents a multi-feature fusion method to solve the enemy target recognition problem. In this method we use HSV color histogram, Color Moment, gabor wavelet and SIFT. By using multi-feature fusion and pyramid kernel and testing on Caltech 101 database, the method provide better results than other methods.
Key words: target recognition; SVM; SIFT; pyramid kernel
1 概述
從海灣戰爭、科索沃戰爭到伊拉克戰爭已經表明,現代戰爭是高科技戰爭,防空、防海、防陸戰爭中,敵我目標的識別是戰爭成功與否的關鍵。在對戰情的分析中,首先要對所發現的目標進行分析,以便分清\"敵方目標\",\"不明目標\"和\"我方目標\",在此基礎上才能有效的提高我軍高科技戰斗力.
針對我軍戰時獲取的圖像,通過圖像分割,將圖像分割成不同的區域.針對各個區域提取目標的特征,通過模式分類方法確定各個區域的類型。在此基礎上,形成圖像的語義。這將是戰時判斷敵我目標的一個有效方法。
本文提出了一種基于HSV顏色直方圖、一二三階顏色矩、Gabor小波和SIFT特征描述子的多特征融合方法,以解決敵方目標識別問題.為了驗證本文提出的方法,我們主要在國際著名的Caltech 101數據庫圖像數據庫上進行效果測試。
本文其余章節組織如下:第二部分綜述采用的方法;第三部分給出了SVM分類所需的圖像特征:RGB顏色直方圖和顏色矩、Gabor小波、SIFT特征,同時給出了SIFT的金字塔核方法。第四部分在的Caltech 101數據庫圖像數據庫進行實驗,并給出了實驗結果。
2 方法綜述
本文的目地是為了實現一個簡單而實用的敵對目標識別方法.因此,使用HSV顏色直方圖、一、二、三階顏色矩、Gabor小波和SIFT組成SVM特征空間以實現分類,通過多特征融合的方法實現了敵對目標識別.敵對目標識別方法流程如下:
2.1 圖像特征的獲取
對每個訓練圖像集合中的每一個圖像,首先生成HSI顏色直方圖、一、二、三階顏色矩和Gabor小波構造第一個SVM特征子空間。然后針對SIFT構造第二個SVM特征子空間。針對這兩個SVM特征子空間,分別使用LibSVM進行訓練,獲取SVM模型信息,使用訓練好的SVM模型,多核多特征融合方式分類識別。圖1是獲取特征空間的過程,圖2是針對特征空間,多特征多核識別。
2.2 負載均衡考慮
在圖像推介過程中,需要針對訓練圖像和待分類圖像獲取RGB顏色直方圖、一、二、三階顏色矩和Gabor小波、SIFT特征,然后進行SVM訓練.在推介過程中,需要模糊化0上下文信息,使用上下文敏感SVM和CF協同工作方式進行推介.因此推介系統需要極高的運算性能和運算內存,在實際處理中通常采取分布使處理,以實現負載均衡。本文采取多個服務器分擔兩個SVM訓練、多核判斷處理、協同推介。這些服務器之間通過TCP自定義協議方式進行通訊。分布式處理的過程如圖3所示。
3 圖像特征獲取
利用圖像的HSV顏色直方圖、顏色矩、Gabor小波和SIFT特征進行目標分類,以此為基礎訓練三個SVM分類器,形成多判別分類器進行目標識別。
3.1 HSV顏色直方圖和顏色矩
提取圖像的HSV顏色直方圖和圖像的顏色矩。HSI顏色空間是直方圖最常用的顏色空間,它的三個分量分別代表色彩(Hue)、飽和度(Saturation)和強度(Intensity). HSI模型是Munseu提出的, 這個模型的建立基于兩個重要的事實: ① I分量與圖像的彩色信息無關;② H和S分量與人感受顏色的方式是緊密相聯的。這些特點使得HSI模型非常適合借助人的視覺系統來感知彩色特性。公式1為HIS與RGB轉換公式。
顏色矩是一種簡單而有效的顏色特征,是由Stricker和Oreng提出的,這種方法的數學基礎是圖像中的任何的顏色分布均可以用它的矩來表示。此外,由于顏色分布信息主要集中在低階矩中,因此,僅采用顏色的一階矩(mean)、二階矩(Variance)和三階矩(Skewness)就可以表達圖像的顏色分布。公式2為一、二、三階顏色矩計算公式。圖4原始圖像,圖5HSI顏色直方圖(16 bin),圖6顏色矩。
公式1HSI與RGB轉換公式 公式2一、二、三階顏色矩計算公式
圖4原始圖像 圖5HSI顏色直方圖(16 bin) 圖6顏色矩
3.2 Gabor小波
圖像I(Z)=I(x,y)表示圖像的灰度分布,則圖像I和Gabor小波gμ,ν的卷積為:
(3)
符號表示卷積。二維Gabor小波的核函數gμ,ν[11]定義為:
(4)
(5)
其中ωμ,kν分別定義了波向量的方向和尺度,z=(x,y),‖ ‖定義了向量范式.在本文中取尺度為4,方向為6。
3.3 SIFT特征和同維方法
SIFT是由Lowe提出的圖像局部特征描述子,在物體識別方面有很好的應用,SIFT算法具有如下特點:
1) SIFT對旋轉、尺度縮放、亮度變化保持不變性,對視角變化、仿射變換、噪聲也保持一定程度的穩定性。
2) 獨特性好,信息量豐富,適用于在海量特征數據庫中進行快速、準確的匹配。
3) 多量性,即使少數的幾個物體也可以產生大量SIFT特征向量。
4) 高速性,經優化的SIFT匹配算法甚至可以達到實時的要求。
5) 可擴展性,可以很方便的與其他形式的特征向量進行聯合。
SIFT實質是一個基于極值點位置和圖像方向直方圖統計的特征描述子。其實現步驟分為三步:1、極值點位置獲取;2、關鍵點方向分配;3、特征點描述子生成。
3.3.1 極值點獲取步驟
首先對原圖形進行高斯卷積生成尺度空間,獲取空間極值點坐標,最后通過曲率精確定位極值點。
①使用不同尺度的高斯核,生成圖像金子塔。L(x,y,σ)=G(x,y,σ)?茚I(x,y)這里(x,y)是空間坐標, σ是尺度坐標,σ決定圖像被平滑程度。其中G(x,y,σ)是尺度可變高斯函數:G(x,y,σ)=e-(x2+y2)/2σ2。
②滿足在圖像二維平面空間和DOG[19](Difference of Gauss)尺度空間中同時具有局部極值的點作為SIFT關鍵點。DOG算子定義為兩個不同尺度的高斯核的差分。D(x,y,σ)=(G(x,y,kσ)-G(x,y,σ))?茚I(x,y)-=L(x,y,kσ)-L(x,y,σ)。
為了尋找尺度空間的極值點,每一個采樣點要和它所有的相鄰點比較,看其是否比它的圖像域和尺度域的相鄰點大或者小。一般采樣點要和它處于同一尺度的8個相鄰點和上下相鄰尺度對應的9×2個點共26個點比較,以確保在尺度空間和二維圖像空間都檢測到極值點。
③上面通過擬和三維二次函數確定了關鍵點的位置和尺度(達到亞像素精度)。然而因為DOG算子會產生較強的邊緣響應,所以SIFT 算法需要舍棄低對比度的關鍵點和不穩定的邊緣響應點以增強匹配穩定性和提高抗噪聲能力。舍棄關鍵點的依據是:一個定義不好的DOG的極值在橫跨邊緣的地方有較大的主曲率,而在垂直邊緣的方向有較小的主曲率.主曲率通過一個2x2 的Hessian矩陣H求出:H=,DOG的主曲率和H的特征值成正比,令α為最大特征值,β為最小的特征值,則Tr(H)=Dxx+Dyy=α+β,Det(H)=DxxDyy-(Dxy)2。令α=λβ,則===,的值在兩個特征值相等的時候最小,隨著r的增大而增大,因此,為了檢測主曲率是否在某域值r下,只需檢測<。一般取λ=10。
3.3.2 關鍵點方向分配
首先針對圖像I(x,y),利用關鍵點鄰域像素進行梯度方向計算Ix和Ty。則(x,y)點的模值定義為:M(x,y)=,其方向定義為:θ(x,y)=tan-1(Iy(x,y)/Ix(x,y))。其中L所用的尺度為每個關鍵點各自所在的尺度。
針對圖像I(x,y)中的所有點(x,y),獲取γ鄰域,并統計γ鄰域的梯度直方圖。梯度直方圖的范圍是0~360度,將其分割為β個柱。直方圖的峰值則代表了該關鍵點處鄰域梯度的主方向,即作為該關鍵點的方向。梯度方向直方圖中,當存在另一個相當于主峰值80%能量的峰值時,則將這個方向認為是該關鍵點的輔方向。一個關鍵點可能會被指定具有多個方向(一個主方向,一個以上輔方向),這可以增強匹配的魯棒性。 一般取γ=16, β=8。通過以上幾步, 可檢測出圖像的SIFT關鍵點,每個關鍵點有三個信息:位置、所處尺度和方向,由此可以確定一個SIFT特征區域。
3.3.3 特征點描述子生成
SIFT描述子是對一個SIFT特征區域的描述,其生成步驟如下:
① 首先將坐標軸旋轉為SIFT特征區域的方向,以確保旋轉不變性。
② 接下來以關鍵點為中心取8×8的窗口。圖7左部分的中央黑點為當前關鍵點的位置,每個小格代表關鍵點鄰域所在尺度空間的一個像素,箭頭方向代表該像素的梯度方向,箭頭長度代表梯度模值,圖中藍色的圈代表高斯加權的范圍(越靠近關鍵點的像素梯度方向信息貢獻越大)。然后在每4×4的小塊上計算8個方向的梯度方向直方圖,繪制每個梯度方向的累加值,即可形成一個種子點,如圖7右部分所示。此圖中一個關鍵點由2×2共4個種子點組成,每個種子點有8個方向向量信息。這種鄰域方向性信息聯合的思想增強了算法抗噪聲的能力,同時對于含有定位誤差的特征匹配也提供了較好的容錯性。
實際計算過程中,為了增強匹配的穩健性,Lowe建議對每個關鍵點使用4×4共16個種子點來描述,這樣對于一個關鍵點就可以產生128個數據,即最終形成128維的SIFT特征向量。此時SIFT特征向量已經去除了尺度變化、旋轉等幾何變形因素的影響,再繼續將特征向量的長度歸一化,則可以進一步去除光照變化的影響。
3.3.4 SIFT的金字塔方法
原始圖形 SIFT圖像5913個特征點原圖像SIFT圖像252個特征點
圖8
SIFT形成的特征描述子特征點個數不同、無序、而且位置互異。而SVM分類器需要向量同維,因此無法直接使用SVM針對SIFT特征進行分類。
針對該問題,國外進行了很多研究。2007年Kristen提出的金字塔核匹配方法,運算簡單而且準確度較高,因此本文采取該方法解決SIFT分類問題。
該方法將特征子數據投影到不同的尺度空間,求同一尺度空間的重疊值。然后再求相鄰尺度空間重疊值的交叉值。其采用的核函數如下:K=wiNi。其核函數具體計算方法如圖9。
4 實驗結果
本文采用Caltech 101數據庫作為實驗對象,該數據庫一共用101種類數據以供識別。本文采用Libsvm作為分類器,其中訓練測試樣本共3600張圖片。圖片類型共36種,每種100張。本文采取訓練樣本和測試樣本各占50%進行測試,部分Caltech101數據庫圖片如圖10。
圖10 Calth101數據庫部分圖像
部分測試結果如表1:
表1 識別率(%)
參考文獻:
[1] 劉忠偉,章毓晉.綜合利用顏色和紋理特征的圖像檢索[J].通信學報,1999(5).
[2] 王文惠,王展,周良柱,萬建偉.基于內容的彩色圖像顏色特征的提取方法[J].計算機輔助設計與圖形學學報,2001(6).
[3] 陳兵旗,孫明.Visual C++實用圖像處理專業教程[M].北京:清華大學出版社,2004(03):132-138.
[4] 張學工.關于統計學習理論和支持向量機[J].自動化學報,2000(06):32-42.
[5] 李國正,王猛,曾華軍.支持向量機導論[M].北京:電子工業出版社,2004.
[6] 肖靚,顧嗣揚.基于SVM綜合利用顏色和紋理特征的圖像分類和檢索[J].通信和計算機,2005.