李紅麗, 馬耀鋒
(鄭州工程技術學院 機電與車輛工程學院, 鄭州 450044)
核學習是一種以核函數和統計學習理論為基礎的機器學習方法[1-2],該方法能將低維映射到高維,并能有效地避免維數災難.核學習通常包括核函數的選擇與構造、使用核函數構建分類器兩個部分[3-4].
支持向量機[5](support vector machine,SVM)的本質為核方法,在解決非線性、小樣本和高維模式識別問題中表現出了諸多優勢[6-8],然而,每一種核具有較大的差異,對應于不同的應用場合.目前,尚未出現完備的選擇核函數的理論依據,因此,選擇與設計適合給定問題核函數是核方法和SVM共同面臨的問題.當數據樣本存在多維數據不規則、含異構信息或高維空間分布不平坦等問題時,難以使用單一的核函數映射處理所有樣本[9-10].
可見光和紅外傳感器具有不同的感知特性[11-13],可見光傳感器根據物體的反射率來成像,紅外傳感器則依據物體的輻射率或溫度來成像.兩者的空間分辨率、灰度差異、邊緣、紋理以及像素間的相關性都不相同[14-16],可見光圖像具有更多的光譜信息和更高的空間分辨率.
針對上述問題,本文通過融合可見光和紅外圖像信息以得到更好的特征來提高分類精度,并提出了一種基于多傳感器特征信息融合和混合核SVM的圖像目標識別方法.首先,利用可見光和紅外圖像的互補性,分別提取同一場景可見光與紅外圖像的灰度共生矩陣[17]以及灰度直方圖統計特征[18-19],從而得到一組目標融合的特征量;然后使用主成分分析法降低特征的維度,減少計算量;最后,提出了一種混合核SVM[20-21]方法對目標特征進行分類識別.
灰度共生矩陣描述了圖像灰度對出現的概率,反映的是圖像灰度對變化幅度和偏移量等局部灰度信息.假設一副圖像有p個不同的灰度值,則圖像p×p大小的共生矩陣元素可表示為
(1)
式中:I(x,y)為像素點(x,y)處的灰度值;i和j為灰度值大小.本文使用灰度共生矩陣的4種不同特征參數來表示特征,分別為:
1) 慣性矩陣,其表達式為
(2)
該特征也稱為對比度,表示圖像亮度值的對比情況,也間接反映了圖像的紋理和清晰度.
2) 角二階矩陣,其表達式為
(3)
該特征反映了圖像紋理的粗細程度和圖像灰度值的分布情況,其值為各像素點灰度值的平方和.
3) 逆差矩陣,其表達式為
(4)
該特征反映了圖像紋理的同質性,表示的是圖像的局部平穩性.
4) 熵,其表達式為
(5)
該特征表示圖像紋理的復雜程度,熵值越大表明像素值分布越分散.
圖像的灰度直方圖刻畫了圖像灰度級的分布情況,其通過統計圖像中每種灰度值像素點的個數來表征圖像的全局特征.紅外和可見光圖像均蘊含著大量的灰度信息,也具有豐富的紋理細節信息.紅外和可見光圖像及其對應的灰度直方圖如圖1所示.從圖1中可以看出,不同傳感器獲取的圖像具有不同的分布特點,凸顯出不同的圖像特征.

圖1 紅外和可見光圖像及其對應的灰度直方圖Fig.1 Infrared and visible images and their corresponding gray histograms
為了更好地刻畫圖像的灰度直方圖統計特征,本文分別計算了圖像的均值、方差、峰度和傾斜度,即

(6)
(7)
(8)
(9)
式中:q(g)=Ng/N,g=0,1,…,L-1,為圖像的灰度統計分布;Ng為灰度值為g的像素點個數;N為圖像總像素點數.
獲取到圖像的灰度共生矩陣和灰度直方圖統計特征后,使用串行融合的方式構建特征向量.假設不同像素維度和方向的灰度共生矩陣的特征向量為X1=(x11,x12,…,x1n1),灰度直方圖統計特征向量為X2=(x21,x22,…,x2n2),則融合后的特征為X=[X1,X2],特征的總維度為n1+n2,本文取值為1 000維.

目前,由于不同核函數的非線性組合通常導致較高的時間、空間復雜度,無法滿足實時應用,因此,本文使用線性組合的方式構建核函數,基于混合核SVM的分類算法流程如圖2所示.通常核函數的線性組合又包括加權求和核、直接求和核以及加權多項式擴展核.同時考慮到具體的數據處理要求,決定了核函數的選取和使用不同的特征時,同一核函數表現出不同的性能,本文使用加權求和核構造混合核函數,其表達式為
(10)
式中:kp為核函數;mp為kp所對應的權重,各種核函數的權重總和為1.由文獻[10]可知,式(10)滿足Mercer條件,因此可以用于SVM.根據式(10)可知,通過調整權重值來獲得不同性能的混合核函數,可以更加靈活地調節混合核的學習能力,提升分類性能.

圖2 本文分類算法流程Fig.2 Flow chart of proposed classification algorithm
由于多核學習多采用基本核函數,如表1所示的直方圖交叉核函數、多項式核函數和徑向基核函數等,因此,可以將多核學習問題轉化為權重系數的求解問題.近年來,針對組合核優化的問題提出了諸多解決方法,如文獻[12]中提出了使用一種凸優化的方法——半定規劃(semi definite programming,SDP)求解該問題,SDP可以求解不同核函數的組合系數,具有較強的泛化能力;文獻[13]中提出了基于序列最小化的方法處理中等規模的優化問題;文獻[14]中使用半無限線性規劃解決較復雜的多核學習問題;文獻[15]中使用梯度下降法來解決多核學習問題,具有較高的效率和更快的收斂速度,該方法又稱為單多核學習方法.

表1 核函數及其表達式Tab.1 Kernel functions and their expressions
單多核學習的求解目標為
(11)
式中:wm為權重量;b為線性分類器的偏移值;F為懲罰因子;ξi為松弛變量;dm為權重系數;φi(x)為非線性映射核函數.將式(11)拉格朗日化后可以得到
(12)
式中:αi和βi為拉格朗日乘子;λ和ηm為權重的約束算子.對wi、b、ξi分別求導并令導數為零,可將其轉化為
(13)
(14)
式中:J(?)為優化目標;?為權重系數.式(13)對偶形式為
(15)
即
使用梯度下降法優化該問題,得到最優解α*,其中梯度求解表達式為
(16)
不斷更新dm,直至達到停止準則,終止該算法,得到最后多核分類器表達式為
(17)
用上文提出的特征提取、融合與分類方法對公共場所的人群密度進行分類,分別采集商場高峰期和平峰期的920對490×455像素的紅外與可見光圖片進行訓練及測試.其中,包括360對訓練圖片和560對測試圖片,并將人群密度分為低高兩類.本文設置各特征權重相同均為1,直方圖交叉核函數、多項式核函數和徑向基核函數的權重分別為0.3、0.4、0.3,SVM的懲罰因子值為0.1.實驗樣本具體分布情況如表2所示.

表2 采集的樣本分布Tab.2 Distribution of collected sample
為了證明不同特征對人群密度分類的有效性,分別使用灰度共生矩陣和灰度直方圖統計特征進行測試,測試結果如表3、4所示.由表3、4可以看出,在低密度人群分類時灰度共生矩陣的分類效果更優,而在對高密度人群進行分類時灰度直方圖統計特征效果更好.融合兩種特征和PCA降維后的分類效果如表5所示.根據表5可以看出,本文所提出的方法能有效提高分類精度.

表3 基于灰度共生矩陣的分類結果Tab.3 Classification results based on gray co-occurrence matrix

表4 基于灰度直方圖統計特征的分類結果Tab.4 Classification results based on statistical characteristics of gray histograms

表5 本文方法分類結果Tab.5 Classification results of proposed method
將本文算法分別與文獻[12]提出的基于小波特征的方法和文獻[19]提出的基于LBP特征的方法進行比較,結果如表6所示.從表6中可以看出,本文算法分類精度更高,提取出的特征相對較少,平均處理時間更短.不同算法對高、低密度人群的具體分類精度如圖3所示,可以看出本文算法對高密度與低密度人群均具有更優的分類精度.本文算法檢測結果如圖4所示,從圖4中可以看出,本文算法對各種密度人群都具備較高的檢測精度.

表6 本文算法與其他算法的比較結果Tab.6 Comparison results of proposed algorithm and other algorithms

圖3 不同算法分類精度比較Fig.3 Comparison in classification accuracy of different algorithms

圖4 本文算法的檢測示例Fig.4 Detection examples of proposed method
由于可見光和紅外傳感器具有不同的感知特性,本文從特征提取和分類器訓練兩個方面提升目標識別的精度.首先結合可見光和紅外傳感器的優勢,分別提取同一場景可見光與紅外圖像的灰度共生矩陣以及灰度直方圖統計特征,并使用PCA算法融合兩種特征,獲得了更具判別能力的特征和更快的檢測速度;然后提出了一種混合核SVM算法,加權融合徑向基核函數、多項式核函數和直方圖交叉核函數,以提高分類精度;最后將所提出的算法用于人群密度分類問題中,將人群密度分為高密度和低密度兩類.實驗結果表明,本文所提出的算法具有更高的分類精度以及更快的處理速度.