



摘要:隨著多媒體技術的不斷發展,傳統的基于關鍵字匹配的圖像檢索方式已經不能滿足圖像檢索的需求,基于內容的圖像檢索方式成為研究的重點。為了實現圖像低層特征和高層語義的關聯,文中采用提取圖像的底層特征,使用支持向量機(SVM)對圖像進行分類的方法,實驗中比較了不同圖像特征對分類結果的影響。結果表明,采用多種特征綜合對圖像進行分類會取得比較好的結果。
關鍵詞:圖像檢索;圖像特征;支持向量機;圖像分類
引言
隨著數字圖像的日益增多,圖像檢索技術在不斷的向前推進。圖像檢索技術的發展經過了基于關鍵字檢索的“以字找圖”方式和基于圖像底層特征相似性比較的“以圖找圖”方式。在理想的狀況下,用戶期望根據圖像的高層語義進行檢索得到有用的圖像。在利用圖像高層語義進行檢索之前,對圖像數據庫進行語義分類是一個有效的方法,具有相同語義的圖像一般也都具有相似的視覺特征,使得將圖像按語義進行分類成為可能。圖像分類僅僅試圖將圖像歸并到某一種語義類別中,從而實現圖像語義特征的提取。
圖像分類的難點在于如何根據圖像的底層視覺特征將圖像歸并到某種有意義的類別當中。許多機器學習的方法由于可以很好的獲得圖像特征和文本描述的對應關系,被引入到了這一領域。萬華林結合圖像的顏色、紋理和邊緣特征,用SVM實現了圖像的語義分類。Boutell采用貝葉斯網絡,利用圖像的視覺特征,處理了室內室外圖像的分類問題。SIMPLIcity系統將圖像分成紋理/非紋理類別,以及照片/非照片語義類。卷積神經網絡 用在圖像分類和物體檢測中。
由于支持向量機(SVM)在優越性能,在模式識別問題中得到了廣泛的應用,本文采用SVM設計圖像分類器,將圖像歸并到某一語義類別當中,實現圖像語義特征的提取。
1 圖像底層特征的提取
目前圖像的顏色和紋理特征的提取技術比較成熟,本文采用這兩種特征來作為圖像底層特征的表示。
1.1 顏色特征
描述了圖像的顏色統計特性,提取方便,速度快,缺點是不能表達圖像的空間信息以及圖像中的目標物體。
1.1.1 HSV空間非均勻量化顏色直方圖
顏色直方圖是圖像的一種全局特征表示。每一幅圖像具有唯一的顏色直方圖,但是不同的圖像可能具有相同的顏色直方圖。由于HSV更符合人的視覺特征,這里考慮采用HSV空間顏色直方圖。在不降低檢索性能的前提下,同時節省存儲空間和計算時間,將HSV三個分量進行非等間隔量化。
本文中將H,S,V分別劃分成7份,2份,2份,按照公式,式中Qs,Qv,Q分別取2,這樣得到一個36維的特征向量。
1.1.2 RGB空間顏色矩
顏色矩是一種簡單而且有效的顏色特征,是由Stricker和Oreng提出,這種方法的數學基礎是圖像中的任何顏色分布都可以用它的矩來表示,由于圖像的信息多集中在圖像的像素顏色的低階矩上,一般只提取一階中心矩(均值),二階中心距(方差),三階中心距(斜度)作為顏色特征的表示。本文采用RGB顏色空間,對R,G,B3個顏色分量分別計算上述3階矩,得到9維的顏色矩特征。
1.2 紋理特征
紋理是描述了圖像或者圖像區域所對應景物的表面特征,與顏色特征不同,紋理特征需要在包含多個像素點的區域中進行統計計算,不是基于單個像素點的特征。本文采用灰度共生矩陣的紋理特征分析方法。
灰度共生矩陣即表示圖像灰度及空間相關的矩陣,即圖像中相距(Δx,Δy)的兩個灰度像素同時出現的聯合概率分布。若將圖像的灰度級定位L,那么共生矩陣為L*L矩陣,可表示為M(Δx,Δy)(h,k),其中位于(h,k)的元素mhk的值表示一個灰度級為h,另一個灰度級為k的兩個相距為(Δx,Δy)的像素對出現的次數。
實驗中采用反差、能量、熵和相關四個特征量來表示紋理特征。
反差(主對角線的慣性矩):
能量(角二階矩):ASM=ΣhΣk(mhk)2
熵:ENT=-ΣhΣkmhk logmhk
相關:COR=其中μx、μy和σx、σy分別為mx、my的均值和方差。
構造4個方向上的共生矩陣,對共生矩陣歸一化,取上述4個參數的均值和標準差作為紋理特征向量中的各個分量,得到一個8維的紋理特征向量。
2支持向量機的構造
支持向量機方法是建立在統計學習理論的VC維理論和結構風險最小原理基礎上的,根據有限的樣本信息在模型的復雜性和學習能力之間尋求最佳折中,以期獲得最好的推廣能力[5]。
相比起神經網絡技術,SVM使用起來簡單方便。它將待解決的問題轉化為一個二次規劃尋優問題,從而避免了局部收斂現象,理論上保證了全局最優解。
給定一組帶標記的訓練數據對(xi,yi),i=1,2,…,l,其中xi∈Rn,且yi∈{-1,1}1。SVM需要解決如下的最優解問題:
訓練向量xi被φ函數映射到高維空間。在特征空間中,分類器實現最有分類超平面的函數為:
f(x)=sign(ΣaiK(xi,xj)+b,其中K(xi,yi) =φ(x)φ(xi)為其核函數。采用不同的點積運算將產生不同的支持向量機算法,常用的支持向量機核函數有多項式核函數、高斯核函數和Sigmoid核函數。
用SVM實現圖像分類,定義所有圖像為輸入空間中的點,要從圖像中抽取圖像的特征向量作為原始空間的輸入向量,由于圖像內容的多樣性,所以圖像為非線性可分,采用線性不可分的SVM分類器。采用SVM實現圖像分類通常需要結合多個二值分類器來解決,包括一對一和一對多兩種方法。
3 圖像分類實驗
對于做實驗的圖像類別不能過于抽象,像自然風光類、季節類、某個國家或者地區類的圖像,這類圖像難于從顏色紋理特征上把握其共同點。實驗中所用的圖像庫來源于Corel圖像庫,由賓夕法尼亞大學實驗室整理用于SIMPLIcity[6]的測試圖像庫。該圖像庫包含了10個語義類別,分別是非洲人物、海灘、羅馬建筑、巴士車、恐龍、大象、花、馬、雪山、美食。每個語義類別各包含100幅圖像,圖像的大小為256*384或者384*256像素。
實驗中所選取的圖像特征為36維的HSV空間非均勻量化顏色直方圖、9維的RGB空間顏色矩以及8維的灰度共生矩陣,將它們作為支持向量機的輸入向量對圖像類進行學習,建立圖像底層特征與高層語義的關聯。訓練測試工具采用的SVM為林智仁的LIBSVM[7]庫,它提供了編譯好的可執行文件,對SVM所涉及的參數調節相對較少,提供了很多的默認參數,并且提供了交互檢驗的功能。在實驗中選取高斯核函數,參數為默認參數。
3.1實驗一
從每類圖像中抽取60幅圖像作為實驗的訓練集,剩余的40幅圖像作為測試集,得到的訓練集大小為600幅,測試集大小為400幅。 共進行5組實驗分別采用不同的特征以及特征的組合作為支持向量機的輸入向量構造分類器。
得到的實驗結果如表1所示:
為了更好的說明每一類別的分類正確率,得到采用顏色直方圖、顏色矩和灰度共生矩陣作為綜合特征時的混淆矩陣如圖1所示
由表1和圖1結果可以看出:
(1)用綜合特征作為支持向量機輸入向量的分類性能要優于采用單一特征作為輸入向量。
(2)恐龍、花這兩類由于由于背景單一,達到了很好的分類效果,由于歷史建筑、大象以及雪山這幾類圖像中的背景比較復雜,導致這幾類的分類正確率特別低,從而使總體的分類正確率不高。這幾類圖像難以從顏色紋理特征上把握其共同點,所以僅從顏色紋理底層特征上進行區分效果不好,需要選取新的圖像特征或者建立新的分類模型。
3.2實驗二
選取其中的6個語義類別與文獻中提到的分類正確率進行比較,本文采用三種特征綜合作為支持向量機的輸入向量。
從實驗結果可以看出
(1)對于背景單一的花、馬、恐龍,取得了100%的分類正確率。
(2)對于背景稍顯復雜的大象和建筑物兩類,分類正確率不高。
4 結論
本文采用多特征結合的圖像分類方法,分別采用顏色直方圖和顏色矩表征顏色特征、灰度共生矩陣表征紋理特征,采用較少的特征維數較好的表示了圖像。對基于SVM的圖像分類方法進行研究,采用libsvm實現圖像的多分類,對于背景不是很復雜的圖像取得了較為顯著的分類結果。但是對于背景復雜的圖像類別分類準確率不高,在下一步的工作中考慮選取更加合適的圖像特征來進行圖像分類。
參考文獻
[1]萬華林,Chowdhury MU.基于支持向量機的圖像語義分類[J].軟件學報,2003,14(11):1891-l899.
[2]Bouteli.M,Luo Jie-bo.Bayesian fusion of camera metadata cues in semantic scene classification[C]//Proc of IEEE Conference on Computer Vision and Pattern Recognition.2004.
[3]James Z.Wang,Jia Li,Gio Wiederhold.SIMPLIcity: Semantics- Sensitive Integrated Matching for Picture Libraries[J]. IEEE Trans. on Pattern Analysis and Machine Intelligence, 23(9):947-963, 2001.
[4]常亮,鄧小林等. 圖像理解中的卷積神經網絡[J],自動化學報,2016,9(42):1300-1312.
[5]V.Vapnik.”The nature of statistical learning theory”Springer- Verlag, New York,1995.
[6]James Z.Wang,Jia Li,Gio Wiederhold.SIMPLIcity: Semantics- Sensitive Integrated Matching for Picture Libraries[J]. IEEE Trans. on Pattern Analysis and Machine Intelligence, 23(9):947-963, 2001.
[7]http://www.csie.ntu.edu.tw/~cjlin/libsvm/
[8]劉盈盈,石躍祥. 一種基于SVMS的語義圖像分類方法[J].計算機應用研究,2008,25(2):452-454.
[9]潘崇,朱紅斌. 基于自適應特征選擇和SVM的圖像分類的研究[J].計算機應用與軟件,2010,1:244-246.
作者簡介:蘇亮(1987.6-),漢族,山東萊蕪人,碩士,工程師,研究方向:人工智能、網絡安全。