雷雯 魏星



摘 要:相關反饋技術和主動學習的提出,縮小了圖像低層特征與高層特征的語義鴻溝,進一步提高了檢索準確性。支持向量機應用在圖像檢索中,以所需圖像特征作為訓練樣本數據,通過選取合適的核函數以及相關參數設置構建分類器,對測試樣本進行分類,從而檢索出相似度更接近的圖像。本文融合了圖像顏色與紋理綜合特征,通過支持向量機學習機制構造分類器,并引入主動學習,實現圖像檢索。實驗表明,引入主動學習可提高檢索準確性。
關鍵詞: 圖像檢索;反饋;支持向量機;主動學習;分類器
中圖分類號:TP391.9 文獻標識碼:A 文章編號:2095-2163(2015)06-
Abstract: Relevance feedback technology and active learning proposed reduce the image low-level features and high-level features of the semantic gap, further improve the retrieval accuracy. Support vector machine in image retrieval, image feature desired as training data, by selecting the appropriate kernel and related parameters set to build a classifier, to classify the test samples,thereby to retrieve an image closer similarity. This article combines the image color and texture synthesis features, classifier is constructed using support vector machine learning mechanism, and by the introduction of active learning, realize image retrieval. Experimental results show that the introduction of active learning can improve the retrieval accuracy.
Key words: Image Retrieval; Feedback; SVM; Active Learning ;Classifier
0 引 言
支持向量機在解決小樣本分類問題中存在一定技術優勢,因而被應用在圖像檢索中。為了縮小高層特征與低層特征的語義鴻溝,有關反饋的算法即已應用在圖像檢索中。涉及的研究有:郭士會提出基于FSVM的相關反饋檢索算法[1],采用語義相關矩陣提高查詢準確度;歐陽軍林等提出用先驗知識的Boosting方法與SVM相結合[2],有效解決了SVM存在樣本數量少、反饋準確率低的問題;郭金旭等提出基于多類SVM相關反饋算法,檢索準確性優于傳統SVM算法[3];針對標注樣本不足,魯珂提出近鄰保留回歸算法[4],解決了過適應問題;符保龍提出基于改進布谷鳥搜索算法的相關算法,較遺傳算法、粒子群算法有較高的準確度[5]。
本實驗融合了圖像的顏色與紋理綜合特征,根據檢索結果,選擇不同數量的正負例圖像作為訓練樣本,以支持向量機學習算法構造分類器,并引入主動學習進行再反饋。實驗表明,主動學習可提高檢索準確性,能夠滿足用戶的不同需求。
1 特征提取
1.1顏色特征
顏色矩[6]于1995年由Stricker和Orengo首次提出,是一種簡單且有效的圖像顏色特征描述方法。圖像的顏色分布信息主要集中在低階矩中,因此,圖像的顏色特征可采用顏色直方圖的一階矩、二階中心矩和三階中心矩來表示。相對于顏色直方圖,該提取方法的優點是不需對顏色空間進行量化,且顏色特征維數降低。式(1)就是顏色矩的三個低階矩:
1.2 紋理特征
圖像的紋理可理解為多個奇異點的連接組成的邊界,而小波變換能夠有效檢測圖像的邊界和奇異點[7]。因此,可用于提取圖像的紋理特征。小波變換是指將信號分解為一系列的子函數,表達為一種子函數累加的形式。小波變換需要有二維小波函數和尺度函數才能應用在圖像處理中,二維小波變換往往通過可分離變量的方法由一維小波函數和尺度函數構造。尺度函數和小波函數也可以理解為一個伸縮和平移的基函數,該基函數沿著圖像的水平方向和垂直方向濾波和采樣,得到一個含帶四子圖的系數矩陣,對其中的逼近子圖不斷進行濾波與采樣,可構成多尺度的小波分解。采用小波變換表示圖像紋理特征是由每個小波分解層上能量的分布信息予以實施和呈現,即均值與標準方差。使用均值與標準方差的分量構成紋理特征向量實現紋理特征的檢索。目前,Haar小波變換,Daubechies小波變換方法等易受到圖像尺寸的限制,Dwong等人[8]提出的一種進行多分辨率分析的W變換克服了尺寸限制,可進行整幅圖像的檢索,實驗表明該方法精確、有效。為了獲得更好的檢索效果,往往采用小波變換結合其他技術的方法。為了實現簡捷品質,本實驗采用MATLAB軟件中自帶了小波函數。
2 相關算法
2.1 SVM
支持向量機是建立在統計學習理論上的分類算法,較神經網絡分類器算法,其在求解最優值時不易陷入局部最優解。通過選擇合適的懲罰系數和核函數,可獲得更優分類面。因此,在解決小樣本問題中存在獨有優勢。在訓練小樣本情況下, 不需要特定問題的先驗知識,就可以切實良好地控制學習機器的推廣能力,因此在圖像檢索中可以有效提高檢索準確性[9]。SVM在解決分類問題上往往都是低維空間不可分,因此,需要引入核函數在高維空間實現可分。核函數在一定程度上影響檢索準確性[10-11]。工作中多采用LIBSVM工具[12],常用的核函數有線性核、多項式核和RBF核,一般選擇RBF核即徑向基核函數。
2.2 SVM訓練步驟
SVM訓練步驟詳細如下:
(1)采用多特征融合的低層特征對待檢索圖像進行相似度測量;
(2)對檢索結果進行正例圖像和負例圖像的標記,得到相關圖像集和不相關圖像集;
(3)構造樣本訓練集 ,其中, 代表樣本圖像的特性向量,如式(3)所示; (3)
(4)對訓練樣本進行學習并構造分類器如式(4)所示:
(5)對于正類樣本的圖像,分別計算每幅圖像的子圖到分類面的距離,取其中最大的距離作為該圖像到分類面的距離。正類圖像的特征向量 到分類面的距離可表示為 ,即如式(5)所示:
(6)計算待檢索圖像與剩余圖像的距離,按照距離大小排序,最終返回檢索結果。
2.3 主動學習
主動學習的思想就是學習機在已知的測試樣本集中自動選擇學習樣本,具體就是在反饋過程中由算法自動選擇供用戶標記的樣本,通過用戶的檢索結果判斷用戶的檢索意圖,為用戶提供一些歧義性較大的反饋樣本[13]。在這些樣本中,標記出感興趣與不感興趣的樣本,經過如此反復操作,歧義性大的圖像就排在后面,在反饋給用戶的結果中與待檢索圖像的相關圖像就越多,更加符合了用戶的查詢需求。相似度測量方法較多,常用的有歐式距離等,文獻[14-15]采用了EMD距離,文獻[16]在此基礎上提出了相應的改進,使檢索率有了一定的提高。實驗中采用EMD-CkNN距離測量方法。
3 實驗分析
本實驗采用微軟的Corel圖像庫,包含20類的2 000張圖片,每類100張。實驗分別選取標記正負例樣本圖像數量為5、10、20、30、40、50、60、70。為了測試方便,正負例圖像數量完全一樣。同時為了測試主動學習對檢索結果的影響,采取了同樣的測試方法。抽取同一幅待檢索圖像,隨機測試8組實驗,對比效果如表1所示。
通過表1可知,選擇反饋圖像的數量越多,檢索準確率并不一定隨之增加。為了獲得更為科學的對比結果,這里采用測試100組求均值的方法,對比結果如圖1所示。
從圖1結果可以看出,在相關反饋中加入主動學習可以提高檢索準確性。通過引入主動學習,在每次檢索結果中顯示歧義較大的圖像范圍內,選擇感興趣與不感興趣的圖像作為反饋的樣本圖像集,如此即使得樣本圖像集在進行支持向量機學習中,會獲得最優分類面,從而將不同類圖像盡可能最大程度地實現分離。研究將獲得更加符合用戶意愿的檢索結果,因此解決了在大量圖像數據庫中快速準確地檢索到用戶所需圖像重點內容難題,滿足用戶的不同需求。研究可知,在實際的應用中,可通過加入主動學習來提高檢索準確性。
4 結束語
支持向量機作為一種相關反饋算法,將分類問題轉換為在線性條件下的凸二次優化問題,找到的極值點都是全局最優點[18]。主動學習的引入,運用人機協同工作縮小了語義鴻溝,檢索結果更加符合用戶的檢索意圖,同時提高了檢索準確性。
參考文獻:
[1] 郭士會,楊明,王曉芳等.基于FSRM的相關反饋圖像檢索算法[J].計算機科學,2012,39(6A):540-542.
[2] 歐陽林軍,劉建勛,曹步清.基于LBSVM機器學習的相關反饋圖像檢索[J].計算機工程與應用,2009,45(2):112-115.
[3] 郭金旭,王昱.基于多類SVM相關反饋技術的研究[J].華中師范大學學報(自然科學版),2008,42(2):354-357.
[4] 魯珂,趙繼東,丁正明等.一種基于近鄰保留的相關反饋圖像檢索算法[J].計算機科學,2012,39(1):281-284.
[5] 符保龍,張愛科.基于改進布谷鳥搜索算法的相關反饋圖像檢索[J].電視技術,2014,38(3):39-42.
[6] 肖秦琨,劉米娜,高嵩.基于顏色和紋理特征的遙感圖像檢索[J].計算機技術與發展,2013,23(4):107.
[7] ALEXANDROV A D. Adaptive filtering and indexing for image databases[J].SPIE,1995,2420:12-23.
[8] DWONG M K.W-transform method for feature-oriented multiresolution image retrieval[J]. SPIE,1999,2941:1086-1095.
[9] Vapnik V.The Nature of Statistical Learning Theory[M].New York: Springer Verlag,1995,11-14.
[10] 奉國和.SVM分類核函數及參數選擇比較[J].計算機工程與應用,2011,47(3):126-127.
[11] 汪延華,陳峻婷.核函數的選擇研究綜述[J].計算機工程與設計,2012,33(3):1181-1185.
[12] 王慧勤,雷剛.基于LIBSVM 的風速預測方法研究[J].科學技術與工程,2011,11(22):5440.
[13] 彭晏飛,尚永剛,王德建.一種新的基于SVM和主動學習的圖像檢索方法[J].計算機工程與科學,2014,36(7):1372-1376.
[14] 李展,彭進業. 溫超.基于EMD距離的多示例聚類[J].計算機科學,2011,38(7):235-238.
[15] 王宇凡,梁工謙,張淑娟.基于相似度量的模糊支持向量機算法研究[J].微電子學與計算機,2014,31(4):112-115.
[16] 李大湘,彭進業,賀靜芳.基于EMD-CkNN多示例學習算法的圖像分類[J].光電子激光,2010,21(2):301-305.
[17] 馮偉興,梁洪,王臣業.Visual C++數字圖像模式識別典型案例詳解[M].北京:機械工業出版社,2012:97.