陳曉寧,楊潤豐,趙 健
(1.東莞職業技術學院電子工程系,廣東東莞 523808;2.西北大學信息科與技術學院,陜西西安 710069)
傳統的基于文本的圖像檢索技術需要人工去標注,耗時多且圖像本身存在非結構化和主觀多義性的視覺特點,具有一定的局限性。20世紀90年代,出現了基于內容的圖像檢索技術[1],對圖像的描述不受人為主觀性影響,因此基于內容的圖像檢索系統克服了基于文本的圖像檢索的不足。在基于內容的圖像檢索中,多側重于計算圖像的全局特征。然而圖像的全局特征并不能完好地描述圖像的細節部分,并且在多數情況下,人們只關注他們想要的局部區域圖像,而對關注之外的其他內容并不關心。因此,僅需要對用戶感興趣的局部區域進行特征的提取,而不必考慮圖像的全局特征。
興趣點往往位于那些含有將豐富圖像內容的地方,因此,興趣點周圍的局部區域也一定蘊含著更多的圖像內容。那么,可以將興趣點周圍區域設為感興趣區域。采用興趣點對圖像進行底層特征提取時,可以較大程度地降低圖像中那些不重要的信息,即圖像的冗余信息,這樣將大幅降低檢索過程的計算量。感興趣區域忽略了圖像的全局特征,通過感興趣區域就能夠很好地描述圖像的局部內容。
1.1.1 興趣點檢測
興趣點檢測的目的就是實現對圖像中那些含信息量比較高的點進行檢測。選擇利用興趣點來描述整幅圖像將大幅縮減對圖像特征提取的復雜度[2-3]。
由于希望興趣點周圍的局部區域能夠盡可能地近似描述整幅圖像的特征,即具有可重復性。圖1所示為一幅圖像經過縮放及旋轉情況下檢測到的興趣點,圖中得到的興趣點基本相同。

圖1 興趣點對幾何變換的穩定性
興趣點也稱為角點(Conner Point)。將二維圖像灰度變化劇烈的點或圖像邊緣曲線上具有曲率極大值的那些點定義為角點。它集中描述了圖像上很多重要的形狀信息,是能夠用來表達圖像的一個重要特征。
Harris角點檢測算法被公認為是一種比較好的方法,它是對Moravec角點檢測器的一種改進。經過對比分析,最后采用各項性能都比較優越的Harris算子對圖像進行興趣點的檢測。Harris算子是利用自相關函數來確定那些發生顯著變化的位置

式中,gx和gy分別表示X和Y兩個方向的梯度;G(σ)為高斯模板。矩陣M的特征值是自相關函數的一階曲率。
對興趣點的確定方法:當圖像的兩個特征值差別較大時,也就意味著圖像信號會沿著某方向的變化較大,這個變化較大的地方也就是邊緣;當這兩個特征值相差非常大的時候,那么圖像的信號將在兩個方向都發生較大變化,這個點即為要找的興趣點。
對圖像興趣點的數目確定,是基于Harris算子提取圖像興趣點的關鍵問題之一。一般情況下,對于不同圖像提取出的興趣點數目不同,而且一旦圖像中沒有邊緣突出的點時,就不能獲得灰度值變化大的區域,也就是說興趣點的數目就會為零,但由于要對圖像提取它的底層特征,那么就必須要找到一定數量的興趣點,然后才能確定興趣點周圍的局部區域即感興趣區域。經實驗結果證明,平均每幅圖像取50~80個興趣點較為合適。
1.1.2 感興趣區域的確定
一幅圖像感興趣區域的確定方法有多種,對感興趣區域的不同選擇將直接影響到能不能對圖像特征進行很好地描述。經過實驗對比,最后對感興趣區域的確定如下:以興趣點為中心,取其周圍41×41像素塊為一個感興趣區域,這樣有多少個興趣點就形成多少個感興趣區域,因此在一幅圖像中提取的感興趣區域就是50~80塊,進而對感興趣區域進行特征的提取。
1.2.1 基于感興趣區域的顏色特征提取
文中對顏色特征的提取方法,采用符合人眼視覺特性的HSV顏色模型。在提取局部顏色特征時,首先將圖像由RGB顏色空間轉換成HSV顏色空間。
(1)首先將圖像由RGB顏色空間轉換為符合人眼視覺特征的HSV(Hue、Saturation、Value)顏色空間,如圖2所示。HSV顏色模型采用Munsell三維空間坐標系統表示,它將彩色信息表示為3種屬性即色調、飽和度和亮度。

圖2 HSV顏色空間示意圖
(2)一幅圖像的顏色種類繁多,這樣會導致直方圖矢量的維數龐大。在維數龐大時,對計算是非常不利的,因此,首先對HSV空間進行量化。
在HSV顏色空間中,用HSV空間的顏色直方圖來描述圖像的整體顏色特征,要用此種方法必須首先將H、S、V 3個分量按照人對于顏色的感知進行非均勻的量化。最終的結果用T來表示,數學計算如(2)所示

式(2)中,「a?表示≥a的最小整數。此方法不僅適合于灰度圖像,對彩色圖像同樣也適用。按照上述量化算法,得到在HSV空間中的36維顏色直方圖。
通過式(2)計算出一系列T值,每一個T值都對應于HSV顏色空間的一個空間區域,對通過式(2)計算得到的所有T值進行歸一化處理,最后將這個歸一化后的值來表達圖像的感興趣區域的顏色特征。
1.2.2 基于感興趣區域的紋理特征提取方法
紋理特征可以用來對圖像中的空間信息進行一定程度的定量描述。一般來說紋理特征是和圖像頻譜中的高頻分量相關。其中已經被廣泛應用的一種比較理想的濾波器是Gabor濾波器,這是由于采用Gabor小波紋理特征對圖像進行描述的方法是很接近于人對形狀的視覺感受的,而且它能最大程度地減小空間域和頻域內的聯合二維不確定性。因此在對比多種算法后,文中對圖像的紋理特征進行提取時采用Gabor小波變換的方法。式(3)表示二維Gabor小波的基函數

如果I(x,y)為給定的一幅圖像,那么對圖像的Gabor小波變換可以定義為

式(4)的描述,表明對象所在的空間位置,彌補了顏色直方圖不能描述對象位置的不足。對一幅圖像紋理特征的描述可以用均值μmn和標準方差σmn,其中μmn和σmn的數學計算公式分別如式(5)和式(6)所示

文中采用的Gabor濾波器為4個尺度(S=4)和6個方向(K=6),因此,得到的特征向量可表示為此特征向量中各分量的物理意義和取值是不相同的,因此,必須先對這些特征向量進行歸一化處理。
經過歸一化后,即使物理意義和取值都不相同的分量,都具有了相同的權重。高斯歸一化方法特點就是:個別的超大或者超小的元素對整個歸一化后的元素值產生的影響較小,實驗證明采用高斯歸一化方法對特征向量進行歸一化處理是一種比較好的方法。
經過歸一化后,g的取值就是[-1,1]區間的一個數值,不僅使各個物理量有了相同的權值,還使得紋理特征變得比較簡單,方便后面的檢索應用。因此,經過歸一化后,得到了36維的紋理特征向量。
設Q是待查詢圖像;I是圖像數據庫中一幅圖像,采用式(1)計算兩幅圖像的相似性

選擇的圖像數據庫為從Corel圖像庫中下載的1000幅圖像,這些圖像共有10類,每類100幅,內容包括食物、花卉、山川、建筑、海灘、非洲土著居民、公共汽車、馬、恐龍和大象等。圖3所示為本次實驗中實際的檢索效果圖。
圖3是本次試驗的檢索結果圖,左上角為要查詢的圖像,后面的為檢索到的圖像,從檢索的結果可以看出圖像從左至右、從上至下,相似匹配度為依次減小,越接近前面的結果,也就是相似性越高。

圖3 檢索結果
圖4是對比了本檢索方法、文獻[2]和文獻[3]的檢索方法的平均檢索準確率的情況。從圖中可以看出文中的平均檢索準確率均高于文獻[2~3]。

圖4 不同算法的平均檢索準確率比較
提出了一種基于興趣點局部區域綜合顏色和紋理的圖像檢索方法,與傳統的單純基于顏色或者紋理進行圖像檢索的方法不同,文中利用興趣點局部區域作為特征的提取對象。實驗證明這種方法提高了圖像的平均檢索準確率。
[1] 章毓晉.基于內容的視覺信息檢索[M].北京:科學出版社,2003.
[2] 翟國,宋余慶.基于興趣點和邊緣特征的圖像檢索方法的研究[J].計算機工程與設計,2009,30(5):1148 -1150.
[3] 汪彥龍,李金龍,劉金華,等.基于內容的圖像檢索方法[J].電視技術,2005(4):9 -12.
[4] 符祥,曾接賢.基于興趣點匹配和空間分布的圖像檢索方法[J].中國激光,2010,37(3):774 -778.
[5] ROSENFELD A,WESZKA J S.An improved method of angle detection on digital curves[J].IEEE Transactions on Computers,1975,24(9):940 -941.
[5] SCHMID C,MOHR R,BAUCKHAGE C.Evaluation of interest point detectors[J].International Journal of Computer Fision,2000,37(2):151 -172.
[6] 翟國,宋余慶,談佳寧,等.基于興趣點和邊緣特征的圖像檢索方法的研究[J].計算機工程與設計,2009,30(5):1148-1150.