張恒博,商 周,李靈華
(大連民族學院計算機科學與工程學院,遼寧大連 116605)
一種基于改進Hu矩的圖像檢索方法
張恒博,商 周,李靈華
(大連民族學院計算機科學與工程學院,遼寧大連 116605)
提出了一個在形狀輪廓的基礎上,進行改進的Hu矩的形狀特征提取與檢索方法。首先,對圖像進行預處理,利用多閾值顏色分割法提取出圖像的前景對象,再采用輪廓跟蹤法得到該對象的形狀輪廓特征;然后,計算7個不變矩,再轉化為10個改進的Hu矩,組成圖像的特征向量;最后,用歐氏距離度量圖像間的相似度。實驗結果表明,該方法具有較好的檢索效果。
基于形狀;圖像檢索;Hu不變矩
基于內容的圖像檢索技術就是通過分析圖像的內容(顏色、紋理、形狀等),從大量的圖像庫中查找含有特定物體的圖像,它克服了傳統方法的不足,融合了圖像處理、圖像識別和圖像數據庫等領域的技術成果,從而可以提供更加有效的檢索手段。
形狀是刻畫物體的基本特征之一,用形狀特征區別物體非常直觀,利用形狀特征檢索圖像可以提高檢索的準確性和效率。對于基本形狀特征的檢索,可以給出有關被檢索對象的形狀描述,可以是一些特征值,也可以是勾畫出的對象的略圖。[1]
基于形狀的圖像檢索可分為兩種:一種是基于輪廓,該方法只利用形狀的外輪廓,而不考慮形狀內部的特征;另一種是基于區域,該方法則是利用形狀的整個區域特征。目前常用于基于形狀檢索的形狀分析方法有傅立葉描述符、不變矩、形態匹配、曲率尺度空間和轉向角曲線等。另外,有時還使用一些標量來對圖像庫進行快速篩選,如圓率、面積和外接矩形長寬比等[2]。其中,Hu首次提出用7個不變矩來表征圖像的形狀。由于矩表征圖像形狀時具有旋轉、平移、縮放等空間幾何不變性,已經被廣泛的用于描述形狀特性。[3]但是該方法對封閉和不封閉結構,由于不能直接計算矩的特征。
本文對Hu不變矩的方法進行了擴展,將區域矩和結構矩的計算統一起來,因此不僅可以計算區域特征,還可以直接計算封閉和不封閉結構的特征,從而也可以識別區域、封閉和不封閉結構。首先對圖像進行預處理,然后計算圖像的改進的Hu矩,把改進的Hu矩做為圖像的特征向量,從而實現了一種改進的圖像檢索方法。
圖像分割的目的是將背景濾除,只保留目標物的特征。可以采用一種彩色多級閾值圖像分割法的分割策略。其原理是根據背景顏色較接近的特點且背景顏色像素數一般要多于目標顏色像素數的特點,找出像素數最多的顏色作為主閾值,其他顏色按與主閾值顏色的接近程度和像素數量的多少分成幾個次閾值級,最后掃描整個圖像將所有等于主閾值和次閾值的顏色都作為背景色濾除,從而實現背景和目標的分離。原圖如圖1,圖像分割后結果如圖2。

圖1 原圖

圖2 圖像分割
圖像銳化主要是為了加強其邊緣特征,使邊緣易于識別。可以采用拉普拉斯卷積核[5]的銳化方法,其銳化卷積核模板為:

邊緣是圖像最基本的特征。為了檢測出邊緣信息,通常是利用其周圍像素灰度或顏色有階躍性變化或屋頂變化的特性判斷該像素是否為邊緣點。可以采用邊緣檢測算子,其原理是一種利用局部差分算子尋找邊緣的算子。銳化及邊緣檢測后的效果如圖3。

圖3 銳化及邊緣檢測
輪廓是基于形狀檢索的依據。輪廓提取的方法可以采用內部點掏空法[5],其原理是利用圖像形態學中的腐蝕處理方法用一個九個點的結構元素對圖像進行腐蝕,再利用原圖像減去腐蝕圖像即可得到輪廓。
輪廓跟蹤是根據某種嚴格的“探測準則”找出目標物體輪廓上的像素,再根據這些像素的某些特征用一定的“跟蹤準則”找出目標物體上的其他像素。“探測準則”原則是:按照從左到右,從下到上的順序搜索,找到的第一個不同于背景的點就是最左下方的點,記為A。然后從該點開始,按右、右上、上、左上四個鄰點中至少有一個邊界點,記為B。從B開始找起,按右、右上、上、左上、左下、下、右下的順序找相鄰的邊界點C。如果C就是A,則表明已經全部搜索完畢。本模型“跟蹤準則”原理是:如果它的上下左右4個鄰點都不是對象點,則它即為邊界點。輪廓跟蹤和提取后的效果如圖4。

圖4 輪廓提取圖

為了得到適用于區域、封閉和不封閉結構的統一不變矩公式,利用矩之間的比值來去掉比例因子μ00,從而使不變矩公式與面積或結構的比例縮放無關,而僅與幾何形狀有關。根據這種思路,利用式(2)和式(3),得到的改進的 Hu矩為


這10個改進的Hu矩滿足結構的平移、縮放、旋轉不變。R1與形狀曲率半徑有關,R2代表形狀的扁度,R1的分母不會為0,但R2~ R10的分母則可能為0。
由邊界圖像得到的相對矩共有10個,共同組成圖像的特征向量:

但矢量中每個分量的取值范圍不同,表示的物理意義也不同,不能直接用歐氏距離來度量,需要對它們進行內部歸一化。通常采用高斯歸一化方法,即

式中,mj和σj分別表示距離值的均值和標準差。若利用3σj進行歸一化,各個fi,j轉變成具有 N(0,1)分布的 fi,jN,其值 99% 可落在[-1,1]區間。實際應用中,可將區間外的值設為-1或1,以保證所有的fi,j值均落在區間內。特征向量歸一化后,用歐氏距離進行相似性度量。由此,構成基于形狀特征圖像檢索方法。
為了驗證該方法的合理性,構建一個基于形狀特征的圖像檢索系統進行測試。圖像庫中包含汽車、風景、鮮花3類600余幅圖像。其中,既包含區域特征明顯的圖像,也包含結構特性明顯(封閉或不封閉結構)的圖像,且圖像之間有平移、縮放和旋轉。該方法對汽車類圖像的檢索結果如圖5。檢索結果的相似性度量見表1。

圖5 基于改進的Hu矩的圖像檢索結果

表1 汽車類檢索結果的相似性度量
在圖5中,左上角的第一幅圖像為查詢圖像,檢索結果返回與查詢圖像最相似的前8幅圖像。圖5表明,無論相似的形狀是否有平移、旋轉、尺度縮放,都能得到很好的匹配,其相似度如表1。從圖像或者文件名都可以看出,前8幅圖像全為類內(汽車類)圖像,檢索精度達到了100%。進一步實驗表明,返回最相似的前18幅圖像時,檢索精度仍然能達到100%。當返回最相似的前36幅圖像時,僅有2幅類外(如風景類)圖像,檢索精度為97.2%,仍能達到用戶的滿意程度。選擇風景類及鮮花類圖像進行測試,結果類似。
本文采用傳統方法對圖像進行了邊緣檢測。并對Hu矩進行一種改進,滿足形狀的平移、旋轉和尺度縮放不變性,統一了圖像形狀的區域和結構描述方法。本文提出了一種基于改進的Hu矩的形狀特征提取與檢索方法,構建了一個基于形狀特征的圖像檢索系統。實驗結果表明,該方法具有明顯的優越性和通用性,為網絡環境下基于視覺特征的圖像搜索引擎設計提供了算法支持。
[1]史延新.基于形狀特征的圖像檢索算法研究[J].電子科技,2008(12):69-71.
[2]李笑牛,袁克杰.基于Hu不變矩的加權矩方法及應用[J].大連民族學院學報,2010,12(5):470 -472.
[3]HU M K.Visual pattern recognition by moment invariants[J].IEEE Trans.on Information Theory,1962(IT -8):179-187.
[4]薛鴻民,劉志鏡,劉利,等.基于形狀的圖像檢索的關鍵技術研究[J].計算機應用研究,2002(11):61-64.
[5]樊亞春,耿國華,周明全.用不變矩和邊界方向進行形狀檢索[J].小型微型計算機系統,2004(04):659-662.
A Method of Image Retrieval Based on Improved Hu Moments
ZHANG Heng-bo,SHANG Zhou,LI Ling-hua
(College of Computer Science and Engineering,
Dalian Nationalities University,Dalian Liaoning 116605,China)
A new method for CBIR based on shape relative moments feature has been presented.Firstly,the image has been pre-processed,the foreground object has been extracted using multi-threshold image segmentation.Then the seven invariant moments have been calculated and translated to ten improve Hu moments,which constructors characterize vectors of image;Finally,the similarity between two images’normalized moment vectors has been measured taking use of Euclidean distance.Experimental results showed that the method has a very good retrival effect.
shape-based;image retrieval;Hu invariant moments
TP391.41
A
1009-315X(2011)05-0499-03
2011-06-20;最后
2011-07-07
張恒博(1972-),男,黑龍江訥河人,副教授,博士,主要從事圖形圖像處理研究。
(責任編輯 劉敏)