計蘊容周韋潤
(1.江蘇科技大學計算機學院 鎮江212003)(2.江蘇句容抽水蓄能有限公司 鎮江212400)
面料是與我們生活聯系非常緊密的一種日用品原材料。使用面料制作成的商品有很多,比如衣服、圍巾、包等。商品制造廠商需要先采購滿足客戶需求的面料,再加工成商品。而紡織面料的種類多種多樣,采用人工對比方式采購不僅勞動強度大而且可靠性低,容易造成采購的面料與制造廠商實際需要的面料不匹配。因此,建立一個有效檢索面料的系統就很有必要。
近年來,基于內容的圖像檢索方法[1]已經應用于織物檢索領域。圖像檢索方法三個重要指標是準確率、可靠性和檢索速度。準確率關系檢測的結果是否準確,可靠性關系檢測的方法是否實用,檢索速度關系檢測過程效率的高低。然而,大部分情況下,這幾個指標之間相互制約,很難同時兼顧。為了彌補傳統圖像檢索方法的單一特征造成的不便,本文提出了一種多特征融合的檢索方法,分析并融合面料圖像的顏色特征、形狀特征和紋理特征,進行檢索。此外,對于各特征所占比重,可以根據不同的特征設置不同的值,整體權重為1。
顏色是圖像中重要的屬性之一,也是描述圖像內容最直接的一種視覺特性。常用的顏色特征表
示方法包括顏色直方圖[2]、顏色集[3]、顏色矩[4]等。顏色直方圖可以簡單地描述圖像中顏色的全局分布,即整個圖像中不同顏色的比例,其通用性較強,被廣泛使用。但是,這種方法也有缺點。由于顏色直方圖是全局顏色統計的結果,丟失了像素點間的位置特征,從而各種顏色的局部分布及空間位置就無法明確。針對這一缺點,本文采用HSV空間中的顏色矩表示顏色特征。
顏色矩是Stricker和Orengo在2002年提出的描述顏色分布的方法,這種方法建立在線性代數中矩的概念上,用矩來表示圖像的顏色分布。分別為顏色一階矩(mean)、顏色二階矩(variance)和顏色三階矩(skewness)。三個顏色矩的數學定義分別如下:

式中:pij為第j個像素的第i個分量;N為像素總數。一階矩計算平均值,反映圖像的亮度;二階矩計算方差,反映圖像的顏色分布范圍;三階矩計算斜度,反映圖像的顏色分布對稱性。
HSV顏色空間有三個屬性,色彩(Hue)、飽和度(Saturation)和亮度(Value)。人眼的色彩感知主要包括色調、飽和度和亮度,這與HSV色彩空間的三個屬性相匹配,因此,本文選用HSV色彩空間進行顏色特征提取,其模型如圖1。

圖1 HSV顏色空間模型
在該空間中,分別獲取了圖像H通道、S通道和V通道三個圖像的顏色矩特征參數。如果用M,N表示兩幅圖像,那么它們矩的距離公式表示為

式中,ωij≥0(1≤i,j≤3)是指定的加權系數,但ωi1、ωi2、ωi3的累積和必須為1。提取到待匹配圖與數據庫中圖像的顏色矩后,通過曼哈頓距離[5]進行相似性度量。
形狀特征是描述高層視覺特征的重要手段。對形狀特征的提取主要是尋找一些幾何不變量,即對圖像中感興趣目標的分割。形狀特征提取流程圖如圖2。

圖2 形狀特征提取流程圖
在本文中,形狀不變矩用來描述圖像的形狀特征。由于Hu不變矩[6~7]在表征圖像形狀時具有空間幾何不變性,如旋轉、平移、縮放時,不隨圖像的位置、大小和方向而變化,因此該方法在提取圖像中的形態方面非常有效。
在連續的情況下,圖像函數為f(x,y),那么圖像的(p+q)階的矩定義為(p+q)階中心矩定義為


(p+q)階歸一化的中心矩定義為

其中:

7個不變矩組為

根據上述式(9)可以計算圖像的7個不變矩陣,提取圖片的Hu不變矩特征后,再通過歐式距離[8]進行相似性度量。
歐氏距離(Euclid Distance)是一個常用的距離定義,也把它稱為歐幾里得度量或歐幾里得距離。它是m維空間中兩點之間的真實距離。二維空間中的歐幾里得距離就是兩個點之間的線性距離。
二維空間歐氏距離公式表示為

三維空間的歐氏距離公式表示為

n維歐氏空間是一個點集,它的每個點x可以表示為(x(1),x(2),…,x(n)),其中x(i)(i=1,2,…,n)是實數,稱為x的第i個坐標,兩個點A=(a(1),a(2),…,a(n))和B=(b(1),b(2),…,b(n))之間的距離d(A,B)定義為下面的公式:

通過計算要匹配的圖的不變矩與數據庫中圖像不變矩的歐氏距離,可以將讀取的圖像與數據庫中的圖像進行比較,選出相似度高的,在系統界面上返回結果圖像。
紋理也是圖像中一種重要的視覺特征,它描述了圖像中重復出現的局部模式以及它們的排列規則,其本質是刻畫像素的鄰域灰度空間分布規律。圖像紋理分析是圖像分析處理研究中的一個關鍵部分。紋理分析在計算機圖形學中具有廣泛的應用。目前,紋理特征的研究方法多種多樣,大致可分為統計法、結構法、模型法和變換法。
在本文中,采用Gabor小波[9~11]變換的方法提取面料圖像的紋理特征。Gabor小波變換可以被看作母小波是Gabor函數的小波變換,即在進行小波變換時,將Gabor函數作為基函數。假設用I(x,y)表示一幅圖像,那么該圖像用Gabor濾波器可以表示為

其中,參量s和t是濾波器模板大小的變量,參數x和y反映像素在圖像中的位置,參量p和q分別表示小波變換的尺度和方向,g*pq表示gpq的復共軛。
假設局部紋理區域具有空間一致性,則變換系數的均值μpq和方差σpq可以代表該區域的紋理特征。

假設用V表示圖像I(x,y)的紋理特征向量,則V可以表示為

假設用Vm表示待查詢圖像m對應的紋理特征向量,用Vn表示數據庫中圖像n對應的紋理特征向量,則采用歐氏距離計算圖像間的相似度,歐幾里德距離可以表示為

其中,c表示紋理特征向量的維數。若Vm和Vn具有不同的維數,則c表示為

由于面料圖像的顏色多種多樣且樣式繁多,為了確保圖像的準確檢索,本文對圖像的顏色特征、形狀特征及紋理特征進行融合。特征融合[12~13]采用對不同特征給予不同權重的方法,用戶可以手動輸入各個特征占融合特征的比重,整體權重值為1。
圖像檢索時,數據庫中的圖像用I表示,待查詢圖像用Q表示,設數據庫中圖像I在三個不同特征提取分析下與待查詢圖像Q的相似性距離分別為D1、D2、D3,手動設置的歸一化權重大小分別為W1、W2、W3,則數據庫中圖像I與待查詢圖像Q基于多特征融合后的相似性距離為

根據上述方法,計算數據庫中所有圖像與待查詢圖像Q的相似度,按照相似度大小排名,返回規定數量內最相似的圖像給用戶。特征融合算法中權重的設置主要根據用戶的需要和待檢索圖像的特點來設置不同特征所占的比重,使算法更自主化,以達到較好的檢索結果。
為驗證本文所提出的多特征融合算法的準確性,將該方法應用于實際拍攝的面料圖像庫中進行實驗。所選用的面料圖像是從某布料加工廠隨機拍攝的800幅面料圖像。實驗中,70%被選為訓練集,30%被用作測試集。面料庫的部分圖像如圖3。

圖3 面料庫圖像樣本
本實驗選擇了查準率(precision)[14]和查全率(recall)[15~16]作為衡量算法平均性能的指標。查準率指的是在一次查詢過程中,返回的結果中相似圖像占檢索到的圖像的比例,查全率指的是在一次查詢過程中,返回的結果中相似圖像占數據庫中相似圖像的比例。本實驗中,假設執行一次查詢過程,返回的結果中相似圖像數目為r,返回的圖像總數為N,數據庫中相似的圖像總數為R,則查準率和查全率的表達式可以表示如下:

為了驗證本文檢索方法的有效性,分別將顏色特征、形狀特征、紋理特征與三項特征融合進行實驗對比。隨機抽取100張圖像,以每一張圖像作為待檢索對象,面料庫作為檢索庫,共運行100次,計算了100次的查全率和查準率,并對查全率和查準率求平均值,得到平均查全率和平均查準率。在實驗中,對比單一特征和多特征融合的查全率與查準率,實驗結果見表1。

表1 單一特征算法和多特征融合算法實驗結果%
從表中的數據可以看出,本文的多特征融合算法,在查全率和查準率方面均高于單一特征。四種算法在不同返回圖像數目時,查準率和查全率的曲線圖如圖4和圖5。

圖4 四種算法查準率曲線

圖5 四種算法查全率曲線
從圖4和圖5中,可以看出多特征融合算法在查準率和查全率上都優于單一特征檢索算法,主要是由于多特征融合算法考慮到多種特征因素的影響,可以在一定程度上減小單一特征帶來的影響。
本文提出了一種結合了顏色、形狀、紋理三種特征的面料圖像檢索方法。通過在HSV空間提取顏色特征,采用Hu不變矩算法提取形狀特征,利用Gabor小波提取紋理特征,最后將三種特征結合,使用相似性度量分別對顏色特征、形狀特征、紋理特征以及融合后的特征進行了圖像檢索實驗。實驗結果表明,基于多特征的檢索效果優于單一特征,具有一定的實際意義。本文研究的是面料圖像的檢索,數據庫中都是布料圖像,布料圖像的種類繁多,針對不同的類型,多特征融合時各權值分配也各不相同。因此,筆者下一步將在此基礎上研究如何合理設置三項融合時的權重,來進一步提高檢索的精確度。