摘要 闡明圖形、線條圖形及填充圖形的概念,提出一種描述圖形視覺特征的新參數(shù)——區(qū)域飽和度,并實(shí)現(xiàn)基于區(qū)域飽和度的線條圖形和填充圖形的自動分類,取得較好的實(shí)驗(yàn)效果。
關(guān)鍵詞 圖形;線條圖形;填充圖形;區(qū)域飽和度
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-489X(2008)24-0109-02
在圖像處理領(lǐng)域,圖像分類一直是人們研究的重點(diǎn)。圖像分類是通過提取圖像的底層視覺特征(如顏色特征、形狀特征、紋理特征)和高層語義特征(如邏輯特征)來實(shí)現(xiàn)的。圖形是一類特殊的圖像,由外輪廓和內(nèi)部區(qū)域組成,一般主體明確,背景單一。本文通過大量圖形進(jìn)行分析實(shí)驗(yàn),提出了一種描述視覺特征的新參數(shù)——區(qū)域飽和度,并以此將圖形分為線條圖形和填充圖形兩類,從而為建立統(tǒng)一的分門別類的圖像資源庫,及人們檢索圖像資源提供方便。
1 概念界定
實(shí)驗(yàn)之前,先對文中涉及的圖形、線條圖形和填充圖形這幾個概念加以界定。
這里所用到的圖形,指的是相對簡單的圖像,是由點(diǎn)、線、面等幾何要素和明暗、灰度、色彩等非幾何要素構(gòu)成的圖或形,具有明顯的形狀和線條特征,但沒有太復(fù)雜的顏色或紋理特征的簡單圖像[1]。為了便于研究,本文中所采用的圖形為只包含一個連通區(qū)域的背景色為白色的黑白二值圖形[2]。
另外,通過對大量的圖形資源進(jìn)行分析看出,一部分圖形的組成元素以線條為主,重在用線條勾勒物體的形象,內(nèi)部填充多為背景顏色,因此看起來內(nèi)部為鏤空,將這種圖形稱之為線條圖形,如圖1所示;而另一部分圖形則主要通過面積較大的色塊及其組合來描述對象,顏色的區(qū)域特征明顯,線條只起到勾勒邊緣的作用或者沒有線條的存在,稱其為填充圖形,如圖2所示。
本文的工作就是通過提取圖形的視覺特征——區(qū)域飽和度,將圖形分為線條圖形和填充圖形兩類。
2 圖形的特征描述
2.1 區(qū)域面積 區(qū)域的面積是區(qū)域的一個基本特性,它描述了區(qū)域的大小。對于數(shù)字圖像,區(qū)域的面積定義為區(qū)域中的像素?cái)?shù)目。
2.2 逼近多邊形的面積由于噪聲、采樣等影響,數(shù)字圖像的邊界常常會有許多較小的不規(guī)則處,這就對圖像的形狀測量和描述有干擾作用。為了減少這些干擾,可以通過多邊形去逼近邊界。
逼近多邊形是用一系列線段去擬合逼近任意邊界,用盡量少的線段表示邊界的基本形狀,然后計(jì)算多邊形的參數(shù),從而使對邊界的描述變得簡單。常用的逼近多邊形表達(dá)方法有三種:基于收縮的最小周長多邊形法、基于聚合的最小均方誤差線段逼近法和基于分裂的最小誤差線段逼近法[3]。本文采用基于聚合的最小均方誤差線段逼近法。
1)計(jì)算圖像的中心點(diǎn)O,為頂點(diǎn)集A分配內(nèi)存空間,并進(jìn)行初始化。
2)確定初始起點(diǎn),計(jì)算各個邊沿點(diǎn)到中心點(diǎn)O的距離,將其最大值賦給max,并將對應(yīng)的邊沿點(diǎn)作為起點(diǎn),將起點(diǎn)加入頂點(diǎn)集A中。
3)按逆時針方向用直線連接每次的起點(diǎn)與當(dāng)前鄰接點(diǎn)(與該點(diǎn)相距為n的鄰近點(diǎn),本文中n取值為3),計(jì)算兩點(diǎn)間的邊沿點(diǎn)到直線的最大距離p。
4)如果誤差p/max小于閾值(閾值為到圖像中心點(diǎn)最遠(yuǎn)距離的百分之幾,本文中取3%),將該鄰近點(diǎn)扔掉,將當(dāng)前鄰接點(diǎn)設(shè)為被扔掉的鄰接點(diǎn)的下一個鄰接點(diǎn)。如果誤差p/max大于閾值,將當(dāng)前鄰接點(diǎn)作為新的起點(diǎn),將起點(diǎn)加入頂點(diǎn)集A中。如果新的起點(diǎn)到最初起點(diǎn)的方向是順時針方向,則將該起點(diǎn)去掉,繼續(xù)進(jìn)行第5)步。否則轉(zhuǎn)3)。
5)將頂點(diǎn)集中的點(diǎn)依次用直線連起來,形成的閉合區(qū)域就是該圖像的逼近多邊形。其中頂點(diǎn)集中元素的個數(shù)就是逼近多邊形的頂點(diǎn)數(shù)。
6)求逼近后的多邊形面積,即逼近多邊形的區(qū)域面積。
2.3 區(qū)域飽和度即圖形對象的輪廓區(qū)域的填充程度,通過觀察發(fā)現(xiàn),線條圖形和填充圖形的最大區(qū)別是,線條圖形在其邊界圍成的輪廓區(qū)域內(nèi),只填充了很少的前景色,而填充圖形恰恰相反,在其邊界圍成的區(qū)域內(nèi),填充了大量的前景色,整個圖形區(qū)域比線條圖形要飽滿的多,因此考慮通過一個圖形的面積和逼近多邊形的比率,來區(qū)分這兩種圖形,由此定義了一個新的參數(shù)——區(qū)域飽和度。區(qū)域飽和度的計(jì)算公式為:
區(qū)域飽和度(F)=
通過設(shè)定區(qū)域飽和度的閾值t,當(dāng)F 3 實(shí)驗(yàn)結(jié)果及分析 人工選取了200幅圖形作為分類實(shí)驗(yàn)的對象,其中線條圖形和填充圖形各有100幅作為實(shí)驗(yàn)對象,采用分類的正確率和準(zhǔn)確率來驗(yàn)證分類: 通過反復(fù)實(shí)驗(yàn)得出當(dāng)閾值t設(shè)為0.5時,實(shí)現(xiàn)了較好的分類效果,實(shí)驗(yàn)結(jié)果如表1所示。 實(shí)驗(yàn)結(jié)果分析:由表1可以看出,基于區(qū)域飽和度的線條圖形和填充圖形的分類中,輪廓圖形誤檢率略高,這是因?yàn)橛行┚€條圖的線條稍粗或比較密集(如圖3),線條圍成的閉合區(qū)域比較小,這樣求得的區(qū)域飽和度就比較大,結(jié)果將其誤分為填充圖形,進(jìn)而也影響了填充圖形的分類正確率。今后的工作應(yīng)該在參數(shù)閾值的選取及結(jié)合其他特征參數(shù)共同進(jìn)行分類上做進(jìn)一步研究。 4 結(jié)論 本文提出一個描述圖形視覺特征的參數(shù)——區(qū)域飽和度,并通過實(shí)驗(yàn)證明基于區(qū)域飽和度的線條圖形和填充圖形的分類準(zhǔn)確率和正確率比較高,方法簡單可行。希望這些工作能對從事圖像處理及相關(guān)領(lǐng)域的研究人員和學(xué)習(xí)者有所幫助。 參考文獻(xiàn) [1]李海軍,寧玉富,郭長友.規(guī)則幾何圖形的識別分析與算法實(shí)現(xiàn)[J].長熟理工學(xué)院學(xué)報,21(4):111-115 [2]柳青,孟祥增,冀翠萍.圖形形狀特征提取前的重要工作[J].電腦知識與技術(shù),2007,3(4) [3]孫即祥.圖像分析[M].北京:科學(xué)出版社,2005