摘要:首次從分形維數的角度出發,提出了用圖像的分形維數對圖像進行分類的問題,并且對小幅交通路況圖像的分形維數分布區間進行了研究。從實驗結果看,分形維數可以很好地作為圖像分類與分析的參數。當盒子邊長ε取最小值2和4時,交通路況圖像的維數區間為2.4~3.0和2.8~3.0。
關鍵詞:圖像處理; 圖像分類; 分形維數
中圖分類號:U491; TP391文獻標志碼:A
文章編號:1001-3695(2007)04-0156-02
0引言
對圖像壓縮的研究過程中由于缺乏對圖像本質屬性,特別是圖像空間冗余度的分析與研究,使得壓縮方法的選擇和使用具有較大的盲目性。在圖像處理前對圖像進行整體分析是一項艱難的工作。有學者運用神經網絡模式識別技術進行云的分類研究[1]。Ran等人將圖像分成邊緣區、平滑區和紋理區[2]。Karu等人用一種粗略的測度來判斷圖像中是否有紋理存在[3]。Chou基于不同尺度下的邊緣強度和模糊推理將圖像像素分成邊緣點、平滑點和紋理點[4]。也有學者提出基于圖像鄰域方向性測度的圖像像素分類方法[5]。這些研究并沒有進一步就面向某一圖像處理目的,對整幅圖像進行分析與研究。文獻[6]中雖然也定義了描述圖像整體信息含量的圖像信息度量,且該定義在一定程度上反映了圖像所含信息量的大小,但它既沒有考慮結構信息,也沒給出更細的定量分類。Jacquin利用分類矢量編碼的方法把分形壓縮編碼相似塊分成三類,即Shade類、Midrange類和Edge類[7]。在實踐中筆者發現,這種分類方法把絕大多數相似塊都分在Edge類。這種分類方法對于提高搜索效率效果不好。究其原因,是因為分形編碼中的相似塊與矢量編碼中的碼矢性質是不同的,照搬矢量編碼中碼書的分類方法,未必能產生好的效果。張旗等學者在研究了圖像小波高頻系數的基礎上,提出了按圖像的邊緣度對圖像進行分類,利用該分類結果可對圖像的壓縮結果進行預測[8]。但是當研究圖像存在噪聲時,對圖像邊緣度的描述不甚精準。
本文提出了基于分形維數的圖像分類方法。利用分類結果可以分析以及初步判斷待測圖像的空間不規則程度,對在進一步進行壓縮編碼時是采用平滑圖像的DCT編碼方法還是采用基于分形的編碼方法具有指導意義。
1分形維數
在計算機圖形學領域中關于曲線和曲面的研究已相對成熟。人們先后提出了如B樣條曲線/曲面、Bezier曲線/曲面等既有堅實理論基礎又有實用價值的圖形、圖像處理方法。然而,這些幾何模型在處理大自然為數眾多的景象,如海岸線、地貌、云、樹木等時,卻顯得不盡如人意,乃至無能為力。這主要的原因是因為計算幾何學研究的是規則的幾何形體,或近似幾何形體。法國數學家Benoit B. Mandelbort以不規則圖形為研究對象,提出了用分形維數這一度量概念來描述自然現象的不規則程度。整形幾何學描述的都是有整數維的對象:點是零維的、線是一維的、面是二維的、體是三維的。這種幾何對象即使作拉伸、壓縮、折疊、扭曲等變換,其維數也是不變的;這種維數稱為拓撲維,記為d。Mandelbort認為,在分形世界中,維數不一定是整數的。特別是由于分形幾何對象更為不規則、更為粗糙、更為破碎,所以它的分形維數或分數維數(簡稱分維數,記為D)不小于它的拓撲維,即D≥d。
維數在數學上可用多種方法來定義。Hausdorff利用集的覆蓋來定義測度的思想,定義了Hausdorff測度和維數,但計算Hausdorff維數一般是相當困難的。實際上最為常用的分形維數定義有盒維等。
可以這樣講:如果把一個物體的邊長分成n個相等的小線段,結果可得到與原物形狀相同的m個小物體。把m寫成以n為底的指數形式m=nd(或d=lg m/lg n),則指數d=lg m/lg n稱為這個物體的盒維數。
分形維數所表示的不規則程度,相當于一個物體占領空間的本領。一條光滑的一維直線,完全不能占領空間。但是科赫曲線卻有無窮的長度,比光滑直線有更多的折皺,擁擠在一個有限的面積里,的確占領了空間,它已不同于一條直線,但又小于一個平面。所以它大于一維,又小于二維,它的容量維為1.261 8,這看來是理所當然的。Mandelbort指出,對于各種分形來說,即使在不同的尺度上,用分維表示的不規則程度卻是一個常量。這表明分維概念的客觀現實特性。
由于分形維數直觀上與物體表面的粗糙程度相吻合,而自然界中的不同紋理粗糙度有很大的差別。分形維數可以作為區別不同圖像區域的分形特性的有效參數,可依據分形維數將圖像分類,對不同類別的圖像采用不同的壓縮編碼方案。
2圖像分形維數的計算
如果一個物體的表面是分形的,則由它產生的圖像灰度表面也具有分形的性質,反之亦然。因此,可以從灰度圖像中提取分形維數。
設集FRn,記Nε(F)是可以覆蓋F的、邊長為ε的n維立方體(記做εn立方體)的最少個數,則F的盒維數DB定義為(當極限存在時)
2.1灰度圖像的分形維數
令離散灰度圖像F是一個在三維空間中的分形曲面,長、寬為R;Nε(F)表示邊長為ε×ε×ε的包含所要估計的圖像區域F的最少立方體個數。所要估計的圖像區域的分形維數DB(這里計算的是盒維數)將由下式決定:
DB=limε→2 [log Nε(F)/ log (R/ε)](2)
設ε×ε為一個單位面積,ε可變大小(ε愈小,分形維數的測定值愈精確),令
其中,f(ε)表示相應點的灰度值大小;floor表示取整;n(ε)即是包含該單位面積上灰度所要的ε×ε×ε大小的立方體個數。
灰度圖像F中的每個單位面積,均作同樣的計算,可以得到nk(ε)(k=1,2,…,(R×R)/(ε×ε)),則有將R、ε代入式(2),即可求出灰度圖像F的盒維數DB。當離散灰度圖像F是單色圖時,F正好填滿二維平面。計算可得這時的DB值也正好為2,這與平常的習慣相符。
2.2灰度圖像分形維數的性質
(1)灰度圖像的分形維數與圖像的大小有關,也與尺度ε有關。
從式(2)容易看出,令同樣內容的兩幅圖像邊長分別為R1、R2,必然產生不同的DB1、DB2。令同樣內容、大小相等的兩幅圖像采用不同的尺度ε,必然產生不同的DB1、DB2。圖像的分形維數與圖像的大小有關,且對于同一幅圖像,圖像愈小或ε愈大,分形維數愈大。這表明,雖然圖像變小了,但是它所包含的信息并未減少。分形維數表示用來表達同一信息所需的最小基底。
(2)灰度圖像的分形維數與式(2)中取對數時采用何種對數無關。令ε=2:
有由式(3)~(5)可見,DB的值只與R、ε有關,而與取何種對數沒有關系。
應用上述圖像盒維數的計算方法,計算各種圖像的分形維數;根據分形維數的大小不同來對圖像進行分類研究。其結果可以有廣泛的應用前景。
3圖像分類研究
心理學的研究表明:圖像是由不同知覺意義的三部分組成,即平滑區、邊緣區和紋理區[2]。如果灰度變化比較平緩,則屬于平滑區;如果灰度變化比較劇烈,則屬于邊緣區,邊緣區內邊緣的密度是區分邊緣區和紋理區的依據。由此可將內容不同的圖像按人們的視覺特點進行簡單分類,如圖1所示。
對于大多數的小幅復雜圖像計算得到分形維數基本位于區間2.4~3.0。可以看出,這些圖像具有明顯的分形特性,用來表達圖像信息所需的最小基底偏大。由此可以得出,小幅復雜圖像具有較大復雜性和信息蘊涵。在進行圖像編碼時選擇分形編碼較DCT編碼有較大的優勢。
4實驗結果分析
本文以分形維數作為度量圖像的指標。實驗環境為AMD Athlon 1800+,256MB RAM PC,Windows 2000, VC++6.0。
實驗圖像選自MATLAB中的部分圖像;圖像大小為256×256。
通過大量的實驗結果表明,對于一幅離散圖像,當盒子邊長ε取最小值2時,計算相應的分形維數。對應于維數區間為2.0~2.1,2.1~2.35,2.35~2.45,2.45~2.5,2.5~3.0。按照人們的視覺特點可將圖像分為紋理圖像、紋理邊緣圖像、紋理邊緣平滑圖像、邊緣平滑圖像、平滑圖像六種類型,如表1所示。分形維數愈接近維數2,表明圖像愈平坦;愈接近維數3,表明圖像愈抖動。當盒子邊長ε取最小值4時,維數區間是2.0~2.2,2.2~2.45,2.45~2.55,2.55~2.6,2.6~3.0,如表1所示。
5結束語
在圖像處理領域中,大部分的研究工作都集中在算法的研究和改進上,對被處理的對象——圖像的本質屬性(分維數:用來表達圖像信息所需的最小基底)進行分析或分類研究則涉及很少。本文首次從分形維數的角度出發,提出了用圖像的分形維數對圖像進行分類的問題,并且對小幅復雜圖像的分形維數分布區間進行了研究。從實驗的結果看,分形維數可以很好的作為圖像分析與分類的參數,采用分形維數的圖像分類與人憑借主觀感受對圖像進行的分類相吻合。在圖像編碼方面,分形維數還可以作為圖像壓縮方法選擇的重要指標。本文僅就分形維數在圖像分類中的應用進行了研究,還可以將本文的基于分形維數的圖像分類的基本思想推廣于其他圖像處理應用方面。
本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。