摘要:該文提出一種新的道路分類方法,在灰度共生矩陣的基礎上得到圖像的紋理特征,并通過決策樹模型得到道路圖像分類的決策樹。實驗證明,該方法有著較高的準確率,其結果在分類方面有著簡單易行的特點。
關鍵詞:道路分類;灰度共生矩陣;紋理特征;決策樹
中圖分類號:TP309文獻標識碼:A文章編號:1009-3044(2009)24-6988-03
Road Image Classification Based on Texture Feature
ZHAO Nan, WANG Chao
(Beijing Normal University College of Information Science and Technology, Beijing 100875,China)
Abstract: The article proposed a new algorithm for road classification. Based on gray level co-occurrence matrix, we got the features of an image. Then the decision tree was gained using the Decision Tree Model. Theoretical calculations are found to be consistent, and easy to be used.
Key words: road classification; co-occurrence matrix; texture feature; decision tree
高空間分辨率圖像中的地物提取是遙感圖像處理的一個重要應用方向,其中,圖像中的道路提取是銜接圖像底層信息和圖像高層信息的一個重要的層次,其圖像的特征提取和分類有著重要的意義。
傳統道路分類方法是由人機交互來進行確定,有著工作量大,難以得到應用的缺陷。另外,也有研究者使用經過融合后的RGB通道圖像來進行分類[1],這種方法有著魯棒性差,沒有普適性的缺陷。
為了克服這些不足,本文提出了一種新的道路分類方法。首先得到預處理后的圖像的灰度共生矩陣,然后在該矩陣上提取若干圖像紋理特征,最后使用決策樹模型得到道路分類的決策樹并確定對道路分類具有決定性意義的特征。
1 數據預處理及灰度共生矩陣
在進行分類之前,我們首先要得到道路和非道路這兩種圖片訓練集。我們采用QUICKBIRD衛星的0.6m北京某區的衛星圖片,從該高空間分辨率圖片中截取若干組道路圖片和非道路圖片作為訓練集。
1.1 數據預處理
在進行數據分類之前,我們首先要對得到的圖像數據進行預處理。由于我們得到的是多通道圖像,在進行分類時我們需要使用灰度圖像。這是因為灰度圖像的結果更具有普適性,其可以再次使用在多通道的圖像分類中。在這里我們使用圖像處理軟件得到訓練集的灰度圖像。
由于灰度共生矩陣主要是針對紋理圖像的,需要減弱整體灰度特征對結果的影響,所以我們要對數據圖像進行灰度歸一化,在保留有價值灰度差異的同時,減小甚至消除圖像中灰度不一致。在這里我們使用的是直方圖歸一化的處理方法。
1.2 灰度共生矩陣
任何圖像都可以看成三維空間中的一個曲面,在三維空間里,相鄰某一間隔長度的兩個像素,他們可能具有相同或不同的灰度級。若能找出這兩個像素的聯合分布的統計形式,對于圖像的紋理分析將是很有意義的。一般可采用灰度共生矩陣作為基礎,對相鄰的兩個區域是否本屬同一個區域的特性進行分析。
灰度共生矩陣方法,是建立在估計圖像的二階組合條件概率密度函數基礎上的。這個方法已經有了較長的研究歷史,也是當前人門公認的一種重要的紋理分析方法 。從像素為 的灰度出發,找到距離為(Dx,Dy)的另一個像素點,其灰度為J,令點在整幅圖像上移動,則會得到各種點對(i,j)。設灰度值的級數為L,則i與j的組合共有L2種。在整幅圖像中,統計出每一種(i,j)值出現的次數,再將它們歸一化為概率Pi,j,則稱形成的方陣[Pi,j]L×L為灰度共生矩陣[2]。
2 基于灰度共生矩陣的紋理特征
為了利用灰度共生矩陣所提供的信息,我們在共生矩陣的基礎上進行二次統計,抽取出紋理特征。許多基于共生矩陣的特征已被定義并驗證過,我們在此使用能量、灰度相關、局部平穩、熵、慣性矩等5個紋理特征系數[3]。
1) 能量(角二階矩)
能量是灰度共生矩陣各元素的平方和,反映了圖像灰度分布均勻程度和粗細程度。E大時紋理粗,能量大;反之E小時紋理細,能量小,灰度相關。
2) 灰度相關
灰度相關用來衡量灰度共生矩陣的元素在行方向或列方向的相似程度,C越小,說明在行或列方向上越相似。
3) 局部平穩
局部平穩性是圖像局部像素的平均水平的標志,L越大,說明圖像越復雜[9]。
4) 熵
熵用來衡量圖像信息量的大小,若圖像沒有任何紋理,則熵的值接近于0;若圖像中充滿著細紋理,則熵值較大;若圖像中分布著較少的紋理,則熵值較小。
5) 慣性矩
這是引用自物理學科的概念,慣性距可理解為圖像的清晰度。紋理越復雜,I越大,效果清晰;反之,I小則紋理簡單,效果模糊。
3 基于紋理特征的道路分類
決策樹是一種以訓練集為基礎的歸納學習方法,本質上是機器學習。它著眼于從一組無秩序、無規則的實例中推理出決策樹表示形式的分類規則。采用自頂向下的遞歸方式,在決策樹內部節點進行屬性值的比較,并根據不同的屬性值判斷從該節點向下的分支,在決策樹的葉節點得到結論。所以從根到葉節點的一條路徑就對應著一條規則,整棵決策樹可解讀出一組表達式規則,其中內部節點表示某種檢驗屬性,分叉表示檢驗結果,葉節點表示類或某一類的分類,頂點稱為根節點。
它有著適于探測式知識發現的特點。它的構造不需要任何領域知識或參數設置,可以處理高維數據,獲取的知識用樹的形式表現容易應用和理解,并且其歸納的學習和分類步驟是簡單和快速的,一般情況下,決策樹分類器具有很好的準確率[4]。
正是因為決策樹有著如此的優點,在這里我們選擇其作為道路分類的方法。
在實際操作中,我們根據前兩步得到訓練集的5項紋理特征,并加上分類信息得到道路分類訓練集。再使用數據挖掘軟件得到道路分類決策樹。
4 實驗結果與討論
我們首先得到了20組道路和非道路樣本,并進行灰度化、灰度歸一化處理,結果見圖1,2,3 :
然后得到每幅樣本所對應的灰度共生矩陣;接著在矩陣上提取出相應的5個特征,結果見圖4。
最后使用WEKA中的J48GRAFT決策樹方法,得到的決策樹如下:
Energy <= 0.054556: FALSE (6.0)
Energy > 0.054556
| Energy <= 0.066297
| | LocalCalm <= 0.764472
| | | Energy <= 0.05625: TRUE (2.0)
| | | Energy > 0.05625: FALSE (2.0)
| | LocalCalm > 0.764472: TRUE (8.0)
| Energy > 0.066297: FALSE (2.0)
從得到的決策樹可以看到,雖然我們使用了5個紋理特征,但在這些紋理特征中,真正對道路分類有貢獻意義的只有能量(Energy)和局部平穩(LocalCalm)這兩個特征。其樹狀圖如圖5。
最后,我們使用測試數據集計算其準確度為:79%。
5 結束語
在本篇論文中,結合了之前所做過的圖像紋理方面的工作,得到了圖像的若干紋理特征。在之前的工作中,其道路分類一直是采用神經網絡來進行,但有時的結果不令人滿意。當使用決策樹后,發現之前認定的5個特征系數不完全都是有用的,這是非常有意義的??梢宰⒁獾?,在今后的工作中如果需要提取特征的話,可以先使用決策樹來得到對結果影響比較大的因子,并能大約得到每個維上影響決策的程度。
但也要注意到,決策樹也是一種對訓練集很敏感的分類方法,在實驗中我也發現,如果使用的道路圖像上有車輛等信息會干擾特征的提取以至于分類的結果。在這里,濾波是一定不能使用的了,因為會影響整個數據的信息量,不過可以考慮使用小波等方式,在小波的基礎上提取特征。
參考文獻:
[1] M.Mokhtarzade, M.J.Valadan Zoej. Road detection from high-resolution satellite images using artificial neural networks[J]. International Journal of Applied Earth Observation and Geoinformation, 2007(9):32-40
[2] Kenneth R, Castleman. 數字圖像處理[M].朱志剛,譯.北京:電子工業出版社,2002.
[3] 王波,姚宏宇,李弼程.一種有效的基于灰度共生矩陣的圖像檢索方法[J].武漢大學學報:信息科學版,2006,31(9):761-764.
[4] Jiawei Han, Michelin Kamber.數據挖掘概念與技術[M].2版.范明,孟曉峰,譯.北京:機械工業出版社,2007.