侯遠韶
(河南工業貿易職業學院 信息工程系,河南 鄭州451191)
圖像分類是圖像處理中重要的一環,它根據圖像信息中含有的不同特征,把不同類別的數據區分開,從而得到圖像分類效果[1]。目前圖像分類的方法主要有:基于色彩特征的索引技術、基于紋理的圖像分類技術、基于形狀的圖像分類技術和基于空間的圖像分類技術。但當前的圖像分類技術過于依賴圖像特征的提取,算法學習大多為淺層模型,同時需要大量的訓練數據進行樣本訓練(即進行有監督訓練),這導致數據量增大和計算復雜度提高。深度學習的出現解決了這一難題。深度學習減小了傳統訓練算法的局部最小性,利用底層特征合成抽象的高層來表示數據的屬性特征,不需要人為設計特征提取模型,在不改變數據原始信息的情況下降低數據維度使數據處理更加容易。聚類技術是數據挖掘的一種重要方法,是無監督學習方法,它通過分析數據集中包含的相似元素集合即簇結構來得到圖像的分類[2]。將深度學習和聚類技術結合起來,可以更好地解決現實中的問題。
深度學習的“深度”是相對于稀疏編碼、最大熵及馬爾可夫模型(HMM)等傳統淺層機器學習算法而言的。這些淺層學習算法只能處理簡單的數據,由于數據的輸入層和輸出層之間只有一層隱含節點,在面對復雜的非線性問題時,難以得到令人滿意的結果。深度學習通過生成性訓練避免過擬合現象的發生,將原始樣本空間中的特征表示進行映射變換得到新的特征空間[3]。……