潘 燕
(福建農業職業技術學院 信息技術學院,福建 福州350007)
決策樹技術的核心用途主要有兩個:分類和預測。該技術著眼的分類規則是由一組無規則的事例推理出決策樹表達形式,它采用自頂向下的方式,在決策樹的內部節點對屬性值進行比較,根據不同屬性判斷從某節點向下的分支,并在決策樹的葉節點處得到結論。整組事例中的每一條規則都在決策樹上的根節點到葉節點上體現出來,整棵決策樹對應著整組規則的排布。以決策樹算法為基礎的分類模型有一個極為突出的優勢:不需要任何領域知識和參數的假設,就可以生成可以理解的規則[1]。
以決策樹算法為基礎的分類模型有如下特征:1)分類原理簡單,通俗易懂;2)分類效率高,被廣泛應用于大數據分類;3)運用決策樹進行分類時,不需要對訓練集數據以外的知識進行學習;4)工作精度高,分類準確[2]。
作為決策樹核心分類方法之一的SVM(support vector machine)有三大優勢:1)構造的分類器少;2)不存在分類盲區;3)分類時,不必應用所有分類器。由于具有這些優勢,SVM算法多用于解決多分類問 題[3]。
下面將研究一種改進型決策樹SVM分類方法,并將其應用于圖像識別中,以檢測該算法的分類性能。
支持向量機是一種用于機器學習的方法,它以統計學習理論為基礎,通過尋找結構化風險最小的途徑來增強學習能力,達到經驗風險和置信范圍最小的目的。該算法可以實現從數量較少的樣本中獲得最優的統計規律,即尋求出正、負分類的最大間隔[4-5]。……