摘要:常用文本分類特征選擇算法主要通過某種評價函數(shù)來計(jì)算單個特征對類別的區(qū)分能力,由于僅考慮了特征和類別之間的關(guān)聯(lián)性,忽略了特征與特征之間的相關(guān)性,從而導(dǎo)致特征集存在冗余。針對這一問題,提出了一種新的用于文本分類的特征選擇算法,該算法可以幫助選出類別區(qū)分能力強(qiáng)、特征之間關(guān)聯(lián)性弱的特征。實(shí)驗(yàn)證實(shí),該算法的性能要優(yōu)于傳統(tǒng)的特征選擇算法。