摘要:煙絲化學(xué)成分可以由實(shí)驗(yàn)方法提取出來(lái),但其關(guān)鍵致香成分很難確定。針對(duì)這一問(wèn)題,一般采用化學(xué)分析方法,但分析耗時(shí)比較長(zhǎng)。根據(jù)煙絲化學(xué)成分與香氣風(fēng)格關(guān)系,使用基于信息增益的特征選擇方法進(jìn)行提取致香成分。通過(guò)計(jì)算煙絲化學(xué)成分中的每個(gè)屬性的信息增益,從中挑選出信息增益大于0的值作為特征選擇的結(jié)果進(jìn)行分類預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,使用該方法能夠得到較準(zhǔn)確的關(guān)鍵致香成分,與傳統(tǒng)特征選擇方法相比,其特征數(shù)據(jù)集的分類結(jié)果也更加準(zhǔn)確,可以作為煙葉香型分類的有效工具。
關(guān)鍵詞:信息增益;特征選擇;致香成分;煙葉香型
中圖分類號(hào):TN911—34;TP391文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1004—373X(2012)18—0092—03
香味、香氣是評(píng)價(jià)卷煙產(chǎn)品品質(zhì)的重要指標(biāo),主要依靠專家進(jìn)行評(píng)吸來(lái)完成,由于受到個(gè)人主觀方面的制約以及香味無(wú)法定量描述其數(shù)量和品質(zhì)等原因,始終無(wú)法確定煙絲中的致香成分對(duì)卷煙產(chǎn)品的香氣風(fēng)格的影響作用[1—2]。目前,大多研究都集中在結(jié)合數(shù)理統(tǒng)計(jì)方法等對(duì)卷煙產(chǎn)品的研究。
針對(duì)這一現(xiàn)狀,提出了一種基于信息增益的特征選擇算法對(duì)煙絲關(guān)鍵致香成分進(jìn)行分析。通過(guò)信息增益方法提取關(guān)鍵特征,能夠?qū)崿F(xiàn)數(shù)據(jù)集有效降維,深入認(rèn)識(shí)關(guān)鍵特征屬性對(duì)輸出變量的影響關(guān)系,并且給出了M5P決策樹(shù)、逐步線性回歸、偏最小二乘回歸算法在原始數(shù)據(jù)集以及兩個(gè)特征選擇的數(shù)據(jù)集的比較分析結(jié)果,實(shí)驗(yàn)表明基于信息增益的特征選擇方法提取的關(guān)鍵特征的分類結(jié)果具有較高的準(zhǔn)確率。
1信息增益與特征選擇
1.1信息增益