吳雪芹 王建民 楊倩

摘 要:為了解烤煙煙葉各項化學指標與其平衡含水率間的關系,檢測了76種國內外烤煙煙葉樣品的吸濕、解濕平衡含水率、總糖、還原糖、總氮、煙堿、氯、鉀、pH,基于RBF神經網絡技術,對煙絲的吸濕和解濕含水率進行了預測分析。預測結果表明,吸濕含水率的R值為0.91,均方差為0.21;解濕含水率的R值為0.94,均方差為0.21。
關鍵字:化學指標;平衡含水率;RBF神經網絡
煙草平衡含水率是煙草的重要物理參數之一,與煙草及其制品的加工、貯藏以及卷煙的抽吸品質間密切相關。煙草的平衡含水率由其組織結構和化學成分共同決定,且許多化學成分都會不同程度地影響其平衡含水率。本文基于RBF神經網絡技術,利用煙草行業中常用的化學指標來達到預測煙草平衡含水率,從而為卷煙企業在使用煙草平衡含水率方面提供一個間接的參考。
1 RBF神經網絡及其模型
神經網絡作為一種通用函數逼近器,可以以任意精度近似任意非線性函數和動態系統,是高度非線性對象建模的有力工具。它對系統的先驗信息要求很少,并且它具有良好的泛化能力,用它作為預測器來預測對象輸出的未來值的精度很高,在非線性系統辨識、建模、控制、信號處理等領域有著重要的應用。
2 Clementine簡介
Clementine是SPSS公司推出的企業級數據挖掘產品,它提供了包括神經網絡、決策樹、聚類分析、關聯分析、因子分析、回歸分析等在內的豐富的數據挖掘模型,它通過節點的連接來完成整個數據挖掘過程,提供機器學習和許多相關統計模型,使數據挖掘的結果更具有可靠性與精確性。本文選用SPSS公司的Clementine來進行RBF網絡模型的實現,Clemetine中的工具箱使RBF網絡的建立、訓練以及預測都變得非常簡單,而且訓練過程及效果非常直觀,使神經網絡應用于實際具有更大的可行性。
3 實驗部分
3.1材料與方法
3.1.1實驗材料
共76種實驗用烤煙煙絲,其中國內選用云南、河南、湖南、福建、湖北、貴州、四川、遼寧等10多個地區、不同部位、不同等級烤煙煙絲61種,國外選用美國、津巴布韋、巴西烤煙煙絲15種。
3.1.2 儀器與設備
Φ700mm濃硫酸干燥器 (重慶金龍玻璃制品有限公司);AL294型電子天平(感量0.0001g,梅特勒—托利多儀器有限公司);DHG-9145A型電熱鼓風干燥箱(上海一恒科技有限公司);FSJ-114型植物樣本粉碎機(農牧漁業部河南扶溝科學儀器廠);AA3連續流動分析儀(德國BRAN-LUEBBE公司);S-3C型精密酸度計(上海大普儀器有限公司)。
3.1.3 試驗方法
3.1.3.1 平衡含水率的測定
稱取樣品約5g置入鋁盒內,經烘箱法,在溫度為40±2℃下烘4h,冷卻至室溫后精確稱量樣品及鋁盒質量,在標準溫濕度條件下(溫度22±1℃、相對濕度60±2%)進行平衡含水率測定 [11]。由ISO恒溫恒濕室控制環境溫、濕度,相對濕度60%的濃硫酸干燥器控制試驗濕度。每間隔一定時間稱量樣品質量,至兩次稱量值相差不超過0.002g,視為達到平衡狀態,烘箱法[12]測量吸濕平衡含水率。測量解濕含水率時需樣品在高濕度條件下平衡3d,然后再放置于標準條件下用相同方法進行測量。
3.1.3.2 化學成分的測定
采用AA3連續流動分析儀檢測樣品的總糖、還原糖、煙堿、氯、鉀、總氮。采用加拿大健康委員會推薦的浸提法[13]測定pH值。
3.1.3.3 數據分析方法
采用DPS7.05對試驗數據進行歸一化處理,采用Clemetine11.1對試驗數據進行RBF神經網絡預測分析。
4 結果與分析
4.1 RBF神經網絡預測
4.1.1 RBF神經網絡模型的建立及參數的設定
為消除數據中各分量之間可能由于單位不同而產生的影響,首先對76種煙絲化學指標進行歸一化處理,以使得各種對應于化學成分的向量都為無量綱的單位的向量。本試驗用于神經網絡建立預測模型的數據61種,驗證模型的數據15種,驗證模型基本包括國內外大多數地區的不同部位等級的煙絲樣品。該模型建立的難點就是需要用相同的試驗樣本同時預測吸濕和解濕兩組數據,這給試驗模型的精度提出很高的要求,如果僅進行一組數據的預測,往往模型預測精度很高,而要同時滿足兩組數據的預測要求,需要對模型中的參數反復進行調試,以達到預測要求。
經過反復調試,該RBF神經網絡最終確定如下參數:模型預防過度訓練為75%,停止條件為默認值,模型選擇為使用最佳網絡,二進制集合編碼,專家模式中均采用默認值,即RBF聚類為20,持續次數為30,權值動量Alpha為0.9,RBF重疊為1.0,自動計算學習速率Eta。試驗所建立的模型如圖1所示。
4.1.2 數據分析
通過所建立的RBF神經網絡預測模型可以看出,吸濕預測模型估計的準確性為84.663,按輸入的相對重要性來分,從大到小的順序為:pH值、總糖、還原糖、鉀、煙堿、氯、總氮;解濕預測模型估計的準確性為84.434,按輸入的相對重要性來分,從大到小的順序為:pH值、鉀、氯、還原糖、總糖、煙堿、總氮。通過所建立的預測模型,對驗證模型中的數據進行預測,預測結果和實測值見表1。模型優化時主要考察的是預測值與標準值相關的相關系數系數(R)和均方差(RMSEP),當模型的相關系數(R)最大,均方差(RMSEP)最小時,RBF神經網絡所建立的模型預測值與分析樣品的實際測量值相關性最好,所建模型為最佳。
其中:Differi為第i個樣品的化學標準值與預測值之差,yi是第i個樣品的化學標準值,ym是所有樣品的化學標準值的平均值, N為預測驗證集樣品數。
5 結論
基于RBF神經網絡技術,利用76種國內外煙絲的化學指標,對煙絲的吸濕和解濕含水率進行了預測,預測結果表明,吸濕含水率的R值為0.91,均方差為0.21;解濕含水率的R值為0.94,均方差為0.21。
參考文獻
[1] Takayoshi. Measurement of migration rate of water in cured tobacco material [J]. Food Sci Technol Res, 2003, 9 (3): 245-249.
[2] Sakamoto K, Takase K, Nakanishi Y. Effects of adsorbed water on compressive properties of tobacco cut-filler aggregate [J]. Nippon Nogeikagaku Kaishi , 1998, 72: 637-644.
[3] 閻克玉,李興波,趙學亮,等.河南烤煙理化指標間的相關性研究[J]. 鄭州輕工業學院學報(自然科學版),2000(3) :20-24.
[4] 徐安傳,王超,胡巍耀,等.紅大煙葉保潤性與其重要致香物質間相互關系的研究初探[J].云南煙草,2006(6):17-22.
[5] 鄧小華,周冀衡,陳新聯,等.煙葉質量評價指標間的相關性研究[J].中國煙草學報,2008(2) :1-8.
[6] S Rcymld Chu,Rahmat Shourcshi, Manocl Tcnorio. Ncural networks for system identificxtion[J].Control Systems Magazinc,IEEE,1990,10(3):31-35
[7] J Barry Gomm, Ding Li Yu. Sclccting radial basis funotion network centers with recursive orthogonal least squares training[J].IEEE Trans, Neural Nctworks,2000,11(12):306-314.
[8] 陳文偉,黃金才.數據倉庫與數據挖掘[M].北京:人民郵電出版社.2004-2
[9] 鄭新奇,劉曉麗.基于Clementine 決策樹的空間數據挖掘方法探討——以平陰縣安城鄉為例[C]//中國測繪學會九屆二次全體理事會議暨2006年學術年會論文集.2006:560-566.
[10] 鄧尚民,韓靖.Clementine在電子商務環境中的數據挖掘應用[J].現代圖書情報技術,2007,(10):62-65.
[11] 何保江,劉強,趙明月,等. 煙草保潤性能測試方法[J].煙草科技,2009 (2) :25-28.
[12] YC/T 31-1996 煙草及煙草制品 試樣的制備和水分測定 烘箱法[S].
[13] Health Canada. Tobacco Control Programme.T-310 Determination of whole tobacco pH [S]. 1999.
作者簡介
吳雪芹(1972-),女,河南省安陽市,工程師,研究生,研究方向:煙草工藝。