楊春蘭,薛大為,鮑俊宏
(蚌埠學院 電子與電氣工程系,安徽 蚌埠 233030)
?
黃山毛峰茶貯藏時間電子鼻檢測方法研究
楊春蘭,薛大為*,鮑俊宏
(蚌埠學院 電子與電氣工程系,安徽 蚌埠 233030)
利用電子鼻對6個貯藏時間5個等級的黃山毛峰茶進行檢測,首先獲取反映茶葉香氣的原始特征向量,再通過主成分分析法(PCA)提取出前5個主成分作為主特征向量,然后以主特征向量作為BP神經網絡(BPNN)的輸入,建立黃山毛峰茶貯藏時間預測模型(PCA-BPNN)。結果表明:PCA-BPNN對于貯藏0 d的茶葉,最大預測誤差為11 d,5個(6.67%)樣本預測誤差超過13 d;對于貯藏60 d的茶葉,最大預測誤差為13 d,4個(5.33%)樣本預測誤差超過10 d;對于貯藏120 d的茶葉,最大預測誤差為16 d,7個(9.33%)樣本預測誤差超過10 d;對于貯藏180 d的茶葉,最大預測誤差為19 d,8個(10.67%)樣本預測誤差超過10 d;對于貯藏240 d的茶葉,最大預測誤差為21 d,8個(10.67%)樣本預測誤差超過10 d;對于貯藏300 d的茶葉,最大預測誤差為14 d,6個(8.00%)樣本預測誤差超過10 d。該研究所建立的PCA-BPNN預測模型可用于檢測黃山毛峰茶貯藏時間,且與以原始特征變量作為輸入的BPNN模型相比,性能更好。
電子鼻;PCA;BPNN;預測模型
茶葉香氣與茶葉品質密切相關,是反映茶葉品質的重要因素。茶葉香氣是由上百種揮發性物質共同作用而形成的整體信息反映[1],構成復雜,因而少數幾個傳感器難以對其進行有效檢測。電子鼻技術的出現為復雜氣味檢測提供了一種有效的途徑。電子鼻[2]是一種仿生物嗅覺功能的檢測儀器,主要由傳感器陣列和模式識別方法組成,可以對氣味的整體信息進行識別。電子鼻技術在水果[3-4]、酒類[5-6]、肉類[7-8]等食品工業領域已經有著廣泛的應用。根據文獻檢索結果,電子鼻技術在茶葉品質檢測方面也有一定報道,但大都集中于對不同等級茶葉品質的檢測方面[9-10],對于不同貯藏時間茶葉品質檢測方面研究報道很少。眾所周知,茶葉的品質不僅取決于茶葉的等級,而且與茶葉貯藏時間的長短有關,等級越高品質越好,貯藏時間越長品質越差。
黃山毛峰茶因盛產于安徽黃山地區而得名,是中國的名茶之一,但對其品質檢測的研究報道不多,尤其是對于不同貯藏時間其品質檢測方面的研究在檢索范圍內尚未見報道。因此,本文擬利用電子鼻技術對不同貯藏時間的黃山毛峰茶品質進行檢測,并嘗試建立起一種可以預測茶葉貯藏時間的有效方法。模式識別是電子鼻重要的組成部分。BP神經網絡[11](back propagation neural network,BPNN)具有非線性映射能力強、結構簡單、泛化能力強等優點,是模式識別中廣泛使用的方法。由于茶葉香氣構成復雜,為了全面獲取茶葉的香氣信息,通常需要選擇較多的特征變量來構成原始特征向量,而這些變量之間往往會存在一定的相關性,如果以這些變量作為神經網絡的輸入,不但建模的效率低,且準確度也會下降。因此,本研究將主成分分析法(principal component analysis,PCA)與BPNN結合(以下簡稱為PCA-BPNN),建立黃山毛峰茶貯藏時間的預測模型。首先,通過電子鼻傳感器陣列獲取各等級不同貯藏時間茶葉香氣的原始特征向量,再通過主成分分析法提取出能夠反映香氣整體信息的主特征向量,最后以主特征向量作為神經網絡的輸入建立茶葉貯藏時間預測模型。
1.1茶葉樣品
試驗用茶葉樣品是從某黃山毛峰茶廠專門訂購的。為了保證試驗結果的可靠性,要求各等級新鮮茶葉均采自同一茶園且加工工藝統一,這樣可以盡量保持客觀條件一致,以減少隨機因素的影響。茶葉樣品共有5個等級,分別為R100,R200,R400,R1000,R2000,其中,數字表示價格(元·kg-1)。從2014年6月1日開始,各等級茶葉樣品每50 g分別采用錫紙袋加干燥劑獨立密封包裝,放入溫度為5 ℃的冰柜中保存。
1.2儀器設備
儀器采用PEN3型便攜式電子鼻,該電子鼻由德國Airsense公司生產,系統主要組成部分包括:傳感器陣列、數據采集軟件、輔助功能單元(采樣/清洗通道、吸附/解附單元)。傳感器陣列包含10個金屬氧化物傳感器,各傳感器特性如表1所示。傳感器輸出為G/G0,其中G為傳感器接觸揮發性氣體的電導率,G0為傳感器在經過活性炭過濾之后的純凈空氣中的電導率。
1.3試驗方法
從2014年6月1日至2015年3月30日,對不同等級茶葉樣品每隔60 d做一次檢測,連續檢測300 d,即0,60,120,180,240,300 d各檢測一次。每次試驗時,室溫保持在26 ℃,從冰柜中取出5種不同等級的干茶葉并分別準備45個重復樣品,每個樣品5 g,放入250 mL燒杯中雙層薄膜密封,靜置45 min。電子鼻每隔1 s采樣一次,連續采樣60 s,清洗時間50 s。
表1各傳感器特性
Table 1The properties of the sensors

傳感器響應特性檢測范圍(mL·m-3)W1C(S1)對芳香成分靈敏10W5S(S2)靈敏度大,對氨氧化合物很靈敏1W3C(S3)對氨水、芳香成分靈敏10W6S(S4)對氫氣有選擇性100W5C(S5)對烷烴、芳香成分靈敏1W1S(S6)對甲烷靈敏100W1W(S7)對硫化成分靈敏,對烴和硫的有機成分較靈敏1W2S(S8)對乙醇靈敏100W2W(S9)對芳香成分、有機硫化物靈敏1W3S(S10)對烷烴靈敏100
1.4數據分析及建模方法
茶葉香氣成分構成復雜,各個傳感器對于同一香氣都有響應,存在信息交叉。而為了盡可能全面地反映原始數據包含的信息,選擇的原始特征變量較多。因此,對原始特征向量采用PCA進行降維處理,消除冗余信息[12],提取出主特征向量。
神經網絡可以任意精度逼近非線性函數,且泛化能力強,是模式識別中經常采用的方法。BPNN是神經網絡中最常用的一種,具有結構簡單、設計方便等優點。因此,本研究采用BPNN建立茶葉貯藏時間的預測模型。
2.1原始特征向量的選擇
電子鼻典型響應曲線如圖1所示。從響應曲線可以看出,各傳感器在60 s以后響應趨于穩態。根據各傳感器響應曲線的變化特點,選擇各傳感器最大響應值、第60 s時的響應值(即穩態值)、60 s內響應的均值、60 s內響應曲線積分值作為原始特征變量。則由特征變量構成40維的特征向量:
X=(x1,x2,……,x39,x40)
(1)

圖1 電子鼻典型響應曲線Fig.1 Typical response curve of electronic nose
式(1)中:x1,……,x10分別為10個傳感器最大響應值;x11,……,x20分別為10個傳感器第60 s時響應值x21,……,x30分別為10個傳感器響應60 s內的平均值;x31,……,x40分別為10個傳感器響應60 s內的積分值。
2.2相關性分析
對各等級不同貯藏時間茶葉樣本原始特征向量進行相關性分析,其中相關系數采用Pearson相關,顯著性檢驗采用Two-tailed檢驗。根據相關性分析的結果,部分變量之間的相關系數值較大,存在明顯的相關性。如果以這些變量作為神經網絡的輸入,將會降低模型的預測精度。因此,有必要通過主成分分析消除原始特征向量中包含的重疊和冗余信息。不同貯藏時間R200茶葉部分變量相關系數矩陣如表2所示。
2.3PCA分析
為了克服原始數據量級的大小對主成分分析的影響,在主成分分析前對原始特征向量進行如下標準化處理:
(2)
表2不同貯藏時間R200茶葉部分變量相關系數矩陣
Table 2Correlation coefficient matrix of partial variables of R200 under different storage time

變量x1x2x11x12x21x22x31x32x11.000x20.1631.000x110.4940.3901.000x120.4760.322-0.2081.000x210.776-0.3980.7590.1861.000x220.0360.6790.3470.7020.2331.000x310.4260.1920.529-0.1300.6730.1001.000x320.2680.5670.2510.4600.2810.3270.8051.000

通過主成分分析,發現各等級不同貯藏時間茶葉原始特征向量前5個主成分方差都大于1,且累計方差貢獻率均超過90%。因此,選擇前5個主成分作為主特征變量可以概況原始變量的主要信息,原始特征向量由40維降為5維。5個等級6個不同貯藏時間前5個主成分方差及貢獻率如表3所示。
2.4PCA-BPNN預測模型設計
BPNN由輸入層、中間層和輸出層組成,網絡的學習過程中通過誤差反向傳播不斷修正連接權和閾值,直到誤差達到設定精度或學習次數達到最大設定次數學習結束。設計中采用單中間層的3層網絡結構。輸入層節點數等于輸入變量(即主成分)個數,為5個;網絡輸出為茶葉貯藏時間預測值,輸出層節點數為1個。中間層節點數選擇沒有統一的有效方法,設計過程中依靠經驗法在一定的單元數范圍內經過多次試驗確定。中間層激勵函數選擇Tansig函數,輸出層激勵函數選擇Purelin函數,學習率為0.1,動量因子為0.5,誤差精度設定為0.01。將各等級每個不同貯藏時間45個茶葉樣品分成2部分,其中30個樣本作為學習樣本,15個樣本作為預測樣本。PCA-BPNN不同中間層節點數學習結果如表4所示。可以看出,當中間層為10個節點時,平均學習次數最少,為2 223次,性能較好。因此,PCA-BPNN結構設計為5-10-1。同時,為了比較網絡性能,還設計了以原始特征變量為輸入的BPNN(以下稱為BPNN),設計方法、參數設置與前面相同,經過反復試驗確定最佳網絡結構為40-18-1,平均學習次數為3 431次。R400等級茶葉兩種網絡的學習曲線如圖2所示,由圖2可以看出,PCA-BPNN相比BPNN學習效率明顯提高。
表3茶葉不同貯藏時間前5個主成分方差及貢獻率
Table3Thevarianceandcontributionrateofthefirstfiveprincipalcomponentsofteaunderdifferentstoragetime

等級主成分方差貢獻率/%累計貢獻率/%R100F145.5648.5548.55F222.4723.9472.49F39.7210.3682.85F48.288.8291.67F51.691.8093.47R200F147.1646.3446.34F232.4731.9078.24F36.526.4084.64F45.315.2289.86F52.692.6492.50R400F145.8944.6244.62F237.1036.0780.69F36.025.8586.54F45.114.9791.51F53.012.9394.44R1000F150.7653.1753.17F224.3225.4778.64F37.357.7086.34F44.134.3390.67F51.011.0691.73R2000F149.2449.2849.28F227.4627.4876.76F311.3111.3288.08F43.093.0991.17F52.312.3193.48
2.5PCA-BPNN模型預測結果
利用PCA-BPNN和BPNN對5個等級不同貯藏時間的15個測試樣本進行預測。兩個網絡模型對各等級茶葉貯藏時間預測結果如表5所示。
表4PCA-BPNN不同中間層節點數學習結果
Table 4Learning results of PCA-BPNN with different node numbers in middle layer

隱層單元數學習次數誤差445640.01641320.01736850.01823450.011022230.011228510.011541070.012039810.01
表5兩個網絡模型對各等級茶葉貯藏時間的預測結果
Table 5Predicted storage time of each level by 2 networks
從分析結果看,PCA-BPNN最大預測誤差為21 d,BPNN為35 d;PCA-BPNN預測誤差超過10 d的樣本數及比例均小于BPNN。說明PCA-BPNN的預測精度優于BPNN。PCA-BPNN對各等級茶葉不同貯藏時間預測平均值如圖3所示。

圖2 R400等級茶葉2種網絡的學習曲線Fig.2 Learning curves of 2 networks for R400

圖3 PCA-BPNN對各等級茶葉不同貯藏時間預測平均值Fig.3 Predicted average value of each level of tea under different storage time using PCA-BPNN
本文利用電子鼻對5個等級6個貯藏時間下的黃山毛峰茶進行檢測。通過PCA提取出不同貯藏時間各等級茶葉前5個主成分,以5個主成分作為BPNN的輸入建立了茶葉貯藏時間預測模型。從預測結果分析,PCA-BPNN對于5個等級6個貯藏時間的茶葉樣本最大預測誤差為21 d。對于貯藏0 d的茶葉,最大預測誤差為11 d,5個(6.67%)樣本預測誤差超過10 d;對于貯藏60 d的茶葉,最大預測誤差為13 d,4個(5.33%)樣本預測誤差超過10 d;對于貯藏120 d的茶葉,最大預測誤差為16 d,7個(9.33%)樣本預測誤差超過10 d;對于貯藏180 d的茶葉,最大預測誤差為19 d,8個(10.67%)樣本預測誤差超過10 d;對于貯藏240 d的茶葉,最大預測誤差為21 d,8個(10.67%)樣本預測誤差超過10 d;對于貯藏300 d的茶葉,最大預測誤差為14 d,6個(8.00%)樣本預測誤差超過10 d。與以原始特征向量作為輸入量建立的BPNN的預測模型相比,PCA-BPNN建模效率和預測精度更高,性能更好。因此,PCA與BPNN結合的方法可用于黃山毛峰茶不同貯藏時間的檢測,且更有效,對于其他種類茶葉品質檢測亦具有一定的借鑒意義。
[1]趙菁. 綠茶特征香氣成分及與品質的關系研究[D].杭州:浙江大學,2002.
[2]楊俊. 電子鼻識別中的預處理與模糊神經網絡算法[D].大連:大連理工大學,2007.
[3]尹芳緣,曾小燕,徐薇薇,等.基于電子鼻的芒果儲存時間預測方法研究[J].傳感技術學報,2012,25(9):1199-1203.
[4]HUI G H, WU Y L, YE D D, et al. Study of peach freshness predictive method based on electronic nose[J].FoodControl, 2012, 28(1):25-32.
[5]LIU M, HAN X, TU K, et al. Application of electronic nose in Chinese spirits quality control and flavour assessment[J].FoodControl, 2012, 26(2):564-570.
[6]ZHOU Q, ZHANG S, LI Y, et al. A Chinese liquor classification method based on liquid evaporation with one unmodulated metal oxide gas sensor[J].Sensors&ActuatorsBChemical, 2011, 160(1):483-489.
[7]洪雪珍,韋真博,海錚,等.基于電子鼻和神經網絡的牛肉新鮮度的檢測[J].現代食品科技, 2014,30(4):279-285.
[8]BALASUBRAMANIAN S, PANIGRAHI S, LOGUE C M, et al. Neural networks-integrated metal oxide-based artificial olfactory system for meat spoilage identification[J].JournalofFoodEngineering, 2009, 91(1):91-98.
[9]于慧春,王俊.電子鼻技術在茶葉品質檢測中的應用研究[J].傳感技術學報, 2008, 21(5):748-752.
[10]陳哲,趙杰文.基于電子鼻技術的碧螺春茶葉品質等級檢測研究[J].農機化研究,2012,34(11):133-137.
[11]唐萬梅. BP神經網絡結構優化問題的研究[J].系統工程理論與實踐,2005 (10): 95-100.
[12]ZHENG L, LUKAC R, WU X, et al. PCA-based spatially adaptive denoising of CFA images for single-sensor digital cameras.[J].IEEETransactionsonImageProcessing, 2009, 18(4):797-812.
(責任編輯高峻)
Study on analysis method of storage time of Huangshanmaofeng tea by electronic nose
YANG Chun-lan, XUE Da-wei*, BAO Jun-hong
(DepartmentofElectronicandElectricalEngineering,BengbuUniversity,Bengbu233030,China)
Five levels of Huangshanmaofeng tea with 6 varied storage time were detected by electronic nose. Firstly, the original feature vectors presenting the tea odor were acquired. Then, the first 5 principal components were extracted as the principal feature vectors by principal component analysis (PCA). With the principal feature vectors used as BPNN input, a new model called PCA-BPNN for storage time analysis of Huangshanmaofeng tea was built. After experimental test, it was shown that for the tea of 0 d storage, the maximum prediction error (MPE) was 11 d, and the samples of prediction error exceeding 10 d was 5 (6.67%); for the tea of 60 d storage, MPE was 13 d, and the samples of prediction error exceeding 10 d was 4 (5.33%); for the tea of 120 d storage, MPE was 16 d, and the samples of prediction error exceeding 10 d was 7 (9.33%); for the tea of 180 d storage, MPE was 19 d, and the samples of prediction error exceeding 10 d was 8 (10.67%); for the tea of 240 d storage, MPE was 21 d, and the samples of prediction error exceeding 10 d was 8 (10.67%); for the tea of 300 d storage, MPE was 14 d, and the samples of prediction error exceeding 10 d was 6 (8.00%). In conclusion, PCA-BPNN model could be used to analyze the storage time of Huangshanmaofeng tea, and the proposed model was better than BPNN, which used original feature vectors as the input.
electronic nose; PCA; BPNN; prediction model
10.3969/j.issn.1004-1524.2016.04.21
2015-12-15
安徽省高等學校省級自然科學研究項目(KJ2013Z195);安徽省高等學校優秀青年人才基金項目(2012SQRL218);國家級大學生創新創業訓練計劃項目(201511305023)
楊春蘭(1980—),女,安徽固鎮人,碩士,講師,研究方向為儀器儀表與智能檢測、食品品質檢測。E-mail: chlyang1981@126.com
,薛大為,E-mail: bbxuedawei@163.com
TP29
A
1004-1524(2016)04-0676-06
楊春蘭,薛大為,鮑俊宏. 黃山毛峰茶貯藏時間電子鼻檢測方法研究[J]. 浙江農業學報,2016,28(4): 676-681.