張紅梅,鄒光宇,王淼森,肖焱中,田 輝,王萬章
(河南農業大學機電工程學院,鄭州 450002)
信陽毛尖又稱豫毛峰,屬綠茶類,是中國十大名茶之一,河南省著名特產,素來以細、圓、緊、直、多白毫,香高、味濃和色綠的獨特風格而飲譽中外[1-2]。目前茶葉品質評判主要依靠專業人員感官評審,易受到人為因素的影響[3]。至今為止對茶葉品質的科學檢測方法報道,主要有Dong CW等[4]通過計算機視覺和圖像處理技術,提取不同茶葉的紋理和色澤圖像特征,采用偏最小二乘法和Ada-ELM,分別建立針芽形綠茶外形感官品質的線性和非線性預測模型,實現對不同品質綠茶的區分;Jiang H等[5]采用近紅外光譜技術,通過建立BP_AdaBoost模型與BPNN模型,對比發現近紅外光譜技術可以成功地應用于綠茶感官品質評價,BP_AdaBoost模型可更好對碧螺春茶品質進行區分;Guo H等[6]采用氣相色譜質譜聯用技術對苦蕎茶進行研究,結果表明全株茶蛋白質和脂肪含量高于全麥茶,而氨基酸和脂肪酸含量低于全麥茶;王夢馨等[7]采用電子舌技術對不同防凍措施的茶園茶葉進行檢測,結果顯示電子舌可對3種不同環境的茶葉進行良好的區分。
電子鼻是一種仿生物嗅覺的新型檢測儀器,具有檢測時間短,樣品預處理簡單,檢測結果可靠等優點,可從宏觀上對樣品品質進行檢測,在肉類[8-10]、果蔬[11-13]、酒類[14-15]等食品行業有著廣泛的應用。電子鼻在茶葉方面也有一定的報道研究,史波林等[16]研究西湖龍井茶香氣特征電子鼻檢測方法,利用軟獨立建模分類法(SIMCA)建立不同等級西湖龍井茶判別模型,等級分類正確率高達95%以上。陳婷等[17]采用電子鼻對云南普洱熟茶進行研究,結果表明電子鼻技術可用于云南普洱熟茶香氣品質判別,對于不同年份的普洱熟茶有非常好的區分度;張紅梅等[18]對信陽毛尖揮發性氣味進行研究,建立電子鼻傳感器信號與茶多酚含量預測模型,結果表明電子鼻技術結合有效地模式識別方法可以用于茶葉理化成分的快速檢測;于慧春等[19]通過電子鼻對4個等級的西湖龍井進行區分,結果表明LDA分析與BP神經網絡對茶葉有良好的區分效果。于慧春[20]研究不同貯藏時間的茶葉香氣成分同電子鼻響應的關系。結果表明電子鼻響應信號隨茶葉貯藏時間有明顯的變化。迄今為止基于電子鼻的茶葉研究,大多只提取單一特征值,單一特征的表征不能全面準確的反映出各傳感器響應的特性差異,從而會降低電子鼻判別的準確率。
本研究提取電子鼻響應信號的總體平均值、上升階段斜率平均值和相對穩態平均值作為特征值,組成一30維的特征矩陣,進行多特征數據優化融合。對原始數據信息進行歸一化處理,采用因子載荷分析、單因素方差分析對歸一化后數據信息進行降維處理。通過PCA無監督模式算法和LDA有監督模式算法,對比觀察優化前后茶葉分類效果變化,以達到減少冗余信息、減小計算復雜度的目的,在實現毛尖等級識別的基礎上,對多特征矩陣優化融合。
實驗選用茶葉樣品為2017年4月河南信陽地區所摘采的信陽毛尖明前茶,選取3種不同品質的信陽毛尖(信陽群體種),品質由高到低分別為特級(T1,特級一芽一葉初展)、一級(Y1,一級一芽一、二葉占90%以上)和二級(Y2,二級一芽一、二、三葉占85%以上),實驗前各等級茶葉采用錫紙袋密封包裝,置于-4 ℃下貯藏。
本次試驗選用由德國AIRSENSE公司生產的PEN3型便攜式電子鼻,該電子鼻具有自動調整、自動校準及系統自動富集的功能。儀器主要包含傳感器通道、采樣通道、計算機。其10個金屬氧化物氣敏傳感器分別為:W1C(S1)對芳香成分靈敏,W5S(S2)對氨氧化合物靈敏,W3S(S3)對氨水、芳香成分靈敏,W6S(S4)對氫氣有選擇性,W5C(S5)對烷烴、芳香成分靈敏,W1S(S6)對甲烷靈敏,W1W(S7)對硫化成分及烴和硫的有機成分較靈敏,W2S(S8)對乙醇靈敏,W2W(S9)對芳香成分和有機硫化物靈敏,W3S(S10)對烷烴靈敏。傳感器輸出為G/G0,其中G為傳感器接觸到揮發性氣體的電導率,G0為經標準活性炭過濾后的氣體的電導率。電子鼻自帶WinMuster軟件,對數據進行采集、測量和分析,將采集到的數據保存到計算機。
對3個等級茶葉各準備15個重復樣品,每個樣品5 g,放入250 mL燒杯中雙層薄膜密封靜置45 min。電子鼻每隔1 s采樣一次,連續采樣60 s,清洗時間50 s,可以基本使傳感器響應恢復初始狀態。試驗在室溫25 ℃下完成。
提取測試信號的總體平均值、上升階段斜率平均值和相對穩態平均值作為原始特征值,共提取10×3個特征參數,組成一30維特征矩陣,各特征參數分別記為V1、V2、V3、…、V29、V30,采用SPSS 21對原始特征矩陣依次進行歸一化處理、載荷因子分析和單因素方差分析,利用MATLAB 2014a進行PCA和LDA分析,對比分析優化前后茶葉分類效果。
10個傳感器對茶葉香氣的響應如圖1所示,從圖中可知10個傳感器隨著響應時間增加,電導比逐漸增大,在20 s時逐漸趨于穩定,到60 s時測量結束。當傳感器處于穩態時,S7、S9響應值較大,說明是對檢測結果起重要作用的傳感器,而S1、S3、S4、S5響應值極低,說明這些傳感器對茶葉氣味敏感度低。香氣是決定茶葉品質的重要因素之一,為綜合考慮各類型氣味對茶葉品質的影響,本研究保留響應值低的傳感器,對所提取的全部特征信息進行歸一化處理。歸一化處理是一種無量綱的處理手段,可消除數據屬性間差別,平滑數據的波動性,同時歸一化將數據轉換為0至1之間小數,減小了計算量,方便數據的處理[21]。本研究采用最值歸一化方法,歸一化的計算方法如下:
(1)
V′為歸一化后特征值,V為原始數據特征值,Vmax為原始特征最大值,Vmin為原始特征最小值。

圖1 信陽毛尖傳感器響應曲線

圖2 數據歸一化處理后PCA分析圖
采用PCA、LDA對歸一化處理的數據進行鑒別分析,結果如圖2、圖3所示。通過PCA降維,前兩個主成分的貢獻率分別為74.37%、16.70%,累計解釋了方差的91.07%,T1、Y1、Y23個不同等級的信陽毛尖可以被初步區分,但Y1組內間距較大,其內部樣品分布較為分散,原始特征矩陣中包含大量冗余信息,需要對特征矩陣進行進一步的優化融合。經LDA降維T1、Y1、Y2組間間距極大,3個不同等級的信陽毛尖已可良好區分。歸一化后結果顯示LDA分析能更好的將3個不同品質茶葉進行區分,LDA分析法分類效果優于PCA分析法。這可能是由于PCA算法降維原理是力求樣本在第一、二主成分坐標軸投影方差最大,避免一、二主軸包含信息的重疊,盡可能多的保留原始變量信息;LDA算法降維是為保證樣本分類后有最大的類間距離和最小的類內距離,使降維后樣品具有最佳的分離性。

圖3 數據歸一化處理后LDA分析圖
因子載荷是主成分分析應用的一個重要方面[22],其將每個傳感器提取的特征值當做一個因子變量,通過比較各因子在主成分一與主成分二軸的投影大小,選擇出影響較大的因子,可有效剔除冗余的特征信息,提高后續分析效率,因子分析結果如圖4所示。

圖4 因子載荷分布圖
由圖4可知不同傳感器提取的特征值所對應的因子載荷分布較為分散,相同傳感器提取的3個特征值對應的因子載荷有明顯重疊現象。有明顯重疊的特征值信號相似度極高,因此可以考慮對在一、二主軸上投影較大的重合點剔除一個特征因子,投影較小的重合點剔除兩個特征因子或全部剔除。最終選出在一、二主軸上投影大的因子,剔除部分重合因子,盡可能保證提取的三類特征值在優化后分布均勻。因子載荷優化后保留特征V3、V4、V5、V8、V16、V17、V19、V20、V21、V24、V25、V29,對茶葉品質進行分類。優化后的新矩陣陣列進行PCA、LDA分析,結果如圖5、圖6所示。與因子載荷優化前相比,大量特征值在優化后去除,對加快分類速度起到重要作用。PCA分析前兩個主成分的貢獻率分別為71.54%、20.83%,解釋了總方差的92.37%。T1、Y1、Y23個不同等級的信陽毛尖組內間距相對經歸一化處理后明顯減小,各類信陽毛尖茶聚集效果顯著提高,有利于對茶葉等級的劃分。但Y1與Y2的組間間距相對減小,這將造成一定程度上Y1、Y2分類的誤判,仍需要進一步的優化處理。LDA分析顯示經因子載荷分析優化,三類茶葉的組間和組內間距發生變化,區分效果依舊保持良好。

圖5 因子載荷分析優化后PCA分析圖

圖6 因子載荷分析優化后LDA分析圖
采用單因素方差分析,將因子載荷優化后的各特征值當作一個因素,3個等級茶葉的響應作為水平,進行方差齊性檢驗。表1為單因素方差分析結果,各特征組間平方和與均方越大,組內平方和與均方越小,重復性越好,其中F值越大表明該特征向量對樣品的區分度越高[23]。綜合對比各特征向量組間平方和與均方、組內平方和與均方、F值可發現,特征向量V4、V5、V21的F值最小,組間平方和與均方較小,組內平方和與均方較大,可能影響毛尖茶品質的區分應予以剔除。剔除后保留V3、V8、V16、V17、V19、V20、V24、V25、V29,對9個特征值組成的新矩陣進行PCA、LDA分析,結果如圖7、圖8所示。PCA分析顯示前兩個主成分的貢獻率分別為73.54%、21.29%,解釋了總方差的94.83%,相比經歸一化處理PCA分析解釋總方差略微增大。同因子載荷優化后相比,各等級茶葉組內間距進一步縮小,3個等級茶葉各自的聚集效果有所增強。Y1、Y2組間間距增大分類效果更加明顯,3個等級的茶葉可得到明顯區分。LDA分析表明單因素方差優化前后分類結果依舊保持良好,佐證說明特征向量V4、V5、V21存在大量冗余信息,單因素方差分析優化可進一步減少3組特征值,優化后會減小計算量,有助于加快分類速度。

表1 各特征值響應程度單因素方差分析結果

圖7 單因素方差分析優化后PCA分析圖

圖8 單因素方差分析優化后LDA分析圖
對電子鼻傳感器陣列進行優化,進一步對九維的新特征矩陣進行數據融合,去除上述提及響應值低的傳感器S3、S4、S5所對應的特征值V3、V24、V25,PCA與LDA分析結果如圖9、圖10所示。與優化前相比PCA圖顯示,3個等級茶葉的組間距離顯著減小:LDA圖顯示Y1茶葉的組內距離明顯增大,3個等級茶葉的組間距離也略微縮小。優化后整體分類效果與優化前相比有所下降,因此需要保留特征值V3、V24、V25。同時這也反映出,雖然傳感器S3、S4、S5對茶葉香氣的響應值低,但是這3個傳感器對于評判茶葉的整體品質也發揮著一定的作用。茶葉的氣味是由多種化學成分組合而成的,一些含量較低的成分也可能會對茶葉品質造成影響。因而評判茶葉品質不應僅從傳感器的響應狀態入手,而要多角度、多層次的考量。

圖9 傳感器優化后PCA分析圖

圖10 傳感器優化后LDA分析圖
本研究針對提取的三類特征值所組成的30維特征矩陣進行優化融合,分別對原始特征矩陣通過歸一化處理、因子載荷分析、單因素方差分析,實現多特征優化融合。結果顯示,最終得到的特征向量V3、V8、V16、V17、V19、V20、V24、V25、V29所組成的9維矩陣,保留了大量原始信息特征,剔除了冗余特征。通過主成分分析顯示,優化后各等級茶葉組內聚集效果顯著提高,組間間距也得到良好的區分。線性判別分析顯示,優化后3個類別茶葉組間間距增大,分類效果更明顯,且分類結果優于主成分分析。研究結果表明,基于傳感器陣列多特征數據融合鑒別信陽毛尖品質是可行的,本研究提出的優化方法可降低數據的維度,通過對各特征分析去除冗余信息后,能有效優化多特征向量組成的矩陣陣列,分類結果更加清晰明朗,實現了對傳感器陣列多特征的優化融合。另外需要指明,本研究給出的特征矩陣陣列可能不是最佳陣列,所提取的3類特征值也并非最適合毛尖品質的鑒別,這些工作還有待進一步的研究。
[1] 張巧萍,聶勝委,張玉亭,等. 信陽毛尖春茶、夏茶的品質現狀及標準淺析[J]. 西南農業學報,2015,28(1):94-98.
[2] 宛曉春,龔淑英,龔正禮. 中國茶譜[M]. 北京:中國林業出版社,2007.
[3] 周小芬,葉陽,陳芃,等. 近紅外光譜技術在茶葉品質評價中的研究與應用[J]. 食品工業科技,2012,33(5):413-417.
[4] Dong C W,Zhu H K,Zhao J W,et al. Sensory Quality Evaluation for Appearance of Needle-Shaped Green Tea Based on Computer Vision and Nonlinear Tools[J]. J Zhejiang Univ Sci B,2017,18(6):544-548.
[5] Jiang H,Chen Q. Chemometric Models for the Quantitative Descriptive Sensory Properties of Green Tea(Camellia sinensis,L.)Using Fourier Transform Near Infrared(FT-NIR)Spectroscopy[J]. Food Analytical Methods,2015,8(4):954-962.
[6] Guo H,Yang X,Zhou H,et al. Comparison of Nutritional Composition,Aroma Compounds,and Biological Activities of Two Kinds of Tartary Buckwheat Tea.[J]. Journal of Food Science,2017,82(7):1735-1741.
[7] 王夢馨,薄曉培,韓善捷,等. 不同防凍措施茶園茶湯滋味差異的電子舌檢測[J]. 農業工程學報,2016,32(16):300-306.
[8] 賈洪鋒,盧一,何江紅,等. 電子鼻在牦牛肉和牛肉豬肉識別中的應用[J]. 農業工程學報,2011,27(5):358-363.
[9] 湯旭翔,劉偉,韓圓圓,等. 基于電子鼻和非線性數據特征分析的雞肉鮮度檢測方法[J]. 傳感技術學報,2014,27(10):1443-1446.
[10] 洪雪珍,王俊. 基于逐步判別分析和BP神經網絡的電子鼻豬肉儲藏時間預測[J]. 傳感技術學報,2010,23(10):1376-1380.
[11] 傅 均,黃燦欽,章鐵飛. 便攜式智能電子鼻系統及其葡萄貨架期評價研究[J]. 傳感技術學報,2017,30(5):782-788.
[12] 王虎玄,胡仲秋,龍芳羽,等. 蘋果汁中魯氏接合酵母早期污染的電子鼻識別研究[J]. 農業機械學報,2016,47(1):209-214,220.
[13] 吳莉莉,鄭丹,鄭寶周,等. 基于電子鼻技術的花椒品種鑒別方法研究[J]. 傳感技術學報,2013,26(11):1473-1477.
[14] 周宇,孟慶浩,亓培鋒,等. 基于單類支持向量機的電子鼻在白酒真假識別中的應用[J]. 傳感技術學報,2015,28(12):1741-1746.
[15] 惠國華,陳裕泉. 基于電子鼻系統的不同風味紹興黃酒區分方法研究[J]. 傳感技術學報,2011,24(12):1799-1803.
[16] 史波林,趙鐳,支瑞聰,等. 應用電子鼻判別西湖龍井茶香氣品質[J]. 農業工程學報,2011,27(S2):302-306.
[17] 陳婷,蔣明忠,彭文,等. 基于電子鼻技術對云南普洱熟茶的香氣品質判別[J]. 西南農業學報,2017,30(2):339-344.
[18] 張紅梅,田輝,何玉靜,等. 茶葉中茶多酚含量電子鼻技術檢測模型研究[J]. 河南農業大學學報,2012,46(3):302-306.
[19] 于慧春,王俊,張紅梅,等. 龍井茶葉品質的電子鼻檢測方法[J]. 農業機械學報,2007,38(7):103-106.
[20] 于慧春. 基于電子鼻技術的茶葉品質研究[D]. 浙江大學,2007,6.
[21] 湯榮志,段會川,孫海濤. SVM訓練數據歸一化研究[J]. 山東師范大學學報(自然科學版),2016,31(4):60-65.
[22] 亓培鋒,孟慶浩,井雅琪,等. 電子鼻中預處理算法選擇及陣列優化[J]. 數據采集與處理,2015,30(5):1099-1108.
[23] 趙鐳,史波林,汪厚銀,等. 電子鼻傳感器篩選的組合優化法研究[J]. 食品科學,2009,30(20):367-370.