荊曉語, 繆 楠, 楊正偉, 李慶盛, 張 鑫, 王志強
(山東理工大學 計算機科學與技術學院, 山東 淄博 255049)
普洱熟茶是以云南大葉種曬青毛茶為原料經特殊發酵后加工而成的[1]。普洱茶具有抗氧化、降血脂、降血糖、抑菌、助消化、醒酒、解毒等作用[2]。隨著貯存時間的增加,普洱茶的內部會發生復雜的化學變化,使得普洱茶的風味和口感有很大提升[3]。近年來,受經濟利益驅動,市場上常會出現普洱茶產品以新替舊、以次充好等現象,嚴重損害了消費者的權益和普洱市場的聲譽。傳統普洱茶存儲年限鑒別方法主要有感官分析法和理化分析法。感官分析法受人為因素影響較大,結果的客觀性容易受到干擾[4];理化分析法目前主要采用傅里葉紅外光譜、表面增強拉曼光譜、高效液相色譜法、近紅外光譜等技術對普洱茶中的酚類、醇類、酸類、酯類等成分進行分析,但是其檢測儀器成本高、體積大、分析過程繁瑣、耗時耗力。
電子舌是一種新型的現代化分析儀器,應用多元統計分析與電極陣列相結合的方法,分析檢測復雜的普洱茶溶液樣本,這種方法優勢在于操作便捷、容易攜帶、成本低、檢測速度快以及再現性良好。近幾年來,電子舌在食品的定性或定量分析過程中取得了一定的效果,現已在茶葉、水、酒、肉等食品中展開應用。電子舌系統的關鍵技術是模式識別,其適用性直接影響到檢測結果的準確性,主要包含特征提取與分類識別兩個步驟。特征提取是從原始的電子舌信號中提取出最重要的信息,從而減少后續數據分析的復雜性。截面積法、特征點法、傅里葉變換和主成分分析法為當前采用的特征提取方法,但這些方法只能提取信號中有限的表征參數,樣本的整體信息無法全面的反映出來[5-6];分類識別是基于所提取的特征信息對樣本分類或識別的方法。神經網絡、支持向量機、隨機森林、極限學習機為現常用的分類識別方法,但因工作參數優化受限的問題,很難使分類效果達到最優。
基于前期對普洱茶的研究,以5種儲存年限的普洱茶為實驗材料,使用實驗室自主研發的電子舌系統為平臺對其進行識別。針對電子舌響應信號的特點,本文的數據預處理采用離散小波變換( discrete wavelet transform,DWT)對電子舌信號進行分析,對不同普洱茶樣本分類識別是通過構建粒子群優化最小二乘支持向量機(Particle swarm optimization-least squares support vector machine,PSO-LSSVM)模型,從而建立了一種對普洱茶存儲年限快速、準確鑒別的新方法。
實驗材料來自于勐海茶廠出產的普洱熟茶,出廠時間分別為2012年、2014年、2016年、2018年和2020年5個不同的年份。準確稱量5 g茶葉,將茶樣放在200 ml沸騰蒸餾水沖泡5min,茶溶液經濾紙過濾,冷卻至室溫(25±2 ℃)后采用伏安電子舌進行數據采集。每個樣本采集完成后,用AL2O3粉末對傳感器陣列進行打磨,放入超聲波清洗儀中清洗。共采集到250個樣本信號,其中2012年、2014年、2016年、2018年和2020年的樣品數量均為50個,用于模型訓練和測試的樣本數量之比為8∶2。
實驗設備采用本實驗室自行開發的大幅脈沖電子舌系統、傳感器、信號調理電路、數據采集卡和基于LabVIEW的上位機軟件組成的系統。本文自主研發的系統結構如圖1所示。工作過程為:由上位機軟件控制數據采集卡產生大幅方波脈沖激勵信號,該信號通過信號調理模塊施加至傳感器陣列,在激勵信號的激發下,樣本溶液在傳感器工作電極表面發生電化學反應,而且產生弱電流響應信號。通過信號調理模塊I/V對電流信號進行轉換、放大和濾波,然后送入數據采集卡進行模/數轉換,最后送入上位機進行信號處理和模式識別分析[7]。

圖1 電子舌系統結構圖
1.3.1 離散小波變換
小波變換被稱為“數字顯微鏡”,其可以對信號進行多分辨率、時頻域、自適應等局部化的分析[8]。由于其分辨能力強、壓縮效果好、有效信息保存完整,已被成功應用在激光誘導擊穿光譜、醫學影像分析等領域中。離散小波變換(DWT)是一種在尺度和位移上離散化處理的小波變換。本研究根據電子舌響應信號的特點采用離散小波變換對其進行Mallat小波分解,公式(1)如下:
(1)

電子舌數據經小波分解后,低頻分量被完整的留了下來,而高頻分量則被剔除。原有信號中有效信息被保留下來,一方面可以獲得特征提取的作用,另一方面起到數據壓縮的作用。
DWT對電子舌數據的壓縮效果主要取決于小波基函數和分解層數的選擇。特征信息的提取效果是由小波基函數決定的,最終的數據規模是由分解層數決定的。為了盡量減少特征信息丟失,尋求最優的壓縮效果,本研究采用波形相似系數對離散小波變換效果進行可視化評價,再選擇最合適的分解層數和小波基函數,波形相似系數公式(2):
(2)
其中,A為電子舌原始信號數據;B為經離散小波變換后的壓縮重構信號數據;ai為A的第i個數據;bi為B的第i個數據;fc為波形相似系數(0~1),反映了原始信號與壓縮重構信號之間的相似性,fc越大表明兩波形之間的相似性越高。
1.3.2 PSO-LSSVM
最小二乘支持向量機(LSSVM)是在SVM的基礎上衍生的一類算法。其將SVM中的二次規劃問題轉化為線性方程組的求解問題,從而提高了算法的求解速度和泛化能力[9]。LSSVM的性能主要取決于正則化參數和核函數寬度的選擇,本文采用粒子群優化算法(PSO)對LSSVM的參數進行全局尋優,從而提高LSSVM算法的分類準確率,其流程如圖2所示。

圖2 PSO優化LSSVM算法的基本流程
PSO-LSSVM算法步驟如下:
對于學習樣本:
T={(xi,yi)|i=1,2,…,n}
(1)假設最優回歸函數,式(3):
y=ωT·x+b.
(3)
其中,ω為權向量,b為偏置量。
(2)將回歸問題轉化為求解最優問題,式(4):
(4)
其約束條件為式(5):
yi=ωT·xi+b+ξi,i=1,2,…,n.
(5)
其中,ξi為松弛因子,γ為正則化參數。
(3)引入拉格朗日函數,式(6):
(6)
其中,αi為拉格朗日因子。
(4)選用高斯徑向基函數(RBF)作為核函數,式(7):
(7)
其中,σ2為核函數寬度。
(5)采用PSO 算法對正則化參數γ和核函數寬度σ2進行尋優,式(8):
(8)

(6)確定LSSVM回歸函數,式(9):
(9)
圖3為8個工作電極在大幅脈沖信號激勵下單個普洱茶樣本的響應信號。從圖3可以看出,在相同樣本中, 8個工作電極的響應信號之間存在著較大差異。為了避免實驗數據的復雜性,應選擇盡可能少并能反映樣本整體信息的電極。經過多次實驗驗證分析,玻、碳、鎳、鈀、鉑、鎢。鈦、金、銀8個電極可以基本反映普洱茶樣本的整體信息。因此本實驗采用電子舌系統單次檢測,從普洱茶樣本中獲得8 000個數據點。

圖3 工作電極陣響應信號
2.2.1 DWT-PSO-LSSVM的建立
分別采用Symlets、Daubechies、Haar、Coiflets小波函數對普洱茶電子舌響應信號執行4至7層分解。其重構信號與原信號的波形系數fc變化情況,如圖4所示。

圖4 不同小波基和分解層數下的波形相似系數統計
從圖4可以看出,不同的小波基對應的波形系數存在較大不同。整體而言,隨著分解層數不斷地增加,fc變化均呈現下降的趨勢,說明在小波變換過程中,隨著分解層數增加,能夠減少更多的冗余信息,數據量會大大減少。通過分析,最后選擇sym6
小波基函數,分解層數為7層。經過DWT預處理后,信號原始數據由8000個點壓縮至73個,極大減少了后續模式識別處理的難度。
采用PSO算法對LSSVM模型的參數進行優化,PSO算法參數設置為:c1=1.5,c2=1.7,初始粒子數為20,最大迭代次數為200。通過對訓練數據的學習及PSO算法對LSSVM模型參數的優化調整,得到LSSVM模型對普洱茶年限預測的最優參數為σ=81.4352,c=43.027 7。
2.2.2 模型性能對比分析
基于DWT方法提取電子舌特征信息,利用測試集數據分別建立基于BPNN、LSSVM和PSO-LSSVM模型的分類混淆矩陣,結果如圖5所示。其中橫坐標為預測類別,縱坐標為目標類別,0~8分別代表5種不同普洱茶的存儲年限。從圖5中可以看出,LSSVM對普洱茶年限鑒別的正確分類樣本數大于BPNN模型,而PSO-LSSVM的正確分類的樣本數大于LSSVM。說明DWT-PSO-LSSVM模型對普洱茶具有良好的區別辨識能力,可以對不同年限的普洱茶進行有效鑒別。

圖5 3種模型的分類混淆矩陣(BPNN模型、LSSVM模型、PSO-LSSVM模型)
對三種模型采用精確率(Precision)、召回率(Recall)和F1-Score參數對比分析,結果見表1,各參數計算公式(10)、(11)和(12):
(10)
(11)
(12)
其中,Tp表示真實的正樣本數量;Fp表示真實的負樣本數量;FN表示虛假的負樣本數量。
從表1中可以看出,PSO-LSSVM模型的Precision、Recall和F1-Score分別為94.8%、94%,0.936,均高于BPNN和LSSVM模型。

表1 不同模式識別模型的性能對比
采用實驗室研究的電子舌系統對不同存儲時間的普洱茶進行定性分析。運用DWT對電子舌輸出信號進行預處理,利用DWT輸出特征數據作為輸入,建立LSSVM分類模型,利用PSO算法對LSSVM的(c,σ)參數進行尋優操作。實驗表明電子舌結合PSO-LSSVM模型可以有效地分辨普洱茶的不同存儲時間。該研究可為茶葉類產品的質量檢測提供新的研究思路。