王 雨, 邢建國, 傅 均, 錢 曙
(浙江工商大學 計算機與信息工程學院,浙江 杭州 310018)
啤酒風味成分復雜,其檢測方法主要有感官品評法和理化指標檢測法[1]。前者依靠感官主觀評判,比如香氣和口味的檢測標準為有無明顯的麥芽香氣和口味是否純正,容易受到外界干擾和個體差異的影響;后者準確度高,但所需檢測時間長、花費成本高。電子鼻技術具有簡單易用、價格低廉、準確率高等優點,但與生物嗅覺相比,由于氣敏傳感器的物理特性和數量的限制,電子鼻存在區分度低、檢測時間長等問題。使用較少的傳感器陣列導致電子鼻的區分度降低,無法對具有高相似度的氣體進行有效區分,限制了電子鼻的應用范圍[1~5]。
本文提出一種基于進氣流速調制的電子鼻系統,通過動態改變進氣流速替代固定進氣流速來調節采樣氣腔中氣體分子的分布,以不同進氣流速時對應的區間梯度作為特征向量,采用改進的自適應主成分分析(principal component analysis,PCA)算法進行分類。將該系統用于啤酒風味的檢測,比較了自適應PCA(adaptive PCA,AD—PCA)、支持向量機(support vector machine,SVM)、高斯混合模型(Gauss mixture model,GMM)幾種分類算法,以驗證本文系統的有效性。
系統包括采樣閥、氣體傳感陣列、氣腔、流量計、流速選擇閥、排氣泵、執行單元、數據采集單元、數據處理單元和計算機。如圖1所示,傳感器陣列采用10只金屬氧化物半導體(metal oxide semiconductor,MOS)型氣敏傳感器。流速選擇閥用于選擇進氣流速(100,200,300,500 mL/min),能夠實現根據指令自動切換進氣流速。執行單元用于控制采樣閥、流速選擇閥和排廢泵。傳感器數據經過數據采集單元傳輸到數據處理單元,通過STM32F407的UART-to-USB直接發送到計算機,進行數據處理和分析。

圖1 系統結構框圖
常用的分類算法所需采樣和排廢時間很長,前后兩次測量間隔較大。為了提高檢測速度,本文從信號的動態響應特性提取動態特征,使用不同調制流速對應的區間梯度作為特征向量,并采用改進的AD—PCA算法進行分類。


實驗材料選擇為2017年2月份生產的5種罐裝啤酒,采購自當地超市。分別為純生啤酒、嶗山啤酒、青島淡爽型啤酒、青島清爽型啤酒和山水啤酒,原麥汁濃度均為8°P(8 %),酒精度均為≥3.1 %VOL。
5種啤酒各取100 mL,分別置于250 mL錐形瓶中,密封靜置1 h使瓶中達到飽和狀態,傳感器預熱1 h。檢測時,先抽取潔凈空氣60 s,待傳感器輸出穩定后,依次以100,200,300,500 mL/min的進氣流速進行測試,每種進氣流速持續時間為20 s,之后自動切換到下一個進氣流速,總檢測時間為80 s。檢測結束后,進行2.5 min的排廢,直至傳感器響應恢復基線再進行下一次的檢測。每個樣本測25次。
本實驗的電子鼻系統采用的氣敏傳感器如表1[7,8]。
圖2所示曲線為上述傳感器陣列對純生啤酒的原始響應信號,可以看出在20,40,60 s時,會進行進氣流速的切換,曲線會有一個很明顯的斜率上的變化,響應曲線不同于其他進氣流速單一的電子鼻??偟臏y試時間為80 s并使用非穩態值進行特征提取和分類識別。本實驗使用的特征向量為每一個傳感器曲線的第1,20,40,60,80 s時的動態信號的區間梯度值。

表1 實驗所用氣體傳感器

圖2 純生啤酒原始傳感器信號
圖3為5種啤酒的在4種流速下的PCA三維散點圖,其中圖3(b)~圖3(d)的特征向量分別包含前述流速下的特征向量,最大前3個主成分貢獻率累積分別為88.7628 %,93.872 4 %,90.637 6 %,89.047 1 %,說明采用三維散點圖足以展示這些樣本。

圖3 4種流速下的PCA三維散點圖
可以看出,流速為100 mL/min時,無法區分出樣本種類。流速為200 mL/min時,相對于其他種類的啤酒純生啤酒區分度比較好,雖然其他種類的啤酒大體上有交集,但也可以很好區分開。流速為300 mL/min時,各樣本已經可以很明顯區分。相同種類啤酒分布比較集中,不同種類的啤酒分布則有一定的距離,但也會有一些樣本偏離樣本中心,與其他樣本出現交集。如山水啤酒和青島清爽型啤酒之間會有交集,有可能是實驗操作的原因造成的誤差。流速為500 mL/min時,區分效果比之前更好一點。總體上,不同流速的區間梯度值(即差值)組成的特征向量,同一種類啤酒對應的PCA主成分分布均不完全相同,個別差別較大。因此,選擇最適合的流速有助于啤酒品種分類。
由表2可以看出,v1(100 mL/min)時,各個種類的分類正確率比較差。進行切換到v2(200 mL/min,其特征向量包含v1的特征向量,下同)后,可以很明顯看到分類正確率有了較大的提高。尤其是青島淡爽型啤酒和山水啤酒提升的最為明顯。在之后v3(300 mL/min)和v4(500 mL/min)可以看出,青島淡爽型啤酒、青島清爽型啤酒、山水啤酒v2(200 mL/min)時就已經達到最大的分類正確率。而嶗山啤酒、純生啤酒的分類正確率還是會有小幅度的提升。

表2 AD—PCA分類正確率 %
SVM分類正確率測試中,每種啤酒的樣本總數為25個,其中的15個作為訓練集,余下的10個作為測試集。訓練集總數為125個,編號1~125;測試集總數為50個,編號1~50,其中1~10為純生啤酒,11~20為嶗山啤酒,21~30為青島淡爽型啤酒,31~40為青島清爽型啤酒,41~50為山水啤酒。使用的特征矩陣為4次流速下對應的梯度值。
采用GMM算法分類正確率測試中,使用的特征矩陣為4次流速下對應的差值。數據為125×40,5種啤酒種類,每種有25個樣本。將其中20個分為訓練樣本,剩下5個為測試樣本。組成的訓練集有100×40,測試集有25×5。由于特征矩陣為差值,導致數據值比較小,根據模型生成的數據會出現負值,因此將特征數據乘以10。訓練集中1~20為純生啤酒,21~40為嶗山啤酒,41~60為青島淡爽型啤酒,61~80為青島清爽型啤酒,81~100為山水啤酒。測試集中1~5為純生啤酒,6~10為嶗山啤酒,11~15為青島淡爽型啤酒,16~20為青島清爽型啤酒,21~25為山水啤酒。
表3為3種算法的分類正確率對比。

表3 3種算法的分類正確率 %
本文設計了一種基于流速調制的電子鼻系統,應用于啤酒分類系統中,證明此系統可以有效縮短電子鼻識別的時間,提高分類準確率。