韓方凱,張雪柯,宋玉軍,呂日琴,張東京,翟科峰
葡萄酒味美、富含大量的生理活性成分,深受消費者喜愛.近年來,隨著生活水平的提高,葡萄酒的消費越來越大眾化,同時葡萄酒的品質問題亦受到人們的廣泛關注.傳統的葡萄酒品質評價方法主要包括感官評價法和理化分析分法.感官評價雖簡單易行,卻具有較強的主觀性;理化分析雖然客觀可靠,然而每一種理化指標僅能標志葡萄酒一方面的品質特性,無法實現葡萄酒綜合品質的準確評判.因此,葡萄酒綜合品質檢測新技術的開發尤為迫切.
為了克服傳統檢測方法的缺陷,研究人員采用新型傳感器技術,如電子舌、電子鼻、近紅外等,開發葡萄酒綜合品質的快速檢測方法.其中,近紅外光譜技術具有檢測速度更快、無需樣品預處理的明顯優勢,具有較大潛力.2009年,吳桂芳等人采用近紅外結合BP-人工神經網絡實現了不同品牌葡萄酒樣本的準確識別[1];2010年,劉巍等人采用近紅外光譜技術構建了不同產地葡萄酒樣本的Fisher判別識別模型,獨立樣本正確識別率達到86.7%[2];2017年,Jing Yu等人采用近紅外結合徑向基人工神經網絡和最小二乘支持向量機構建了不同葡萄品種的葡萄酒識別模型,預測準確率均在90%以上[3].
極限學習機(Extreme learning machine,ELM)是一種新型前饋神經網絡算法,由Huang等人于2006年首次提出[4].與傳統采用梯度下降法的神經網絡相比,ELM隨機產生輸入層與隱含層的連接權值及隱含神經元閾值,具有學習速度快,且泛化能力好的優勢,現已廣泛用于模式識別.然而,目前國內外尚未出現采用近紅外光譜技術結合ELM算法建立葡萄酒品質快速識別方法的相關報道.
本研究嘗試采用近紅外光譜技術結合ELM算法構建不同產地、葡萄品種、品牌葡萄酒樣本的快速識別模型,以克服傳統檢測的缺陷,建立葡萄酒品質快速識別新方法.
研究所用葡萄酒樣本信息如表1所示.采樣結果保證同一品牌(張裕),同一葡萄品種(赤霞珠),不同產地(山東煙臺、河北廊坊、陜西咸陽)的葡萄酒樣本各10個;同一葡萄品種(赤霞珠),同一產地(山東煙臺),不同品牌(張裕、長城、朋珠)的葡萄酒樣本各10個;同一品牌(張裕),同一產地(山東煙臺),不同葡萄品種(赤霞珠、蛇龍珠、美樂)的葡萄酒樣本各10個.

表1 葡萄酒樣本
研究采用傅立葉變換近紅外光譜儀(WQF-600N,北京北分瑞利分析儀器(集團)有限責任公司)對葡萄酒樣本進行檢測分析.儀器參數設置如下,采樣分辨率為4cm-1,數據范圍為3300.00cm-1~10000.00cm-1,每個樣品掃描次數為32次.測樣時,直接將葡萄酒樣本原液置入樣品室內進行光譜掃描.
研究首先采用主成分分析(Principal Component Analysis,PCA)對原始光譜信息進行降維和去共線化,以可以解釋原始變量信息90%以上的主成分得分作為輸入構建ELM模型.經過多次對比研究,采用閾值傳遞函數(hardlim)作為隱含層神經元激活函數.隨機選取每組樣本總數2/5個樣本作為測試集,其余樣本作為訓練集構建ELM模型,并考察了不同隱含層神經元個數對模型預測效果的影響.
近紅外光譜是由樣品中含氫基團(C-H,O-H,S-H,N-H)分子振動引起的,反映出這些基團基頻振動的合頻與倍頻信息,波普范圍內,二級倍頻區與三級倍頻區,一級倍頻區與二級倍頻區,合頻區與一級倍頻區都有一定的重合帶,再加上葡萄酒本身的復雜性,導致酒樣近紅外光譜數據具有嚴重的共線性.因此,研究首先采用PCA對近紅外光譜數據進行預處理,以達到降維和去共線化的目的.不同產地、葡萄品種及品牌的葡萄酒樣本近紅外光譜信息在不同主成分下的累積貢獻率如圖1所示.可以看出,前7個主成分的累積貢獻率已達到90%以上,可認為能夠代表原始變量信息.

圖1 不同主成分累積貢獻率
ELM測試集預測結果如圖2所示.從圖中可以產出,針對產地識別,其中本屬于山東煙臺的2個樣本判錯給陜西咸陽,正確識別率為83.33%;針對品種識別,其中1個屬于赤霞珠的樣品錯判給蛇龍珠,正確識別率為91.67%;針對品牌識別,共有2個樣本預測錯誤,其中有1個屬于張裕牌的樣品和1個屬于長城牌的樣品均錯判給朋珠牌,正確識別率為83.33%.

圖2 ELM測試集預測結果(A-產地識別,B-品種識別,C-品牌識別)
從ELM模型預測結果可以產出,近紅外光譜技術對品質差異性的成品葡萄酒樣本預測正確率均在83%以上,效果良好.這主要是由于產地、葡萄品種及生產工藝(品牌)是影響成品葡萄酒綜合品質的主要因素.產地、品種及品牌的差異導致終端葡萄酒產品理化成分(如酚類、香氣成分、pH、總酸等)的差異[5-7],而近紅外光譜技術可以識別出復雜基質中有機物成分及含量的變化,從而可以實現品質差異性葡萄酒樣本的識別.
為克服葡萄酒綜合品質傳統檢測方法的局限性,研究采用近紅外結合ELM建立葡萄酒品質快速識別方法,結果顯示,ELM模型對不同產地、葡萄品種、品牌葡萄酒樣本的正確識別率均在83%以上.可以看出,近紅外結合ELM可用于葡萄酒綜合品質的快速預測.