劉沐涵,陳國慶,2*,肖榕陽,徐煜杰,陳哲涵,蔡紀元
(1.江南大學 理學院,無錫 214122;2.江蘇省輕工光電工程技術研究中心,無錫 214122;3.江南大學 物聯網工程學院,無錫 214122)
近年來,含乳飲料在國內的市場逐漸擴大,其食品安全問題也引起了廣泛關注[1-4]。由于含乳飲料成分復雜,其質量檢測和產品種類劃分往往費時費力。市場上銷售的含乳飲料種類繁多、質量參差不齊,消費者很難通過直觀的感覺來判斷含乳飲料的營養成分。因此,需要建立一種快速、方便、可靠的含乳飲料分類技術。
3維熒光光譜技術具有準確、快速、無損等優勢[5-15]。國內外學者主要關注食品成分的定量檢測,近年來食品分類方面的研究也逐漸開始完善。WANG等人對電子鼻應用于酒類和液體食品的分類進行了研究[16]。TANG等人利用傳感器電子舌檢測技術實現了茶飲料的分類[17]。LIU等人通過建立口味傳感器陣列對玉米汁飲料進行分類鑒定[18]。目前,暫時沒有基于3維熒光光譜結合因子分析和聚類分析的方法對含乳飲料進行分類的相關報道。
本文中對市售含乳飲料進行研究,參照含乳飲料的國家標準GB/T 21732-2008中的產品分類標準,利用3維熒光光譜技術獲取樣本數據,結合主成分分析、因子分析的方法降低變量的維數,再通過聚類分析,實現了對含乳飲料的分類[19]。
實驗中所用設備包括: FLS920P熒光光譜儀、微量移液槍以及TGL-16M臺式離心機。
樣品配置方法:選取了市場上常見的12種不同品牌的含乳飲品,用去離子水稀釋至體積分數為0.40,依次標記為樣品1~12。
將配置好的樣品放入3維熒光光譜儀中進行檢測,參量設置為:激發波長為50nm~700nm,發射波長為265nm~800nm,檢測完成后對測量結果進行了發射光譜矯正[20]。
經觀察比較,所測得的12種市售含乳飲料的3維熒光光譜依據形態可以明顯分為兩種,一種有兩個熒光峰,另一種只有一個熒光峰,如圖1所示。12種含乳飲料的熒光發射光譜如圖2所示。其中發射波長為350nm左右的熒光峰是由含乳飲料中的蛋白質類物質受到熒光激發所產生的,而550nm處的熒光峰是由含乳飲料中的有機食品添加劑(如山梨酸鉀、卡拉膠等)產生的。部分含乳飲品缺少由食品添加劑產生的熒光峰,其主要原因是添加劑濃度較低,稀釋后的樣品中添加劑含量較少,產生的熒光十分微弱。

Fig.1 3-D fluorescence spectra of two brands of milk beverages (volume fraction of milk beverages: 0.40)

Fig.2 Emission spectra of 12 brands of milk beverages (volume fraction of milk beverages: 0.40)
可以看出,不同種類含乳飲料雖然熒光發射峰的峰值位置基本一致,但是熒光峰的形狀各異。為了更好地研究含乳飲料的熒光特性,作者利用多元統計方法對3維光譜數據進行詳細分析。
首先對數據進行預處理,將得到的12組3維熒光光譜數據按發射譜依次展開,形成12組1維數據向量,共得到4709個變量和12組樣本數據。為便于比較各含乳飲料3維光譜的特性,本文中截取含乳飲料的3維光譜中能夠體現出熒光特性的一部分數據來進行分析,即發射波長為300nm~650nm所對應的波段,預處理后得到由12組樣品和956個變量組成的數據。
將預處理后的數據導入SPSS軟件,進行主成分分析,前3個主成分的方差貢獻率分別為81.87%,13.28%和3.07%。前兩個主成分的累計方差貢獻率可以達到95.15%(大于85%),因此可以只保留前兩個主成分,降維效果較好。將第一主成分(P1)和第二主成分(P2)繪制散點圖,如圖3所示。圖中,三角形對應配制型含乳飲料,圓點對應乳酸菌飲料,方塊對應發酵型含乳飲料。通過主成分分析的方法進行降維,將變量降到2維,再繪制樣品的散點圖。在圖3的坐標系中,將各點投影到45°線上,可以將各個類別分隔開,但是分類的閾值間隔并不明確。因此考慮采用因子分析的方法重新對數據進行降維。

Fig.3 Principal component analysis scatter plots of 3-D fluorescence spectra data of 12 brands of milk beverages
主成分分析是利用線性變換的思想,在損失很少信息的前提下把多個指標轉化為幾個不相關的綜合指標,每個主成分都是原始變量的線性組合,使得主成分比原始變量具有某些更優越的性能。而因子分析由研究原始變量相關矩陣內部的依賴關系出發,把錯綜復雜關系的變量表示成少數的公共因子和僅對某一個變量有作用的特殊因子線性組合而成。
對預處理后的數據運用SPSS軟件進行因子分析,并選取適當個數的公共因子組成初始因子載荷矩陣,最終保留8個公共因子。采用正交旋轉中的最大方差旋轉法,對初始因子載荷矩陣做因子旋轉,從而得到最終的因子載荷矩陣,再運用回歸分析法,計算各因子的得分系數及對應于12種含乳飲料的公共因子得分。
選用平方歐氏距離對以上因子得分矩陣進行聚類分析,聚類方法采用瓦爾德法,最終獲得的聚類譜系圖如圖4所示。

Fig.4 Results of 3-D fluorescence spectrum analysis of 12 brands of milk beverages by using Ward linkage
聚類分析譜系圖中給出了不同閾值距離下樣品的分類結果,可根據分類需求對閾值進行選擇。隨著閾值距離從0增加到25,12個樣品可以被依次分為12類(距離為0)、4類(距離為2)、3類(距離為2.5)、2類(距離為5)、1類(距離為25)。因此,如果以距離為2.5作為閾值,12個樣品可以分為3類。第1類包括1號、4號、5號、7號、10號樣品,除1號樣品外,其余樣品為發酵型含乳飲料;第2類包括2號、8號、9號樣品,除8號樣品外,其余樣品均為乳酸菌飲料;第3類包括3號、6號、11號、12號樣品,全部為配制型含乳飲料。因此,將因子分析結合聚類分析對含乳飲品的光譜進行處理,可以初步實現將市售含乳飲料劃分為3種類別:發酵型含乳飲料、乳酸菌飲料以及配制型含乳飲料,分類正確率達到83%以上。
含乳飲料的發射光譜有兩類明顯的熒光峰,分別由蛋白質和食品添加劑產生,不同品牌的含乳飲料的熒光峰形狀存在差異。主成分分析結果顯示,前兩個個主成分的累積貢獻率為95.15%(大于85%),因此保留前兩個主成分。將第一主成分和第二主成分對應的樣本點繪制成散點圖,能夠大致劃分為3類,但是類與類之間的距離閾值難以確定。通過因子分析對3維熒光光譜預處理后的數據進行降維,再利用聚類分析對降維后的數據進行處理,能夠將市售含乳飲料分為配制型含乳飲料、發酵型含乳飲料和乳酸菌飲料,分類的正確率可以達到83%以上,為開發含乳飲料分類系統提供了基礎。