謝有超,彭黔榮,2,*,楊 敏,張 榮,付陽洋
(1.貴州大學化學與化工學院,貴州貴陽 550025;2.貴州中煙工業有限責任公司技術中心,貴州貴陽 550009;3.貴州大學藥學院,貴州貴陽 550025)
我國是世界上最早養蜂的國家之一,目前,蜂群總數已達到920萬群,占世界蜂群總數的13%。由于蜂群種類和數量的紛繁復雜,我國既是蜂產品生產大國,也是出口大國,2018 年我國蜂蜜行業產量約54.25萬噸,天然蜂蜜的出口量到達了10萬噸[1]。蜂蜜是指蜜蜂從花朵中采集花蜜并儲藏在蜂巢中的濃稠、甜味、似糖漿的物質,主要由碳水化合物(75%~80%)、水(15%~18%)、蛋白質(0.29%~1.69%)、有機酸(0.1%~1%)和礦物質(0.03%~0.9%)組成[2]。它是一味營養豐富、藥食同源的食品,共有180多種營養成分,老年人和嬰兒都能食用,具有補脾胃、潤腸、潤肺和解毒等功效。蜂蜜中含有的超氧化物歧化酶(SOD)是一種氧自由基清除劑,具有延緩衰老的功能[3]。此外,蜂蜜可作為輔助藥物用于臨床,能夠起到防癌以及抗癌的良好功效[4-5]。
蜂蜜中由于具有復雜多樣的化學成分,傳統的檢測方法如高效液相色譜法、高效液相色譜/質譜法、氣相色譜法、氣相色譜/質譜法等通過化學分析化學手段得出被測成分含量,是對蜂蜜內部品質檢測及摻假判別檢測的國際標準方法[6-7]。雖然這些方法敏感性較高,但設備成本高、檢測手段單一、操作過程復雜,對樣本有破壞,已難以滿足生產實踐中對蜂蜜品質及摻假鑒別的大批量、快速、無損的檢測需求。近紅外(NIR)光譜技術以其具有快速、高效、環境友好等特點,在石油化工[8-9]、制藥[10-11]、煙草[12-13]等行業都扮演著重要作用。NIR分析手段也被廣泛應用于蜂蜜中的果糖、葡萄糖、蔗糖、麥芽糖、水分以及微量成分的檢測、分析鑒別蜂蜜摻假、植物花蜜來源和產地鑒別。本文基于近紅外光譜技術在蜂蜜檢測的應用現狀,綜述了化學計量學解析近紅外光譜對蜂蜜定量和定性分析的研究成果,對近紅外光譜技術在蜂蜜檢測中存在的問題進行總結,并進一步對蜂蜜檢測方法提出展望。
近紅外光譜技術作為一種較為成熟的光譜技術,可實現對蜂蜜中糖類、水分、羥甲基糠醛等理化指標的快速檢測。定量模型的選擇直接影響著對蜂蜜中成分含量的預測能力,可分為線性和非線性校正方法。偏最小二乘法(PLS)作為一種線性回歸的多元校正方法,當各變量內部高度相關時,通過對檢測樣品的光譜陣X和濃度陣Y同時進行分解,并在分解時考慮X和Y兩者間的相互關系,加強對應計算關系,保證最佳校正模型的建立[14]。PLS是多元線性回歸、典型相關分析和主成分分析的完美結合,是所有多元校正方法里變量約束最少的方法,這種靈活性使之用于當樣本數據遠小于變量數時,也能得到最佳的回歸系數,在光譜多元校正分析中得到了最為廣泛的應用。
蜂蜜之所以被認為是高價值的食品,是因為其碳水化合物(主要是葡萄糖和果糖)為生物體提供即時能量,蜂蜜中果糖和葡萄糖的含量及比例對蜂蜜的結晶狀態和營養效能也有較大影響[15]。當前針對糖類的檢測手段如液相色譜法存在著分析成本高、環境不友好、檢測技術水平低等弊端,無法實現快速和實時檢測。蜂蜜中果糖、葡萄糖、蔗糖和麥芽糖等糖類成分均有-CH2、C-O、O-H等基團,在近紅外區均有特征吸收峰[16]。因此,采用近紅外光譜技術可以實現對蜂蜜中的糖類成分的檢測。
在目前的研究中,糖類成分的定量分析大多采用PLS校正模型,極少采用非線性定量模型如人工神經網絡(ANN)對蜂蜜中的糖類成分進行預測。大部分的研究在于如何采用不同的預處理方法和特征變量選擇提高PLS模型對蜂蜜中糖類含量的預測能力,通過模型建立和驗證過程中用到的統計參數,如校正標準偏差(SEC)、預測標準偏差(SEP)、決定系數(R2)或相關系數(R)等對PLS校正模型進行評價。
邱琳等[17]以多批次不同產地、不同品種的原蜜、煉蜜及商品蜂蜜樣本為研究對象,以液相色譜-示差折光法分別測定蜂蜜中果糖、葡萄糖和還原糖的化學值為參考值,用PLS分別建立三種糖類的近紅外光譜與化學值的定量分析模型,以標準正態變量變換(SNV)、多元散射校正(MSC)、SNV作為預處理方法和以留一內部交互驗證法確定最佳因子數所建的回歸模型的R分別為0.97390、0.92794、0.95268,SEP分別為0.647%、1.300%、1.270%。蜂蜜中糖類含量的預測結果均較好,表明應用近紅外光譜技術可用于對蜂蜜糖類成分進行定量檢測。
丁家欣等[18]用高效液相色譜-蒸發光散射檢測器(HPLC-ELSD),測定了國內不同地區蜂蜜樣本中的葡萄糖和果糖,并將其測定的化學值作為建模的參考值。再用近紅外透射光譜法采集光譜,為解析復雜和重疊的光譜信息,采用一階導數和數據中心化對光譜進行預處理。以交互驗證法優化葡萄糖和果糖分析模型的最佳因子數,建立蜂蜜光譜與葡萄糖和果糖的PLS模型,校正模型的R值分別為0.918、0.954,RMSEP為1.610、1.879。相比于HPLC-ELSD法測定蜂蜜中糖類含量,極大地減少了分析步驟和時間,為快速測定蜂蜜中葡萄糖和果糖提供了檢測方法。
蜂蜜中糖類成分的檢測可通過PLS建立線性的校正模型,在實際工作中,光譜變量與濃度之間具有一定的非線性。為了比較線性和非線性分析模型對于蜂蜜中糖類含量的測定能力,?zbalci等[19]采集了不同品牌的蜂蜜樣品光譜,分別以PLS和人工神經網絡(ANN)建立對葡萄糖、果糖、蔗糖和麥芽糖含量的預測模型,發現以PLS建立的分析模型R值為0.964、0.965、0.968、0.949,而在930種不同拓撲結構中選擇出的四種最佳ANN模型的R值為0.965、0.965、0.978、0.956,這表明出兩種分析模型都能快速準確測定蜂蜜中的糖類成分,并且由兩種化學計量學所建立的回歸模型得出的結果差異性不大,為檢測蜂蜜含量提供了不同研究思路。
在對不同蜂蜜糖類的預測中,PLS模型的R值都能達到90%以上,表明近紅外光譜技術采用PLS模型的預測值與傳統化學分析手段的參考值相關性極高,可使用近紅外光譜技術逐漸替代傳統的分析方法實現對蜂蜜糖類的快速檢測。非線性校正模型ANN和線性校正模型PLS的R值十分接近,但在模型建立的過程中,非校正模型的認知難度要大于PLS。因此,在對蜂蜜糖類成分進行快速、高效檢測時,首先考慮建立PLS線性校正模型。
水是蜂蜜中的第二大成分,被認為是蜂蜜最重要的特征之一,其含量的多少會影響蜂蜜的理化性質,如粘度、比重量、風味和結晶[20]。水分含量高的蜂蜜在高溫下容易發酵,引起變質。蜂蜜中水分含量的高低受多種因素影響,如蜜源的種類、溫度和濕度、釀蜜時間的長短和養蜂人員的技術等[21]。目前,對蜂蜜中水分含量的測定方法常采用折光法,但其對檢測環境和檢測樣本的均勻性要求較高,因此,近紅外光譜法作為一種簡單快速的分析手段被逐漸用于蜂蜜水分的檢測之中。
水在近紅外譜區有一些特定的吸收譜段區,研究者大多從特征波長的選擇方法進行研究,通過對蜂蜜樣本近紅外光譜圖的特征波段進行優化選取建立最佳的PLS校正模型,從而不斷提高蜂蜜中對水含量的預測能力。
Li等[22]采用SN/T 0852-2000進出口蜂蜜檢驗方法對市售蜂蜜樣品的水分含量進行測定,作為模型參考值。為盡可能地包含樣品特征信息,降低噪音干擾,在對樣品進行近紅外采集光譜后,采用一階導數+MSC+Savitzky Golay(SG)濾波平滑的方式對光譜進行預處理。通過特征吸收峰位置確定波長范圍并建立水分的PLS定量分析模型。對校正模型進行準確性考察后得到其校正集的相關系數為0.9990,校正集的均方差(RMSEC)為0.174,實測值與模型預測值的相對偏差在±5%以內,證明了運用近紅外技術檢測蜂蜜水分的可能性。
為提取最有效的光譜信息,減少建模所用的變量數,提高模型對蜂蜜中水分的預測精度,屠振華等[23]在模型建立過程中利用了不同特征波長選擇辦法,以相對標準偏差(RSD)評價模型性能。結果發現,以反復遺傳算法選擇作為一種全局性的特征波長選取方法,不僅有效使建模所用的變量數減少了95%,同時也提高了模型的預測精度和穩定性,水分模型的相關系數也由未經變量選擇的 0.9758 提高到了 0.9833,校正相對標準偏差(RSDC)和預測相對標準偏差(RSDP)分別由2.06%、2.34%下降到1.71%、2.04%。
不同光譜波段和不同預處理方法的選擇會直接影響所建近紅外光譜模型對蜂蜜水分的預測能力,劉晨[24]對77組蜂蜜樣本通過近紅外采集光譜,并通過由特征吸收和無特征吸收的六個波段建立模型。在六個不同波段之中分別以基線校正、消除常數偏移量、歸一化和一階導數四種不同光譜預處理方法校正模型,以相關系數和驗證校正標準差(RMSECV)評價模型性能。結果表明,在4850~5120 cm-1波段中,R可以達到99.42%,RMSECV為1.01,采用的不同預處理方法結合PLS對水分的預測準確率都可以達到94%以上,這為快速建立蜂蜜水分分析模型的波段區間選擇提供了參考。
特征選擇作為近紅外光譜分析中不可缺失的一個環節,其波長或波段的選擇能顯著影響PLS校正模型對于蜂蜜中水分含量的預測。特征變量提取的方法繁多,使用不同的方法可能會得到不同或差異較大的預測結果,因此,針對不同的蜂蜜樣本,除了通過水的特征吸收峰確定校正譜段外,還應比較不同特征選擇方法對模型的影響,從而建立對蜂蜜水分含量預測效果最佳的PLS模型。
羥甲基糠醛(HMF)是衡量蜂蜜質量的一個重要指標,它幾乎不存在于新鮮純正的蜂蜜中,因此可以反映蜂蜜新鮮程度及加工處理條件的優劣。它是由糖的降解形成的,主要來自果糖,果糖在熱穩定性上比蔗糖和葡萄糖差,在酸性條件下就會部分脫水生成羥甲基糠醛[25]。在過去的幾十年里,美國國家環境健康科學研究所致力對HMF進行研究,以便獲得與之相關的毒性信息,一些研究人員已證實了HMF具有致癌能力[26]。最近的研究也表明HMF的代謝產物也可能是致癌化合物,危害人體健康[27-28]。
蜂蜜中的HMF一般用高效液相色譜法進行測定,其前處理繁瑣、檢測時間長,不利于實時檢測。HMF對人體有害,消費者們希望能快速方便地檢測出其在蜂蜜中的含量,保證蜂蜜的品質。近紅外光譜技術中的PLS校正模型由于在多元分析中能實現對小樣本光譜數據的分析,研究者常通過對模型預處理方法和潛變量數進行優化得到最佳的回歸模型,由顯著性檢驗等方法判斷近紅外光譜法與傳統分析手段有無差異。
鄭連姬等[29]利用高效液相色譜測定97個蜂蜜樣品HMF的化學值,并采用透反射方式采集樣品光譜。為了提高校正模型的預測能力,通過Norris求導法(Norris derivative)和一階導數及10個因子數對光譜進行預處理,建立了蜂蜜中羥甲基糠醛的近紅外光譜與化學值間的校正模型,PLS模型的校正決定系數、交叉驗證系數分別達到0.99874、0.99620,RMSEP為2.02,RMSECV為2.40。與傳統高效液相色譜法所得的化學值進行t顯著性檢驗,得出P>0.05,表示兩種方法檢測結果無顯著性差異,證實了近紅外光譜技術可用于對蜂蜜中HMF含量進行測定。
在蜂蜜精制過程中可能會產生影響人體健康的5-羥甲基糠醛(5-HMF),Li等[22]對同仁堂收集的蜂蜜樣本通過近紅外光譜技術建立PLS模型,采用一階導數+SG平滑+MSC的光譜預處理方法,以預測殘差平方和(PRESS)為判據選擇潛變量因子數14建立校正模型,其模型很好地預測了不同精煉溫度和精煉時間的蜂蜜樣本,R到達了0.9963,RSEVC為0.7857,比率性能偏差(RPD)為11.3862,遠大于RPD要求值3,這表明過程分析中使用的近紅外光譜等技術可應用于蜂蜜的精制過程中5-HMF含量變化的定量測定。
為了快速測定意大利蜂蜜中5-HMF的含量,Apriceno等[30]將研究重點放在用近紅外光譜技術對不同植物來源的5-HMF進行預測,采用高效液相色譜法獲得41份不同產地蜂蜜樣品的HMF,作為參考值。利用化學計量學對近紅外數據進行特征提取,通過對光譜區域、回歸模型、散射和導數校正的深入研究,結果得出偏最小二乘回歸比主成分回歸預測能力更強,以4252~4848 cm-1光譜區域結合光譜散射預處理所建立的分析模型的預測的相關系數為0.98,RPD為3.3,建立了魯棒性良好的校正模型,證明了基于NIR-化學計量學的方法是一種強有力的工具,可用于蜂蜜等復雜食品基質的質量控制,判斷蜂蜜的新鮮程度。
HMF的PLS模型的預處理方法和潛變量數經優化選擇后,其R能達到95%以上,經t顯著性檢驗和RSD值可以得出近紅外光譜法與高效液相色譜法并無顯著差異,可用于對HMF的測定,并且預測效果極佳。因此,近紅外光譜法作為檢測HMF的一種新穎手段,可逐漸替代操作繁瑣的傳統化學分析方法,實現對蜂蜜中HMF地快速、高效檢測。
蜂蜜中微量物質往往和蜂蜜的抗菌、抗腫瘤、抗氧化、抗炎等生物學功能相關[31]。其含量在蜂蜜中較少,由于常規檢測要求儀器性能好,檢測方法合理,業務人員水平高,不確定因素過多往往會導致對蜂蜜中微量成分的檢測不精確。而近紅外光譜法采用透射原理,無需對樣品進行任何的預處理過程,建立良好的校正模型就能對微量成分的含量進行快速預測。
pH是描述氫離子活度的參數,可作為區分花蜜和甘露蜜以及判斷單花蜜是否真實的一個重要參數,而蜂蜜總酸度反映了蜂蜜中酸性物質含量的高低,是衡量蜂蜜是否發酵的重要參數,也是區分花蜜和甘露蜜的一個重要參考指標[32]。李水芳[33]對來自全國不同地區的15 種蜂蜜樣本測得的pH和總酸度與樣品近紅外光譜進行分析。基于歐式距離的K-S方法把樣本集劃分為校正集和驗證集,并利用蒙特卡洛方法剔除奇異值,再經競爭性自適應重加權采樣(CARS)變量選擇法結合PLS回歸進行變量篩選來提高模型的穩健性,優化后pH和總酸度PLS模型的預測能力明顯提高,R可以分別達到0.9058、0.9083,RMSEP分別為0.1196、0.4674。
酚類物質是蜂蜜外觀和功能特性的重要組成部分,被認為具有很高治療價值,而蜂蜜中礦物質(特別是銅和鐵)的存在可能導致高活性羥基自由基的產生[34-35]。另一方面,水溶性維生素,特別是維生素C(抗壞血酸)的抗氧化特性,有助于提高機體免疫力[36]。Escuredo等[37]首次運用近紅外光譜技術對蜂蜜中的抗氧化劑化合物進行預測,以伊比利亞半島西北部的60個蜂蜜樣本建立起酚類、類黃酮、銅和維生素C的分析模型,通過留一內部交互驗證法選擇最佳因子數避免過度擬合,分別采用不同的光譜的預處理方法建立四者的PLS模型,以RMSEV值和RPD量化模型性能。研究表明,所建模型對酚類和類黃酮總值具有較高的預測能力(RPD>3)。
為了進一步提高抗氧化活性以及酚類物質模型的預測能力,Haroon[38]基于近紅外光譜技術對蜂蜜成分進行研究,對6 種不同的品種蜂蜜樣品采用不同的預處理方法進行PLS分析,首次實現了對類胡蘿卜素含量以及三價鐵離子進行快速檢測,其建立的五個定量模型對蜂蜜的總酚含量、總黃銅含量、總類胡蘿卜素含量、三價鐵離子和 1,1-二苯基-2-三硝基苯肼相關系數達到了0.95~0.96,RPD為3.45~3.89,所建立的校正模型能很好地量化蜂蜜的抗氧化性成分。
酶活性是評估蜂蜜質量的基礎,Huang等[39]為了研究溫度效應對淀粉酶活性的動力學機制,對來自不同植物來源的蜂蜜樣本基于可見光和近紅外(Vis/NIR)光譜分析,應用PLS和最小二乘支持向量機(LS-SVM)算法來建立Vis/NIR光譜與淀粉酶活性之間的定量關系。結果發現,通過高斯濾波平滑-標準正態變量(GF-SNV)預處理并結合連續投影算法(SPA)選擇特征波長建立LS-SVM模型(GF-SNV-LS-SVM)比PLS更能快速測定蜂蜜的淀粉酶活性,在校正集和預測集中都有更高的決定系數,R2可以達到0.8872。因此,證實采用Vis/NIR光譜技術結合化學計量學可快速,無損地測定蜂蜜的淀粉酶活性。
PLS模型因其突出的優勢,結合化學計量學方法被逐漸用于蜂蜜微量成分的檢測之中。通過RPD值驗證了近紅外光譜技術的預測值和傳統的分析化學、儀器化學手段對蜂蜜檢測的化學值并無顯著差異。非線性校正方法如(SVM)也可用于蜂蜜檢測之中,在預測能力上看,可能比PLS方法的效果更好。因此,在進行系統地檢測蜂蜜的成分時,不僅僅應考慮線性校正方法,對非線性校正手段如ANN和SVM都應進行模型建立的考慮,從而針對不同的蜂蜜樣本成分含量的檢測選擇出最佳的定量分析模型。
蜂蜜作為一種天然食品,其營養價值愈來愈受到人們的關注,然而不少不法商人受利益驅動,使蜂蜜摻假成為繼橄欖油[40-41]和牛奶[42-43]之后,最有可能成為摻假的目標食品,蔗糖、果糖、葡萄糖、麥芽糖及高果糖漿等都是蜂蜜中最為常見的摻假物。蜂蜜摻假不僅極大損害了消費者利益,給消費者帶來健康問題,同時也導致食品信任問題,影響了我國蜂蜜出口,因此,蜂蜜摻假問題越來越受到眾多學者的關注。蜂蜜摻假鑒定技術隨著摻假手段的發展也不斷在發展,現代分析手段對蜂蜜摻假問題進行研究,為定性分析蜂蜜摻假的研究方向提供了思路。蜂蜜的鑒別摻假技術及特點如表1。
當前現有的蜂蜜摻假鑒別方法各具優缺點,近紅外光譜技術因其具有快速無損鑒別的優勢,一直是鑒定蜂蜜摻假問題的研究重點和熱點,所涉及到的模式識別工具如無監督的聚類模型和有監督的分類模型從不同的角度對蜂蜜進行摻假鑒別。不同摻假類別的蜂蜜采用不同的定性分析模型的鑒別能力有所差異,研究者往往根據原理不同的算法建立多種分類器,比較得出合適特定蜂蜜樣本的最佳分析模型。
麥芽糖漿(MS)是蜂蜜最常見摻雜的甜味劑,Li等[49]首次運用近紅外光譜法鑒別摻雜MS蜂蜜,并比較不同摻雜程度的MS和高果糖玉米糖漿(HFCS)蜂蜜在最小二乘線性判別(PLS-LDA)模型中的鑒別能力。在PLS-LDA模型的優化過程中,CARS用來選擇關鍵變量可以提高模型的預測精度,相比于未對波段進行特征選取的PLS-LDA模型,CARS-PLS-LDA方法對HFCS摻假蜂蜜和MS摻假蜂蜜的判斷準確度可以達到86.3%和96.1%。
Ferreiro等[50]對西班牙的33 種不同花蜜來源的蜂蜜運用可見-近紅外光譜與化學計量學相結合的方法快速鑒別蜂蜜摻假,通過不同的無監督和有監督學習方式對摻假蜂蜜進行區分。結果發現無監督學習方式、層次聚類法(HCA)和主成分分析(PCA)可以顯示出不同程度蜂蜜摻假的空間分布,但是不能實現完全的區分。而通過有監督學習方式,LDA可以實現九種摻假水平(在10%~90%范圍內)之間的完全區分,所建立的PLS回歸模型得到了高相關系數,對于摻雜程度低于45%的蜂蜜,外部預測模型中的最大誤差低于1%。
Guelpa等[51]將近紅外光譜與化學計量學相結合,對南非蜂蜜、故意摻入糖溶液(葡萄糖和果糖)蜂蜜以及廉價進口蜂蜜進行鑒別。采用臺式實驗室儀器、小型手持便捷式以及移動模塊化三種不同的近紅外設備采集樣品光譜,通過K-S算法改進后的duplexs算法將樣本集劃分為訓練集和測試集。在不同的儀器設備上采集的光譜采用不同的光譜預處理方法建立PLS-DA判別模型,以交互驗證和測試集的正確分類率來比較在不同儀器上所建立模型的性能。研究表明,采用有監督的PLS-DA在三種不同儀器上對摻假蜂蜜的總體分類精度都能達到93.3%以上。
PLS-LDA在蜂蜜摻假鑒別中應用十分廣泛,作為一種有監督的分析模型,對摻假蜂蜜的鑒別精度都能達到90%以上,且通過對波段進行特征選擇,其判斷準確度能得到極大的提升。HCA作為無監督聚類分析中應用最為廣泛的方法,因為沒有數據的存在,其鑒別能力要低于PLS-LDA,甚至不能實現摻雜物類型的完全區分。因此,在對蜂蜜摻假進行檢測時,盡量建立有“學習”樣本的有監督的定性分析模型,并通過不同的分類算法比較得出最佳分類器,實現對摻假物的區分。
蜂蜜是一種天然產品,蜜蜂從植物中采集花蜜,并儲存在蜂巢中作為食物食用。蜂蜜的成分和性質取決于蜜蜂在其生產過程中捕獲的花蜜的植物來源。而傳統對于蜜源鑒定的方法一般都存在著需對樣品進行破壞性處理,分析費時、操作復雜,同時分析過程中會用到強酸或強腐蝕性等有害試劑,影響檢測人員的安全和健康[53]。因此,有必要探索一種新的快速、廉價、安全的測定蜂蜜蜜源的方法。
近紅外光譜對蜜源的鑒別大多采用有監督的模式識別方法,如反向傳播人工神經網絡(BP-ANN)、偏最小二乘判別分析(PLS-DA)和SVM等。分類模型的算法原理不同,其正確判別率往往有所差異。鑒別分析人員不能通過蜂蜜光譜數據直接確定定性分析模型,往往需要建立不同分類器,比較得出分類正確率最高的模型。
為了實現快速無損識別蜂蜜蜜源,Chen等[54]使用帶光纖探針的近紅外儀器對洋槐蜜、椴樹蜜、油菜蜜、荊花蜜和棗花蜜5種國產蜂蜜進行分類。分別采用一階導數,SG平滑和二階導數對光譜進行預處理,以基于主成分分析的馬氏距離判別分析法(MD-DA)和反向傳播人工神經網絡(BP-ANN)建立分類模型。結果表明,BP-ANN模型比MD-DA具有更好的預測能力,其校準集和驗證集的分類正確率均在90%以上。
單一花種蜂蜜往往比混合蜜更具商業價值,Minaei等[55]基于VIS-NIR高光譜成像技術對波蘭的五種單一蜜源蜂蜜進行判別,從快速和非破壞角度為蜜源鑒別提供了檢測手段。通過PCA對高光譜圖像進行降維,以S-G平滑算法對圖像去噪,使用徑向基(RBF)神經網絡、SVM和隨機森林(RF)三種不同的機器學習算法預測蜜源。結果表明,RBF不論在預測精度和計算時間方面都優于SVM和RF,可對單一蜜源實現正確分類。
線性判別法和非線性判別法的性能孰優孰劣在化學計量學中一直是討論的重點。Haroon等[56]基于6種不同蜜源的PCA數據分別建立線性LDA和非線性LS-SVM的判別模型,通過交互驗證確定兩者模型的最佳主成分個數。在優化過程中,以6個主成分建立的LDA模型和以9個主成分確定LS-SVM模型有最高的識別率,且LDA模型的判別率要高于LS-SVM,訓練集和測試集的判別率均為100%。
Gan等[57]對不同植物來源的蜂蜜樣品采用四種不同分析手段進行鑒別分析。使用SNV方法對光譜數據進行預處理,建立偏最小二乘判別分析(PLS-DA)模型用于植物來源分類,PCA用于減少數據的維度,剔除異常值,應用支持向量機判別分析(SVM-DA)和區間偏最小二乘(iPLS)分別優化分類器的判別結果。結果發現以電子鼻(EN)、電子舌(ET)、近紅外光譜(NIR)和中紅外光譜(MIR)四種分析手段建立的模型對校正集和預測集樣本的鑒別精度幾乎都是100%。
不同的判別模型的鑒別能力有所差異,但有監督的模式識別的正確率往往要優于無監督的模式識別,比如BP-ANN模型就比MD-DA具有更好的預測能力。由于有監督的模式識別的原理不同,孰優孰劣需要根據蜂蜜樣本的光譜數據建立模型才能進行比較,但正確分類率都能達到90%。因此,對蜂蜜蜜源的鑒別首先考慮有監督的分類模型,結合光譜數據特點選擇正確判別率最高的定性分析模型。
蜂蜜品質與產地關系密切,歐盟規定:蜂蜜標簽應標注產地,同一植物來源而產地不同的蜂蜜,價格會有所差異[58]。中國作為蜂蜜的生產和出口大國,日益嚴峻的商業競爭更要求加大對于蜂蜜產地標簽的重視。由于蜂蜜產地的差異主要來自環境因素,這種差異較摻假和蜜源植物的差異小,因此產地判別比摻假和蜜源植物判別更加困難[59]。
近紅外光譜技術在中藥[60-61]、農產品[62-63]等產地溯源的研究已比較成熟。蜂蜜產地鑒別由于光譜數據差異性小,對其研究較晚,但還是通過化學計量學中的模式識別方法如PLS-LDA對蜂蜜產地進行鑒別研究,并采用不同的預處理方法和特征變量選擇提高模型的判別正確率。
李水芳等[64]為實現蜂蜜產地的快速鑒別,對4種不同產地的蜂蜜樣品通過近紅外光譜結合化學計量學方法對蜂蜜產地進行判別分析。采用基于歐式距離K-S法把樣本劃分為訓練集和預測集,對光譜數據進行一階導數和歸一化預處理,再用小波變換(WT)進行壓縮和濾噪。以徑向基神經網絡(RBFNN)和偏最小二乘-線性判別分析(PLS-LDA)對不同產地的蜂蜜樣品建立判別模型。研究表明,WT結合線性的PLS-LDA建模比WT結合非線性的RBFNN建模更適合蜂蜜產地判別,驗證集的判別總正確率為90.9%,從而證實近紅外光譜技術具有快速判別蜂蜜產地的潛力。
為創建特定的產地光譜指紋,Woodcock等[65]對法國科西嘉島蜂蜜樣品的近紅外光譜數據通過一系列化學計量工具進行分析。通過PCA對科西嘉島和非科西嘉島的光譜數據進行初步分析,研究各種光譜預處理方法對偏最小二乘法回歸模型的判別能力。研究發現,使用交叉驗證確定主因子數,變量選擇特定波段和二階導數數據預處理開發的最佳PLS判別模型對科西嘉和非科西嘉蜂蜜樣品正確分類結果分別是90.0%和90.3%,為科西嘉島蜂蜜創建了特定光譜指紋。
Herrero等[66]為了開發單一,快速的判別模型,對15個是來自加利西亞受保護地理標志(PGI)的蜂蜜和15個非PGI標簽蜂蜜的近紅外光譜數據進行SNV預處理以消除基線漂移后,分別采用PLS-DA、簇類的獨立軟模式法(SIMCA)、K最鄰近法(KNN)和多層前饋神經網絡(MLF-NN)建立分類模型,從敏感性和特異性來評價模型用于判別分析的能力。結果顯示,NIR信息數據與SIMCA算法的組合開發的模型,其特異性較高而敏感性較低,可以用于鑒別真正的PGI蜂蜜。
目前,采用近紅外光譜技術對蜂蜜產地鑒別的研究不多,大部分建立的分析模型是PLS-LDA,通過不同預處理方法和變量選擇方法提高PLS-LDA模型的判別能力,分析模型較為單一。因此,需結合蜂蜜光譜數據開發多種分類模型,拓展近紅外光譜技術對蜂蜜產地的鑒別檢測,從而深化對蜂蜜全面、系統地研究。
近年來,隨著現代儀器分析技術的不斷進步,近紅外光譜技術在很多傳統行業的檢測方面方興未艾。作為一種新型的分析手段,憑借其快速、準確、無損以及環境友好等優勢,在蜂蜜成分含量測定、真偽摻假鑒別、蜂蜜蜜源鑒別和產地鑒別都已取得了很大的進展。但是,應用近紅外光譜技術結合化學計量學對蜂蜜進行檢測還存在一些問題:
a.在蜂蜜成分的定量分析中,采用的最多是PLS建立的線性回歸模型來預測成分含量,而對于非線性模型的研究較少,如決策樹回歸、人工神經網絡和KNN回歸方法。此外,由于蜂蜜在不同地區,不同季節的成分含量差異較大,所建立的預測模型往往魯棒性能差。
b.對于蜂蜜摻雜物的研究,目前的近紅外光譜技術還無法做到對所有的摻雜物進行檢測,隨著蜂蜜需求量的增加,蜂蜜直接或間接摻入糖和劣質蜂蜜的問題會日益凸顯,迄今為止也沒有一種用于蜂蜜摻雜物測定的便捷式設備。
c.對蜂蜜的地理和植物來源的判別分析上,它涉及到多因素問題,往往需要多位經驗豐富的專家才能實現對蜜源和產地的判別,因此在模型的建立上,前期成本比較高昂。
未來,對蜂蜜的檢測會越來越朝著快速無損的分析技術方向進行,近紅外光譜技術作為其中的佼佼者,也不會依循單一的分析手段,會結合多變量數據分析和機器學習方法,深度挖掘數據背后的含義,開發多類預測模型,擴展其在蜂蜜檢測中的應用。另外,便捷式設備也將逐漸開發并應用到用到蜂蜜檢測的各個方面之中,而不再局限在分析實驗室中,更能保障食品安全,提升人們對蜂蜜食品安全的信心。