吉鑫,樊雙喜,李宜聰,鐘其頂*,陸瑋,李安軍,劉國英,黃艷,胡心行,葉方平
1(中國食品發酵工業研究院有限公司,北京,100015)2(全國食品發酵標準化中心,北京,100015) 3(安徽古井貢酒股份有限公司,安徽 亳州,236800)
白酒作為我國傳統的蒸餾酒,其獨特的釀造工藝經傳承和改良,最終形成以糧谷為主要原料,以大曲、小曲或麩曲及酒母等為糖化發酵劑,經蒸煮、糖化、發酵、蒸餾等工序制成的飲料酒[1]。白酒的主要成分為水和乙醇,作為白酒呈香呈味物質,決定著白酒風格和質量的微量有機組分如有機酸、酯類、醛類和除乙醇外的醇類等僅占總體積的2%左右[2]。2019年10月公布的《產業結構調整指導目錄(2019年本)》較先前版本,取消了對白酒生產線的限制,此舉將推動白酒行業的高質量發展。隨著政策的放開,白酒生產的準入門檻就必然隨之提升,對白酒的安全、品質,白酒生產、檢測技術以及人員的要求也將更嚴格。由于缺乏完善的質量安全標準、準確的食品真實性定義、精確高效的檢測技術手段、先進的生產設施和完整的質量體系等原因,白酒質量安全控制以及真實性依然存在較大提升空間[3]。
特定特征組分分析技術應用于白酒的摻假檢測是我國目前較為常用且發展相對成熟的技術手段,如氣相色譜法[4]、氣相色譜-質譜分析法[5-6]、近紅外光譜法[7]和液相色譜法[8]等,可以對GB/T 10345—2007中所規定的白酒微量物質和一些常見的揮發性香氣成分實現定性或精確定量檢測。然而上述檢測方法都是具有針對性的,如氣相色譜法主要用于白酒中揮發性物質的測定,液相色譜法用于不易揮發物質和大分子的測定。在應對當前白酒市場變化多樣的摻假物質和造假手段時,傳統的分析方法由于無法檢測未知摻假物質,存在一定的局限性,無法滿足高效、多維度的白酒快速檢測要求。
核磁共振波譜(nuclear magnetic resonance,NMR)首次作為定量分析的分析工具是在1963年由JUNGNICKEL等提出[9]。20世紀70年代初期,NMR開始在食品科學領域發揮其優勢。相比于其他傳統的分析方法,1H NMR技術不僅能夠實現白酒樣品中所有質子的無偏檢測,反映酒體成分的全部特征,而且能夠在1次實驗中直接分析和檢測大量的樣品[10]、保持樣品的完整性,且操作簡單快速,測量精確,重復性高。該技術已成功應用于牛奶[11]、果汁[12]、蜂蜜[13]和葡萄酒[14]的成分分析和摻假鑒別。1H NMR圖譜中囊括了大量已知和未知的有機化合物特征信息,通過統計分析手段對白酒1H NMR圖譜中的信息進行深入挖掘,抽取有效的數據信息,不僅有利于對于未知化合物的結構解析,而且NMR信號能夠提供有機酸、酚類、氨基酸等高通量數據依據。在強波譜重疊的情況下,較為常用的統計學手段是偏最小二乘回歸(partial least squares regression,PLSR)分析模型,如NMR技術結合PLSR已成功應用于啤酒中麥汁濃度、乙醇和有機酸的定量分析[10,15]。以上研究為白酒中微量組分的NMR定量研究提供了一定的參考依據。由于白酒基質復雜,采用定量NMR技術直接對白酒樣品進行積分定量時,靈敏度不足、信號峰重疊和溶劑峰壓制技術造成臨近信號被隱藏等問題,導致無法實現白酒中有機酸和醛類的準確定量?;谏鲜鲈?,NMR技術在白酒中的應用研究基本上還處于空白階段。
為突破以上技術難點與不足,本研究擬采用1H NMR技術結合PLSR分析方法從復雜的波譜中提取有效的特征定量信息,建立白酒中有機酸和醛類的PLSR定量分析模型,實現白酒中有機酸和醛類的準確測定,為非目標1H NMR指紋圖譜技術應用于食品質量安全與真實性研究奠定良好的基礎。
實驗所用白酒樣品均由白酒企業提供,共計77個,其中濃香型白酒29個,馥郁香型白酒48個。疊氮化鈉(NaN3)(高純級),北京博奧拓達科技有限公司;3-(trimethylsilyl)-propionate acid-d 4(TSP)標準品,安諾倫(北京)生物科技有限公司;H3PO4、KH2PO4、HCl、NaOH(分析純),北京化工廠;重水(D2O)(99%)、丙酸、己酸、2-乙基丁酸、乙縮醛標準品,Sigma-Aldrich公司;緩沖液Technical(pH 2.00、4.01、7.00),瑞士Mettler-Toledo公司;無水乙醇(分析純),天津市大茂化學試劑廠;乙酸標準品,北京百靈威科技有限公司;丁酸標準品,上海安譜實驗科技有限公司;戊酸、異戊酸、異戊醛標準品,梯希愛(上海)化成工業發展有限公司;40%乙醛,福晨(天津)化學試劑有限公司。
Bruker Avance Ⅲ HD 400 MHz波譜儀、Bruker自動進樣器(SampleJet)、Bruker SampleJet 5 mm高通量核磁管,德國Bruker Biospin公司;AB204-N 萬分之一天平、S210 pH計、InLab?Science pH電極,瑞士Mettler-Toledo公司;島津GC 2010氣相色譜儀、氫火焰離子化檢測器,日本島津公司。
1.3.1 NMR樣品制備
用移液槍準確吸取100 μL樣品緩沖溶液[16]于樣品管,加入900 μL白酒樣品溶液,用1 mol/L NaOH和1 mol/L HCl將樣品pH精確調節至4.0(± 0.02 pH單位),混合均勻后吸取600 μL于5 mm NMR管中,用于NMR測定。
1.3.2 基礎數據的獲得
1.3.2.1 氣相色譜法
采用直接進樣氣相色譜內標法對白酒樣品中有機酸和酯類的含量進行測定。色譜柱為聚乙二醇毛細管柱(60 m×0.25 mm,0.15 μm膜厚);升溫程序為初溫35 ℃,保持1 min,以3.0 ℃/min升到70 ℃,以3.5 ℃/min升到180 ℃,再以15 ℃/min升到210 ℃,保持15 min;檢測器溫度為300 ℃;進樣口溫度為280 ℃;載氣為He,流速1 mL/min;分流比20∶1;進樣量1.0 μL。
1.3.2.2 核磁共振波譜法
實驗所采用的1H NMR的共振頻率為400.13 MHz,配備5 mm BBI探頭;譜寬(SW)為20.552 4;采樣點數(TD)為65 536;接收增益(RG)為16;掃描次數(NS)為64,弛豫延遲(D1)為4 s;以3-(三甲基硅基)氘代丙酸鈉(TSP,δ=0)作為化學位移的零點。Bruker標準的脈沖序列(NOESYGPPS 1D)用于水(δ=4.8)和乙醇(δ=1.18和δ=3.64)的信號抑制。設定儀器檢測溫度為300 K,樣品檢測前需等待5 min以穩定檢測溫度,調節樣品pH=4.0±0.02。
1.3.31H NMR數據質量控制
由于采用標準的脈沖序列(NOESYGPPS 1D)用于水和乙醇的信號壓制,白酒中有機酸和醛類成分的信號強度得到了明顯的提高。將所有白酒樣品的NMR氫譜疊加,進一步檢查可能由于水和乙醇信號的抑制不當、pH調節不準確、系統誤差或其他原因導致的譜圖基線偏移現象[17]。對每個樣品重復測定3次,以保證數據質量的可靠性。
1.3.4 核磁共振波譜預處理
采用合適的波譜預處理方法,能夠有效地減少1H NMR圖譜峰漂移、基線不平、峰形不對稱和溶劑峰干擾等引起的數據波動問題。目前造成核磁信號偏移的原因主要包括儀器本身波動、質量濃度、溫度以及pH大小等。白酒1H NMR圖譜中一些特征信號峰的化學位移出現偏移,將會導致PLSR模型樣本錯誤的分組,因此,采用適當的峰化學位移偏移校正對齊方法對隨后的多元變量統計分析相當重要[18]。為了解決上述問題,本研究使用了MestReNova核磁共振數據分析軟件(美國 Mestrelab Research SL公司)的分段對齊方法,靈活選擇峰化學位移校正對齊的區域。圖1-a為分段對齊前,分段對齊后的圖譜如圖1-b所示。由圖1可知,分段對齊方法較好解決了1H NMR圖譜峰化學位移的偏移問題。

a-分段對齊前;b-分段對齊后圖1 白酒1H NMR圖譜特征峰化學位移分段對齊校正Fig.1 Alignment correction of chemical shift of characteristic peaks in Baijiu 1H NMR spectrum
TOMASI等[19]提出了一種改進的icoshift算法有效地解決了1H NMR信號波動的問題,能夠對微小的信號進行調整。ESSLINGER等[20]認為目前用來減小1H NMR圖譜數據波動最有效的手段是Bucket或者Bins,該方法的原理是將1H NMR圖譜切割為許多很小的一定區域的盒子(Bucket)。其優點是能夠重新產生一個代表原始1H NMR的新圖譜,同時該圖譜所包含的數據點的數量有所減少,便于后續的統計分析。然而缺點是與原始NMR圖譜相比較會造成一定數量有效信息的缺失。
采用MestReNova核磁共振數據分析軟件對NMR原始波譜進行定標、相位校正、基線校正、峰化學位移對齊和分段積分處理。分別選取0.01,0.015,0.02,0.025,0.03,0.035 和0.04 ppm作為每個分段積分的區域(Bins)寬度的取值,研究結果表明,0.01 ppm能夠保持足夠的數據分辨率以及能夠最大限度地減少圖譜信息的損失。因此,以每0.01 ppm作為區間對白酒1H NMR全譜的有效區域進行劃分。去除水信號和乙醇信號殘余峰所在區域,分段積分的有效區域為0.8~9.5 ppm,分段積分后大約能夠獲得700個分段積分值,這些分段積分值隨即作為統計分析的輸入變量。
1.3.5 偏最小二乘回歸分析
PLSR作為一種高效抽提信息的方法,在建模過程中集合了主成分回歸、多元線性回歸方法的優點,研究多因變量對多自變量的回歸建模,尤其是對解決各變量內部高度線性相關、樣本個數少于變量個數等問題較為有效,使得到的譜向量與分析物濃度直接相關[21]。
本研究以每0.01 ppm作為區間對白酒1H NMR全譜的有效區域進行劃分,并以此作為自變量矩陣,以GC所得白酒中微量組分含量結果為因變量矩陣,分別對矩陣和進行分解,如公式(1)、公式(2)所示:
X=TPT+EX
(1)
Y=UQT+EY
(2)
式中:T和U分別為X和Y的得分矩陣,P和Q分別為X和Y的載荷矩陣,EX和EY分別為X和Y的擬合殘差矩陣。
將T和U做線性回歸,如公式(3)所示:
U=TB+EU
(3)
式中:B是U與I的線性回歸系數,即Y與X得分矩陣間的線性回歸系數;EU為誤差項。
在預測時,對于未知樣品光譜陣Xpred,對應的各成分含量陣Ypred,如公式(4)所示:
Ypred=TpredBQ
(4)
主成分數的選擇是PLSR建模的關鍵,若選取的主成分個數過多,與響應無關的變量產生的背景噪聲會導致模型過擬合,影響對統計趨勢的認識,降低預測能力;若選取的主成分個數過少,則不能充分反映樣品信息,導致模型擬合不充分,預測準確性降低。本研究通過主成分對各變量的累積貢獻率和留一交叉驗證中各主成分數的校正標準差(the standard deviation of prediction,RMSECV)綜合考慮選取建立PLSR的主成分數。以己酸為例,選取若干個主成分分別進行PLSR建模,主成分累積貢獻率和RMSECV隨主成分個數的變化規律如圖2和圖3所示。由圖2和圖3可知,隨著主成分個數的增加,RMSECV值逐漸降低,累計解釋方差逐漸增加。當主成分個數是12時,RMSECV值相對最小,主成分對自變量和因變量的累積貢獻率均大于85%,且自變量X矩陣累計解釋的方差基本保持不變。因此,綜合考慮主成分累積貢獻率和RMSECV,選取最佳主成分個數12進行PLSR建模。

圖2 主成分累積貢獻率隨主成分個數的變化規律Fig.2 Variation of cumulative contribution rate of principal components with the number of principal components

圖3 交叉驗證的校正標準差隨主成分個數的變化規律Fig.3 Variation of RMSECV with the number of principal components
根據上述原理分別對白酒中有機酸(乙酸、丙酸、丁酸、戊酸、己酸和異戊酸)和醛類(乙醛、乙縮醛和異戊醛)的主成分數進行選擇,建立PLSR定量分析模型,結果如表1所示。

表1 PLSR定量分析模型主成分數Table 1 The number of principal components of PLSR quantitative analysis model
在上述實驗方法的基礎上,分別建立白酒中有機酸和醛類的PLSR預測模型,模型預測效果如圖4所示,縱坐標為白酒中各組分含量的預測值,橫坐標為氣相色譜法所得的白酒中各組分測定值。由圖4可知,各組分的測定值與預測值點呈對角線分布,預測值與測定值線性關系良好,表明該模型的擬合效果和預測效果較好。

a-乙酸;b-丙酸;c-丁酸;d-戊酸;e-己酸;f-異戊酸;g-乙醛;h-乙縮醛;i-異戊酸圖4 白酒中有機酸和醛類的PLSR定量分析模型預測結果Fig.4 Results of PLSR quantitative analysis model of organic acids and aldehydes in Baijiu
預測模型的質量通常需要通過建立預測值與測定值之間的關系進行評價,常用的模型評價參數為決定系數(R2)、預測標準偏差(RMSEP)和誤差范圍比(residual predictive deviation,RPD)等,計算公式(5)~公式(7)如下:
(5)
(6)
(7)

以每0.01 ppm作為區間對白酒1H NMR全譜的有效區域進行劃分,并以此作為自變量;以氣相色譜法所得白酒中組分濃度測定結果為因變量,建立白酒中有機酸和醛類的PLSR預測模型,模型計算結果如表2所示。由表2可知,白酒中乙酸、丙酸、丁酸、戊酸、己酸、異戊酸、乙醛、乙縮醛和異戊醛的R2分別為0.926 0、 0.985 8、 0.989 9、 0.993 5、 0.982 7、 0.982 5、 0.978 0、 0.994 1和 0.947 5,RMSEP范圍為0.128 7~0.633 3(<0.7),RPD 3.7,回歸效果較好,預測精度高。

表2 白酒中有機酸和醛類PLSR定量分析模型Table 2 PLSR quantitative analysis model of organic acids and aldehydes in Baijiu
由于偏最小二乘法的回歸系數方差無法得到準確的無偏估計,故采用Jack-knife方法進行方差估計,通過計算βi對應的t統計量(服從自由度為建模使用的成分個數的t分布),進行均值是否為零的假設檢驗,Jack-knife方法進行方差估計的表達式如公式(8)所示[23]:
(8)

對回歸系數進行相應計算,判斷并挑選出對白酒中微量關鍵有機組分含量預測有顯著影響的變量,從而篩選出1H NMR圖譜中用于區分各微量組分的特征信號區域。表3總結了PLSR定量分析模型中與白酒中有機酸和醛類含量具有顯著相關性的1H NMR信號區域,可以看出除丙酸和己酸,各組分的PLSR最佳預測區間全部位于脂肪族區(0.25~3.00 ppm)和中場區(3.00~6.00 ppm)。結合白酒中有機酸和醛類的信號峰歸屬,由表4可知,除丙酸、異戊酸和乙醛外,各組分的PLSR最佳預測區間均包含該化合物特征峰的化學位移區段,例如對乙酸含量預測有極顯著影響的信號區域包含乙酸的甲基質子信號(δH2.08)區域,而根據白酒釀造過程,對乙酸含量預測有極顯著影響的4.11~4.15 ppm區域可能與乙酸乙酯亞甲基質子信號(δH4.12)相關。對丙酸含量預測有極顯著影響的信號區域共有12個,根據人類代謝組數據庫和丙酸加標實驗可知,由于丙酸的甲基質子信號(δH1.16)區域與乙醇甲基質子信號區域重疊,故此區域未計入預測模型。然而,以上12個區域均未包含丙酸的亞甲基質子共振信號,卻呈現了最佳的PLSR預測模型。同樣,對異戊酸含量預測有極顯著影響的5個信號區域不含異戊酸質子信號特征峰化學位移,且其中3.02~3.09 ppm和3.20~3.27 ppm與異戊酸含量呈負相關關系。因此,根據以上結果推斷PLSR預測模型不僅僅依賴于分析物本身的結構特征,還可能來源于其他因素,例如,通過多元統計學確定出與分析物含量呈共線關系的其他化合物的化學位移,可能為白酒中分析物形成機理的過渡或補充反應產物的質子信號區域[24]。

表3 回歸系數顯著性統計表Table 3 Table of significance of regression coefficient

續表3

表4 白酒中有機酸、醛類和酯類的信號峰歸屬Table 4 Signal peak attribution of organic acids and aldehydes in Baijiu
本研究采用1H NMR技術作為檢測手段,結合偏最小二乘回歸分析方法,建立白酒中6種有機酸(乙酸、丙酸、丁酸、戊酸、己酸和異戊酸)和3種醛類(乙醛、乙縮醛和異戊醛)PLSR定量分析預測模型。有機酸和醛類的PLSR預測模型的R2為0.93~0.99,RMSEP<0.7,RPD 3.7。將NMR PLSR模型預測結果與氣相色譜法進行對比分析,以各分析物的氣相色譜方法測定結果為橫坐標,以NMR PLSR模型預測結果為縱坐標做線性回歸,發現各組分的氣相色譜方法測定值與NMR PLSR預測值點呈對角線均勻分布,線性關系良好(R2均>0.92),氣相色譜法和NMR PLSR預測結果誤差在±8%以內,滿足方法可行性對比分析驗證要求。研究表明NMR PLSR定量預測模型可用于白酒中6種有機酸(乙酸、丙酸、丁酸、戊酸、己酸和異戊酸)和3種醛類(乙醛、乙縮醛和異戊醛)的快速、準確定量分析,模型擬合效果好、預測精度較高,可推廣應用于白酒或其他重要食品中微量有機組分(酯類、糖類、氨基酸等)的定量檢測,具有廣泛的適用性。
PLSR定量分析預測模型的建立解決了當前1H NMR定量分析方法在白酒基質中信號靈敏度不足、信號峰重疊嚴重等問題,為白酒質量安全控制提供了技術支撐,有利于滿足白酒企業對產品質量把控和政府相關部門對市場監管的需要,為開發基于1H NMR指紋圖譜的非目標白酒真實性鑒別方法和模型奠定了基礎。