堵錫華 宋 明 田 林 徐 艷 陳 艷 李 靖
(徐州工程學院材料與化工學院,徐州 221018)
橄欖油是直接冷榨油橄欖果實所得的食用油,因其富含不飽和脂肪酸及多種抗氧化營養物質[1],除具有護膚作用外[2],對心血管疾病、阿爾茨海默病、糖尿病、甚至乳腺癌等癌癥也具有良好的預防、保健作用和功效[3-5],故近年來越來越受到人們的喜愛,科研工作者對其研究也越來越受重視。在這些對橄欖油的研究工作中,相對對橄欖油的營養成分或揮發性成分的檢測較為常見,如Antonietta Baiano等[6]采用色譜質譜聯用技術對橄欖油揮發性香氣成分進行了分析;田維芬等[7]則采用頂空固相微萃取-氣質聯用技術對不同品牌種類的橄欖油揮發性風味物質進行了檢測和分析;龍偉等[8]也利用氣相色譜及氣質聯相色譜技術對初榨橄欖油的營養成分進行了檢測并對其油脂特性進行了分析;少量的研究工作則關注于橄欖油的功能性研究方面,如高建平等[9]探討了橄欖油等3種不同食用油對小鼠的血脂、肥胖以及糖尿病易感性的影響;Rezaei S等[10]則研究了橄欖油在減輕非酒精性脂肪肝方面的優越性,這些研究工作均取得了較好的成效。
近年來,定量結構-保留相關性(QSRR)研究成為熱點之一,在色譜定性分析方面發揮了重要作用,它將化合物的色譜保留性質與分子結構特征進行關聯,可深入了解色譜分離機理,判斷化合物結構及相關性質,評價色譜分析中的固定相性質,預測色譜保留行為[11]。由于目前對橄欖油的這些研究需要通過大量的實驗才能獲得相關數據,因此費時費力,而利用在農業[12]、環境化學[13,14]、食品科學[15,16]、機械[17]、物理學[18]、建筑學[19]等方面廣泛應用的神經網絡(Neural Networks)方法建立QSRR模型,對橄欖油揮發性成分進行研究,就成為一種簡便有效的手段。為此筆者在前期做了較多的基礎研究[20-22]工作,這里采用人工神經網絡法中的BP算法,對文獻[23]檢測橄欖油得到的揮發性香氣成分,建立連接性指數、分子形狀指數、原子類型電性拓撲狀態指數和電性距離矢量四種分子結構參數與橄欖油揮發性成分的色譜保留指數之間的神經網絡模型,根據該模型得到的保留指數預測值與實驗值較為吻合,故利用神經網絡方法對橄欖油揮發性香氣成分進行研究,可快速獲取揮發性成分的保留指數值,為提高橄欖油品質研究提供參考。
橄欖油揮發性成分及其色譜保留指數(RI)來源于文獻[23],它們主要包括:烴類、醛類、醇類、酯類、酸類、酮類及其他少量的酚類、醚類等化合物,將這些橄欖油揮發性化合物分子列于表1。

表1 橄欖油揮發性成分的分子結構參數及保留指數
采用Chem3D Ultra 9.0三維分子結構應用軟件,繪出鄧澤元等[23]采用GC-MS-O結合電子鼻測定的橄欖油揮發性成分分子的結構圖,再用MATLAB計算科學建模軟件,根據文獻方法[24,25]自編程序,計算了文獻[23]檢測出的108種揮發性成分中,97個具有保留指數值分子的連接性指數、分子形狀指數、原子類型電性拓撲狀態指數和電性距離矢量,共四大類分子結構參數,將這四大類結構參數中大部分分子為0值的數組去除,用具有強大功能的MINITAB統計分析軟件及具有數據挖掘、預測分析的SPSS軟件,對計算得到的結構參數進行分析,優化篩選了分子連接性指數中0X、2X和5X、分子形狀指數的K2和K3、原子類型電性拓撲狀態指數的E1和E2、電性距離矢量中M2共8種參數,與橄欖油揮發性成分色譜保留指數相關性為最優,可以構建定量結構-保留相關性(QSRR)模型。
為檢驗使用8個變量所建模型的穩定性,用Jackknifed法對式(1)進行檢驗,這里由于樣本數相對較多,以每20個分子為一組,每一組中每次剔除一個分子,用余下的分子進行建模,如依次剔除第1、21、41、61、81號分子,用余下分子建模,得到第一個相關系數,依此類推,這樣共得到20個Jackknifed相關系數r,見表2。

表2 Jackknifed相關系數r的檢驗
為提高多元回歸模型(1)預測橄欖油揮發性成分色譜保留指數的能力,這里應用MATLAB軟件中的神經網絡法進一步進行研究。在神經網絡輸入層、隱含層、輸出層三層網絡結構中,主要是隱含層變量(Y)的選擇,基于前期工作[26,27]基礎,綜合許祿[28]及Andrea[29]的建議規則,隱含層變量(Y)計算式為: 2.2>n/M≥1.4(這里n為樣本數,M為權重),M的計算又可以根據M=(Si+1)Y+(Y+1)So(Si、Y、So分別為神經網絡的輸入層變量、隱含層變量和輸出層變量)計算得到。
將前面篩選的橄欖油揮發性成分的8個分子結構參數作為輸入層變量,這些分子的色譜保留指數作為輸出層變量,根據隱含層變量計算公式得到的Y可取5或6,經過計算分析比較,發現Y采用6時,所得結果更好,故對橄欖油揮發性成分色譜保留指數預測的神經網絡采用8-6-1的網絡結構方式。為防止建模過程中的過擬合現象,將97個橄欖油揮發性成分分子分為3組:第一組為訓練集組(以每5個分子為一組,取其中第1、2、4個分子)、第二組為測試集組(每5個分子組中的第5個分子)、第三組為驗證集組(每5個分子組中的第3個分子),每組分子為隨機選擇,用MATLAB中神經網絡法進行計算分析。
用8種參數與橄欖油揮發性成分色譜保留指數構建的多元線性回歸模型為:
RI=89.3890X+206.8272X-107.0535X+61.196K2-31.096K3-57.013E1-38.427E2-12.915M2+281.690
(1)

從式(1)可以看到,利用選取的8個參數與保留指數的多元回歸模型相關系數達到0.91,基本達到建模的要求。對該模型檢驗的Jackknifed相關系數r的平均值為0.911,與多元回歸方程相關系數完全吻合,說明以這8個變量建立模型的穩定性較好。
進一步采用神經網絡研究得到了預測橄欖油揮發性成分色譜保留指數模型的總相關系數rt=0.996 7,3個集組的相關系數分別為:訓練集組的相關系數r1=0.996 2、測試集組的相關系數r2=0.998 2、驗證集組的相關系數r3=0.996 8,這里明顯可以看出,模型總相關系數相比多元回歸法模型相關系數得到了明顯的提升,達到了0.99以上優級相關性,利用該神經網絡模型預測的橄欖油揮發性成分的色譜保留指數與實驗值的吻合度較為理想,兩者的平均相對誤差僅為1.56%,誤差明顯小于多元回歸法結果,將橄欖油揮發性成分保留指數的預測值與實驗值也列于表1中,預測值與實驗值的關系見圖1,兩者相對誤差值見誤差控制圖2。

圖1 橄欖油揮發性成分色譜保留指數實驗值與預測值關系

圖2 誤差控制圖
由于不同產地、不同方法生產出的橄欖油含有的揮發性成分各有不同,但其中正是含有少量不同的成分組成,形成了其自身獨特的香味特征。橄欖油揮發性香味成分的種類繁多,主要有烴類、醛類、醇類、酯類、酸類、酮類及其他少量的酚類、醚類等眾多類型的揮發性有機物,有的成分含量相對較多,有的成分雖然含量極少,但是影響其獨特香氣的重要成分。而這些揮發性香氣化合物分子性質均與其分子結構有密切的聯系,從表1中可以看到,橄欖油揮發性成分的分子結構參數和保留指數之間有一定的關系,揮發性化合物分子上連接的取代基種類、取代基的數量、取代基所在位置、連接的方式以及基團之間相互影響的大小等等,均影響著保留指數的大小;揮發性成分分子體積越大,其保留指數也越大。

利用本模型可尋找不同產地、不同方法所得橄欖油含有的揮發性香氣成分的區別,發現不同品質橄欖油中起獨特風味作用的成分,從而為生產高品質的橄欖油在理論上作出指導。
