馮長君,劉玉勝,馮 惠
(徐州工程學院化學化工學院,江蘇 徐州 221008)
儲良龍眼揮發性成分的定量-保留指數分析
馮長君,劉玉勝,馮 惠
(徐州工程學院化學化工學院,江蘇 徐州 221008)
基于拓撲理論及MATLAB程序計算41種龍眼揮發性成分的分子連接性指數(mXtv)和電性距離矢量(Mt)。采用最佳變量子集回歸方法,建立龍眼揮發性成分的保留指數(BZ)與mXtv、Mt的定量結構-保留相關的五元回歸方程,傳統判定系數、逐一剔除法交叉驗證系數依次為0.981、0.976。用Jackknife法檢驗模型的穩健性,其傳統判定系數在0.975~0.986之間。該模型具有高度穩健性與良好的預測能力,并能較好解釋有機組分保留指數的遞變規律。
儲良龍眼;揮發性成分;保留指數;連接性指數;電性距離矢量;定量結構-保留相關性
龍眼是無患子科(Sapindaceae)龍眼屬(Dimocarpus Lour.)常綠果樹,俗名桂圓,又名龍目、比目等。我國是龍眼原產地,種植面積及產量居世界第一位。龍眼具有藥食兩用性。《神農本草經》稱龍眼“主五臟邪氣,安志、厭食、久服強魂魄,聰明”。現代藥理研究表明,龍眼能提高人體的免疫功能,具有抗衰老、抗腫瘤、抵御細菌病毒的侵襲及抗炎、抗感染等作用[1]。龍眼營養豐富,總糖含量高,富含維生素、視黃醇、尼克酸等。此外,還含有粗蛋白、無機鹽等人體所必需的營養物質。因此,人們已開發出龍眼系列產品,如龍眼混濁飲料、龍眼保健茶、龍眼發酵酒、龍眼保健果醋等,但對龍眼(儲良)中的芳香物質進行定量構效關系研究[3-5]尚未見報道。本實驗采用Kier和Hall的價連接性指數(mXtv)[6]及Liu等[7-9]的電性距離矢量(Mt),關聯儲良龍眼中41種揮發性化合物的保留指數(BZ)[10],經最佳變量子集回歸(leaps-and-bounds regression,LBR)建立的五元數學模型,其相關系數(R)、判定系數(R2)、交叉驗證相關系數(Q2)依次為0.991、0.981、0.976,呈現出良好穩定性與預測能力,可為各種龍眼揮發性化合物保留指數的預測提供一種簡便有效手段。
1.1 材料與儀器
儲良龍眼 市購。氣相色譜-質譜聯用儀 美國Agilent公司。
1.2 方法
1.2.1 Kier指數構建
進行物質構效關系研究的關鍵是建立描述分子結構的拓撲指數[11-12],以反映分子中原子間的連接方式與次序,即分子結構差異。迄今已報道了400余種拓撲指數,其中以Randic[13]最先提出、后經Kier等[6]擴展的價連接性指數(mXtv)的應用最為廣泛。Kier指數的核心概念為原子點價(δiv),用以表征非氫原子的結構差異,定義式為:

式中:Mi、mi為非氫原子i的電子總數及價電子數;hi為與非氫原子i直接鍵合的氫原子。在分子隱氫圖的鄰接矩陣基礎上,定義分子的價連接性指數(mXtv):

式中:mXtv是一個指數體系,由(m+1)個指數組成;m表示相應指數的階數,m=0,1,2,…;t代表分子子圖的類型,常用4種子圖為鏈、星、星-鏈、環狀子圖,依次對應t為p、c、pc及ch。本實驗利用MATLAB 軟件計算 11 種mXtv:0Xpv、1Xpv、2Xpv、3Xpv、4Xpv、5Xpv、3Xcv、4Xcv、4Xpcv、5Xpcv、Xchv。
Liu等[7-9]考察了多種著名拓撲指數的局限,提出能夠較為全面反映分子的拓撲、幾何及電性特征的Mt,其計算過程分為以下3步進行:
首先,定義分子中非氫原子的原子類型(Ki)與原子屬性(Ii),電性距離矢量理論給出13種原子類型及43種原子屬性;如鹵素屬第13種原子類型,其中氯原子的ICl= 1.9108。
第2步:考慮非氫原子i在分子中并不是孤立存在的,還要受其他非氫原子(j)的影響(相應擾動值為“ΔIi”),定義其電性狀態指數(Di)為:

第3步:綜合考慮不同原子類型的非氫原子之間的電性及拓撲作用,定義分子電性距離矢量(molecular electronegativity distance vector,MEDV),以“Mt”表示。這1 3種原子類型兩兩相互作用,使構成9 1個“Mt”,t=1~91(具體計算過程見文獻[7-9])。
本實驗化合物分子中共有6種原子類型:Ki=1,2,3,4,9,10。它們兩兩組合構成的Mt的依次為M1、M2、M3、M4、M9、M10、M14、M15、M16、M21、M22、M26、M27、M32、M37、M42、M43、M77、M78、M82。本實驗利用MATLAB程序計算了文獻[10]中41種有機分子的這21個Mt(其中M43、M82全為0)。
1.2.2 多元線性回歸分析
將每種化合物的11種連接性指數、19種電性距離矢量及相應的保留指數(BZ)輸入MINITAB14軟件,應用其中最佳變量子集回歸選擇最佳變量組合,建立相應的定量結構-保留相關(quantitative structure-retention relationship,QSRR)模型。采用逐一剔除法(levae-oneout,LOO)法對模型的預測能力及穩健度進行檢驗,以交叉驗證相關系數(Q2)予以評價。一般認為Q2大于0.5,模型比較穩定,具有良好的預測能力;大于0.9,模型非常穩定及更優的預測準確率。用方差膨脹因子(variance inflation factors,VIF)[14-15]評價模型中各自變量的多重相關性,VIF的定義式為:
式中:R2為自變量X中某一變量與余下變量的相關系數。如VIF=1,表明各自變量間完全不相關;當VIF<5時, 說明變量間沒有明顯的自相關性,所建模型是穩定的;當VIF>5時,說明變量間存在明顯的共線性,所建模型不能用于估算與預測。
2.1 龍眼中化學組分分析
采用頂空固相微萃取法提取龍眼中揮發性成分,用氣相色譜-質譜聯用儀進行檢測得到41種揮發性化合物的保留指數(BZ)見表1(使用MATLAB、MINITAB14等計算軟件進行統計分析)[10]。
2.2 龍眼揮發性成分的BZ與Mt的數學模型
應用MINITAB14軟件中最佳變量子集回歸程序建立的最佳QSRR模型:

式中:n′、R、R2、Q2、F、S分別為樣本數、相關系數、判定系數(亦稱削減誤差比例)、交叉驗證相關系數、Fischer檢驗值、估計標準誤差,n′=41,R=0.991,R2=0.981,Q2=0.976,F=371.319,S=45.894。其Q2=0.976>0.9,表明該模型非常穩定,具有很優的預測能力。按此模型給出的計算值與其實驗值非常吻合(表1),其關系見圖1。


圖1 41種龍眼揮發性化合物保留指數的實驗值與計算值的關系Fig.1 Relationship between experimental and calculated retention indexes of 41 volatile compounds in Chuliang longan

表1 龍眼中41種化學組分的拓撲指數及其保留指數Table 1 Molecular topological indices and GC-MS retention indices retention indices of 41 volatile compounds in Chuliang longan
2.3 所建數學模型的魯棒性檢驗
為了檢驗模型(5)中是否存在“異常值”及機會相關,采用Jackknife法[16]予以檢驗。其一,由于所研究的是較大樣本(樣本容量n′>30),采用逐組剔除法,即每次分別剔除化合物序號的個位是1,2,…,0的化合物,用余下數據建模,共進行10次,它們的R2、F值及S值見表2。

表2 模型(5)的穩健性檢驗Table 2 Results of determination of the robustness of model 5 by Jackknife method
由表2可見,10個模型的R2在0.975~0.986之間,即在0.981附近上下波動,呈現良好的正態分布。說明模型(5)對41個化合物的保留指數具有良好穩定性。模型(5)中各自變量0Xpv、M14、M15、M21、M77的VIF值依次為1.276、1.354、1.976、1.583、1.112,它們的VIF都遠小于5,可見各個自變量之間的自相關性很低,再次證明該模型具有較好的穩定性。
在氣相色譜過程中,除了溶質本性以外的所有影響因素都可人為予以有效控制,因此,溶質的性質便成為該過程中的唯一變數。顯然,氣相色譜保留指數(BZ)便是溶質分子微觀結構的函數。因此,通過物質的定量結構與BZ的QSRR,不僅可以顯示分子結構的微觀參數與BZ的遞變規律,而且對于預測保留值、選擇分離條件以及探索色譜保留機理具有重要的意義。在柱溫及固定相確定情況下,BZ則只與溶質的分子結構相關,即與溶質分子間的作用能有關。分子間作用能的本質是分子間力——取向力、誘導力、色散力和氫鍵,通常以色散力(或氫鍵)為主。影響色散力的主要因素為分子的大小與形狀:溶質分子的體積越大,其變形性越大,相應瞬間偶極之間的作用力增強,其色散力越大,相應它們的BZ越大。對于同分異構體,其色散力基本上是隨著分子的支化度增大而減小的。因此,它們的氣相色譜保留指數與分子的支化度呈負相關。本實驗所研究的化合物有烷烴、芳烴、醇、有機酸、酯等,其分子之間含有取向力、誘導力、色散力及氫鍵等。進入模型(5)中的自變量為0Xpv、M14、M15、M21、M77,它們所蘊含的物理意義如下:0Xpv反映分子大小及其中非氫原子結構差異;電性距離矢量M14(2×2)、M15(2×3)、M21(2×9)、M77(9×9)涉及第2類原子“—C—”(非極性基團)、第3類原子“—C<”(非極性基團)及第9類原子“—O”(強極性基團,即羥基)之間的相互作用,其間包含色散力、取向力、氫鍵等作用力。因此,這些描述子與保留指數之間存在密切相關關系。模型(5)的相關系數高達0.991,這在食品科學中的QSRR研究已屬少見[3,17-19],這也表明其對龍眼揮發性成分的結構表征是合理的,為龍眼的綜合利用以及功能性食品的研發提供理論支持。
采用價連接性指數(mXtv)、電性距離矢量(Mt)與儲良龍眼中揮發性化合物的保留指數(BZ)關聯,經最佳變量子集回歸建立的數學模型,具有較強的穩健性及預測能力,其削減誤差比例(R2)高達98.1%,說明僅有1.9%的隨機因素尚未被揭示。根據進入模型(5)中的自變量0Xpv、M14、M15、M21、M77可知,影響保留指數的結構因素主要是—C—、—C<、羥基及其相互之間的作用力。利用所建的BZ-QSRR模型,不僅可以解釋BZ的遞變規律,而且可以估算與預測保留值,對于選擇實驗分離條件、探索色譜保留機理等也具有一定的參考價值。
[1] 李升鋒, 劉學銘, 吳繼軍, 等. 龍眼果肉的研究與開發[J]. 福建果樹,2004, 25(2): 12-15.
[2] 文良娟, 滕建文, 于蘭. 龍眼果汁飲料的研制[J]. 食品科技, 2002, 28(9): 55-56.
[3] 堵錫華. 香梨酒香氣成分保留時間的定量構效關系研究究[J]. 食品科學, 2011, 32(2): 218-221.
[4] 余訓民, 楊道武. 應用新定義的拓撲指數預測烷氧氯硅烷、單硫醚的氣相色譜保留指數[J]. 分析化學, 2005, 33(1): 101-105.
[5] FENG Changjun, YANG Weihua, MU Lailong. Estimation and prediction of bioconcentration factors of nonionic organic chemicals in fish by electrotopological state indices and structural parameter[J]. Chinese Journal of Structural Chemistry, 2008, 27(5): 575-587.
[6] KIER L B, HALL L H. Derivation and significance of valence molecular connectivity[J]. Journal of Pharmaceutical Sciences, 1981, 70(6): 583-589.
[7] LIU Shushen, YIN Chunsheng, LI Zhiliang, et al. QSAR study of steroid benchmark and dipeptides based on MEDV-13[J]. Journal of Chemical Information and Computer Sciences, 2001, 41(2): 321-329.
[8] LIU Shushen, LIU Hailing, YIN Chunsheng, et al. VSMP: A novel variable selection and modeling method based on the prediction[J].Journal of Chemical Information and Computer Sciences, 2003, 43(3):964-969.
[9] LIU Shushen, YIN Chunsheng, WANG Liansheng. Combined MEDVGA-MLR method for QSAR of three panels of steroids, dipeptides, and COX-2 inhibitors[J]. J Chem Inf Comput Sci, 2002, 42(3): 749-756.
[10] 張義, 高蓓, 徐玉娟, 等. 頂空固相微萃取-氣質聯用方法分析龍眼中的揮發性化合物[J]. 食品科學, 2010, 31(16): 156-160.
[11] 馮長君. 取代芳烴生物降解性的新型連接性指數模型[J]. 華中科技大學學報: 自然科學版, 2010, 38(3): 108-111.
[12] 馮長君, 沐來龍, 楊偉華, 等. 用拓撲指數和神經網絡研究有機污染物的生物富集因子[J]. 化學學報, 2008, 66(19): 2093-2098.
[13] RANDIC M. On characterization of molecular branching[J]. J Amer Chem Soc, 1975, 97(23): 6609-6615.
[14] 馮長君. 手性有機酸保留指數的手性指數及原子類型電拓撲指數模型[J]. 物理化學學報, 2010, 26(1): 193-198.
[15] 馮長君. 3-取代硫基-5-(2-羥基苯基)-4H-1,2,4-三唑類化合物抑菌活性的定量構效關系和結構修飾的理論研究[J]. 化學學報, 2012, 70(4): 512-518.
[16] 馮長君, 堵錫華. 胺類化合物Kovats指數的拓撲研究[J]. 色譜, 2001,19(2): 124-127.
[17] 堵錫華, 陳艷. 柚子皮香精油揮發性成分的保留相關性研究[J]. 食品科學, 2009, 30(19): 61-64.
[18] 陳艷, 堵錫華. 紅莓發酵酒香氣成分定量結構-色譜保留值構效關系研究[J]. 食品科學, 2009, 30(21): 39-42.
[19] 馮長君, 石春玲, 李鳴建. 蚌蘭花揮發油化學成分色譜保留值的構效關系研究[J]. 食品科學, 2010, 31(19): 42-44.
Quantitative Structure-Retention Relationship Analysis of Volatile Compounds in Longan
FENG Chang-jun,LIU Yu-sheng,FENG Hui
(School of Chemistry and Chemical Engineering, Xuzhou Institute of Technology, Xuzhou 221008, China)
Based on the topological theory and self-MATLAB program, Kier’s molecular connectivity indices (mXtv) and electro-negativity distance vector (Mt) were calculated for 41 volatile compounds in Chuliang Longan as identified by GC-MS.A five-element regression model of quantitative structure-retention relationship (QSRR) for retention index (RI) as a function ofmXtvand Mt was constructed using leaps-and-bounds regression (LBR). The traditional correlation coefficient (R2) and the crossvalidation correlation coefficient (Q2) of leave-one-out (LOO) were 0.981 and 0.976, respectively. The robustness of the regression model was validated by Jackknife method, and the results showed that the R2was between 0.975 and 0.986. The present study demonstrates that the model is highly reliable and has favorable predictive ability, and can better elucidate the change rule of GCMS retention indices for organic components.
Chuliang longan;volatile composition;retention index;molecular connectivity indices;electro-negativity distance vector;quantitative structure-retention relationship (QSRR)
TS207.3;O6-051
A
1002-6630(2012)08-0244-04
2011-04-04
國家自然科學基金面上項目(21075138);徐州市科技局基金項目(XZZD1104);徐州市賈汪區科技局基金項目(XM10A05)
馮長君(1954—),男,教授,本科,主要從事有機物構效關系研究。E-mail:fengcj@xzit.edu.cn