陳 艷,堵錫華
(徐州工程學院化學化工學院,江蘇 徐州 221008)
酸橘果皮油揮發性成分色譜保留指數的構效關系
陳 艷,堵錫華
(徐州工程學院化學化工學院,江蘇 徐州 221008)
在分子拓撲理論的基礎上,計算68種酸橘果皮油揮發性成分化合物的3類拓撲指數值:價分子連接性指數(Xi)、分子形狀指數(Km)和電性拓撲狀態指數(En)。通過最佳子集回歸,建立酸橘果皮油揮發性成分定量結構-色譜保留指數相關(QSRR)模型,所建模型的相關系數達到0.977,用該模型估算的平均相對誤差為3.13%。通過Jackknife法、交互檢驗和外部檢驗證明該模型具有總體穩健性和良好的預測能力。結果表明:多種指數聯合能夠較全面地表征分子結構特征,有效揭示影響化合物色譜保留時間的本質因素。
酸橘;揮發性成分;色譜保留指數;構效關系
酸橘是柚子的變種,其風味與柚子、橙子、檸檬、橘子等有很大的差異,果汁有較強的酸味,所以不能直接食用,但其果皮有特有的清爽香氣,可以添加在烤魚、烤肉、火鍋調料等食品中,能產生誘人的風味。因此,研究酸橘果皮油的揮發性成分,對食品工業有很大的應用價值[1-2]。楊榮華[1]用溶劑萃取法提取酸橘果皮的精油,用硅膠柱將果皮油分為碳氫化合物成分和含氧化合物成分,并利用氣相色譜和色譜-質譜連用系統分析了酸橘果皮油的揮發性成分,依據各成分的保留指數,進一步鑒定出68種揮發性成分,其中包括23種碳氫化合物、45種含氧化合物。
分子定量結構-色譜保留(quantitative structure-retention relationship,QSRR)是對色譜保留值與結構定量關系進行研究[3-5],對預測色譜保留值、選擇分離條件等具有重要意義[6],本研究利用Randic[7]和Kier[8]等提出的價分子連接性指數(Xi)、分子形狀指數(Km)[9]和Hall等[10-11]提出的電性拓撲狀態指數(En)關聯酸橘果皮油68種揮發性成分的保留指數,建立QSRR預測模型。
1.1 數據的來源
68種酸橘皮油揮發性成分包括23種碳氫化合物和45
種含氧化合物的保留指數引自文獻[1]。
1.23 種拓撲指數的計算
1.2.1 價分子連接性指數(Xi)
價分子連接性指數的核心是分子中原子的點價,對于含有不飽和鍵和雜原子的分子,其點價為:

式中: Zi、Ziv分別為非氫原子i的總電子數、價電子數,hi為與原子i直接鍵合的氫原子數。在分子隱氫圖的鄰接矩陣基礎上定義分子的價分子連接性指數(Xi)。

1.2.2 分子形狀指數(Km)
Kier定義烷烴分子的形狀指數為:
式中:m為形狀指數的階數;nj為分子j中非氫原子數;Pj為分子j中具有路徑(邊的數目)m的個數。
為了擴展飽和烴的分子形狀指數的應用范圍,Kier于上述公式中引入修正項j,分子j中原子i的修正值αi定義為:

式中:r為sp3雜化碳原子的原子半徑(r=77nm);ri為非sp3雜化碳原子或其他雜原子的原子半徑。

1.2.3 電性拓撲狀態指數
原子n的電性拓撲狀態指數可用式(6)計算:

式中:t為具有相同類型原子的個數;In為分子中每個非氫原子的固有狀態值。

式中:Nn為原子n的電子層數;δnv為原子n的Kier點價。
ΔIn是某原子(n)固有狀態In值在分子中受其他原子的影響產生的增量:

式中:rnj為原子n與原子j之間相隔的最短路徑數加1;∑是對分子中原子n以外的其他原子求和。
1.2.43 類拓撲指數的程序化計算
首先應用Chem3D Ultra 9.0軟件分別構建68個酸橘果皮油揮發性成分的分子結構,存為mol文件,然后在Matlab 7.1.0環境下,調用上述分子結構,應用文獻[12-13]的方法編制程序,計算得到10種價分子連接性指數,4種分子形狀指數和7種電性拓撲狀態指數(23種碳氫化合物和45種含氧化合物所共有的原子類型),共有21個描述子。
1.3 定量結構-保留指數相關分析方法
將每種化合物的21種描述子作為自變量X,相應的色譜保留指數(RI)為因變量Y構建數據集,應用最佳子集回歸(Leaps-and-Bounds regression )選擇最佳變量組合,建立相應QSRR模型。以逐一剔除法(LOO)交互檢驗判斷其穩定性與預測能力,同時引入Kubinyi函數(Kubinyi function,FIT)[14-15],其計算公式:

式中: y為化合物數;b為變量數。FIT值越大,所建的模型越穩定,預測能力越高。
2.1QSRR模型的建立
應用SPSS 13.0統計分析軟件,就上述化合物數據集進行多元統計分析,經最佳變量子集回歸構建QSRR模型見表1。對所得的不同模型進行LOO交叉驗證,即每次抽取68個化合物作為樣本,剔除1個化合物作為被預測對象,再由預測值與實驗值進行線性回歸,即得交叉驗證系數(Q及Q2)。

表1 RI與Xi、Km及En的最佳變量子集回歸結果Table 1 Leaps-and-bounds regression between RI and Xi, Kmand En
由表1交叉驗證系數和FIT的遞變規律,得出最佳六元數學模型:
RI = 152.309 + 211.966X1-265.468X5- 17.408K3-66.406E1-25.957E2- 21.557E5(n=68,R=0.977,R2= 0.954,Q2=0.944,Q=0.972,S=48.483,F=209.314) (10)
式中:n、R、R2、Q、Q2、S、F依次為樣本數、相關系數、判定系數、交叉驗證系數、估計標準誤差及Fisher 檢驗值。

表2 酸橘果皮油揮發性成分的拓譜指數和色譜保留指數Table 2 Retention indexes and topologic indexes of volatile compounds in sudachi peel oil

續表2
用模型(10)計算酸橘揮發性成分的色譜保留指數(表2),和文獻值基本吻合,平均相對誤差為3.13%。2.2模型穩健性和預測能力的再檢驗
用Jackknife法[16]對模型進行穩健性再檢驗。每次從68個化合物中去掉化合物序數中個位分別是0,1,2,3,…,9的分子,剩余化合物為建模組,根據模型(10)的形式進行回歸,重復10次,所得Jackknife的R值分別為0.976、0.980、0.976、0.975、0.976、0.977、0.975、0.978、0.977、0.978。其中R值最大為0.980最小值為0.975,相關系數均波動不大,呈良好的正態分布,平均值為0.977,和模型(10)的相關系數一致,說明回歸模型具有可接受的總體穩健性。

圖1 酸橘果皮油揮發組分色譜保留指數的計算值和文獻值相關圖Fig.1 Plot of calculated against previously reported values of retentionindexes volatile compounds in sudachi peel oil
一個好的QSRR模型除了具有良好的穩健性以外,還必須具有對外部樣本的良好預測能力。為此,將68個化合物分為訓練集和檢驗集,以訓練集建立模型,然后預測檢驗集樣本。隨機抽取50個化合物作為訓練集樣本,余下的18個化合物(表2中用*號標記)作為外部檢驗集樣本。對訓練集進行不同變量數的最佳變量選擇,結果表明,選擇的最佳變量子集與應用全部68個化合物所得結果相同,即仍是X1、X5、E1、E2、E5、K3的組合,這說明50個訓練集與68個化合物的整體數據集具有相同的QSRR規律,訓練集模型的有關統計參數和整體數據所建的模型沒有顯著差異,用訓練集所建最佳QSRR模型預測檢驗集的色譜保留指數與文獻值基本吻合,平均相對誤差為3.10%。圖1是訓練集和檢驗集計算值和文獻值的相關圖。
2.3 酸橘果皮油揮發性成分色譜保留指數的本質因素
化合物在色譜柱上的保留行為與化合物同固定相之間的相互作用有關。固定相一定時,這種相互作用的大小直接與化合物的拓撲、幾何和電性特征相關[17]。
進入模型(10)的6個拓撲指數分3種:價分子連接性指數、分子形狀指數和電性拓撲狀態指數。這3種描述符恰恰反映了化合物分子的拓撲、幾何和電性特征,所以3種指數的聯合用于酸橘果皮油色譜保留指數擬合,能夠全面揭示影響保留指數的主要因素,所建模型獲得令人滿意的估算與預測結果。
本研究用3類拓撲指數對68個酸橘果皮油揮發性成分色譜保留指數進行相關研究,通過最佳子集回歸建立了六元QSRR模型,所建模型不僅具有較高的相關系數,而且通過Jackknife法檢驗,LOO交互檢驗和外部檢驗證明具有良好的穩健性和預測能力,用該模型成功地預測了酸橘果皮油揮發性成分的保留指數,為探索化合物的分離條件提供基礎數據。該研究表明多類拓撲指數聯合建立的數學模型能夠更為全面地揭示影響化合物某種性能的結構因素,所以獲得較為理想的研究結果,對其他天然產物中揮發性組分的QSRR研究起到一定的指導作用。
[1]楊榮華. 酸桔果皮油揮發性成分的研究[J]. 食品科學, 2001, 22(3): 71-73.
[2]楊榮華. 酸桔果皮油的特征香氣成分[J]. 無錫輕工大學學報, 2000, 19(5): 475-478.
[3]陳艷, 馮長君. 部分有機污染物氣相色譜保留指數的QSRR研究[J].計算機與應用化學, 2007, 24(10): 1404-1408.
[4]陳艷. 單硫醚氣相色譜保留指數的分子拓撲研究[J]. 武漢理工大學學報, 2007, 29(3): 82-85.
[5]陳艷, 馮長君, 岳瑋. 脂肪醇生物活性和理化性質的QSAR/QSPR[J].哈爾濱工業大學學報, 2009, 41(12): 209-212.
[6]楊學謹, 李延東, 王善偉, 等. 二茂鐵衍生物疏水參數的測定及其保留值與結構定量關系的研究[J]. 色譜, 1996, 14(2): 86-90.
[7]RANDIC M. On characterization of molecular branching[J]. J Amer Chem Soc, 1975, 97(23): 6609-6615.
[8]KIER L B, HALL L H. Molecular connectivity in structure-activity analysis[M]. England: Research Studies Press, 1986.
[9]許祿, 胡昌玉. 應用化學圖論[M]. 北京: 科學出版社, 2000: 149-162.
[10]HALL L H, KIER L B, BROWN B B. Molecular simmilarity based on novel atom-type electrotopological state indices[J]. J Chem Inf Comput Sci, 1995, 35(6): 1074-1080.
[11]HALL L H , KIER L B. Electrotopological state indices for atom types: a novel combination of electronic, topological, and valencestate information [J]. J Chem Inf Comput Sci, 1995, 35(6): 1039-1045.
[12]胡黔楠, 梁逸曾, 王亞麗, 等. 直觀隊列命名法的基本原理及其在矩陣與拓撲指數計算中的應用[J]. 計算機與應用化學, 2003, 20(4): 386-390.
[13]張婷, 梁逸曾, 趙晨曦, 等. 基于分子結構預測氣相色譜程序升溫保留指數[J]. 分析化學, 2006, 34(11): 1607-1610.
[14]SAIZ-URRA L, GONZAEZ M P, TEIJEIRA M. 2D-autocorrelation descriptors for predicting cytotoxicity of naphthoquinone ester derivatives against oral human epidermoid carcinoma[J]. Bioorganic and Medicinal Chemistry, 2007, 15: 3565-3571.
[15]SAIZ-URRA L, GONZAEZ M P, TEIJEIRA M. QSAR studies about cytotoxicity of benzophenazines with dual inhibition toward both topoisomerases Ⅰ and Ⅱ: 3D-MoRSE descriptors and statistical considerations about variable selection[J]. Bioorganic and Medicinal Chemistry, 2006, 14: 7347-7358.
[16]DIETRICH W S, DREYER N D, HANSCH C. Confidence intervalestimators for parameters associated with quantitative structure/ activity relationship[J]. J Med Chem, 1980, 23: 1201-1205.
[17]林志華, 劉樹深, 李志良. 多氯代二苯并呋喃在不同色譜柱上的氣相色譜保留行為: 定量結構-色譜保留關系(QSRR)的研究[J]. 色譜, 2001, 19(2): 116-123.
Quantitative Structure-Chromatographic Retention Time Relationship Analysis of Volatile Compounds in Sudachi Peel Oil
CHEN Yan,DU Xi-hua
(School of Chemistry and Chemical Engineering, Xuzhou Institute of Technology, Xuzhou 221008, China)
Based on the chemical topological theory, Kier , s molecular connectivity indexes (Xi ), molecular shape indexes (Km) and Hall’s electrotopological state indexes (En) of 68 volatile compounds found in sudachi peel oil were calculated. A model corresponding to the quantitative structure-retention index (RI) relationship (QSRR) of these volatile compounds was deduced by leaps-and-bounds regression, with a correlation coefficient (R) of 0.977. An average relative error of 3.13% for estimation with the model was observed. This model exhibited excellent stability and predictability evaluated by Jackknife method, leave-one-out (LOO) cross-validation and external validation procedure. The regression results indicate that the multi-kinds of topolagical index can characterize molecular structure and demonstrate the essential affecting factors of compound retention index.
sudachi;volatile components;retention index;quantitative structure-retention relationship (QSRR)
S666
A
1002-6630(2010)18-0312-05
2010-06-29
江蘇省自然科學基金項目(09KJD150012);徐州市科技計劃研究項目(XM08C015)
陳艷(1968—),女,教授,碩士,主要從事污染物、藥物和食品構效關系研究。E-mail:chenyan681110@126.com