李美萍,張生萬(wàn)
(山西大學(xué)生命科學(xué)學(xué)院,太原030006)
磺胺類藥物是一種典型的作為飼料添加劑和疾病防治的獸藥,在國(guó)內(nèi)外養(yǎng)殖業(yè)中廣泛使用.在動(dòng)物養(yǎng)殖的應(yīng)用過(guò)程中很大部分會(huì)隨糞便排出體外而進(jìn)入環(huán)境. 磺胺類藥物一旦進(jìn)入環(huán)境會(huì)分布到土壤、水和空氣中,即開(kāi)始在水體、懸浮物、土壤等環(huán)境介質(zhì)中發(fā)生遷移、轉(zhuǎn)化、吸附等一系列過(guò)程[1]. 而在環(huán)境介質(zhì)中的吸附和遷移行為是決定環(huán)境中磺胺類藥物分布和殘留的重要過(guò)程,其吸附行為與其電離常數(shù)pKa 有關(guān),盡管常見(jiàn)磺胺類藥物的pKa 值可以通過(guò)實(shí)驗(yàn)確定或從相關(guān)手冊(cè)上查到,但是通常實(shí)驗(yàn)得到的pKa 值的方法比較繁瑣,不僅如此,在某些情況下,實(shí)驗(yàn)測(cè)定值還存在較大不確定性. 因此,研究磺胺類化合物的結(jié)構(gòu)和pKa 值之間的定量關(guān)系以及從理論和計(jì)算上尋找有效和可靠的預(yù)測(cè)pKa 值的方法十分重要. 李玉琴[2]曾報(bào)道了基于啟發(fā)式和基因表達(dá)式編程法預(yù)測(cè)磺胺類藥物的pKa 值,但關(guān)于三維全息原子場(chǎng)作用矢量(three-dimensional holographic vector of atomic interaction field,3D-HoVAIF)描述子用于磺胺類藥物的pKa 值預(yù)測(cè)還未見(jiàn)有關(guān)文獻(xiàn)報(bào)道. 最近,我們從磺胺類藥物的分子結(jié)構(gòu)出發(fā),提出了一個(gè)簡(jiǎn)單而有效的方法來(lái)計(jì)算其pKa 值.通過(guò)使用定量結(jié)構(gòu)- 性質(zhì)相關(guān)(quantative-structure property relationonship,QSPR)方法,并結(jié)合三維全息原子場(chǎng)作用矢量參數(shù),對(duì)31 個(gè)磺胺類化合物的pKa 值進(jìn)行了預(yù)測(cè),獲得比較滿意的結(jié)果.此研究不但可以對(duì)該類化合物的pKa 值進(jìn)行預(yù)測(cè),還有助于對(duì)其在環(huán)境中的作用機(jī)理的研究.
三維全息原子場(chǎng)作用矢量(three-dimensional holographic vector of atomic interaction field,3DHoVAIF)[3]從原子之間相對(duì)距離和原子的自身性質(zhì)出發(fā),基于三種原子間非鍵作用方式—靜電、立體和疏水作用,將有機(jī)分子中常見(jiàn)的氫、碳、氮、磷、氧、硫、氟、氯、溴、碘原子分別按其所處元素周期表中不同主族劃分為5 大類,為了能充分表達(dá)分子的細(xì)微結(jié)構(gòu)特征,又將不同主族中原子按其雜化狀態(tài)分為10 類,這樣分類后一個(gè)分子內(nèi)部不同類別的原子之間,相互作用情況就有55 種. 由于3D-HoVAIF 分別采用靜電、立體和疏水三種勢(shì)能來(lái)表達(dá)原子間不同的作用形式,所以,對(duì)于一個(gè)有機(jī)分子而言,用于表征分子結(jié)構(gòu)信息的原子作用項(xiàng)就有3 ×55 =165 個(gè). 這些三維矢量描述子可以不借助任何實(shí)驗(yàn)參數(shù)得到. 其具體的描述公式參見(jiàn)文獻(xiàn)[3-6],在此不再贅述.
本文研究的31 種磺胺類藥物及其pKa 值來(lái)自于文獻(xiàn)[2],其名稱見(jiàn)表1. 使用Chemoffice8.0 繪制31 種磺胺類藥物的分子結(jié)構(gòu)圖,用Chem3D 自帶的MOPAC 半經(jīng)驗(yàn)量子化學(xué)軟件在AM1 水平上最終優(yōu)化得到分子空間結(jié)構(gòu)(截?cái)嘀?.001KJ/mol),并采用Mulliken 布居分析法以單點(diǎn)(singlepoint)形式計(jì)算出原子的凈電荷數(shù)量,將分子中每個(gè)原子的空間位置及電荷分別以笛卡兒坐標(biāo)和凈電子數(shù)目的形式輸入 C 語(yǔ)言應(yīng)用程序3DHoVAIF. exe 加以處理,得到分子的3D-HoVAIF 描述子.

表1 磺胺類藥物名稱及pKa 值Table 1 Name and pKa values of sulfonamides
本文以R (建模相關(guān)系數(shù)),Rcv (交互檢驗(yàn)相關(guān)系數(shù)),RMSEF (擬合誤差)和RMSEP (預(yù)測(cè)誤差)作為衡量模型預(yù)測(cè)能力的標(biāo)準(zhǔn). 關(guān)于模型建立過(guò)程中訓(xùn)練集和測(cè)試集的樣本選取,我們按照參考文獻(xiàn)[2]從31 個(gè)樣本中選取10 個(gè)樣本作為測(cè)試集,其余的21 個(gè)樣本作為訓(xùn)練集,選取的測(cè)試集在表1 中用“* ”號(hào)標(biāo)出.
為了研究3D-HoVAIF 描述子與磺胺類藥物pKa 值的內(nèi)在聯(lián)系,本文使用三維全息原子場(chǎng)作用矢量165 個(gè)描述子進(jìn)行逐步回歸 (Stepwise Multiple Regression,SMR),選出顯著性變量,分別采用多元線性回歸(Multiple Lines Regression,MLR)和偏最小二乘回歸 (Partial Least Square Regression,PLS)進(jìn)行建模. 并采用留一法交互檢驗(yàn)對(duì)模型的穩(wěn)定性和預(yù)測(cè)能力進(jìn)行評(píng)估.
2.2.1 多元線性回歸
在多元線性回歸過(guò)程中,為了消除變量間偶然相關(guān)的影響,剔除影響模型穩(wěn)定性的自變量,使回歸方程始終顯著,需要在多元回歸分析中引入逐步回歸的方法. 本文采用SPSS 統(tǒng)計(jì)學(xué)軟件對(duì)變量進(jìn)行逐步回歸分析,得到如下方程:

其中,E 表示靜電作用. 如,E5-9表示第5 類N 原子與第9 類S 原子的靜電作用項(xiàng),即sp3雜化的N原子與sp2雜化的S 原子之間的靜電作用;E8-8表示第8 類S 原子與第8 類S 原子的靜電作用項(xiàng),即sp3雜化的S 原子與sp3雜化的S 原子之間的靜電作用;以此類推. 根據(jù)本實(shí)驗(yàn)建立的模型能夠看出,sp3雜化的N 原子與sp2雜化的S 原子之間的靜電作用對(duì)磺胺類藥物的pKa 影響較大,且呈負(fù)相關(guān). 使用上述模型對(duì)31 個(gè)磺胺類化合物的pKa值進(jìn)行估計(jì)與預(yù)測(cè),并將計(jì)算結(jié)果與實(shí)驗(yàn)值相關(guān)情況繪于圖1 中.
2.2.2 偏最小二乘回歸
為了檢驗(yàn)?zāi)P偷姆€(wěn)定性,繼而用偏最小二乘回歸方法進(jìn)行建模. 為保證變量單位空間尺度一致,首先采用自定標(biāo)法對(duì)原始變量標(biāo)準(zhǔn)化處理,隨后用化學(xué)計(jì)量學(xué)軟件Simca -p10.0 對(duì)訓(xùn)練集樣本建模,并以交叉檢驗(yàn)最高值(交叉檢驗(yàn)Y 的解釋方差)所對(duì)應(yīng)的主成分?jǐn)?shù)2 作為模型的復(fù)雜程度. 由4 個(gè)變量提取2 個(gè)主成分解釋了Y 變量89.6%方差,交叉檢驗(yàn)解釋Y 的方差為78.3%,其結(jié)果見(jiàn)表2. 同時(shí)將pKa 值實(shí)驗(yàn)值與預(yù)測(cè)值對(duì)比結(jié)果繪于圖1 中. 從圖1 和表2 可見(jiàn)PLS 計(jì)算結(jié)果與多元線性回歸結(jié)果基本吻合,說(shuō)明所選模型具有較好的穩(wěn)定性和預(yù)測(cè)能力.

圖1 pKa 實(shí)驗(yàn)值與預(yù)測(cè)值相關(guān)Fig.1 Plot of calculated value and experimental value
文獻(xiàn)1 運(yùn)用啟發(fā)式方法(HM)和基因表達(dá)式編程(GEP)方法建立了磺胺類藥物pKa 值預(yù)測(cè)模型,為了便于比較將其結(jié)果與本文基于3D -HoVAIF 描述子建模的相關(guān)數(shù)據(jù)列表2.

表2 磺胺類藥物pKa 值QSPR 模型比較Table 2 Contrast of QSPR models for pKa values of sulfonamides
從表2 可看出,采用3D-HoVAIF 所建模型和文獻(xiàn)2 建模所得相關(guān)系數(shù)和交互檢驗(yàn)復(fù)相關(guān)系數(shù)相當(dāng),但3D-HoVAIF 計(jì)算簡(jiǎn)便,結(jié)構(gòu)參數(shù)的取值完全來(lái)自分子本身的結(jié)構(gòu),描述子的物理意義明確且所建的線性模型可以識(shí)別和提供對(duì)這些化合物的pKa 值起作用的描述符.
研究結(jié)果表明了靜電作用是影響磺胺類藥物pKa 值的主要因素,尤其是sp3雜化的N 原子與sp2雜化的S 原子之間的靜電作用對(duì)磺胺類藥物的pKa 值影響較大,且呈負(fù)相關(guān). 同時(shí)從本文的結(jié)果看出3D-HoVAIF 能夠較好地表征磺胺類藥物分子的結(jié)構(gòu)信息,具有計(jì)算簡(jiǎn)便、物理意義明確的優(yōu)點(diǎn),并且避免了當(dāng)今大多3D 分子設(shè)計(jì)技術(shù)在應(yīng)用前需要對(duì)分子進(jìn)行疊合操作等方面缺點(diǎn),將其應(yīng)用在其他抗癌藥物活性[7-10]研究方面也取得了一定的效果,顯示出3D-HoVAIF 較為廣闊的應(yīng)用前景.
[1] He J H,Qiu J R,He D C,et al. Environmental behavior and related control technologies of sulfonamides[J]. Guangdong Agri. Sci.,2012,7:225(in Chinese)[何金華,丘錦榮,賀德春,等. 磺胺類藥物的環(huán)境行為及其控制技術(shù)研究進(jìn)展[J]. 廣東農(nóng)業(yè)科學(xué),2012,7:225][2] Li Y Q,Si H Z,Xiao Y L,et al. Quantitative structure activity relationship models based on heuristic method and gene expression programming for the prediction of the pKa values of sulfa drugs[J]. Acta Pharm. Sin.,2009,44(5):486(in Chinese)[李玉琴,司宏宗,肖玉良,等.基于啟發(fā)式和基因表達(dá)式編程法預(yù)測(cè)磺胺類藥物的pKa 值[J]. 藥學(xué)學(xué)報(bào),2009,44 (5):486]
[3] Zhou P,Tian F F,Li Z L. Three dimensional holographic vector of atomic interaction field(3D - HoVAIF)[J]. Chem. Intell. Lab. Syst.,2007,87:88.
[4] Tong J B,Zhou P,Zhang S W,et al. QSAR studies of anti-HIV drug HEPT using (3D -HoVAIF)[J].Acta Phys. Chim. Sin.,2006,22:721(in Chinese)[仝建波,周鵬,張生萬(wàn),等.三維全息原子場(chǎng)作用矢量用于HEPT 類抗艾滋病藥物的QSAR 研究[J].物理化學(xué)學(xué)報(bào),2006,22:721]
[5] Zhou P,Mei H,Tian F F,et al. Applying novel three dimensional holographic vector of atomic interaction field to QSAR studies for several classical drug systems[J]. Chem. J. Chin. Univ.,2007,28(6):1027(in Chinese)[周鵬,梅虎,田菲菲,等. 新型三維原子場(chǎng)全息相互作用矢量用于幾類典型藥物體系的QSAR 研究[J]. 高等學(xué)校化學(xué)學(xué)報(bào),2007,28(6):1027]
[6] Li M P,Zhang S W. QSAR studies of 5'-methylthioadenosine nucleosidase inhibitors using three -dimensional holographic vector of atomic interaction field[J]. J. Anal. Sci.,2011,27(5):566 (in Chinese)[李美萍,張生萬(wàn). 三維全息原子場(chǎng)作用矢量用于5' -甲硫腺苷核苷酶抑制劑的QSAR 研究[J]. 分析科學(xué)學(xué)報(bào),2011,27(5):566]
[7] Tong J B,Wang P,Li Y F,et al. Quantitative structure activity relationship studies of 5 -pheny-1 -phebylamino-1H - imidazole of Anti - HIV drug using three-dimensional descriptors[J]. J.At.Mol.Phys.,2011,28(1):41(in Chinese)[仝建波,王平,李云飛,等. 咪唑衍生物類抗艾滋病藥物3D -QSSR 研究[J]. 原子與分子物理學(xué)報(bào),2011,28(1):41]
[8] Tong J B,Chen Y,Che T,et al. Quantitative structure activity relationship studies of anti - tuberculosis drug using three - dimensional structure descriptors[J]. J. At. Mol. Phys.,2012,29(3):382(in Chinese)[仝建波,陳洋,車挺,等. 酰肼類抗結(jié)核病藥物的3D - QSAR 研究[J]. 原子與分子物理學(xué)報(bào),2012,29(3):382]
[9] Xu L N,Liang G Z,Li Z L,et al. Three-dimensional holographic vector of atomic interaction field for quantitative structure - activity relationship of Aza -bioisosteres of anthrapyrazoles (Aza - APs)[J]. J.Mol. Graph. Model.,2008,26:1252.
[10] Zhu W P,Liang G Z,Liao L M,et al. Chemical structural characterization and design of influenza neuram inidase inhibitors using three - dimensional holographic vector of atomic interaction field through quantitative structure-activity relationship studies[J]. Chinese J.Anal.Chem.,2008,36(6):799(in Chinese)[朱萬(wàn)平,梁桂兆,廖立敏,等. 三維全息原子場(chǎng)作用矢量(3D-HoVAIF)用于神經(jīng)氨酸酶抑制劑的結(jié)構(gòu)表征與設(shè)計(jì)及定量構(gòu)效關(guān)系(QSAR)研究[J]. 分析化學(xué),2008,36(6):799]