


摘 要:運用常見的取代基結構參數對化合物表征,進行苯胺類化合物生物毒性的QSAR研究;利用化學計量學建模,并由所得模型結果進行了苯胺類化合物
以苯胺類化合物對小鼠的日服毒性半數致死量LD50作為生物毒性指標,提取29種苯胺類化合物的取代基結構參數及1種分子指示變量作為分子結構描述符。利用SPSS軟件建模,并由所得模型結果進行了苯胺類化合物結構與生物毒性關系的理論解釋。
苯胺類化合物的結構為:
不同的苯胺類化合物具有相同的部分,也有不同的取代基結構,即不同的苯胺類化合物結構不盡一樣。常見的取代基團有-CH3,-Et,-NO2,-Cl等,這些取代基的類型、位置及數目會影響化合物的毒性。影響化合物毒性的電子效應類型參數,包括基團電負性效應參數σx,極化效應參數σα,場效應參數σF,共軛效應參數σR,取基團立體效應參數L和疏水參數π,其值見表1。
依據表1,每種苯胺類化合物有5中不同取代位置和6種取代基結構。
苯胺類化合物的生物毒性與其結構參數有關,為了從整體上考慮對生物毒性影響,在研究中設置指示變量I。
有的變量相關性較大,這里采取加權線性組合定義新變量,可以得到下式:
σF=0.4×σF1+0.24×σF3+0.3×σF4 (1)
以篩選出的取代基結構參數π1、π2、σF1、σF3、σF4、σR2及分子指示變量I與苯胺的生物毒性數據進行多元回歸建模。取29種苯胺類化合物中的26個樣品回歸建模,余下的3個樣品作為回歸模型的獨立檢測集。
采用SPSS統計軟件進行回歸建模。
原始數據建立的QSPR模型為:
lg(1/LD50)=2.575-0.426π2-2.284σR2-1.078σF+0.218I (2)
(R=0.966,R2=0.933,SE=0.058921,F=65.115,sig=0.000,n=26)
(其中σF是按1式定義的新取代基參數)。
為了避免由于各變量的量綱不同對建立的模型影響,所以對篩選后變量進行數據標準化處理,即
XZ=■ (3)
數據標準化后,建立的QSPR模型為:
lg(1/LD50)=-0.467π2-0.556σR2-0.616σF+0.695I (4)
(R=0.966,R =0.933,SE=0.058921,F=65.115,sig=0.000,n=26)
以上模型中,R:相關系數,SE:標準誤差,F:檢驗值,sig:檢驗概率,n:樣本化合物數目。
QSPR模型的驗證的內部檢驗:
R值較大,R=0.969, F 值較大(F=65.115)通過檢驗(sig=0.000),標準偏差較小,SE=0.058921,說明進入方程的結構參數與苯胺類化合物生物毒性顯著相關,回歸方程整體上有意義。從表2可以得到,通過t檢驗值檢驗,表明回歸方程的各個系數是有意義的。從圖1可以看出,苯胺類化合物生物毒性實驗值和預測值基本在直線上或直線兩側附近波動,說明實驗值和預測值較為接近,模型有良好的穩健性和預測性,模型的預測計算值及殘差見定義均方誤差函數MSE:
(5)
方差膨脹因子值越大,自變量之間存在共線性的可能越大。一般認為,當VIF>5時,可以認為變量之間存在共線性問題。由表3知,該模型自變量的VIF值在1到4之間,說明自變量之間的相關性不大。
通過對苯胺類化合物生物毒性QSAR模型評價,表明所建的回歸模型穩定可靠,方程的所有系數是有意義的,可用于苯胺類化合物生物毒性的預測和生物毒性理論解釋。
由(2)、(4)式可以看出,生物毒性lg(1/LD50)與I 呈正相關,與π2、σR2和σF呈負相關。如果苯胺類化合物具有較大I值,較小的π2、σR2和σF值,那么可以預測出該化合物具有較高的生物毒性。
由標準回歸系數可知,除分子指示變量I(0.695)外,呈負相關的新定義的取代基結構參數σF(見1式)的標準回歸系數(-0.616)最大(取絕對值),即表明它對苯胺類化合物的生物毒性影響很大。取代基疏水參數π、場效應參數σF和共軛效應參數σR等結構參數對應電子效應的綜合影響,才產生了大小不同的生物毒性。
參考文獻
[1]許祿,吳亞平,苯酚類化合物的三維定量構效關系研究[J].計算機與應用化學,2000(17):14-17.
[2]戴益民,等.應用多維標度法預測硝基苯化合物的生物毒性[J].長沙理工大學學報,2008,5(1):59-62.
[3]曹晨忠.有機化學中的取代基效應[M].北京:科學出版社,2003.