付 瑾,馬 羚,焦 龍
(西安石油大學化學化工學院,陜西 西安 710065)
苯類有機物是地下水環境中常見的污染物。地下環境中的苯類有機物以非水相液體(NAPL)的形態污染土壤、含水層和地下水。殘渣可持續殘留數十年甚至數百年,長期污染地下環境,分解過程的中間產物也對環境造成二次污染。苯類污染物的主要來源是石油生產、使用、儲存和運輸過程中造成的石油泄漏和滲透。地下水環境油污事故時有發生,特別是在快速發展的產油國,此類污染問題尤為嚴重。
近年來,許多氧化劑(如羥基自由基(·OH)、臭氧和硝酸鹽自由基)已被用于降解環境中的有機物,有機污染物與·OH的反應是去除環境中有機污染物的最重要途徑[1-2]。苯類有機物與·OH的反應速率常數(kOH)是大氣中有機化合物的重要參數,是評價環境持久性和生態風險性的重要指標[3]。通過實驗方法獲得kOH成本高、費時費力,難以滿足化學物質生態風險評估的需要。因此,亟需建立一種能夠高效預測有機化合物的kOH的理論方法。
定量構效關系(QSAR)是在一個已知化合物的分子結構和生物活性之間建立一個數學模型,然后預測該系列中一個未知化合物的生物活性。該技術已成功地應用于預測有機化合物的各種反應(如與·OH、硝基和臭氧的反應)的動力學速率常數。目前,QSAR廣泛應用于藥物設計[4-8]、化合物的化學物理性質研究[9-12]、反應機理[13-18]、環境中化學物質暴露水平和生物活性評價[19-20]評價等領域。三維定量構效關系(3D-QSAR)通過分子三維空間構型計算各種場的作用以建立QSAR模型,操作簡單,一般模型預測準確度更高,且更為穩定。本研究采用3D-QSAR中比較分子場分析(CoMFA)方法,對苯類有機物的44種化合物建立其kOH的QSAR模型,分析了苯類有機物的分子結構對其kOH值的影響。
44個化合物的數據列于表1。采用SYBYL-X 2.0(Tripos, U.S)分子模擬軟件構建全部的分子模型及建立QSAR模型,通過留一交叉驗證和外部測試集驗證,評估模型的預測能力。將44種化合物隨機分為兩組:第Ⅰ組中含37種化合物,第Ⅱ組中含7種化合物(第Ⅱ組在表1中用“*”標記)。用均方根相對誤差(RMSRE)、交叉驗證均方根誤差(RMSECV)、預測均方根誤差(RMSEP)來評價模型的預測能力,其定義分別見式(1)~(3)[21]。

表1 kOH的實驗值和預測值
(1)
(2)
(3)


表1(續)
所有對CoMFA的分子建模和計算都是由SYBYL-X 2.0 (Tripos, U.S.)軟件進行。在SYBYL軟件里構建44個分子結構模型,采用Gasteiger-Huckel來計算原子電荷,通過Tripos標準分子力場進行分子結構優化,能量梯度收斂值RMS設為 0.0209 kJ·mol-1·A-1,最大迭代次數設為1000次,其余均采用默認值。
CoMFA是將立體場和靜電場建立在分子周圍的三維的網格上,對于每個網格點,計算了分子與已定義探針之間的相互作用能。CoMFA模型由sp3雜化的C+原子作為探針,并設定其臨界值在 125.58 kJ·mol-1。當x、y和z軸的三維網格間距為2A時,Lennard-Jones公式和庫侖函數用于計算的空間場和靜電場的作用能。最后進行偏最小二乘法分析,先用交叉驗證方法檢驗所得模型的預測能力,得到最佳主成分數(N)和交叉驗證系數平方(q2),再進行非交叉驗證得到非交叉驗證相關系數平方(R2)和Fisher統計量(F)、估計標準偏差(SEE),并用這些數據作為判斷回歸模型預測能力的依據,以三維等勢圖顯示[21-22]。
以第I組化合物為訓練集建立CoMFA模型,該模型的最佳主成分值為2,q2=0.885,R2為0.935,SEE為0.070,F值為244.967。用所建立的模型預測第II組化合物的kOH數值,預測結果見表1。第II組kOH數值的預測RMSRE為0.3911,RMSEP為0.0382,預測值與實驗值之間的回歸方程為y=0.9622x+0.3589(y表示預測值,x表示實驗值),相關系數為0.9688。如表1所示,化合物的kOH數值預測值和實驗值基本一致。用第I組完成留一交叉驗證,依次預測第I組中37個樣品的kOH數值。預測結果如表1所示,第I組化合物kOH數值的預測RMSRE為0.6860,RMSECV為0.0669,預測值與實驗值之間的回歸方程為y=0.9338x+0.6465(y表示預測值,x表示實驗值),相關系數為0.9671。實驗值與預測值數點圖見圖1。兩種驗證結果說明所建立的CoMFA模型合理,具有預測能力。

圖1 實驗值與預測值散點圖
分子之間的重疊范圍影響CoMFA模型的構建,分別嘗試用不同化合物為模板利用Align Database板塊進行分子疊合,結果表明,44號化合物(2-Naphthol)的疊合效果最好。因此,選取最活躍的44號分子作為模板對第I組化合物進行分子疊合,疊合結果如圖2所示。

圖2 分子共同骨架的疊合圖
圖3為CoMFA模型中模板分子的立體場和靜電場的三維等勢圖。在立體場等勢圖中,綠色區域表示分子活性會隨著空間位阻的上升而提高,黃色區域表示空間位阻的降低有助于分子活性的提高;此外,靜電場等勢圖中,紅色區域表示引入帶負電荷的取代基有利于提高分子活性,藍色區域表示引入帶正電荷的取代基有利于提高化合物的活性。從等視圖可見,在44號分子的2號·OH取代位、6、7取代位的位置附近顯示為黃色區域,表示該基團使kOH值減小;從靜電場等勢圖可見,分子的兩個苯環連接的附近為紅色區域,表示該區域添加負電荷能夠減小化合物的kOH值。

Steric field Electrostatic field圖3 CoMFA模型的三維等勢圖
本研究采用CoMFA方法對44個苯類化合物進行研究,生成3D-QSAR模型。CoMFA分析結果顯示,交叉驗證系數q2值為0.885。交叉驗證系數q2接近于1,說明所有化合物都具有相似的相關性,所建立的模型的穩定性會更好。這些統計參數表明,所建立的模型具有可靠、良好的內外預測能力,該模型有望作為預測苯類有機物kOH值的計算工具。