999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

定量構效關系應用于水中有機污染物降解過程的研究進展

2021-08-19 02:01:18李玉坤炊衣琦楊凱峰
化工環保 2021年4期
關鍵詞:分子結構模型

張 丹,晁 聰,李玉坤,炊衣琦,楊凱峰

(1. 中原工學院 能源與環境學院,河南 鄭州 450007;2. 河南省食品安全檢測工程技術研究中心,河南 鄭州 450000)

隨著經濟的快速發展,越來越多的有機物被合成、使用,并排放到水體、大氣、土壤、沉積物等環境介質中,進入人類賴以生存的生態系統。多數有機污染物具有毒性高、易生物富集等特點,能直接或間接紊亂內分泌系統、干擾免疫系統平衡,對人體健康和生態環境構成威脅[1]。因此,對有機污染物降解過程的研究已引起廣泛關注。然而,由于有機污染物種類繁多,要逐一、全面地對其進行降解實驗并不現實。因此,基于已有的有機污染物降解過程的研究,建立多種有機污染物分子結構與環境轉化性質之間的定量構效關系(quantitative structure-activity relationship,QSAR)十分必要[2-3],不僅可以節省實驗所需的人力、物力資源,還能依據建立的模型對未知化合物的反應活性、轉化機制進行模擬預測。近年來,越來越多的研究者將QSAR應用于苯系物[4]、多環芳烴[5]、有機磷酸酯[6]、染料[7]等有機污染物的自由基氧化、微生物降解、超臨界水氧化、光降解等過程的研究。

本文介紹了QSAR的原理及建模方法,對QSAR應用于水中有機污染物不同降解過程中反應活性模擬預測及機理解釋的研究進行了綜述,并對該領域的發展趨勢進行了展望,以期為相關研究提供參考。

1 QSAR的原理及建模方法

1.1 基本原理

QSAR基于化合物分子結構與理化性質、環境遷移轉化行為及生態毒理學效應之間的內在聯系,以同系物或多種有機物的結構參數或理化參數為自變量,反應活性、毒理效應等為擬預測變量即因變量,利用數理統計方法建立自變量與因變量之間的定量關系[8]。QSAR模型既可預測未知化合物的目標性質,又能解釋分子結構變化導致的性質變化,推測可能的作用機理,還可指導化合物的改性[9]。

QSAR首先由HANSCH等[10-11]在20世紀60年代確立,隨著計算機技術、人工智能及機器學習技術的發展,研究化合物分子結構與其反應活性/毒理效應之間定量關系的手段得到了豐富[12]。目前二維QSAR主要有Hansch法、基團貢獻法、分子連接性指數法等;近年來三維結構信息的引入開啟了三維QSAR,主要有分子形狀分析、距離幾何法、比較分子相似因子分析等[13]。在三維基礎上考慮分子多構象計算的四維QSAR,進而考慮受體對配體誘導契合的五維QSAR,以及考慮受體、配體相互作用時溶劑化作用的六維QSAR,使人們對QSAR理論及技術有了更深入的認識[14]。雖然三維以上的方法考慮因素更多、更接近真實體系,但目前尚處于方法研究階段,應用較少。

QSAR模型的建立流程如圖1所示,收集的數據分為擬預測變量數據和分子結構描述符數據,應確保數據盡可能完整可靠,這是模型有效的前提。數據的來源通常有3種方式:1)實驗;2)文獻,如學術期刊、報告、網站等;3)在線或離線的計算機程序、數據庫。分子結構描述符是化合物理化性質的量化表征,一種有機物包含大量的分子結構描述符,如組分描述符、量子描述符、幾何參數、電子參數等,但并不是所有的描述符在QSAR建模中都有用,很多描述符表現出與擬預測變量較差的相關性或與其他描述符的共線性,因此,進行分子結構描述符的篩選十分必要,這有助于降低處理過多描述符的復雜性、降低過度訓練的風險[15]。建立化合物結構與反應活性/毒理效應關系模型的方法一般分為線性、非線性兩類,線性方法通常有回歸分析(多元線性回歸(multiple linear regression,MLR)、主成分回歸(principal component regression,PCR)等)、聚類分析、因子分析、模式識別等多元統計分析方法,非線性方法主要有支持向量機(support vector machine,SVM)、人工神經網絡(artificial neural network,ANN)、遺傳算法等[16]。最后,對建立的模型進行驗證與評價,多采用內部驗證評價模型的穩健性和擬合度,采用外部驗證評價模型的預測能力。

圖1 QSAR模型的建立流程

1.2 建模方法

在完成數據收集、分子結構描述符的篩選后,需要建立分子結構描述符(自變量)與擬預測變量(因變量)之間的定量關系模型,此時建模方法的合理選擇對于構建模型的有效性非常重要。下面將針對常用的QSAR建模方法進行簡要闡述。

作為經典建模方法,MLR法被認為是所有回歸方法中最具透明度的算法。MLR法基于多個獨立自變量,建立與因變量的線性回歸關系模型,進而預測因變量的大小。一般要求自變量之間不存在明顯的自相關性,即多重共線性不顯著。MLR方程中獨立自變量與因變量的廣義數學表達式如式(1)所示。

式中:y為因變量,即定量構效關系模型的擬預測變量;b0為常數項;b1,b2,…,bn為各獨立自變量的回歸系數;x1,x2,…,xn為獨立自變量,即使用的分子結構描述符。

MLR法除了可得到自變量與因變量的關系,還可獲得自變量對因變量的影響程度信息,具有結構簡單、計算速度快等優點。ZHANG等[7]通過逐步MLR法建立的QSAR模型研究了偶氮染料分子結構與光降解活性之間的關系,結果表明:pH為9.0時的QSAR模型可對偶氮染料在紫外光照射下的光穩定性做出較為準確的預測;柔軟度、碳原子上最正及最負部分的電荷是關鍵的描述符。MLR法在實際應用中應注意:1)自變量之間應相互獨立,可通過方差膨脹因子診斷多重共線性;2)為了避免線性回歸過擬合,使用的自變量數量不宜超過樣本總數的1/5[16]。

PCR法首先將自變量集通過數據降維處理,排除重疊的部分,轉換為少數線性無關的新變量,即主成分,同時盡可能保留自變量的數據結構特征;然后將主成分按貢獻率排序,進行MLR。當自變量集維度太高時,降維提取貢獻率大的主成分能降低建模復雜性,可較好地解決多重共線性問題。

與PCR法類似,因子分析通過研究自變量集的相關關系矩陣內部結構,尋找起支配作用的主因子[17],用于確定顯著影響化合物反應活性的結構因素。模式識別將結構參數作為數量化的模式向量,使結構與活性聯系起來[18],在QSAR研究中對于合理選擇降解活性化合物具有指導作用。此外,偏最小二乘(partial least squares,PLS)法同樣基于成分提取,除了考慮自變量數據集外,還兼顧因變量數據集,是一種多因變量對多自變量的建模方法[16]。PLS法兼顧MLR法和PCR法的優點,適用于分子結構描述符之間存在多重共線性或變量個數大于樣本容量的情況。

1.2.2 SVM法

不同于傳統統計學的經驗風險最小化,SVM法是一類基于結構風險最小化原理的機器學習算法。SVM法結合最大化分類間隔思想和基于核函數的方法,致力于將非線性可分的數據通過核函數映射到高維特征空間,轉化成可線性分割的關系。建模過程中,通過對比不同核函數,如線性核函數、徑向基核函數、多項式核函數等的性能,選擇合適的核函數,建立全局最優模型。徐鏡善等[19]采用SVM法對酚類化合物進行QSAR研究,根據均方根誤差最小原則,確定徑向基核函數為最優核函數,所建立模型的預測精度(0.934)優于MLR法(0.895)及PLS法(0.894),表現了較好的預測能力、泛化能力。SVM法具有魯棒性、精度高、自適應能力強等特點,在解決樣本容量小、非線性、高維等問題方面具有獨特優勢。

葛根是蘇伯維爾的君藥,而葛根素則是葛根的有效成分,研究表明其具有解熱〔4〕,鎮痛〔5〕,抗菌、抗感染〔6〕,降血壓〔7〕,降血糖、血脂〔8〕,抗氧化,抗腫瘤,解酒〔9〕等作用,與蘇伯維爾的功能主治一致,所以本實驗選擇葛根素作為蘇伯維爾水提工藝的含量測定指標。為考察提取情況,首先對葛根素含量進行考察,其次對浸膏得率進行考察,試驗分析得出:葛根素含量比浸膏得率更好地反映藥材的提取情況,故設計葛根素含量與浸膏得率的權重系數為8:2。為確保水提工藝的合理性,本實驗進行了驗證試驗,結果表明,正交試驗優選出的水提工藝合理可行。

1.2.3 ANN法

作為一種模擬人腦功能及神經網絡工作的機器學習方法,ANN法以數學網絡拓撲結構為理論基礎,包括3層:輸入層、輸出層和位于它們之間的隱含層,其中隱含層數量至少為兩個的神經網絡稱為深度神經網絡。在前向傳遞中,變量由輸入層輸入,經過隱含層處理轉換后,在輸出層得到結果。如果輸出層的輸出結果達不到期望,通常會轉入反向傳播算法,對神經元的權值、偏差進行調整更新,從而使建立的模型能更好地描述自變量與因變量的關系[20]。楊靜等[21]采用遺傳算法結合ANN法構建了27種性質參數與23種酚類化合物臭氧氧化速率的QSAR模型,模型表明,酚類化合物電子云分布、苯環取代基性質、水溶液中溶劑化作用均會顯著影響臭氧氧化速率;模型的預測值與實測值相關性顯著(R2=0.95),預測能力較強,與PLS算法建立的模型相比,ANN模型穩健性更好。ANN法具有非線性、自適應學習能力強等優點,在解決非線性問題方面具有優勢。

2 QSAR在有機污染物降解過程的應用

2.1 反應活性模擬預測

為研究有機污染物的環境歸趨、降解轉化,需要獲得反應動力學參數,如降解速率、半衰期等。由于有機污染物種類繁多,逐一進行實驗測定耗費大量人力、物力資源,難以適應環境評價的需要,建立有機污染物降解過程反應活性的QSAR模型具有重要意義。

2.1.1 光降解動力學的模擬預測

有機污染物的光降解分為直接光解和間接光解,是環境降解轉化的重要途徑[22-23]。作為光降解反應動力學的重要參數,光解速率是評估有機污染物光解過程、在環境中持久性的一項重要指標。研究表明,通過構建QSAR模型,可實現對偶氮染料、多環芳烴、溴化物等有機污染物光解速率的模擬預測,詳見表1。

表1 有機污染物光降解反應速率的QSAR預測模型

ZHANG等[27]研究鹵代消毒副產物的紫外光直接光解過程時發現,鹵代基數目越多,光解速率越大;光解速率還受鹵代基類型的影響,碘代>溴代>氯代。采用MLR方法構建的光解速率參數(logk)與分子結構描述符的QSAR模型表明,最高占據分子軌道與最低未占據分子軌道之間的能隙(ELUMOEHOMO)、復合擴展拓撲化學原子指數描述符與logk呈現較高的相關性,Williams圖驗證該模型具有較好的魯棒性和可靠性。

CHEN等[28]研究了多氯聯苯硫醚的直接光解反應,發現光解過程遵循準一級反應動力學方程,高氯化聯苯硫醚的降解速率通常比低氯的同類化合物快;構建的光解速率QSAR模型表明,氯原子的取代模式、偶極矩和ELUMO-EHOMO是主要的描述符。王文清等[29]基于反向傳播算法的ANN,以反應物濃度、H2O2投加量、光強度、pH、反應時間5個因素作為輸入層,以反應物剩余率的對數作為輸出層,利用94組數據構建了UV-H2O2光降解微囊藻毒素過程的QSAR模型,模型可對多因素條件下的光解速率進行仿真預測。

2.1.2 高級氧化過程反應動力學的模擬預測

高級氧化過程是指通過活化化學氧化劑產生的高活性物種(如羥基自由基·OH、硫酸根自由基SO4-·等),與有機污染物發生反應,將有機污染物氧化成小分子物質,甚至降解為H2O、CO2的過程[30]。高級氧化過程具有條件溫和、高效、環境友好等優點,在環境有機污染物去除、原位化學修復領域的應用前景廣闊[31]。高級氧化過程產生的·OH、SO4-·與有機污染物發生降解反應的速率常數(k)是表征污染物與活性物種反應強度、能力的重要參數,除了實驗獲取外,QSAR模型也是預測k的一種重要手段[22,32]。目前文獻已構建的一些代表性QSAR模型如表2所示。

表2 ·OH、SO4-·與有機污染物反應速率常數的QSAR預測模型

LUO等[33]收集有機物分子與·OH的反應速率常數(k·OH),采用MLR方法構建了具有良好預測能力的QSAR模型,并發現最高占據分子軌道能(EHOMO)對模型的貢獻最大,是影響k·OH的最主要因素,EHOMO作為衡量分子給電子能力的參數,其值越大越容易被親電試劑·OH攻擊發生降解反應。此外,考慮到許多有機物含有可電離基團,可以分解為不同種類的陰離子/陽離子,對·OH具有不同的反應活性,LUO等[34]研究了9種氟喹諾酮(fluoroquinolones,FQs)和11種磺胺類(sulfonamides,SAs)抗生素在3種解離形式(FQ±(兩性離子)/FQ+/FQ-,SA0(中性)/SA+/SA-)下與·OH的反應速率常數(k·OH)的QSAR模型,發現CH2RX(X為電負性原子,如O、N、S、P、鹵素)片段數、C原子上最大正原子凈電荷和分子偶極矩是影響反應活性的主要因素,其中CH2RX片段數、分子偶極矩的增加會導致logk·OH值增大,而C原子上最大正原子凈電荷的增加則導致logk·OH值的減小。模型預測了環境相關pH條件下不同解離形式FQs、SAs的k·OH,對可電離有機污染物的環境評估具有重要意義。

另外,YE等[41]在構建SO4-·氧化有機污染物過程的反應速率常數預測模型時發現,多元MLR建立的模型對訓練集化合物的擬合精度為0.88,對驗證集化合物的預測正確率為62%;ANN法建立模型的擬合精度更好(0.99),但對驗證集化合物的預測正確率較低(42%),這表明不同的建模方法影響模型的擬合精度和預測能力。CHENG等[42]研究了30種有機物在不同氧化體系(O2、H2O2、O3和·OH)中的降解過程,建立了有機物氧化還原電位(oxidation-reduction potentials,ORP)的QSAR模型,隨后基于反應速率常數(k)、氧化劑與有機物的ORP差值之間的線性關系,提出斜率、截距兩個新的預測因子用于預測有機物的k值和最小氧化電位,建立了斜率、截距、ORP值的QSAR模型,這表明斜率、截距及相關量子化學參數可用于預測反應活性,為氧化劑的選擇提供了新思路。

2.1.3 生物降解性的模擬預測

生物降解是指微生物通過氧化、還原、水解等作用使有機物分子發生礦化,轉化成小分子的過程,通常被認為是有機污染物在環境中的一類重要降解轉化過程[43]。開展有機污染物生物降解性的研究,有助于評估其在水體、土壤等環境介質中的潛在降解能力[44]。目前獲取生物降解性數據的主要途徑是實驗測定,但難以通過實驗測定所有有機物的生物降解性,且實驗需要經過微生物菌株培養、篩選等過程。因此,開展生物降解性的QSAR研究十分必要,可通過QSAR模型探尋生物降解性的影響因素,預測其他有機污染物的生物降解性。

ACHARYA等[45]根據分子結構描述符將103種有機物分為3組(第1組,單環芳香類化合物,69種;第2組,多環芳香類化合物,34種;第3組,所有芳香類化合物,103種),采用MLR方法進行QSAR建模。發現與第1組數據集QSAR模型相關的描述符是與疏水性、電子性、立體性、尺寸有關的化學性質,而第2、3組數據集的QSAR模型與相對抽象的描述符相關,如分子幾何、立體化學、構象指數、2D指紋等,因此單環芳香類化合物的QSAR模型比其他兩組的更容易解釋化合物分子結構對生物降解性的影響。CHEN等[46]以825種有機物為大樣本,采用C4.5決策樹、函數內回歸樹和邏輯回歸方法分別建立生物降解性的預測模型,發現函數內回歸樹模型在訓練集和驗證集上的預測準確率分別為81.5%和81.0%,穩健性最好;C4.5決策樹和邏輯回歸模型形式相對簡單,容易理解預測規則。此外,唐晨等[47]基于587種有機物的數據,分別利用MLR法、SVM法建立QSAR模型,根據有機物各碎片基團與生物降解性的相關系數,發現芳香酸、醛、脂肪酸、脂肪醇等對生物降解性有明顯的促進作用,而芳香碘、叔胺、芳香硝基、氨基甲酸酯等對生物降解性的消極影響較大。SVM模型的總體預測率(87.9%)和驗證集正確率(86%)均高于MLR模型(81.4%和82%),具有較好的預測能力。

QSAR模型不僅在好氧生物降解性的模擬預測領域得到了成功應用,在厭氧生物降解過程也同樣適用。馬益等[48]基于155種有機物的“血清瓶”厭氧生物降解篩選實驗數據,分別采用MLR法、反向傳播人工神經網絡(BP-ANN)法構建QSAR模型,發現積極影響厭氧生物降解性的碎片基團有16種,其中磷酸酯、溴代脂肪烴、吡啶環等貢獻值較大;起到消極影響的碎片基團有20種,叔胺、酰胺、甲基芳香烴等貢獻較大。模型評價結果表明,BP-ANN方法預測精度優于MLR方法。

此外,QSAR在多環芳烴[5]、鄰苯二甲酸酯[49]、苯酚[50]、芳香類化合物[51-53]等有機污染物生物降解性預測的應用均表明,QSAR模型可為有機污染物活性參數研究提供參考,有助于幫助合理預測結構相似的未知有機污染物的環境轉化行為。

2.2 反應機理解釋

QSAR除了模擬預測不同降解過程的反應活性外,所反映出的分子結構描述符信息還有助于闡釋反應機理[54],為有機污染物的去除提供理論指導。LUO等[4]構建了·OH、SO4-·與76種芳香類有機污染物反應活性的QSAR模型,發現EHOMO是對反應活性影響程度最大的描述符。EHOMO越高的分子越容易受到強親電體的攻擊,有助于電子的轉移過程;與·OH相比,高EHOMO分子更易與SO4-·發生反應。最高占據分子軌道分布依賴于官能團類型,因此參考最高占據分子軌道分布可以區分不同官能團有機物分子反應的傾向性差異,QSAR模型反映出的EHOMO描述符可作為衡量自由基氧化反應單電子轉移路徑的定量指標。

LI等[55]分別以脂肪族、芳香化合物為數據集,采用MLR方法建立了水合電子反應速率常數的QSAR模型,發現均包含最低未占據分子軌道能(ELUMO)、單電子還原電位(ERED)、極化率(α)3個描述符。與經常出現在氧化反應(如·OH反應)速率預測QSAR模型中的描述符EHOMO相比,ELUMO是還原反應重要的預測變量,代表分子對親核體(如水合電子)攻擊的敏感性,對脂肪族和芳香化合物水合電子反應速率常數的方差解釋率分別為60.1%和56.4%,低ELUMO分子更傾向于從其他來源獲得電子,并被還原。ERED描述了化合物的還原活性,α則與整體反應活性有關,α越高,電子分布越靈活,對親核體或親電體的反應性越強。CVETNIC等[56]對17種新興污染物光氧化降解過程(UV-C/H2O2、UV-C/S2O82-)的系統行為進行研究,采用遺傳算法結合MLR建立了QSAR模型,模型表明與新興污染物副產物降解動力學的經驗參數u和s相關的描述符可較好地解釋降解機理,即降解過程為·OH、SO4-·氫取代路徑和電子轉移路徑;另外兩個描述慢、快礦化副產物比值的經驗參數w和q依賴于新興污染物母體的結構特征,如緊湊/線性結構、分子對稱性等,可用描述符和與分子大小、形狀相關的權重因子來解釋。QSAR模型在將反應動力學、降解機制與簡化的反應路徑相關聯方面提供了較高的準確性。

3 結語與展望

QSAR將有機污染物分子結構與降解活性、機理解釋聯系起來,適合處理大量數據。QSAR模型能夠識別現有數據的趨勢,模擬預測未經測試化合物的反應活性,為研究環境中種類繁多的有機污染物的降解過程、環境歸趨提供了一種可行的解決方案,但在實際應用中仍需不斷探索。未來可對以下主要問題進行深入研究。

a)降解活性數據受實驗條件、方法的影響,不同來源的數據可比性有限,直接用于構建QSAR模型會影響模型的準確性,需建立有機污染物降解活性數據篩選流程,確定統一、標準的篩選方法。

b)對于新興污染物降解過程研究,應補充、擴展QSAR模型降解活性數據集數據。

c)如何將QSAR模型應用于實際環境介質,如水體、土壤、大氣等,還有待解決。QSAR模型直接外推到其他條件并不科學,需建立可定量有機物分子中不同官能團誘導效應、共振效應、立體效應的相互作用因子,在QSAR模型中考慮復雜環境介質中共存的有機污染物或介質成分(如溶解性有機物、陰陽離子、酸堿度等)對目標污染物反應活性的影響。

猜你喜歡
分子結構模型
把握分子結構理解物質的性質
中學化學(2024年5期)2024-07-08 09:24:57
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
三步法確定有機物的分子結構
壓裂返排液中瓜膠濃度檢測及分子結構解析
解讀分子結構考點
中學化學(2016年10期)2017-01-07 08:37:06
外電場中BiH分子結構的研究
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 午夜啪啪网| 久久国产热| 久久6免费视频| 国产精品一区不卡| 国产在线视频欧美亚综合| 四虎亚洲精品| 亚洲色图欧美一区| h网站在线播放| 日韩精品资源| 欧美国产在线一区| 亚洲乱码视频| 伊人91视频| 69精品在线观看| 18黑白丝水手服自慰喷水网站| 国产成人h在线观看网站站| 日韩欧美视频第一区在线观看| 999精品视频在线| 五月丁香在线视频| 又猛又黄又爽无遮挡的视频网站| 免费在线色| 欧美激情首页| 国产91高清视频| 欧美成人一级| 久久久久青草大香线综合精品| 99精品在线看| 四虎在线高清无码| 又大又硬又爽免费视频| 亚洲伊人久久精品影院| 亚洲视频一区| 国产激情无码一区二区三区免费| 国产噜噜在线视频观看| 日韩精品资源| 婷婷亚洲综合五月天在线| 国产在线观看第二页| 亚洲综合色婷婷| 日韩精品少妇无码受不了| 成人综合久久综合| 免费国产无遮挡又黄又爽| 国产美女主播一级成人毛片| 国产成人亚洲欧美激情| 久久久久国产精品免费免费不卡| 一区二区无码在线视频| 91小视频在线观看免费版高清| 国产精品亚洲片在线va| 老司国产精品视频| 亚洲成网777777国产精品| 亚洲一区第一页| 国产成人无码久久久久毛片| 欧美一级色视频| 成年A级毛片| 亚洲最大福利网站| 亚洲无码日韩一区| 欧美中文字幕在线播放| 中国国语毛片免费观看视频| 色综合国产| 黄色三级网站免费| 欧美一级大片在线观看| 亚洲国产精品不卡在线| 色网站免费在线观看| 国产Av无码精品色午夜| 毛片基地美国正在播放亚洲 | 欧美天堂久久| 91无码国产视频| 99热这里只有免费国产精品| 黄色一级视频欧美| 玖玖免费视频在线观看| 97在线国产视频| 亚洲av成人无码网站在线观看| 日韩毛片在线视频| 理论片一区| 国产午夜在线观看视频| 亚洲欧洲天堂色AV| 99久久精品免费看国产电影| 国产欧美视频一区二区三区| 午夜国产精品视频| 国产精品欧美在线观看| 国产99在线| 国产综合网站| 国产精品自拍露脸视频 | 丰满人妻久久中文字幕| 欧美色视频网站| 亚洲bt欧美bt精品|