999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量回歸的非線性變量篩選用于酚類化合物QSAR建模的研究

2014-04-29 00:44:03徐鏡善王凱袁哲明
安徽農(nóng)業(yè)科學(xué) 2014年13期

徐鏡善 王凱 袁哲明

摘要 首先基于支持向量回歸(SVR)依均方根誤差最小原則確定最優(yōu)核函數(shù),再以最優(yōu)核函數(shù)為基礎(chǔ),進(jìn)行SVR非線性自變量篩選,最后以所選自變量進(jìn)行建模預(yù)測(cè)。將該方法應(yīng)用于酚類化合物的QSAR研究,最優(yōu)核函數(shù)確定為徑向基核,最終保留自變量為疏水性參數(shù)(lgP)與拓?fù)渲笖?shù)(Am3)。結(jié)果表明:基于SVR進(jìn)行變量篩選能有效地剔除無關(guān)自變量,進(jìn)一步改進(jìn)SVR對(duì)小樣本數(shù)據(jù)的建模預(yù)測(cè)能力。該方法在農(nóng)業(yè)環(huán)境毒性污染物的QSAR研究領(lǐng)域有較廣泛的應(yīng)用前景。

關(guān)鍵詞 支持向量回歸;自變量篩選;定量構(gòu)效關(guān)系;酚類化合物

中圖分類號(hào) S11+1 文獻(xiàn)標(biāo)識(shí)碼

A 文章編號(hào) 0517-6611(2014)13-03799-03

Abstract Firstly,the optimal kernel function was determined in accordance with the minimum root mean square error based on support vector regression (SVR),and then on the basis of the optimal kernel function,the independent variables were screened nonlinearly using SVR.Finally,modeling was conducted on the training set and prediction was performed on the test set using the selected independent variables.The method was applied to QSAR study of phenolic compounds,the optimal kernel function was determined as RBF kernel,the retained independent variables as hydrophobic parameter (lgP) and topological index Am3.The results show that irrelevant variables can be effectively eliminate using SVR to screen variables and prediction ability was further improved for SVR modeling on small sample data,this method has a potential application prospect in the QSAR research field of environmental toxic pollutants of agriculture.

Key words Support vector regression; Independent variable screening; Quantitative structureactivity relationships; Phenol compounds

據(jù)統(tǒng)計(jì),當(dāng)今人類50%的財(cái)富來自于化學(xué)品。隨著工業(yè)的高速發(fā)展,10萬多種化學(xué)制品被投入環(huán)境中。由于人們無限制地生產(chǎn)和濫用化學(xué)制品,一些有毒化學(xué)品必會(huì)被大量投放到環(huán)境中。酚類化合物是有機(jī)化學(xué)工業(yè)的基本原料,被廣泛用于工業(yè)制造如酚醛樹脂、合成纖維、炸藥、農(nóng)藥、石料及染料等[1]。與之相關(guān)的各類工業(yè)廢水、廢氣被大量地排放到生活環(huán)境中,給農(nóng)業(yè)生產(chǎn)、人類生活帶來極大的傷害。所以,正確評(píng)價(jià)酚類化合物等有機(jī)化合物的毒性效應(yīng)是十分必要的。

化合物的分子結(jié)構(gòu)可決定其性質(zhì)。怎樣由化合物的分子結(jié)構(gòu)預(yù)知其性質(zhì),并且確立其結(jié)構(gòu)和性質(zhì)之間定量化關(guān)系是一個(gè)關(guān)鍵問題。定量構(gòu)效關(guān)系[2](Quantitative structure activity relationship,QSAR)是解決這一難題的途徑,可用來預(yù)測(cè)化合物的生物活性。酚類化合物種類繁多且分布廣泛,開展實(shí)地試驗(yàn)費(fèi)力、費(fèi)時(shí),而QSAR方法可以有效地估算這些化合物在環(huán)境中的毒性。

應(yīng)用特征篩選方法選擇包含豐富信息的描述符是定量構(gòu)效關(guān)系研究的重要步驟。常用方法有回歸分析、主成分分析(Principal component analysis,PCA)、逐步判別分析、偏最小二乘法分析(PLS)、遺傳算法(Genetic algorithm,GA)和人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)等[3]。以統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ)的支持向量機(jī)(Support vector machine,SVM)基于結(jié)構(gòu)風(fēng)險(xiǎn)最小,較好地解決了局極小、非線性、過學(xué)習(xí)等問題,具有優(yōu)異泛化推廣能力[4-6]。QSAR方法首先利用理論計(jì)算計(jì)算得到化合物分子的結(jié)構(gòu)參數(shù)或理化性質(zhì),再利用這些參數(shù)或性質(zhì)對(duì)化合物進(jìn)行分析,比傳統(tǒng)實(shí)驗(yàn)測(cè)定省時(shí)、省力,甚至能對(duì)一些無法實(shí)驗(yàn)測(cè)定的化合物進(jìn)行分析[7-9]。結(jié)合SVM,筆者對(duì)酚類化合物進(jìn)行了QSAR分析,以揭示對(duì)環(huán)境的影響。

1 材料與方法

1.1 數(shù)據(jù)來源

3 結(jié)論

采用SVR不同核函數(shù)對(duì)酚類化合物進(jìn)行QSAR建模,再以最優(yōu)核函數(shù)基于SVR進(jìn)行非線性變量篩選。對(duì)于該酚類化合物,首先SVR的最優(yōu)核函數(shù)確定為徑向基核,徑向基核函數(shù)也被其他研究者認(rèn)可,并且得到廣泛使用;其次,保留的自變量為lgP與Am3,而V和V2均未保留,表明分子的拓?fù)浣Y(jié)構(gòu)與疏水性影響酚類化合物的麻醉毒性;最后,以保留自變量進(jìn)行建模預(yù)測(cè),其預(yù)測(cè)精度(Q2pred=0.934)優(yōu)于不經(jīng)變量篩選的SVR預(yù)測(cè)精度(Q2pred=0.898),亦優(yōu)于PLS與MLR的預(yù)測(cè)精度(Q2pred分別為0.894與0.895),其中PLS與MLR的建模效果相當(dāng)。將不同的建模方法用于該酚類化合物的QSAR分析,結(jié)果表明SVR基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,使得其對(duì)獨(dú)立測(cè)試樣本表現(xiàn)出較好的預(yù)測(cè)效果,泛化能力優(yōu)異;基于SVR的非線性變量篩選方法可有效地去除了冗余、不相關(guān)自變量,提升SVR的建模預(yù)測(cè)能力。該方法在環(huán)境毒性污染物(如酚類化合物)等的QSAR研究領(lǐng)域有較廣泛應(yīng)用前景。然而,SVR也存在許多問題有待解決,例如最優(yōu)核函數(shù)的選取及核函數(shù)參數(shù)的優(yōu)化均需要理論、應(yīng)用上的改進(jìn)。

參考文獻(xiàn)

[1] 金相燦.有機(jī)化合物污染化學(xué)[M].北京:清華大學(xué)出版社,1990:49-73.

[2] 王連生,韓朔瞪,支正良.有機(jī)物定量結(jié)構(gòu)-活性相關(guān)[M].北京:中國環(huán)境科學(xué)出版社,1993.

[3] 許祿,邵學(xué)廣.化學(xué)計(jì)量學(xué)方法[M].北京:科學(xué)出版社,1995.

[4] VAPNIK V.The nature of statistical learning theory[M].NY:Springer,2000.

[5] 鄧乃揚(yáng),田英杰.數(shù)據(jù)挖掘中的新方法:支持向量機(jī)[M].北京:科學(xué)出版社,2004.

[6] 馬曉光,胡非.利用支撐向量機(jī)預(yù)報(bào)大氣污染物濃度[J].自然科學(xué)進(jìn)展,2004,14(3):349-353.

[7] 鐘國華,胡美英.QSAR 及其在農(nóng)藥設(shè)計(jì)中的應(yīng)用和進(jìn)展[J].農(nóng)藥學(xué)學(xué)報(bào),2001,3(2):1-11.

[8] 印家健,李夢(mèng)龍,文志寧,等.支持向量回歸用于氨基酸描述符在肽 QSAR 建模中的性能評(píng)價(jià)[J].四川大學(xué)學(xué)報(bào):自然科學(xué)版,2006(2):30.

[9] XIAO M,ZHENG G,YU T,et al.Quantitative structure and activity relationship studies on the toxicity of polychlorinated naphthalenes using support vector machines[J].Journal of Analytical Science,2007,23(2):143.

[10] 李劍,陳德釗,吳曉華,等.優(yōu)化的徑向基-循環(huán)子空間網(wǎng)絡(luò)為藥物定量構(gòu)效關(guān)系建模[J].分析化學(xué),2005,33(6):28-32.

[11] 郭明,許祿.酚類化合物的QSAR研究[J].環(huán)境科學(xué)學(xué)報(bào),1998,18(12):122-127.

[12] TROPSHA A,GRAMATICA P,GOMBAR V K.The importance of being earnest:validation is the absolute essential for successful application and interpretation of QSPR models[J].QSAR & Combinatorial Science,2003,22(1):69-77.

主站蜘蛛池模板: 国产男人天堂| 国产成人精品第一区二区| 久久精品无码中文字幕| 无码AV高清毛片中国一级毛片| 国内毛片视频| 一级成人a毛片免费播放| 成人在线亚洲| 99久久精品免费观看国产| 国产一区成人| 国产一区二区三区免费| 色哟哟色院91精品网站| 91成人在线免费观看| 粗大猛烈进出高潮视频无码| 亚洲娇小与黑人巨大交| 日韩在线欧美在线| 欧美成人免费| 本亚洲精品网站| 深爱婷婷激情网| 97精品国产高清久久久久蜜芽| 国产成人区在线观看视频| 国产视频入口| 免费中文字幕在在线不卡 | 久久黄色影院| 日韩欧美91| 久久精品国产亚洲麻豆| 91视频区| 亚洲美女AV免费一区| 制服丝袜 91视频| 国产99欧美精品久久精品久久 | 欧美一区国产| 一级毛片无毒不卡直接观看| 国产精品免费入口视频| 亚洲人成日本在线观看| 国产99免费视频| 91亚瑟视频| 国内精品九九久久久精品| 成年午夜精品久久精品| 久久国产高清视频| 97超级碰碰碰碰精品| 亚洲欧洲美色一区二区三区| 久久伊伊香蕉综合精品| 国产精品yjizz视频网一二区| 中国国产一级毛片| 午夜电影在线观看国产1区| 国产欧美一区二区三区视频在线观看| 国产丰满大乳无码免费播放 | 97成人在线观看| 无码日韩精品91超碰| 一级毛片免费的| 91在线丝袜| 国产真实乱人视频| 亚洲成人一区在线| 一区二区三区成人| 色妞www精品视频一级下载| 中文字幕资源站| 久久精品最新免费国产成人| 国内丰满少妇猛烈精品播 | 欧美精品亚洲日韩a| 不卡视频国产| 国产女人综合久久精品视| 亚洲天堂2014| 国产aⅴ无码专区亚洲av综合网| 国产成人AV大片大片在线播放 | 久久久精品无码一区二区三区| 国产美女叼嘿视频免费看| 一本一道波多野结衣av黑人在线| 国产sm重味一区二区三区| 日韩久草视频| 91久久精品国产| 欧美亚洲一区二区三区在线| 国产人成午夜免费看| av午夜福利一片免费看| 亚洲欧州色色免费AV| 99视频在线免费观看| 国产欧美日本在线观看| 国产流白浆视频| 国产在线视频二区| 九九视频免费看| 东京热av无码电影一区二区| 国产制服丝袜无码视频| 午夜视频www| 美女视频黄又黄又免费高清|