999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

以程海為例用支持向量機回歸算法預測葉綠素a濃度

2012-09-09 05:30:36許云峰馬春子霍守亮席北斗錢光人
環境工程技術學報 2012年3期
關鍵詞:模型

許云峰,馬春子,霍守亮,席北斗,錢光人*

1.上海大學環境與化學工程學院,上海 200444

2.中國環境科學研究院,北京 100012

以程海為例用支持向量機回歸算法預測葉綠素a濃度

許云峰1,馬春子1,霍守亮2,席北斗2,錢光人1*

1.上海大學環境與化學工程學院,上海 200444

2.中國環境科學研究院,北京 100012

應用支持向量機回歸(SVR)算法預測程海富營養化水體葉綠素 a(Chl-a)的濃度,用留一法交叉驗證(LOOCV)優化SVR預測模型的參數,并根據平均相對誤差(MRE),討論SVR預測模型的準確性。結果表明:用徑向基核函數構建的SVR預測模型預測結果最優;SVR預測模型的預測值和實測值具有很好的一致性,相關系數為0.938,MRE為12.30%。SVR預測模型的建模結果優于人工神經網絡(BP-ANN)預測模型,說明SVR算法能夠準確預測 Chl-a濃度。

支持向量機回歸(SVR);葉綠素a;程海;徑向基核函數

水體富營養化已經成為我國大多數湖泊水質惡化的主要問題,其主要表現為溶解氧濃度降低、生物多樣性減少、水體葉綠素a(Chl-a)濃度升高,爆發水華等[1-3]。氮磷等營養物的過量輸入是導致水體富營養化的主要原因。因此,水體富營養化的早期預測很有必要[4]。

近幾十年來,三維模型[5]、SALMO 確定性模型[6]等多種模型被用于水體富營養化的預測,其中,人工神經網絡(BP-ANN)模型因其方法簡單和預測能力相對較好,被廣泛應用[7]。但是,BPANN模型在處理小樣本和多變量數據時容易產生過擬合現象[8],即可能產生很好的擬合效果卻得不到好的預測結果。

支持向量機回歸(SVR)算法[9-10]是以 Vapnik創立的統計學習理論為基礎建立的數據處理新算法。該方法從嚴格的數學理論出發,論證和實現了在小樣本情況下最大限度地提高預報的可靠性,實際應用取得了令人滿意的研究成果。同時,該方法還能避免BP-ANN模型的過擬合現象,具有很好的泛化能力。目前,SVR算法已應用于化學合成[8]、材料優化[8]、浮游植物種類預測[11]和藻類生長評價[12]等許多領域。

筆者以程海為例,運用SVR算法預測富營養化水體的Chl-a濃度。先對SVR預測模型的參數進行優化,然后用SVR算法建立Chl-a濃度的預測模型,并與BP-ANN預測模型的結果進行比較。

1 數據與方法

1.1 程海數據分析

通過調查分析,確定程海的主要水質指標:Chl-a濃度,μg/L;總氮(TN)濃度,mg/L;總磷(TP)濃度,mg/L;水溫(Tw),℃;透明度(SD),cm;電導率(γ),μS/cm;溶解氧(DO)濃度,mg/L;化學需氧量(CODCr),mg/L;高錳酸鹽指數(CODMn),mg/L。這些指標會對程海藻類的生長產生直接或間接的影響,進而影響水體中的 Chl-a 濃度[13-15]。程海的物理、化學指標數據來自1988—2008年云南省環境監測站的常規監測數據,以及筆者的現場調查。

由于程海缺少1988—2005年的Chl-a濃度監測數據,因此需采用SVR和BP-ANN分別建立定量預測模型進行預測。

以 Chl-a 濃度為目標變量;SD,DO 濃度,CODCr,CODMn,γ,Tw,TN 濃度和 TP濃度等變量為影響因素,以37個樣本為訓練集,建立了SVR和BPANN預測模型。

1.2 支持向量機回歸

SVR通過引入不敏感函數(ε)進行回歸分析,可以得到較好的回歸分析結果。將實際問題通過非線性映照映射到高維特征空間,并在高維特征空間構造線性回歸,從而取得在原始空間的非線性回歸效果[16]。

設樣本集為:(Y1,X1),…,(Yi,Xi),X ∈ Rn,Y∈R。回歸函數用下列線性方程表示:

式中,Y為目標函數;Φi(X)為輸入向量的非線性映射集;wi和B為系數。各值的大小由最小化正規化風險函數R(C)來確定。R(C)可表示為:

為了確保最優化問題有解,引入松弛變量ζi和,回歸預測模型可表示為:

約束于

根據優化條件可以得到支持向量回歸機的對偶問題:

在一定約束條件下

最后,得到支持向量機的回歸估計公式[17-19]:

式中,K(Xi,Xj)為核函數,其值為特征空間Φ(X)中兩個結果向量 Xi和 Xj的乘積,即 K(Xi,Xj)=Φ(Xi)Φ(Xj)。核函數的優勢在于能在不知道Φ(X)具體變換形式的情況下,用低維空間數據輸入計算高維特征空間中的點積[20]。在實際應用中,常用的核函數有線性核函數、多項式核函數、徑向基核函數三種,具體形式如下。

線性核函數:

多項式核函數:

徑向基核函數:

2 結果與討論

2.1 SVR預測模型參數的選擇

所有輸入模型的數據都進行標準化預處理。由于數據樣本較少,故采用留一法交叉驗證(LOOCV)[8]選擇SVR預測模型的參數。將n個樣本分成兩個不相關的子集,分別為訓練集(n-1個樣本)和預測集(1個樣本)。n個樣本輪留作為預測集,對另外n-1個樣本建立的訓練模型進行驗證,得到預測值與實際值之間的差別。用平均相對誤差(MRE)來評價模型預測能力的好壞:

式中,ei為第i個樣本的實際值;pi為第i個樣本的預測值;n為LOOCV的樣本總數。

圖1為C=10時,三種核函數的MRE隨ε的變化;圖2為ε=0.01時,三種核函數的MRE隨C的變化。由圖1和圖2可見,用徑向基核函數構建的SVR預測模型得到的平均相對誤差最小。說明徑向基核函數可以對程海的Chl-a濃度進行更好的定量預測。

圖1 C=10不敏感函數(ε)對應的MREFig.1 MRE in LOOCV versus the ε with C=10

圖2 ε=0.01平衡因子(C)對應的MREFig.2 MRE in LOOCV versus the C with ε=0.01

SVR預測模型預測能力的強弱與核函數的選擇有很大的關系,不同核函數對MRE的影響很大。同時,參數ε和C也非常重要,其不僅權衡最大空白與最小訓練誤差,也會影響訓練和預測結果,因此,參數ε和C應與核函數類型一起進行優化。通常情況下,ε和C值在建模前是不確定的,其值大小取決于數據的類型。ε值過大,算法在擬合數據過程中會出現壓力不足現象;ε值過小,訓練數據集將會出現過擬合現象。而C的變化與ε基本相反[8]。

用徑向基核函數對程海的數據建立SVR預測模型,并采用網格法進行ε和C的參數優化。圖3表示徑向基核函數MRE隨ε(步長為0.01)和C(C=1~10時步長為1;C=10~100,步長為10)的變化趨勢。從圖3可以看出,選用徑向基核函數建立SVR預測模型對應的平均相對誤差最低(C=10,ε =0.03,σ =1)。

圖3 徑向基核函數不同ε和C時對應的MREFig.3 MRE in LOOCV versus C and ε with RBF kernel function

2.2 SVR預測模型的建立

根據2.1節得到的最優核函數及最佳ε和C的組合,使用程海的水質指標(SD,DO濃度,CODCr,CODMn,γ,Tw,TN 濃度和 TP 濃度)建立了 Chl-a 濃度的最佳SVR預測模型。以37個樣本點作為訓練集對Chl-a濃度建立SVR預測模型,如圖4所示。

圖4 Chl-a濃度SVR建模結果Fig.4 The result of SVR model of Chl-a concentration

Chl-a濃度最佳SVR預測模型的回歸方程為:

式中,βi=表示支持向量的拉格朗日系數。根據式(13)可以得到Chl-a濃度的預測值,對預測值和實測值進行比較,相關系數為0.938。這表明SVR預測模型的預測值與實測值具有高度的一致性。

2.3 SVR預測模型與BP-ANN建模結果比較

為了評價SVR預測模型的預測和泛化能力,將其與BP-ANN預測模型進行比較。應用三層(輸入層、隱含層和輸出層)BP-ANN模型建模,BPANN預測模型經過參數優化,確定隱含層節點數為5。選擇Sigmoid函數為轉換函數,預測誤差用MRE表示。圖5為用BP-ANN建立的Chl-a濃度預測模型。

由圖4和圖5可知,SVR對Chl-a濃度的建模結果與實際結果十分吻合,實測值和預測值的相關系數為0.938,通過公式計算得到MRE為12.30%。BP-ANN預測模型實測值和預測值的相關系數為0.933,通過公式計算得到 MRE為25.72%,高于SVR預測模型。因此得出,SVR預測模型的建模結果明顯好于BP-ANN預測模型,所以用SVR預測模型來預測程海的Chl-a濃度更加可靠。

圖5 Chl-a濃度BP-ANN建模結果Fig.5 The result of BP-ANN model of Chl-a concentration

3 結論

(1)在參數優化過程中,在合適的ε和C下選擇徑向基核函數建立SVR預測模型得到的結果平均相對誤差最小,說明徑向基核函數更適合對程海的復雜富營養化問題進行預測。

(2)用SVR建模的相關性系數為0.938,說明模型的預測值與程海的實測值具有高度的一致性,表明,程海的Chl-a濃度可以用SVR預測模型來定量預測。

(3)SVR預測模型的建模結果明顯好于BPANN預測模型,說明對于Chl-a濃度的預測,SVR算法具有更高的可靠性。

(4)根據建立的SVR預測模型,對收集的程海實測數據樣本的Chl-a濃度進行定量預測,所預測的Chl-a濃度可以為多元統計方法推測程海營養物基準參照狀態提供數據。

[1]PRETTY J N,MASON C F,NEDWELL D B,et al.Environmental costs of freshwater eutrophication in England and Wales[J].Environ Sci Technol,2002,37(2):201-208.

[2]DODDS W K,BOUSKA W W,EITZMANN J L,etal.Eutrophication of US freshwaters:analysis of potential economic damages[J].Environ Sci Technol,2008,43(1):12-19.

[3]XUE X,LANDIS A E.Eutrophication potentialoffood consumption patterns[J].Environ Sci Technol,2010,44(16):6450-6456.

[4]KARUL C,SOYUPAK S,ILESIZ A F,et al.Case studies on the use of neural networks in eutrophication modeling[J].Ecological Modelling,2000,134(2/3):145-152.

[5]MAO J,CHEN Q,CHEN Y.Three-dimensional eutrophication model and application to Taihu Lake,China[J].J Environ Sci,2008,20(3):278-284.

[6]WALTER M,RECKNAGEL F,CARPENTER C,et al.Predicting eutrophication effects in the Burrinjuck Reservoir(Australia)by means of the deterministic model SALMO and the recurrent neural network model ANNA[J].Ecological Modelling,2001,146(1/2/3):97-113.

[7]JIANG Y,XU Z,YIN H.Study on improved BP artificial neural networks in eutrophication assessment of China eastern lakes[J].J Hydrodynamics:B,2006,18(3,Suppl):528-532.

[8]LIU X,LU W C,JIN S L,et al.Support vector regression applied to materials optimization of sialon ceramics[J].Chemometrics Intelligent Laboratory Systems,2006,82(1/2):8-14.

[9]VAPNIK V N.A nature of statistical learning theory[M].New York:Springer Verlag,1995.

[10]VAPNIK V N.Statistical learning theory[M].USA:A Wiley-Interscience Publication,John Wiley and Sons Inc,1998.

[11]RIBEIRO R,TORGO L.A comparative study on predicting algae blooms in Douro River,Portugal[J].Ecological Modelling,2008,212(1/2):86-91.

[12]YAN Q,WANG G.Prediction model of alga's growth based on support vector regression[C]//2009 International Conference on Environmental Science and Information Application Technology:2.Wuhan:ESIAT,2009:673-675.

[13]侯延鵬.營養元素及光照、溫度對銅綠微囊藻生長、越冬及復蘇的影響研究[D].南昌:南昌大學,2008.

[14]王珂.不同環境條件下銅綠微囊藻和柵藻競爭能力的比較研究[D].南京:河海大學,2006.

[15]蒙萬輪.重慶郊區水庫水體富營養化試驗研究[D].重慶:重慶大學,2005.

[16]YANG S,LU W,CHEN N,et al.Support vector regression based QSPR for the prediction of some physicochemical properties of alkyl benzenes[J].J Molecular Structure:THEOCHEM,2005,719(1/2/3):119-127.

[17]GU T,LU W,BAO X,et al.Using support vector regression for the prediction of the band gap and melting point of binary and ternary compound semiconductors[J].Solid State Sciences,2006,8(2):129-136.

[18]CHALIMOURDA A, SCHOLKOPF B, SMOLA A J.Experimentally optimal ν in support vector regression for different noise models and parameter settings[J].Neural Networks,2004,17(1):127-141.

[19]RIAHI S,POURBASHEER E,GANJALI M R,et al.Support vector machine-based quantitative structure-activity relationship study of cholesteryl ester transfer protein inhibitors[J].Chemical Biology Drug Design,2009,73(5):558-571.

[20]王宏宇,糜仲春,梁曉艷,等.一種基于支持向量機回歸的推薦算法[J].中國科學院研究生院學報,2007,24(6):742-748.

Using Support Vector Regression Algorithm to Predict Chlorophyll-a Concentrations with Chenghai Lake for Example

XU Yun-feng1,MA Chun-zi1,HUO Shou-liang2,XI Bei-dou2,QIAN Guang-ren1
1.School of Environmental and Chemical Engineering,Shanghai University,Shanghai 200444,China
2.Chinese Research Academy of Environmental Sciences,Beijing 100012,China

The support vector regression(SVR)algorithm was used to predict the concentration of chlorophyll-a(Chl-a)of eutrophication water in Chenghai Lake,and the leave-one-out cross-validation(LOOCV)method was used to optimize the model parameters.Then the prediction accuracy of SVR model was discussed on the basis of the mean relative error(MRE).The results demonstrated that the SVR model built by radial basis kernel function(RBF)had the optimal predictive ability.The predicted values of SVR were in good consistency with the measured values of experiment.The correlation coefficient(R)and MRE of SVR model could reach 0.938 and 12.30%,respectively.It was found that the modeling results of SVR were better than that of back propagation artificial neural networks(BP-ANN),suggesting that SVR was a valuable tool for the prediction of Chl-a.

support vector regression(SVR);chlorophyll-a;Chenghai Lake;radial basis kernel function

X524

A

10.3969/j.issn.1674-991X.2012.03.031

1674-991X(2012)03-0207-05

2011-12-21

國家水體污染控制與治理科技重大專項(2009ZX07106-001)

許云峰(1971—),女,副教授,博士,主要從事水污染控制工程研究,yfxu@shu.edu.cn

*責任作者:錢光人(1960—),男,教授,博士,主要從事環境污染控制材料及廢棄物資源化的研究,grqian@shu.edu.cn

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲大学生视频在线播放| 中国成人在线视频| 精品国产免费观看| 亚洲天堂视频在线观看| 国产99在线| 亚洲第一成年免费网站| 国产小视频a在线观看| 18禁黄无遮挡网站| 亚洲第一区欧美国产综合| 福利国产微拍广场一区视频在线| 国产aⅴ无码专区亚洲av综合网 | 日本高清免费一本在线观看| 国产精品视频白浆免费视频| 国产男女免费完整版视频| 91免费观看视频| 久久99精品久久久大学生| 一区二区三区四区精品视频| 亚洲天堂首页| 日韩精品一区二区三区视频免费看| 国产精品手机视频| 亚洲网综合| 国产精品伦视频观看免费| 欧美激情伊人| 亚洲精品福利网站| 无码视频国产精品一区二区| 成年免费在线观看| 久久精品无码一区二区日韩免费| 精品91视频| 国产欧美成人不卡视频| 国产一区二区三区夜色 | 免费国产无遮挡又黄又爽| 91亚洲精选| 婷婷色中文| 亚洲男女在线| 波多野结衣视频一区二区| 亚洲婷婷丁香| 国产欧美日韩在线在线不卡视频| 2024av在线无码中文最新| 五月婷婷精品| 亚洲美女视频一区| 在线免费a视频| 久久99国产综合精品女同| 久久精品国产91久久综合麻豆自制| 三上悠亚在线精品二区| 亚洲品质国产精品无码| 91黄色在线观看| 亚洲bt欧美bt精品| 欧美v在线| 四虎国产精品永久一区| 97在线免费| 午夜国产在线观看| 日韩无码视频播放| 欧美www在线观看| 日韩欧美中文字幕在线精品| 亚洲性影院| 亚洲天堂首页| 亚洲精品在线91| 亚洲国产精品成人久久综合影院| 国产成人高清精品免费5388| 亚洲系列无码专区偷窥无码| 超清人妻系列无码专区| 精品少妇人妻av无码久久| 国产免费久久精品44| 国产三级视频网站| 成人va亚洲va欧美天堂| 亚洲精品高清视频| 中文国产成人精品久久一| 91青青草视频| 波多野结衣在线一区二区| 亚洲精品大秀视频| 色老二精品视频在线观看| 国产地址二永久伊甸园| 最近最新中文字幕在线第一页| 国产精品亚洲专区一区| 精品一区二区三区波多野结衣| 国产丝袜无码一区二区视频| 制服丝袜一区二区三区在线| 亚洲中文制服丝袜欧美精品| 亚洲欧美日韩视频一区| 日韩精品亚洲一区中文字幕| 狠狠做深爱婷婷久久一区| 国产日本欧美在线观看|