穆秀云 李林兵
水質(zhì)評價方法總的來說可分為兩大類:單因子評價法和綜合評價法。單因子評價法計算簡單,可直觀反映哪些指標超標,但由于是對單個水質(zhì)指標獨立進行評價,因此得到的評價結(jié)果不能全面反映水質(zhì)量的整體狀況,可能會導(dǎo)致較大的偏差。綜合評價法可同時評價多種指標對水質(zhì)的影響,從整體上給水質(zhì)一個客觀全面的評價。當前研究較多的綜合評價法包括綜合指數(shù)法、灰色聚類法、灰色模式識別法、模糊綜合評判法、模糊模式識別法和人工神經(jīng)網(wǎng)絡(luò)模型等。綜合指數(shù)法通過多個指標并賦予各指標不同權(quán)重的綜合來判斷水質(zhì)標準,它綜合考慮了各指標對水質(zhì)的影響,卻忽略了水質(zhì)分級界線的模糊性,評價結(jié)果不能很好地反映出水質(zhì)污染的真實狀況;灰色和模糊系統(tǒng)兩大類方法也均存在一些缺陷,如都需要設(shè)計若干不同的效用函數(shù)(灰色系統(tǒng)的白化函數(shù)、模糊數(shù)學的隸屬函數(shù)等)以及人為地給定各評價指標的權(quán)重(或權(quán)函數(shù))等。這些效用函數(shù)和指標權(quán)重的給定往往因人而異,造成評價模式難以通用,而且增加了應(yīng)用的困難和人為主觀因素對結(jié)論的影響。事實上,在評價指標確定后,水質(zhì)評價的過程是把這些指標的監(jiān)測值與標準值進行比較和分析,在此基礎(chǔ)上判斷其與哪一級分類標準更接近。因此,水質(zhì)綜合評價屬于模式識別問題。當前,人工神經(jīng)網(wǎng)絡(luò)已在模式識別中廣泛應(yīng)用,可利用它對環(huán)境水質(zhì)進行評價,可將水質(zhì)評價中的評價標準作為樣本輸入,評價級別作為網(wǎng)絡(luò)輸出,通過網(wǎng)絡(luò)歸納出評價標準與評價級別間復(fù)雜的內(nèi)在非線性關(guān)系,從而對水質(zhì)進行綜合評價。
BP網(wǎng)絡(luò)對水質(zhì)進行評價時,其輸出層的神經(jīng)元個數(shù)取為水質(zhì)分類的級數(shù),其輸入為評價指標的不同指標值。在傳統(tǒng)的BP網(wǎng)絡(luò)訓(xùn)練中,是各水質(zhì)級別的指標值范圍內(nèi)抽取足夠的訓(xùn)練樣本,但這種做法無法考慮處于兩個相鄰水質(zhì)級別分界處的樣本,使訓(xùn)練后的網(wǎng)絡(luò)對處于兩個相鄰水質(zhì)級別分界處的水質(zhì)評價誤差很大。由于各級水質(zhì)的指標值均處于一個給定取值區(qū)間(根據(jù)水質(zhì)評價標準選取)內(nèi),各指標的取值是隨機的,可視為一個隨機過程,故本文引入馬爾可夫鏈蒙特卡羅方法(MCMC)來模擬各指標的取值。這樣可生成大量的訓(xùn)練樣本,從而克服了傳統(tǒng)BP方法訓(xùn)練樣本少的弊端;由于將各指標取值視為一個隨機過程,故各指標值均可以一定概率出現(xiàn),克服了傳統(tǒng)方法無法考慮不同水質(zhì)級別分界線模糊性的缺點。
本文將改進后的BP算法稱為基于MCMC的BP算法,即MCMC-BP。為檢驗本文提出的MCMC-BP模型的實用性,擬在以下實例中進行檢驗。
某市1998年在7個樣本點對污染指標進行監(jiān)測,表1列出了其中8項指標的實測值。為了與其他評價方法比較,利用MCMC算法生成訓(xùn)練樣本時,假定各指標值符合正態(tài)分布,其方差為取值范圍的5%。MCMC算法隨機模擬2200組樣本,其中200組樣本做校核樣本。為削除不同量綱的影響,需對模擬樣本和實測數(shù)據(jù)進行歸一化處理,其處理過程如下:


圖1 三層BP神經(jīng)網(wǎng)絡(luò)圖

表1 地表水水質(zhì)監(jiān)測實測值 (mg/L)
BP網(wǎng)絡(luò)采用三層,即輸入層-隱層-輸出層,隱層激活函數(shù)采用雙曲正切函數(shù)(式(2)),輸出層采用線性函數(shù)。輸入層節(jié)點數(shù)為監(jiān)測水質(zhì)指標總數(shù),輸出層節(jié)點數(shù)為水質(zhì)級別總數(shù),隱層節(jié)點數(shù)根據(jù)經(jīng)驗優(yōu)選確定,本文取為13,故網(wǎng)絡(luò)拓撲結(jié)構(gòu)為8-13-5,BP訓(xùn)練1456次收斂,而傳統(tǒng)BP在相同容量的訓(xùn)練樣本條件下,收斂時訓(xùn)練次數(shù)為1162次,改進的BP收斂速度提高了約20%。

式(2)中:f為網(wǎng)絡(luò)節(jié)點的輸出;n為網(wǎng)絡(luò)節(jié)點的輸入;b為網(wǎng)絡(luò)閾值。
圖1中,n為輸入節(jié)點的個數(shù);m為隱層節(jié)點的個數(shù);l為輸出節(jié)點的個數(shù)。
將歸一化以后的實測數(shù)據(jù)輸入到已訓(xùn)練好的RAGA-BP模型中,對7個樣本點的水質(zhì)進行評價,輸出結(jié)果見表2。從表1與《地表水環(huán)境質(zhì)量標準》對比中可以看出,測點3的指標值有三項指標達到Ⅱ級,兩項達到Ⅴ級,Ⅰ級、Ⅲ級、Ⅳ各一項,因此本文模型判定為Ⅱ是比較合理的;測點7指標有4項達到Ⅱ級,故判其為Ⅱ級更準確,且與《水環(huán)境質(zhì)量評價灰色模式識別模型及應(yīng)用》(史曉新,夏軍—中國環(huán)境科學)中的DT法結(jié)果相同,證實了本文方法的準確性。

表2 水質(zhì)評價結(jié)果
1.本文建議的基于MCMC的BP算法將各評價指標值視為隨機,利用MCMC方法獲取足夠的訓(xùn)練樣本,克服了訓(xùn)練樣本不足的問題,并考慮了水質(zhì)級別界線的模糊性,增強了BP網(wǎng)絡(luò)的泛化能力。
2.MCMC算法在很大程度上提高了傳統(tǒng)BP算法的收斂速度。從兩個應(yīng)用實例的BP網(wǎng)絡(luò)輸出結(jié)果來看,預(yù)報的精度有所提高,收斂速度平均提高約20%。
3.該方法可以用于地下水水質(zhì)評價或地震災(zāi)害等的評價問題中,具有較好的普適性