徐 悅,周林飛,成 遣
(沈陽農業大學水利學院,沈陽 110866)
濕地是地球上的重要生態系統,具有巨大的生產能力以及改善生態環境的作用。而濕地中水環境質量是影響濕地生態系統好壞的重要因素,選用恰當的評價方法進行評價分析水環境尤為重要。影響濕地水環境質量的因素非常多且復雜,這些因素的共同作用導致了水質評價的不確定性,因此,水質評價的關鍵就是怎樣處理這些復雜因素和不確定性[1]。綜合指數法是比較傳統的水環境質量評價方法,其優點是容易理解和簡單易操作;缺點是嚴密性不夠,體現在指數數值確定時,人為的主觀因素影響過大。目前較常用的水環境質量綜合評價方法有陳守煜教授提出的模糊數學法,它包括模糊綜合評判法和模糊模式識別法,并用級別特征值來最后判斷水質的級別;還有灰色聚類法,它類似于模糊綜合評判法;此外,常用的還有物元法、投影尋蹤法和主成分分析法等。但這些方法在實際應用中均有其自身缺陷。隨著計算機的普及,使復雜計算變得相對容易,許多數學方法在水質評價中得到了運用,提高了水質評價水平,也使其規范化。鑒此,本文通過綜合分析石佛寺水庫汛期和非汛期3個水質監測斷面七個指標的監測數據,采用熵權賦權貝葉斯和BP神經網絡兩種方法對水體質量現狀進行評價,并對評價方法進行了分析比較。
石佛寺水庫位于遼河干流上,地處沈陽市法庫縣依牛堡鄉和沈北新區黃家鄉,屬于大型的平原水庫。石佛寺水庫2009年起實施生態建設工程,在水庫庫區內遼河的左岸種植荷花、蒲草和蘆葦,同時進行生態蓄水,利用下游閘門控制水位,庫區內水面面積16.13 km2。隨著生態環境的改善水生植物的面積和種類不斷增加,目前荷花133.33 hm2,蘆葦173.33 hm2,蒲草366.67 hm2,并新自然生長出許多新的水生植物種類,整個水庫已經成為一個東北大型表面流人工濕地。經遙感調查總面積為25.05 km2。
石佛寺人工濕地入口、中間和出口各布設1個水質監測點,共計3個監測點,每月監測1次,時間為月初。監測指標有溶解氧(DO)、化學需氧量(CODCr)、高錳酸鹽指數(CODMn)、五日生化需氧量(BOD5)、氨氮(NH3-N)、總磷(TP)、總氮(TN),進行水質評價時水質評價指標亦選取此7項指標。利用兩種方法對石佛寺人工濕地進行水質評價時,數據采用2009-2014年入口、中間和出口斷面的水質監測數據,將各年數據處理成汛期與非汛期2個時段。將《中華人民共和國地表水環境質量標準》(GB3838-2002)作為水質評價標準,評價級別采用5級標準,分別為Ⅰ類,Ⅱ類,Ⅲ類,Ⅳ類和Ⅵ類。
英國數學家貝葉斯(THOMAS BAYES)首先提出了概率論中的貝葉斯定理,這提供了一種基于假設的先驗概率,計算給定假設下觀察到不同數據的概率的方法。熵的概念來自于熱力學,其本質是序,它來度量事物狀態的多樣性、混亂程度。發展至今,結合到多種領域,都起到了一定的作用。將熵值理論結合貝葉斯方法構建成熵權賦權貝葉斯模型應用在水質評價中,可以充分考慮到過于強調人的主觀判斷有的缺陷。
2.1.1 貝葉斯評價原理
貝葉斯公式[2]定義為:設隨機試驗E的樣本空間為Ω,A?Ω,Bi(i=1,2,…,s)為Ω的一個有限劃分,且P(Bi)>0,則:
(1)
式中:等式左邊是已知信息A的條件下,水質為第i級的可能性,即后驗概率;先驗概率為P(Bi),即事前認知水質屬于級別i的估計;P(A|Bi)為監測斷面水質屬于不同級別時,出現某一水質級別的可能性大小,視為似然概率。
Bi表示水質為第i等級,先驗概率反映了關于P(Bi)是一正確假設機會的背景信息,如果沒有這一先驗信息,可以簡單地賦予每一候選假設相同的先驗概率。因此,貝葉斯公式評價水質時,采用假定賦予水質各評價指標為每個級別的概率相等,P(Bi)=1/5(i=1,2,…,5),則式(1)改變為式(2)。
(2)
令xj表示第j(j=1,2,…,m)個評價指標的監測值,對應(2)式中的A;yjz表示第j個評價指標各等級的標準值(j=1,2,…,m,z=1,2,…,5),對應(2)式中Bi,則得到在條件xj下,第j個水質評價指標屬于第z等級的概率為:
(3)
式中:P(xj|yjz)為第j個評價指標屬于第z等級的條件下監測值為xj的概率,此概率采用評價指標的實測值xj和指標標準值yjz之間差值的倒數進行計算,公式如下:
(4)
式中:Ljz=|xj-yjz|(z=1,2,…,5,j=1,2,…,m)。
2.1.2 熵權法確定權重過程
由各項監測指標值的差異程度即熵值來確定各指標的客觀權重是熵權法的基本思路。計算步驟如下:
(1)構建各年份n個評價對象m個評價指標的判斷矩陣;
(2)對于評價的各項指標的計量單位并不統一的問題,可以將各評價指標歸一到[0,1],得到歸一化判斷矩陣Cn×m=(cij)n×m;
(3)對于某個評價指標j(j=1,2,…,m),計算熵如式(5)所示。
(5)

(4)對于某個評價指標j(j=1,2,…,m),其熵權即權重的定義為:
(6)

2.1.3 基于熵權賦權的貝葉斯算法

由于數據太多,僅以評價2010年非汛期出口斷面為例進行詳述。計算過程為:①按第一、二步計算評價斷面各項指標監測值屬于各等級概率,得到表1。②數據標準化:使用matlab軟件的mapminmax函數對2010年2個時段7個觀測指標的原始觀測數據進行標準化,結果見表2。③計算嫡權:由式(5)和式(6)使用歸一化數據計算各評價指標的嫡權系數和權重,結果見表3。④計算加權概率:按第六步計算出評價斷面屬于各等級的概率,并比較,找出最大值所屬的級別即評價結果,見表4。同樣的步驟,依次計算出2009-2014年汛期和非汛期各斷面屬于各等級的概率,評價結果見表5。

表1 2010年非汛期出口斷面各評價指標屬于不同等級概率Tab.1 Grade probabilities of indexes for the export section of non flood season in 2010

表2 2010年監測數據的標準化Tab.2 Standardization of monitoring results

表3 各評價指標的嫡及嫡權Tab.3 Entropies and weights of the indexes

表4 2010年非汛期出口斷面屬于各等級的概率Tab.4 Grade probabilities of water quality for the export section of non flood season in 2010
BP神經網絡輸入層神經元所選用的7項指標包括BOD5、CODMn、CODCr、NH3-N、TP、TN、DO。以GB3838-2002《中華人民共和國地表水環境質量標準》中的5個級別水質標準分界值作為模型的評價依據,選用一個神經元作為輸出層,本研究將水質類別用數值表示,若輸出值在(0,0.2]為I類水質,(0.2,0.4]為II類水質,(0.4,0.6]為Ⅲ類水質,(0.6,0.8]為Ⅳ類水質,(0.8,1.0]為Ⅴ類水質。隱含層神經元(隱含節點)數目由式(7)確定[3]。網絡精度受隱含層節點數的影響比較大,節點數多,訓練時間就長,容易使網絡過于擬合,節點數少,又會導致網絡學習效果不佳,從而影響訓練精度[4],所以需要找到一個恰到好處的隱含層節點數。本文隱含層節點數的確定是采用試錯法,利用式(7)進行計算,最后取定w=13。從而得到一個結構為7→13→1的BP神經網絡結構模型,如圖1所示。式中,w-隱含層神經元數目(隱含節點);m-輸入節點(輸入層神經元數),m=7;n-輸出節點(輸出層神經元數)n=1,α-常數,一般取值范圍為1~10。
(7)

圖1 水質評價BP網絡模型結構圖Fig.1 BP neural network model structure of waterquality
對學習樣本和期望輸出進行網絡訓練,檢測其網絡訓練效果,建立網絡net=newff(P,T,[S1,S2…SN],{TF1, TF2,…,TFN},BTF,BLF,PF)。式中:P-輸入參數矩陣,T-目標參數矩陣,S-隱含層和輸出層數目,TF-相關層傳遞函數,BTF-網絡訓練函數,BLF-權值學習函數,PF-性能函數。
設定程序參數對模型進行訓練,隱含層與輸入向量連接,輸出層與輸入向量無連接,運算工具采用Matlab。為得到良好的訓練結果,要首先采用linspace函數對樣本等間隔均勻內插擴充數量[5],本研究中P即為分屬于5個級別水質標準的擴充后數據矩陣,T即對應的擴充后期望輸出值的矩陣,S為[13,1],為把網絡的全部輸出限制在一個較小的范圍,隱含層的傳輸函數選用tansig,輸出層的傳遞函數選用logsig,均為非線性的sigmoid型函數。traingdx為加入動量項和自適應調節學習速率的訓練函數,學習速率是在BP神經網絡調試過程中重要的參數,經過多次試驗,選定學習率為0.098,學習誤差為0.000 1,訓練次數為5 000次。
經過207次迭代,6次訓練后,誤差為9.272 4×10-5,小于期望誤差10-4,達到精度要求,學習樣本數據訓練均方誤差變化曲線如圖2所示。

圖2 學習樣本數據訓練均方誤差曲線Fig.2 The network MSE curve of learning samples training
保存訓練好的模型,對每年各斷面監測數據進行歸一化處理,然后帶入訓練好的網絡,進行仿真運算,得到2009-2014年汛期和非汛期各斷面的輸出值,整理后確定各斷面水質類別,結果見表5。
兩種評價方法所得的評價結果如表5所示,由表5可知,除2009年非汛期入口、2011年非汛期出庫,2013年非汛期入口,2014年汛期庫中,2014年非汛期入口外,其他各時段各斷面評價結果相同。2009年非汛期入口,BP神經網絡法為Ⅳ,熵權賦權貝葉斯法為Ⅴ;2011年非汛期出庫,BP神經網絡法為Ⅱ,熵權賦權貝葉斯法為Ⅲ;2014年汛期庫中,BP神經網絡法為Ⅱ,熵權賦權貝葉斯法為Ⅲ;2014年非汛期入口,BP神經網絡法為Ⅳ,熵權賦權貝葉斯法為Ⅲ;這幾年兩種評價結果雖有差別,但差別不大。對比濕地內實際水質狀況,可以看出評價結果都是相對客觀可信的。

表5 兩種評價方法得到的評價結果對照表Tab.5 The comparison table of evaluation results of two evaluation methods
綜合這兩種評價方法,認為2009年非汛期入口斷面水質評價結果為Ⅳ~Ⅴ類水,2011年非汛期出口斷面水質為Ⅱ~Ⅲ類,2013年石佛寺人工濕地非汛期入口斷面水質類別是Ⅲ~Ⅴ類,2014年汛期庫中斷面水質類別是Ⅱ~Ⅲ類,2014年非汛期入口斷面水質為Ⅲ~Ⅳ類。其他評價結果如表5所示。
(1)從表5可以看出,兩種評價方法出庫 水質基本都優于入庫水質,由此可知遼河水體在流經人工濕地后水質得到了明顯改善,濕地的水質凈化效果明顯。2009年-2014年出庫水質為Ⅱ類或Ⅲ類,根據《遼寧省水功能區劃分》(2005年,遼寧省水利廳)石佛寺水庫水質目標應為Ⅲ類,據此,石佛寺水庫水質狀況良好,不存在用水障礙。
(2)各年汛期濕地出口水質狀況均好于非汛期,主要原因有兩個:①汛期正是植物生長旺盛時期,濕地內的蘆葦、蒲草、荷花以及其他水生植物對水質具有很好的凈化作用,而且微生物也十分活躍,對水質亦具有凈化作用;②汛期降水量以及上游來水量均大,水流速度快,水體復氧能力強,因此水體自凈能力強,對于污染物具有稀釋降解作用。
(3)2009年和2010年非汛期的來水最差,為Ⅳ~Ⅴ類,2013,2014年非汛期也較差,為Ⅲ~Ⅴ類,其余年份較好一些,為Ⅲ類。盡管這幾年非汛期的來水水質相對較差,但經人工濕地凈化處理后出口斷面的水質類別均為Ⅲ類及Ⅲ類以上。
從兩種方法得到評價結果的計算過程難易來比較,可以看出熵權賦權貝葉斯法更簡單,而BP神經網絡法計算相對復雜,計算量大,體現在兩方面:需要大量的訓練樣本,單憑水質標準中的5組臨界值數據還遠遠不能滿足網絡的建模條件。嫡權賦權貝葉斯法計算過程簡單、計算方法簡潔明了,具體體現在:指標權重只需計算一次;不需要大量樣本,只需評價指標等級劃分標準;根據水質監測數據即可確定各水質指標的權重大小;水質類別分辨性更好。因此,在水質評價中,采用熵權賦權貝葉斯法比BP神經網絡法更具優勢。
分別運用熵權賦權貝葉斯法和BP神經網絡法對石佛寺人工濕地2009-2014年入口、中間和出口斷面的水質進行評價,來了解石佛寺人工濕地的來水及自身的水質現狀。用這兩種方法得到的結果都相對客觀可信,說明這兩種方法都有效可行。但嫡權賦權貝葉斯法計算過程簡單,方法簡潔明了,體現在:指標權重僅計算一次;不需要大量的測試樣本,這些優勢是BP神經網絡算法不具備的。評價結果表明:石佛寺人工濕地出口水質級別基本高于入口水質級別,說明濕地水質凈化效果明顯;汛期出庫水質優于非汛期;石佛寺人工濕地出口水質為Ⅱ類或Ⅲ類,符合水庫水質目標Ⅲ類的標準。
[1] 王鐵良,陳 曦,蘇芳莉,等.模糊數學在雙臺河口濕地水質評價中的應用[J].沈陽農業大學學報,2011,42(1):79-83.
[2] 蘇 淳.概率論[M].北京:科學出版社,2004.
[3] 張立明.人工神經網絡的模型及其應用[M].上海:復旦大學出版社,1993:55-70.
[4] 史 峰,王小川,郁 磊,等. MATLAB神經網絡30個案例分析[M]. 北京: 北京航空航天大學出版社, 2010:12-16.
[5] 張 宇,盧文喜,陳社明,等.基于T-S模糊神經網絡的地下水水質評價[J].節水灌溉,2012,(7):35-38.