,,,,
(1.華北水利水電大學,河南鄭州450000;2.中國水利水電科學研究院 流域水循環模擬與調控國家重點實驗室,北京100038;3.河北農業大學,河北保定071001)
水資源危機已成為世界上一個十分尖銳的社會問題,水資源危機不僅表現在水資源數量的短缺,更反映在水質的惡化。近年來,隨著國家《水污染防治行動計劃》(簡稱“水十條”)的發布,城市水系水質越來越受到重視。為更好地推進地區水資源合理有序以及可持續的開發利用,更好地推進最嚴格水資源管理制度的實施,探求地區水資源管理相對薄弱的環節,開展流域及地區水質評價,識別典型城市河流中主要污染物和研究其時空變化規律很有必要。
水質評價越來越受到人們的關注,評價方法也有很多。目前國內外進行水環境質量評價的常用方法有內梅羅指數法[1-3],單因子法[4-5],以及人工神經網絡等數據挖掘手段模型[6-9],T-S模糊神經網絡模型[10],差分進化算法-投影尋蹤模型[11],灰色模式識別模型[12],可拓學物元分析方法[13-14],模糊評價法[15-16],主成分分析法[17-20]以及主成分分析法與其他方法耦合[21-22]等。Chang分析了Han River及其支流在1993—2002年中水環境時空變化,識別了主要影響因子[23]。Sener等結合水質指標法和GIS技術評估Aksu 河的水環境狀況,認為化學需氧量和鎂是造成水環境惡化的主要參數[24]。Singh等采用多元統計分析方法,對Gomti River的24個水質參數進行研究,分析了河流水環境的時空變化特征[25]。張汪壽等利用多元統計法對北運河武清段水污染的時空變異特征進行了分析[26]。拜亞麗采用熵權的集對分析法對水環境質量進行評價[27]。
本文以深圳市坪山河流域為研究對象,通過合理的案例設計與數據分析,以SPSS軟件中的主成分分析法為工具,研究了河流污染源主要成分的時空變異性,以期為坪山流域的河流主要污染的時空變化提供參考,為城市河流水污染防治和水環境管理提供支撐。
坪山河位于深圳市東北部龍崗區的坪山街道和深圳市大工業區境內,貫穿整個新區,源短流急,是典型的城市雨源型河流。坪山河干流主要有3個水質監測站點,其中碧嶺位于上游,紅花潭位于中游,上洋斷面位于下游。其位置分布見圖1。

圖1 坪山河研究區位置
主成分分析的原理是在保持重要信息的基礎上,通過原始變量的少數線性組合代表原始數據的絕大部分信息,減少研究問題的復雜程度。主成分評價水質的方法,具體可分為以下步驟。


(1)
再求得滿足|λE-R|=0的非零值λ,根據特征值求出(λE-R)X=0的非零基礎解系P1,P2,…,Pn,即為對應特征值λ的特征向量。主成分個數的提取原則為特征值前m個主成分,滿足:
(2)
c) 綜合評價
λ=λ1+λ1+,…,+λm
(3)
式中,m為主成分個數。通過式(3) 計算各監測斷面主成分的得分值及綜合得分值,并對其污染程度進行排序。其中綜合得分越高,污染就越嚴重,且主成分表達式中最大線性系數相對應的指標即為最主要的污染物。
應用SPSS軟件,主要是為了獲得特征向量矩陣和原始數據的標準化后的矩陣。特征向量矩陣是通過“分析”—“降維”—“因子分析”,然后通過“轉換”—“計算變量”兩步獲得;而標準化矩陣通過“描述統計”—“描述”命令實現。后續的綜合得分通過Excel操作實行。
坪山河流域水質數據來源于深圳市環境監測中心站(碧嶺、紅花潭、上洋),其數據監測序列為2011—2015年,監測項目為GB 3838—2002《地表水環境質量標準》中24項常規指標,監測頻率為每月一次。為摸清該河流的主要污染物質和時空變化規律,本文數據分析設計如下。
a) 研究空間變異性。按照3斷面分別找出每個斷面的主要污染成分指標,將5 a的數據和國標的4個類別(Ⅱ,Ⅲ,Ⅳ,Ⅴ)的標準數據的22個指標,設計(64×22)的矩陣,分別求出每個斷面的主要污染指標。
b) 研究時間變異性。按照5 a分別找出每年的主要污染指標,將3個斷面的12個月數據和國標的4個類別(Ⅱ,Ⅲ,Ⅳ,Ⅴ)的標準數據,設計(36×22)的矩陣,分別求出每個年份的主要污染指標。
按照GB 3838—2002《地表水環境質量標準》,本文采用單因子污染指數法對碧嶺、紅花潭和上洋3個斷面近5 a的水質情況進行了評價,見圖2。

圖2 坪山河水質分類評價結果
根據圖2可以看出,2011—2015年,上游碧嶺的水質數據最好,介于Ⅱ類水與劣Ⅴ類水之間。中游的紅花潭和下游的上洋斷面水質很差,常年為劣Ⅴ類水。碧嶺的水質隨季節性的波動比較明顯,夏秋季節水質較春冬季節好,這可能跟徑流量的季節性變化有關。但是根據這個評價結果,雖然能判別出其主要污染成分,但還很難辨別出其時空變異性。
按照3斷面(碧嶺、紅花潭、上洋)將5 a的水質數據的22個指標,設計(60×22)的矩陣,通過 SPSS 軟件分析得到3個斷面特征值矩陣見表1。最大線性系數即特征值的絕對值越大,其相對應的指標在各主成分中載荷就越大,因此特征值的絕對值最大者對應的污染物指標為主成分中最主要的污染物。每個斷面特征矩陣代表80%以上的信息,即在每個矩陣中篩選出代表所有信息80%的特征值。因為每個特征值在所在矩陣中的載荷不同,所以最后篩選出的特征值的個數也不同,即每個斷面的主要污染成分個數有所不同。
從表1可以看出,碧嶺斷面第一、第二和第三主成分中特征值最大值對應的污染指標分別為總磷、總氮和糞大腸菌群,即總磷在第一主成分中載荷最大,總氮在第二主成分中載荷最大,糞大腸菌群在第三主成分中載荷最大。紅花潭斷面鋅、砷在第一主成分中載荷最大,氨氮在第二主成分中載荷最大,氟化物在第三主成分中載荷最大,糞大腸菌群在第四主成分中載荷最大。上洋斷面硫化物在第一主成分中載荷最大,氨氮在第二主成分中載荷最大,化學需氧量在第三主成分中載荷最大,硒在第四主成分中載荷最大。分析得到斷面的主要污染成分指標,見表2。

表1 3個斷面特征值矩陣

表2 坪山河流域不同斷面主要污染物分布
從表2可以看出上游碧嶺的主要污染物成分為總磷、氨氮、糞大腸菌群;中游的紅花潭主要污染物成分是鋅、砷、氨氮、氟化物、糞大腸菌群;下游的上洋主要污染物成分是硫化物、氨氮、化學需氧量、硒。3個斷面的主要污染物成分出現了一定的變化,其中氨氮是共有的主要污染物成分。
按照5 a將3個斷面的12個月數據設計(36×22)的矩陣,通過 SPSS 軟件分析得到2011—2015年特征值矩陣見表3,同空間變異分析,特征值的絕對值最大者對應的污染物指標為主成分中最主要的污染物。

表3 2011—2015年特征值矩陣
從表3分別可以看出2011—2015年各污染物在主成分中的載荷。通過表3分析得到每年的主要污染成分指標見表4。

表4 坪山河流域不同時間主要污染物分布
從表4可以看出,2011年主要污染物成分為硫化物、氨氮和硒;2012年主要污染物為砷和氨氮;2013年主要污染物為硒、氨氮、糞大腸菌群和揮發酚;2014年主要污染物為砷、氨氮和揮發酚;2015年主要污染物為硒、氨氮、總磷和糞大腸菌群。2011年以來,氨氮一直都是主要的污染物,另外糞大腸菌群、砷、硒也是比較常出現的污染成分。偶爾也會出現硫化物、揮發酚等主要污染成分。
通過特征值計算各監測斷面及各年主成分的得分值及綜合得分值,并對其污染程度進行排序。其中綜合得分絕對值越高,污染就越嚴重。從表5可以看出,碧嶺的最好水質出現在2015年,最差的在2012年,這可以說明2015年的水質比2011年水質狀況較好一些,上洋和紅花潭也有類似的情況,這說明從2011年以來,水質有一定的改善。

表5 坪山河不同斷面在不同時間的綜合得分情況
從表6可以看出碧嶺12月至次年2月水質較好,紅花潭1月至次年4月水質較差。從2011—2015年,水質年度排名最好的一直出現在碧嶺,最差的大部分出現在紅花潭,這說明碧嶺水質優于上洋,上洋優于紅花潭。這結果與圖2的結果相印證,同時主成分分析法得到了圖2得不到的結果。碧嶺水質優于上洋,上洋優于紅花潭表明污染源主要可能來自中游的紅花潭地區。

表6 不同年份綜合得分情況
在水質評價中,水質指標眾多,不同指標間往往存在一定程度的重疊,運用主成分分析可以對原指標變量進行變換后形成彼此相互獨立的主成分,在保證原始數據的信息損失最小的情況下,以少數的綜合變量取代原有的多維變量,減小評價指標之間的相關影響,反映水質的綜合狀況。通過分析得到以下3個結論。
a) 上游碧嶺的水質最好,介于Ⅱ類水與劣Ⅴ類水之間。中游和下游的紅花潭上洋斷面水質很差,常年為劣Ⅴ類水。碧嶺的水質隨季節性的波動比較明顯,夏秋季節水質較春冬季節好。
b) 從空間上看,碧嶺水質優于上洋,上洋優于紅花潭。上游碧嶺的主要污染物為總磷、氨氮、糞大腸菌群;中游主要污染物為鋅、砷、氨氮、氟化物;下游主要污染物成分為硫化物、氨氮、化學需氧量、硒。3個斷面的主要污染物成分出現了一定的變化,其中氨氮是3個斷面共有的主要污染物成分。
c) 從時間上看,2011年以來,砷、氨氮一直都是主要的污染物,另外糞大腸菌群也是比較常出現的污染成分。通過污染程度排名,總體來看水質有變好的趨勢。
d) 通過主成分分析法所得結果與長年監測實際情況一致,結果表明,主成分分析方法是一種切實可行的水質綜合評價方法,對環境質量評價問題有一定的參考價值。