李步東 ,朱長軍,楊少波,曲 珍
(1.河北工程大學 能源與環境工程學院,河北 邯鄲 056038; 2. 西藏自治區水文水資源勘測局日喀則水文水資源分局,西藏 日喀則 857000)
為了更加深入、準確的了解河流存在的水環境問題,國內外相關學者將各類數學和統計學評價方法應用在水質評價和水體污染源解析等研究中。目前,國內外對河流水質評價的方法主要有單因子評價法、綜合污染指數法、模糊綜合評價法、水污染指數法、主成分分析法和多元統計分析法等[1]。水環境質量評價對水環境的治理提供了重要的依據,不同的水環境質量評價方法所適用的條件和評價結果會略有不同。Singh等[2]認為,河流水質評價需要確定各污染源以及定量化的污染貢獻率。鄭倩玉等[3]采用主成分分析(PCA)對松花江流域哈爾濱段水質污染現狀進行綜合評價,并根據主成分分析計算得到的相關數據進行APCS-MLR(絕對主成分多元線性回歸分析)量化主成分對各污染物的貢獻率。萬金保等[4]認為主成分分析(PCA)利用線性變換將多個原始變量轉化為少數幾個相互獨立的綜合指標(即主成分),提高了分析結果的客觀性和可靠性。
本文根據遼寧省水環境監測中心2015年全年水質監測數據,按照遼河的水文規律,將6~8月劃分為豐水期、4~5月和9~11月劃分為平水期,枯水期為12~翌年3月,并分別對遼河豐、平、枯三個時期進行水質分析,利用主成分分析法分析污染物的主要來源以及APCS-MLR(絕對主成分多元線性回歸分析)量化各主成分對每種污染物的污染貢獻率,以達到為遼河水環境質量評價提供更加準確的結果,同時為遼河的水污染治理與環境保護提供科學的依據和方向。
以遼河7個監測斷面(如下圖所示)溶解氧、高錳酸鹽指數、化學需氧量、五日生化需氧量、氨氮、類大腸桿菌等表征耗氧有機物的水質指標,以及砷和石油類等代表東北老工業區污染的水質指標為基礎。利用主成分分析法對遼河水質進行綜合評價,然后利用絕對主成分回歸分析進行遼河污染物源解析,所有水質指標均嚴格按照地表水環境質量標準(GB3838-2002)的規定進行分析。
主成分分析法(principal components analysis)核心思想就是運用降維的方式,把多個因子轉化成少數的幾個代表性的綜合因子,但這幾個因子已經足夠代表大部分原來的信息。最終實現減少變量個數的目的[5]。通常,主成分分析需要進行數據標準化、計算數據矩陣協方差或相關矩陣、求出協方差矩陣特征值和特征向量和確定主成分及綜合得分四個步驟。假設擁有n個初始變量,表示x1,x2,xn,Y1,Y2,…Yn,表示主成分后的變量,R為變量間的相關系數矩陣,則有以下方程組成立:

圖 遼河監測斷面分布圖Fig. Distribution of monitoring sites of Liao River
(1)
一般,假如前k個數據的累計方差貢獻率超過了85 %,那么這前k個數據便是提取出來的主成分。
2.2.2 絕對主成分多元線性回歸分析
APCS-MLR則是在主成分分析法的基礎上對水質指標進一步分析計算,是對水體進行水質評價和水體污染源解析的有效方法之一[2, 6~8],其原理是利用主要的指標評價水質,根據主成分分析過程中得到的標準化數據、特征向量以及因子得分系數,經過式(2)~(4)計算得到絕對主成分得分(APCS)[6~9]。 然后繼續利用SPSS 19.0的分析—回歸功能,以絕對主成分得分為自變量,以污染物濃度為因變量進行多元線性回歸分析(如式5所示),得到回歸方程的回歸系數,從而確定各主成分對污染物的貢獻率[10~12]。
(2)
(3)
APCSjk=(Az)jk-(A0)j
(4)

(5)
式中:a0為MLR常數項,Aj為回歸系數。
遼河6個監測斷面的豐、平、枯水期的主成分載荷矩陣及總方差的解釋如表1所示。本文在提取主成分時選取特征值大于1作為標準,對豐水期、枯水期各提取了三個主成分,平水期提取了兩個主成分。基本涵蓋了8個污染物的全部信息。其中,豐水期第一主成分(PCA1)、第二主成分(PCA2)和第三主成分(PCA3)總方差貢獻率分別為49.891%、27.632%和17.121%;顯而易見,第一主成分對遼河豐水期的水質影響最大,可以視為豐水期遼河水體的主導污染物。從因子載荷值看,與第一主成分相關性較大的有NH3-N和As;由此可以推斷遼河水體的主要污染源為農業種植和畜禽養殖等面源污染以及冶金行業的污廢水排放。第二主成分相關性較為顯著的有BOD5和石油類。說明該期間遼河水質污染問題主要由石化企業導致的。第三主成分顯著相關的有高錳酸鹽指數和CODCr;說明該期間耗氧有機污染物是主要污染類型;遼河沿程周邊多為人口眾多的大中城市,另外,該區域的工業區規模較大,尤其是造紙行業和畜牧業占有較大比例,生活污水與工業廢水中含有大量的耗氧有機物,是遼河有機污染物的主要來源。
遼河平水期第一主成分和第二主成分總方差貢獻率分別為55.087%和26.992%;與第一主成分顯著相關的為BOD5和石油類。該期間水質污染源與豐水期第二主成分所推斷的污染源類似,石化企業的廢水排放為主要污染源。平水期第二主成分顯著性較強的為DO,說明水體中DO濃度較低,導致該現象的原因可能為城市生活污水和企業污、廢水集中排放,水體中耗氧物質急劇增加使得水體耗氧速率遠大于復氧速率,DO明顯降低。
遼河枯水期第一主成分、第二主成分和第三主成分總方差貢獻率分別為48.574%、23.568%和16.090%;與第一主成分顯著性相關的為高錳酸鹽指數、CODCr和BOD5,其與豐水期第三主成分顯著相關性指標類似,說明兩者主要污染源相似。枯水期第二主成分顯著性相關的為DO和As,由此可以推測枯水期第二主成分主要受到冶金行業與城市生活污水和企業污、廢水集中排放的影響。枯水期第三主成分顯著性相關的為石油類和糞大腸菌群,說明枯水期第三主成分污染物來源可能為生活污水、畜禽養殖以及石油化工等。

表1 遼河主成分載荷矩陣及總方差的解釋Tab.1 Interpretation of principal component loading matrix and total variance of Liao River
根據各主成分載荷矩陣和其對應的特征值,可以求得遼河各監測斷面的主成分綜合得分,再參考主成分綜合得分與水質類別對比表(見表2)[13],即可得到遼河每個監測斷面不同時期的水質類別(見表3)。
從遼河豐水期第一主成分和第二主成分得分來看,雙臺子河閘斷面的得分最高,遠超過其他監測斷面,說明與第一主成分和第二主成分相關性較大的NH3-N、As、BOD5和石油類在該斷面含量較多,雙臺子河閘是第一主成分與第二主成分所代表污染物的主要來源; 豐水期第三主成分得分最高的為通江口監測斷面,說明與第三主成分顯著相關的高錳酸鹽指數和CODCr在該監測斷面含量較高。
遼河平水期第一主成分與第二主成分得分最高的仍為雙臺子河閘監測斷面,說明與第一主成分相關的BOD5和石油類和第二主成分相關的DO在雙臺子河閘監測斷面污染較為嚴重。
遼河枯水期第一主成分得分最高的為遼中監測斷面,其次是雙臺子河閘監測斷面,說明與枯水期第一主成分相關的污染物主要來源于遼中監測斷面;枯水期第二主成分得分最高的為通江口監測斷
面,說明通江口監測斷面是第二主成分所代表污染物的主要來源;枯水期第三主成分得分最高的為雙臺子河閘監測斷面,說明該監測斷面是第三主成分所代表污染物的主要來源。
綜上所述,雙臺子河閘監測斷面水質最差,污染程度遠超過其它監測斷面,同樣,在遼河豐水期、平水期和枯水期各監測斷面主成分綜合得分來看,雙臺子河閘監測斷面得分最高,馬虎山監測斷面在豐、平、枯水期得分均為最低,說明馬虎上監測斷面水體污染相較于其他斷面較輕。從整體上看,遼河水體污染非常嚴重,基本為Ⅳ類或Ⅴ類水質。從遼河沿程監測斷面水質類別來看,遼河水質整體上呈現出上游比下游污染程度低的趨勢。

表2 主成分分析法水質分級標準Tab.2 Water quality classification standard of principal component analysis

表3 各監測斷面不同時期水質綜合評價Tab.3 Comprehensive evaluation of water quality in all section in different periods
根據主成分分析可知,遼河主要污染物為高錳酸鹽指數、CODCr、BOD5、NH3-N和石油類。為了進一步量化各主成分對每種污染物的污染貢獻率[14~16],采用APCS-MLR對污染源貢獻率進行計算,具體結果如表4所示。對于PCA/APCS來說,污染源的貢獻率不一定在0~100%區間內,該值小于零或者大于100%的原因往往與污染源的排入對其他非影響指標的稀釋有關[17~19]。除枯水期的砷指標外,其它評價指標的R2(相關系數)值均大于0.7,說明進行多元線性回歸分析在統計學上是有效的。
遼河水體豐水期第一主成分對NH3-N、As和石油類的貢獻率分別為49.09%、58.65%和24.71%。由主成分分析結果可知,豐水期第一主成分包含的污染物主要來源為農業種植和畜禽養殖等面源污染以及冶金行業的污廢水排放;第二主成分主要影響BOD5和石油類,對其貢獻率分別為13.62%和12.18%,該污染物主要來源于沿岸石油化工企業的工業廢水排放有關;第三主成分影響DO、高錳酸鹽指數、CODCr、BOD5和糞大腸菌群,對其污染貢獻率分別為26.80%、53.68%、66.14%、14.93%和20.55%,該污染物的主要來源為城鎮生活廢水、工業廢水以及畜牧業排放的廢水等。
遼河水體平水期第一主成分對DO、高錳酸鹽指數、CODCr、BOD5以及NH3-N的貢獻率為45.61%、30.48%、56.16%、26.93%和160.89%。根據主成分分析可知,平水期第一主成分的污染物主要受到石化企業污廢水排放的影響;第二主成分對DO、高錳酸鹽指數、CODCr、BOD5以及石油類的貢獻率分別為10.13%、35.79%、21.19%、94.75%、70.65%,影響該污染物的主要原因可能為城市生活污水和企業污、廢水集中排放。
遼河水體枯水期第一主成分對高錳酸鹽指數、CODCr、BOD5、NH3-N、石油類以及糞大腸菌群的貢獻率分別為100.25%、101.26%、128.36%、93.71%、54.33%和79.76%,污染物主要來源于豐水期第三主成分相似。第二主成分對DO、高錳酸鹽指數、CODCr、NH3-N以及石油類的貢獻率分別為42.39%、31.16%、25.75%、164.60%和27.34%,污染物主要受到冶金行業與城市生活污水和企業污、廢水集中排放的影響。第三主成分主要影響石油類,對其污染貢獻率為24.58%,污染物主要來源為石油化工等。

表4 各時期主成分對污染物的貢獻率Tab.4 Contribution rate of principal components to pollutants in all periods
4.1 利用主成分分析與絕對主成分得分—多元線性回歸分析對遼河水體進行水環境質量評價及其水體污染源分析,結果表明水體主要污染物包括高錳酸鹽指數、CODCr、BOD5、NH3-N和石油類。豐水期第一主成分對NH3-N、石油類的貢獻率分別為49.09和24.71;平水期第一主成分對高錳酸鹽指數、CODCr、BOD5和NH3-N的貢獻率為30.48%、56.16%、26.93%和160.89%;枯水期第一主成分對高錳酸鹽指數、CODCr、BOD5、NH3-N和石油類的貢獻率分別為100.25%、101.26%、128.36%、93.71%和54.33%。
4.2 豐水期第一主成分的污染物主要來源于農業種植和畜禽養殖等面源污染以及冶金行業的污廢水排放;平水期第一主成分的污染物主要來源于石化企業污廢水排放;枯水期第一主成分的污染物則偏向于城市生活污水和工業廢水的排放以及畜牧業造成的污染。
4.3 遼河7個監測斷面中,馬虎山斷面的水質優于其他監測斷面,雙臺子河閘斷面水質最差,遼河水質整體上為Ⅳ類或Ⅴ類水質,總體上呈現出中游水質較好,下游水質最差的趨勢。該評價結果明確指出遼河水體的污染物來源,為遼河水質的治理提供了明確的方向。