王 帥,潘本鋒,張建輝,解淑艷,宮正宇,李 亮
中國環境監測總站,國家環境保護環境監測質量控制重點實驗室,北京 100012
環境空氣質量綜合評價方法選取對于環境管理具有重要的決策引導作用,常用的空氣質量綜合評價方法主要有綜合指數法[1-2]、灰色聚類法[3]、模糊綜合評判法[4]、主成分分析法[5]、人工神經網絡法[6]等。其中,綜合指數法具有計算簡單、指標覆蓋全面的優點,在環境管理中被廣泛應用于不同城市間空氣質量的比較或同一城市空氣質量的變化趨勢分析;其他幾種方法在科學研究中有所使用,但在環境管理中的實際應用并不多見。由于與空氣質量標準相關聯,綜合指數法中的單項指數還可應用于制定空氣質量分級標準。在《環境空氣質量標準》(GB 3095—2012)[7]發布前,環境空氣質量綜合指數主要包括二氧化硫、二氧化氮、可吸入顆粒物等3項指標,對于當前新開展監測的細顆粒物、臭氧、一氧化碳等指標應如何納入綜合指數,仍缺乏充分的研究論證。在綜合指數法中,各污染物均使用評價濃度除以質量標準中的濃度限值進行標準化,再按照等權重進行求和。但由于不同污染物間具有一定的關聯性,因此綜合指數法會有一定的信息冗余,部分污染物的實際權重可能會被放大。另外,綜合指數計算過程中各項污染物評價濃度選取方法和評價標準的差異也會影響污染物的實際權重和信息冗余情況,有必要對這一現象進行深入分析,使得所采用的評價方法符合環境管理的需求。主成分分析法與其他方法相比的優點是指標權重的確定較為客觀,在環境空氣質量綜合評價中有不少應用[8-9]。研究提出了4種備選綜合指數計算方法,并采用主成分分析技術對不同綜合指數計算方案下污染物的權重系數進行了分析,提出了適合中國當前環境管理需要的綜合指數計算方法,為有關科學研究和環境管理提供借鑒。
數據來自74個實施環境空氣質量新標準城市2013年6項污染物逐月統計數據,污染物濃度統計方法依據《環境空氣質量評價技術規范(試行)》[10]中有關規定。污染物統計指標如表1 所示,SO2、NO2、PM10、PM2.5的統計指標均為月均值濃度,CO的統計指標為月均值或日均值95百分位數濃度,O3統計指標為日最大8 h值的月均濃度或90百分位數濃度。6項污染物統計指標分別按照各自在《環境空氣質量標準》(GB 3095—2012)中的濃度限值進行標準化。根據統計指標和參比標準的差異,共提出4種備選標準化方案。

表1 不同綜合指數計算方案下污染物的標準化方法
定義單項指數占綜合指數比例最大的污染物為主要污染物,對不同的綜合指數計算方案分別統計逐月的主要污染物情況。同時對各項污染物統計指標間的相關關系進行全年和逐月分析。
為了研究不同計算方案下各污染物的最優權重系數,以主成分分析方法的結果為參比進行比選研究。主成分分析技術主要被用于在保證較小的信息損失下通過選擇較少的新指標來代替原始指標,經過線性變換以較少的綜合變量來代替原來的多維變量,從而起到減少信息冗余和信息噪音的目的。分析方法:設有n個樣本,每個樣本有p項污染物,構成 n × p階矩陣 Xi×j(i=1,2,…,n;j=1,2,…,p)。首先對矩陣 Xi×j的 p 個列向量進行標準化,使其成為均值為0、方差為1的列向量,記為 Zij(i=1,2,…,n;j=1,2,…,p)。然后求出其相關系數矩陣R,并求R的p個特征根λj(j=1,2,……,p)和對應的特征向量 Ej=(e1j,e2j,……,epj)T。構造的新特征向量彼此不相關。以特征根為權重計算各特征向量的貢獻率:

在經典主成分分析方法中,通常是選取累積貢獻率大于85%的最少數量的特征變量為指標來進行綜合評價,從而起到減少指標維度的目的。但研究的目的是對不同綜合指數計算方案的信息冗余情況進行比較,并不是用于降低指標維度,因此將累積貢獻率設為100%,即保留所有的特征向量信息。將p個特征向量按照其權重不同,進行列向量加權求和,得出新的綜合向量:

該綜合向量代表了給定的統計指標下各項污染物的最優系數,以最優系數為權重計算綜合指數能夠在不損失信息的前提下去除冗余信息。將主成分分析中的標準化方法與表1中標準化方法進行簡單數值變換后就可以得出不同計算方案下的優化系數。各項污染物的優化系數均以PM2.5系數為1進行歸一化得出最優權重系數。
數據分析和處理使用 Matlab、SPSS、Excel軟件完成。
圖1為不同綜合指數計算方案下74個城市逐月主要污染物的分布情況。

圖1 不同綜合指數計算方案下逐月主要污染物頻率分布情況
從圖1可以看出,以SO2為主要污染物的頻率很小,僅在 1、2、11、12月的個別城市出現過。以CO為主要污染物的頻率也很小,僅方案3中個別城市在 2、3、11、12 月出現過。說明 SO2、CO污染物濃度較低,在不同計算方案下都不是主要污染物,而以 PM2.5、O3、PM10、NO2為主要污染物的頻率相對較大,表明這4類污染物是目前影響中國環境空氣質量的主要污染物。不同方案之間以 NO2、PM2.5、PM10為主要污染物的頻率大體呈現出方案3≤方案1≤方案2≤方案4的規律,而以O3為主要污染物的頻率呈現相反的變化趨勢。不難看出,這是由于計算指數時 NO2、PM2.5、PM10選用的參比標準逐漸加嚴而O3選用的參比標準逐漸放寬導致的。從逐月的變化規律來看,以PM2.5為主要污染物的頻率在冬季最高,夏季最低;以PM10為主要污染物的頻率在4月最高,6、7月最低;以O3為主要污染物的頻率在夏季最高,冬季最低。
由圖1可知,在方案3中以O3為主要污染物的頻率較高,在7、8月約90%城市以 O3為首要污染物,而在冬季1、2月仍有近16%城市以 O3為首要污染物。方案4中,O3的作用被過分低估,在5—8月等 O3污染較重的時段僅有不到5%的城市以O3為主要污染物。可以看出,方案3、方案4均不能客觀反映中國O3污染狀況,方案1、方案2是相對合理的備選方案,能夠合理地反映出O3的逐月變化規律。
利用主成分分析技術統計得出的優化權重系數如圖2所示,均以PM2.5系數為1進行了標準化。

圖2 不同計算方案下各項污染物逐月優化系數
優化權重系數的確定考慮了6項污染物間的信息相關性和重疊性,優化系數大于1時表明該污染物應有更高的權重,即現有綜合指數計算方法中該污染物的權重有所低估,出現信息缺失;當優化系數小于1時表明該污染物應有更小的權重,即現有綜合指數計算方法中該污染物的權重偏高,出現信息冗余;當優化系數小于0時,表明該污染物并不適合作為判定污染的指標。由于污染物濃度變化具有明顯的月際特征,因此同一種污染物在不同月份的最優權重系數也有一定的波動性。
從PM10優化權重系數來看,4種方案下的PM10優化系數主要在0.5~1.5范圍內波動,信息缺失和信息冗余情況基本保持平衡。從 SO2、NO2、CO優化權重系數來看,4種方案下 SO2、NO2、CO逐月權重系數主要分布在大于1的范圍,表明4種方案對這3項污染物濃度變化信息均反映不足。從O3優化權重系數來看,4種方案下的O3優化系數均出現了較為劇烈的月際變化,4—8月O3優化系數主要分布在大于1區域,表明4種方案的綜合指數應給予O3更大的權重,而其他月份(如1—3月)O3的權重系數小于零,4種方案均存在O3信息冗余的現象,特別是方案1和方案4的信息冗余情況較為嚴重。
將每種計算方案下的逐月優化權重系數進行算術平均,得到不同方案下各污染物的平均權重系數(表2)。在不同方案中SO2的平均權重系數為1.96~2.89,NO2的平均權重系數為 1.89~2.38,CO的平均權重系數為2.05~4.24,這3種污染物的優化權重系數明顯大于1,表明4種計算方案中這3種污染物的實際權重都偏小。PM10的平均權重系數為1.08~1.17,與4種綜合指數計算方案中的系數基本一致。O3的平均權重系數為 -1.33~0.43,優化權重系數明顯小于1。即在去除冗余信息后,SO2、NO2、CO的權重得到相對強化,PM2.5、PM10的權重被相對削弱,O3的權重在夏季得到強化,在冬季被削弱。

表2 不同方案下各項污染物的平均優化權重系數
各方案下PM10、SO2、NO2的平均權重系數較為接近,從這方面難以區分不同方案的優劣。但方案1、方案4中 O3平均優化權重系數均小于零,特別是在1—3月O3污染較輕的月份給予了過高的權重,從這個角度來看方案 2、方案 3更優。
由4種計算方案中污染物平均權重系數和逐月主要污染物頻率分布情況可以看出,方案2是相對較優的綜合指數計算方法。但在傳統的綜合指數計算方法中,不同污染物采用了等權重方案。
而實際上由于污染物間有著復雜的相關性,傳統的綜合指數計算方法可能會存在一定的信息冗余。主成分分析技術作為一種降維處理方法,能夠去除信息噪音和信息重復,最大限度地保留系統信息。根據主成分分析結果,方案2中SO2、NO2、PM10、CO、O3、PM2.5的平均權重系數分別為2.31、2.38、1.09、4.09、0.42、1.00。這一權重系數與污染物濃度間的相關性有密切關系。
表3為城市污染物月統計指標間的Pearson相關系數,可以看出 SO2、NO2、CO、PM2.5、PM105種污染物間均呈現極顯著正相關關系,逐月的相關系數亦基本類似(結果略),其中 PM2.5和 PM10的相關性最好。這種顯著正相關關系可解釋為不同污染物排放的同源性,如各種生產、生活活動均同時排放多種污染物。而對于 PM2.5、PM10來說,PM2.5是PM10其中一部分,所以有著高度的相關性。在經過冗余信息處理后,兩者的權重被相對弱化,即 PM2.5與 PM10的總權重(2.09)與 SO2、NO2的權重基本相當。

表3 各污染物月統計指標的Pearson相關系數
O3與其他5種污染物的相關關系較復雜(表4),1月O3統計量與其他污染物統計量間呈顯著負相關關系,7月 O3統計量與除CO外其他污染物統計量間呈顯著正相關關系,但4、10月均不存在類似的相關關系。這一現象與O3的季節性污染特征有關,夏季光照強度大,為光化學反應創造了條件,O3的生成量與前體物濃度水平存在正相關關系;而冬季光照強度弱,即使前體物濃度水平較高,O3的生成速率主要受到光照條件的限制,不受前體物濃度水平控制。因此在冬季時,顆粒物濃度低、空氣質量較好的城市,由于光照條件好其O3濃度可能會高于其他顆粒物污染重的城市。正是由于這種復雜的相關關系,使得O3逐月優化權重系數出現明顯的季節變異特征。例如冬季O3與其他主要污染物間呈負相關關系,其優化權重系數為負值,表明冬季O3并不適合作為評價污染狀況的指標;而夏季O3與其他主要污染物間呈正相關關系,其優化系數變為正值,是度量空氣質量 狀況的有力指標。

表4 不同月份O3統計指標與其他污染物指標的Pearson相關系數
雖然主成分分析方法能夠給出更為客觀和精確的綜合評價結果,幫助管理者理清不同評價方法下污染物間內在的權重關系,但在實際環境管理應用時顯得過于復雜。且由于主成分分析方法的標準化參數是逐月變化的,無法用于逐月環境空氣質量狀況的同比和環比分析,采用統一的標準化方法和計算公式符合環境管理的需求。另外,環境空氣質量綜合評價方法的選取除注重科學性和客觀性外,還要特別注意對環境管理和環境決策的引導性,兩者有時不能完全一致。例如某些污染物的城市間濃度差異較大,從信息識別角度講很有價值,但若大多數城市污染物濃度均滿足標準限值要求時,這種濃度差異對于環境管理的價值是有限的;而對于某些濃度較高但城市間濃度差異相對較小的污染物,從信息識別角度來講價值并不高,卻是環境管理和決策中應該重點強調的。
傳統綜合指數計算方案中SO2、NO2、CO的權重與主成分分析方法優化后的權重相比偏低,但由于中國當前主要大氣污染物是PM2.5、PM10、O3,降低SO2、NO2、CO的權重符合環境管理的需求。綜上,建議以方案2為計算逐月環境空氣綜合指數的計算方法,不同污染指標間按照等權重處理。分析方案2計算方案可知,該方案可延伸應用于季度、半年、年度綜合指數計算,與《環境空氣質量評價技術規范(試行)》中年度評價的有關方法保持一致,使得逐月評價結果與全年評價結果在綜合指數數值和排序方面均能夠保持一致。將方案2應用于2013年74個城市逐月綜合指數計算,并以《環境空氣質量評價技術規范(試行)》中方法計算出的年度綜合指數作為參比(圖3)。可以看出,每個城市逐月的綜合指數均在參比值附近波動,其平均值接近于參比值(圖中虛線),即逐月綜合指數和排名結果與年度綜合指數和排名結果是一致的,進一步驗證了方案2的適用性。其他方案由于標準化方法發生變化,計算出的逐月綜合指數則與參比值有明顯的偏差(結果略)。

圖3 74個城市逐月綜合指數平均值和極值與參比綜合指數關系(方案2)
方案2與《環境空氣質量評價技術規范(試行)》資料性附錄3中的參考方法并不完全相同,主要差別是 SO2、NO2、PM10、PM2.5等 4 項污染物的單項指數僅考慮了月均值,而未考慮重污染時期高濃度事件的影響,導致圖3中逐月綜合指數平均值偏低于參比值。考慮到顆粒物的健康危害主要表現為長期慢性效應[11-12],且中國當前和今后一段時期內顆粒物平均濃度仍將處于較為嚴重的水平,因此主要強調顆粒物平均濃度這一指標。未來隨著空氣質量的不斷改善和環境管理精度的提高,有必要將高濃度污染事件的影響考慮到評價指標中。
1)環境空氣質量綜合指數計算方法中統計指標和參比標準的變化會對逐月主要污染物的判定有較大的影響,在4種計算方法中 PM2.5、PM10和O3是目前影響中國環境空氣質量的主要污染物。
2)主成分分析結果表明,在去除冗余信息后,4種方案中 PM2.5、PM10的權重被相對削弱,SO2、NO2、CO 的權重得到相對強化,O3的權重在夏季得到強化,在冬季被削弱。污染物相對權重變化的原因是污染物間有著復雜的相關性。其中SO2、NO2、PM10、PM2.5和 CO 月統計量間有顯著的正相關性,O3與 SO2、NO2、PM10和 PM2.5間的相關性因季節而不同。
3)綜合考慮主成分分析結果和中國大氣環境管理的實際需求,建議計算逐月環境空氣質量綜合指數時,SO2、NO2、PM10、PM2.5宜以月均值除以年均值標準進行標準化,CO、O3宜以特定百分位數濃度除以日均值標準(或8 h均值標準)進行標準化。該方法可延伸到季度、半年、年度的環境空氣質量綜合指數計算。
[1]唐永鑾.環境質量綜合指數簡介[J].環境科學,1979,4(2):71-74.
[2]劉碩,朱建平,蔣火華.對幾種環境質量綜合指數評價方法的探討[J].中國環境監測,1999,15(5):33-37.
[3]陳瑋.基于灰色聚類與模糊綜合評判的空氣質量評價-以長江沿岸主要城市為例[D].上海:華東師范大學,2012:7-10.
[4]王陸軍,廖曉芬.寶雞市大氣環境質量分析與綜合評價[J].西南師范大學學報:自然科學版,2005,30(1):154-157.
[5]豆俊峰,鄒振揚.主成分分析法在大氣環境質量綜合評價中的應用[J].重慶環境科學,2001,23(2):32-33.
[6]何璠.基于BP人工神經網絡的環境質量評價模型研究[D].成都:四川大學,2006:33-58.
[7]GB 3095—2012 環境空氣質量標準[S].
[8]張曙紅,武鵬程.武漢市大氣環境質量的綜合評價[J].環境科學與技術,2008,31(3):110-113.
[9]杜敏,基于主成分分析法的環境質量綜合指數研究[D].成都:四川大學,2006:11-19.
[10]HJ 663—2012 環境空氣質量評價技術規范(試行)[S].
[11]王帥,丁俊男,王瑞斌,等.我國環境空氣中顆粒物達標統計要求研究[J].環境科學,2014,35(2):401-410.
[12]World Health Organization.Air quality guidelinesglobal update 2005[R].Bonn:WHO Regional office for Europe,2005:275-280.