高 飛,王 勇,陳清祥,汪懿清
(1.南京信息工程大學 地理與遙感學院,江蘇 南京 210044)
近幾年,我國霧霾天氣頻發,長江三角洲、珠江三角洲和京津冀魯地區等區域尤其嚴重。現在研究普遍認為,霧霾的主要組成是PM2.5(PM是英文Particulate Matter的首字母縮寫)。PM2.5是指空氣動力學直徑小于或等于2.5 μm的顆粒物,也稱為可入肺顆粒物[1]。當前研究表明,PM2.5不僅降低大氣能見度,對飛機起降以及地面交通安全構成巨大威脅[2],而且對人體的呼吸系統、心血管系統等造成多方面的損害[3]。2011年,環保部發布實施《環境空氣PM10和PM2.5的測定重量法》首次對PM2.5測定進行規范,并在常規空氣質量評價項目中增設PM2.5日均、年均濃度限值[4],將PM2.5作為環境治理工作的重點。PM2.5已經成為當前政府和公眾廣泛關注的熱點問題。
國外對PM2.5的研究開展較早,美國和一些歐洲國家在20世紀90年代就開展了大規模的PM2.5研究,主要涉及PM2.5質量濃度的時空分布、排放清單、排放特征譜、源解析以及PM2.5對大氣能見度和人體健康的影響等方面[5,6]。相比之下,我國在氣溶膠粒子方面的研究起步較晚,對于PM2.5的研究目前還處于起步階段,主要是研究PM2.5與氣象要素之間的關系。馬雁軍、潘本峰、周麗等對近幾年北京局部地區顆粒物的觀測和研究[7-9]發現,降水量、相對濕度、風速等氣象要素與PM2.5存在顯著的相關關系;李旭芳、李廣德等研究了北京地區PM2.5在不同季節上的濃度差異,得出PM2.5在時間上的變化規律[10,11]。這些研究多數集中于PM2.5某城市點狀區域的時間變化特征,但針對PM2.5大范圍的空間分布的研究尚未多見。本文基于蘇錫常地區2013年春季(3~5月)的PM2.5數據,分析PM2.5與氣溫、降水量、風速、相對濕度等氣象要素的關系,利用GIS技術進行建模,嘗試模擬蘇錫常地區2013年春季PM2.5的空間分布,并將模型與IDW插值方法進行比較,從而為政府制定相關環境政策提供更多參考,為大氣環境的治理提供一些借鑒和依據。
本文以長江三角洲的蘇錫常地區為研究對象,該地區是江蘇省乃至全國范圍內最具經濟競爭力的地區,城市工業化率高達70%左右,涵蓋了數個國家級工業園區,雄厚的工業基礎對PM2.5的影響舉足輕重;此地也是國內汽車保有量最大的地區之一,尾氣排放量非常大,從而進一步影響了PM2.5;還有該地區緊鄰太湖,水域氣候效應顯著,對PM2.5的影響不容小視;該地人口稠密,環境狀況格外重要,而空氣質量問題尤以霧霾最為典型。因此,選取該區域具有非常高的研究價值。同時,蘇錫常地區總共分布了21個PM2.5監測站,基本覆蓋全地區,為本研究提供了數據保障。
PM2.5數據[12]:蘇州、無錫和常州3個地區 PM2.5監測站的經緯度坐標數據,并通過PM2.5監測網手動錄入2013年春季蘇錫常地區21個PM2.5監測站(蘇州8 個、無錫7個、常州6個)日平均濃度數據,經統計整理得到PM2.5春季平均濃度的屬性數據,經ArcMap中DisplayXYData工具處理得到PM2.5春季平均濃度的空間數據(Shapefile格式)。

圖1 PM2.5監測站及氣象站分布圖(審圖號:GS(2005)362)
氣象數據[13]:蘇錫常及周邊地區13個氣象站(江蘇省8個、浙江省2個、安徽省2個、上海市1個)2013年春季(3~5月)的逐日數據(包括日降水量、日平均氣溫、日平均風速、日平均相對濕度),經統計整理得到春季的降水總量、平均氣溫、平均風速和平均相對濕度數據。
GIS數據:中國地區CGIAR-CSI SRTM DEM 90數據[14],經ArcMap中Extract工具裁切處理得到蘇錫常地區的DEM數據,再經Raster To Point工具、AddXYCoordinates工具和Point To Raster工具處理得到分辨率為1 km的蘇錫常地區經緯度柵格數據;比例尺為1 ︰400萬的全國市縣矢量數據[15],經ArcMap中Clip工具裁切處理得到蘇錫常地區的矢量數據。
當前研究表明,影響大氣中PM2.5濃度的因子主要有排放源、氣象因素以及顆粒物物化性質[16],PM2.5與風速、降水量、相對濕度等氣象條件具有較好的相關性[17]。本文利用GIS技術,對氣象要素進行空間插值,統計PM2.5濃度與氣象要素的關系,建立回歸方程,從而研究蘇錫常地區PM2.5空間分布特征。
1.3.1 插值方法
本文采用了反距離加權平均法(IDW)進行數據插值,其優點在于算法簡單,易于實現,能夠很好地克服其因數據場的空間分布不均而使估值出現偏差的缺點,從而取得較好的插值效果,可以作為精確估值[18],因此IDW被國內外眾多學者應用于氣象要素的插值[19-21]。
IDW是基于“地理學第一定律”的基本假設,即2個物體的相似性隨它們間的距離增大而減小[22]。假設已知樣點對預測點值的預測都有局部性影響,其影響隨距離增加而減小,離預測點近的已知樣點在預測過程中所占權重大于離預測點遠的已知樣點,確定權重的公式:

式中,λi為預測過程中已知樣點的權重;di0為預測點與各已知樣點之間的距離;N為預測過程中需要使用的預測點周圍的樣點數量;p為距離的冪,其最佳值通過求均方根預測誤差RMSPE的最小值求得,本文將該值設定為2。
1.3.2 線性回歸分析
線性回歸分析是描述一個因變量Y與一個或多個自變量X之間的線性依存關系。根據多個自變量的最優組合建立線性回歸方程來預測因變量的回歸分析稱為多元線性回歸分析,其模型的一般形式為:

式中,y*為根據所有自變量X計算出的估計值;b0為常數項;b1,b2,…,bn為對應于x1,x2,…,xn的偏相關系數。偏相關系數表示假設在其他所有變量不變的情況下,某一個自變量變化引起因變量變化的比率。
1.3.3 GIS技術
GIS技術是以地理空間為基礎,采用地理模型分析方法,提供空間動態地理信息,實現地理研究和地理決策服務的計算機技術系統。GIS技術可以有效地管理空間數據,確定站點的空間位置和分布,并進行空間可視化表達,同時能夠將觀測值的屬性數據與空間數據高效集成,通過地理空間分析研究PM2.5和氣象要素的空間變化特征,并利用圖形生成功能生成矢量和柵格數據。
本文建立了基于氣象要素的多元線性回歸模型來擬合PM2.5的空間分布,根據廖順寶[23]等提出的柵格尺度應考慮數據源的密度和空間分布特性的結論,經過對不同尺度下的柵格進行模擬驗證,最終選取柵格空間分辨率為1 km×1 km,該尺度不僅具有較高的精度,而且也更適合本文數據條件下的空間表達和實際業務應用需要。

圖2 模型構建流程圖
利用Hold-Out Method方法[24],將PM2.5數據分成兩組,一組作為訓練集(共17個),另一組作為驗證集(共5個),如圖1a。將訓練集與影響因子進行多元線性回歸分析,再根據回歸方程及各因子的柵格數據,通過柵格計算得到PM2.5擬合結果。為了驗證模型的模擬效果,利用驗證集進行模擬驗證,并評價模型。
采用降水量、溫度、風速和相對濕度作為此次建模的影響因子,樣本長度為2013-03-01~2013-05-31共1 911個樣本。在當前研究中,周麗[9]選取了199個樣本進行北京地區PM2.5濃度與其相關因子研究的建模和驗證;李廣德[11]通過對114個樣本數據的分析,得到了北京市區春夏季PM2.5濃度時間變化特征,故本研究樣本數量相較于前人而言,較為充足。利用觀測的PM2.5數據,本文分析其與降水量、溫度、風速和相對濕度的相關特征,各自的相關系數分別為-0.684、0.362、-0.664和-0.695。除溫度外,其他因子均通過了0.01的信度檢驗,說明溫度與PM2.5相關性較弱。同時考慮到氣象要素的地帶性變化特征對PM2.5濃度的影響,故將經度和緯度數據加入影響因子。以降水量、風速、相對濕度、經度和緯度作為此次建模的影響因子進行多元回歸,得到如下方程:

式中,C為PM2.5濃度;X1為降水量;X2為風速;X3為相對濕度;X4為經度;X5為緯度;模型的復相關系數R為0.74;絕對平均誤差為2.82。可以看出,該模型回歸相關性較好,誤差較小。

圖3 春季氣象要素柵格圖
從多元回歸方程的系數可知,降水量與PM2.5為負相關關系,這是由于降水對PM2.5有著強烈的沖刷作用和去除效應,使PM2.5顆粒隨降水沉降,濃度降低[25];風速與PM2.5為負相關關系,因為風速越大,大氣水平輸送能力越強,污染物的擴散速度越快,越不容易聚積形成“靜穩”狀態[9];相對濕度與PM2.5為正相關關系,因為相對濕度越大,越有利于大氣中的氣體轉化為粒子,使得污染物顆粒濃度增加[26];另外高濕度條件(大于60%)會使污染物顆粒結合空氣中水分子形成穩定的大粒徑顆粒滯留在大氣中,導致濃度升高[27]。
對降水量、風速、相對濕度進行IDW插值得到氣象要素柵格數據,如圖3。利用回歸公式,經ArcMap中的柵格計算得到PM2.5擬合結果,如圖4a。采用常州市武進監測站、安家監測站、蘇州市上方山監測站、相城區監測站和無錫市大學城監測站作為該模型的驗證集,樣本長度為2013-03-01~2013-05-31共448個樣本,模擬驗證結果見表1。

圖4 PM2.5擬合結果及PM2.5 IDW插值結果

表1 PM2.5模擬驗證結果
由表1可以看出,該模型是有效的,其相對誤差在0.17%~6.66%之間,平均相對誤差為3.30%,說明利用氣象要素與PM2.5濃度顯著的相關性來研究PM2.5的空間分布具有較高的合理性,但是由于PM2.5顆粒物復雜的物化特性及其影響因子的多樣性,有些擬合值與觀測值有較大偏差(如蘇州市上方山監測站),但從總體上擬合效果不錯,因此該模型擬合PM2.5空間分布具有較高的可信度。
從圖4a可以看出,2013年春季蘇錫常地區的PM2.5濃度在43.55 ~99.32 μg/m3之間,其空間分布特征從整體上表現為東南低、西北高。高濃度區域主要在常州市和蘇州市的西南部,特別是常州市湟里鎮、東安鎮,蘇州市東山鎮、臨湖鎮,濃度在75 μg/m3以上;低濃度區域主要在蘇州市和無錫市的東部和東南部,如蘇州市角直鎮、陽澄湖鎮,無錫市東港鎮、羊尖鎮,濃度小于50 μg/m3,這是由于風速是影響PM2.5最顯著的氣象要素[26],而蘇錫常地區的氣候具有明顯的季風特點,春季是冬夏季風轉換的季節,盛行風向為東南風,使位于上風向的蘇州市污染物濃度降低,位于下風向的常州市污染物濃度升高,形成大致上濃度由東南向西北降低的趨勢;局部上,蘇州市和無錫市的中部有零星的小范圍低值區域,如蘇州市城南鎮、郭巷鎮,無錫市南長區、崇安區,濃度在45 ~60 μg/m3之間,這些區域植被覆蓋率高,而大面積的植被對PM2.5具有一定的阻截、吸附和移除作用[28],可以降低局部環境的PM2.5濃度。
通過表1和圖5中多元線性回歸模型和IDW插值方法的結果比較可以看出,IDW插值的誤差較大,最小相對誤差為1.52%;最大相對誤差達到12.10%;平均相對誤差5.04%,這3個參數均遠大于多元線性回歸模型的對應誤差,說明基于氣象要素的多元線性回歸模型整體上優于IDW插值方法,能夠更好地反映PM2.5空間分布特征,揭示PM2.5的空間分布規律。從擬合效果上看(見圖4),該模型有效地消除了IDW插值方法產生的“牛眼”現象,降低了對采樣點分布均勻性的依賴,更適合實際情況中采樣點無法均勻選取的情況,同時也能夠在一定程度上反映局部地區PM2.5濃度的變化特征。

圖5 多元線性回歸模型與IDW插值方法的比較
利用2013年春季蘇錫常地區的PM2.5濃度觀測資料和同期的蘇錫常及周邊地區的氣象資料,分析PM2.5與氣溫、降水量、風速、相對濕度等氣象要素的相關性,建立了基于氣象要素的多元線性回歸模型,研究蘇錫常地區PM2.5的空間分布,得到的結論如下:
1)該模型綜合考慮了氣象要素中降水量、風速和相對濕度與PM2.5的顯著相關性,并經過模擬驗證,平均相對誤差為3.30%,能夠有效地模擬PM2.5的空間分布狀況。
2)2013年春季蘇錫常地區PM2.5空間分布具有顯著的特征,受主導風向影響,總體上呈現出東南低,西北高的特點,并且由于大面積植被的作用,在蘇州市和無錫市的中部有小范圍低值區域。
3)該模型有效消除了單一使用IDW插值方法容易受到監測站空間分布的影響而出現極值區域和極值中心偏差的現象,同時也能夠在一定程度上突出局部地區的變化特征,從而較好地反映PM2.5空間分布狀況。
由于我國PM2.5研究工作起步較晚,PM2.5監測站雖然基本覆蓋研究區域,但主要集中在城市,農村地區較少,因此研究結果對農村地區PM2.5濃度的空間分布反映不足。由于PM2.5數據在時間上是零散間斷的,長期連續的觀測資料十分有限,這也限制了樣本的長度,從而降低了模型的精度。隨著我國霧霾治理力度的不斷加大,PM2.5監測站的不斷增多,PM2.5數據的完整性和連續性將會大大增強,本文會在此條件下進行更系統的分析和研究,進而更深入地揭示PM2.5的空間分布規律。
[1]朱建超.PM2.5的綜述與思考[J].中國衛生檢驗雜志,2012,22(10):2 526-2 528
[2]董雪玲.大氣可吸入顆粒物對環境和人體健康的危害[J].資源產業,2004,6(5):50-53
[3]Menichini E,Monfredini F.Relationships Between Concentrations of Particle-bound Carcinogenic PAHs and PM10Particulate Matter in Urban Air[J].Fresenius Environ Bull,2001,10(6):533-538
[4]中國首次制定PM2.5質量標準[J].大眾化標準,2011(12):62-63
[5]Oscar P,Rosa M,Susana G,et al.Characterization and Sources Assignation of PM2.5Organic Aerosol in a Rural Area of Spain[J].Atmospheric Environment,2009,43(17):2 796-2 803
[6]Lin K,Wei L,Yu H W,et al.Comparison of PM2.5Source Apportionment Using Positive Matrix Factorization and Molecular Marker-based Chemical Mass Balance[J].Science of the Total Environment,2008,39(4):290-302
[7]馬雁軍,王揚鋒,劉寧微,等.遼寧中部城市群可吸入顆粒物PM10、PM2.5的污染水平[J].中國粉體技術,2010,16(1):9-13
[8]潘本鋒,趙熠琳,李健軍,等.氣象因素對大氣中PM2.5的去除效應分析[J].環境科技,2012,25(6):41-44
[9]周麗,徐祥德,丁國安,等.北京地區氣溶膠PM2.5粒子濃度的相關因子及其估算模型[J].氣象學報,2003,61(6):761-767
[10]李旭芳,初鈞晗,于令達,等.北京市城區單監測點PM2.5質量濃度變化特征[J].北京師范大學學報:自然科學版,2011,47(3):258-261
[11]李廣德,李效文.北京市區春夏PM2.5和PM10濃度變化特征研究[J].環境科學與管理,2013,38(5):52-56
[12]PM2.5監測網[EB/OL].http://www.cnpm25.cn/ ,2013-03-01/2014-01-18
[13]中國氣象科學數據共享服務網[EB/OL].http://cdc.cma.gov.cn/home.do/ ,2013-06-02/2014-01-18
[14]CGIAR-CSI(國際熱帶農業中心)[EB/OL].http://srtm.csi.cgiar.org/,2013-04-12/2014-01-18
[15]國家基礎地理信息中心[EB/OL].http://ngcc.sbsm.gov.cn/ ,2013-04-12/2014-01-18
[16]劉隨心,曹軍驥,安芷生,等.西安大氣細粒子(PM2.5)質量濃度變化特征及其影響因素[J].過程工程學報,2009,9(2):691-695
[17]徐敬,丁國安,顏鵬,等.北京地區PM2.5的成分特征及來源分析[J].應用氣象學報,2007,18(5):645-654
[18]范銀貴.空間插值方法在繪制降雨量等值線圖中的應用[J].水利水電科技進展,2002,22(3):48-50
[19]林忠輝,莫興國,李宏軒.中國陸地區域氣象要素空間插值[J].地理學報,2002,57(1):47-56
[20]Goovaerts P.Geostatistical Approaches for Incorporating Elevation into the Spatial Interpolation of Rainfall[J].Journal of Hydrology,2000(1):113-129
[21]Bartier P M,Keller C P.Multivariate Interpolation to Incorporate Thematic Surface Data Using Inverse Distance Weighting (IDW) [J].Computer&Geoscience,1996,22(7):795-799
[22]Minowa Y.Verification for Generalizability and Accuracy of a Thinning-trees Selection Model with the Ensemble Learning Algorithm and the Cross-Validation Method[J].Journal of Forest Research,2008,13(5):275-285
[23]廖順寶,張賽.多年平均氣溫數據空間化誤差的尺度效應[J].地球信息科學學報, 2014,16(1):8-14
[24]Tobler W A.A Computer Movie Simulating Urban Growth in the Detroit Region[J].Economic Geography,1970,46(2):234-240
[25]湯天然,陳建楠,李廣前,等.降雨對PM2.5濃度的影響及人工降雨降低PM2.5濃度的探討[J].貴州氣象,2013,37(4):35-37
[26]劉大錳,馬永勝,高少鵬,等.北京市區春季燃燒源大氣顆粒物的污染水平和影響因素[J].現代地質,2005,19(4):627-633
[27]徐曉峰,段欲曉.北京地區PM10與氣象條件分析——城市氣象服務科學討論會學術論文集[C].北京:中國氣象學會秘書處,2001
[28]趙晨曦,王玉杰,王云琦,等.細顆粒物(PM2.5)與植被關系的研究綜述[J].生態學雜志,2013,32(8):2 203-2 210